2初級技術工具
HPA (水平 Pod 自動擴展)
HPA (Horizontal Pod Autoscaler)
Kubernetes 依 CPU、記憶體或自訂指標自動增減 Pod 副本數的控制器,用於 推理 (模型推理) (Inference Optimization) (Variational Inference) 與 機器學習運維 擴展。
詳細解釋
HPA(Horizontal Pod Autoscaler)依設定的指標(如 CPU、記憶體使用率或自訂/外部指標)週期性計算目標副本數,並調整 Deployment 或 StatefulSet 的 replicas,實現水平擴展。需 Metrics Server 提供資源指標;v2 API 支援多指標與自訂指標。在 機器學習運維 中常用於 推理 (模型推理) (Inference Optimization) (Variational Inference) 服務:流量升高時自動加 Pod,流量降時縮減。與 Kubernetes、機器學習運維、推理 (模型推理) (Inference Optimization) (Variational Inference) 相關。