HPA (水平 Pod 自動擴展)

HPA (Horizontal Pod Autoscaler)

Kubernetes 依 CPU、記憶體或自訂指標自動增減 Pod 副本數的控制器,用於 推理 (模型推理) (Inference Optimization) (Variational Inference)機器學習運維 擴展。

詳細解釋

HPA(Horizontal Pod Autoscaler)依設定的指標(如 CPU、記憶體使用率或自訂/外部指標)週期性計算目標副本數,並調整 Deployment 或 StatefulSet 的 replicas,實現水平擴展。需 Metrics Server 提供資源指標;v2 API 支援多指標與自訂指標。在 機器學習運維 中常用於 推理 (模型推理) (Inference Optimization) (Variational Inference) 服務:流量升高時自動加 Pod,流量降時縮減。與 Kubernetes機器學習運維推理 (模型推理) (Inference Optimization) (Variational Inference) 相關。

探索更多AI詞彙

查看所有分類,繼續學習AI知識