本页面介绍了如何识别预配不足和超额预配的 Google Kubernetes Engine (GKE) 集群。GKE 针对费用优化场景(例如超额预配的集群和空闲集群)以及可靠性改进场景(例如预配不足的集群)提供分析洞见和建议。GKE 会提供相应的建议,以扩容、缩容或删除集群。对于空闲集群,请参阅识别空闲的 GKE 集群。
确认已识别的集群可从扩容或缩容建议中受益后,您可以进行建议的更改,以节省费用或提高集群的可靠性。如果可能,建议会包含预计每月节省的费用或成本。如需了解详情,请参阅了解费用或节省金额估算值。
GKE 不会为 Autopilot 集群提供这些分析洞见,这些集群仅产生极少的运营费用,因为您只需为工作负载请求的资源付费。如需了解详情,请参阅 Autopilot 价格。
GKE 会监控您的集群,并通过 Active Assist 提供指导以优化您的使用。Active Assist 是一项服务,它提供 Recommender,可生成有关使用 Trusted Cloud by S3NS资源的分析洞见和建议。如需详细了解如何管理分析洞见和建议,请参阅利用分析洞见和建议优化 GKE 使用。
获取有关预配不足和超额预配的集群的分析洞见和建议
GKE 会在 Trusted Cloud 控制台的以下位置显示这些分析洞见和建议:
- Kubernetes 集群页面,位于以下位置:
- 在 Kubernetes 集群列表中,在适用集群的通知列中
- 特定集群的集群页面上的通知横幅
- FinOps 中心
在 Kubernetes 集群页面中,建议的标题如下:
- 超额预配的集群:“减少集群资源以降低费用”
- 预配不足的集群:“增加集群资源以提高可靠性”
您还可以通过 Google Cloud CLI 或 Recommender API(使用 CLUSTER_UNDERPROVISIONED
和 CLUSTER_OVERPROVISIONED
子类型)接收这些分析洞见和建议。
按照相关说明查看分析洞见和建议。
确定预配不足或过度预配的集群后,请参阅合理调整集群大小的注意事项。
GKE 如何识别预配不足和超额预配的集群
下表介绍了 GKE 用于识别可扩容或缩容的预配不足和超额预配的集群的信号,以及每个信号的阈值。此外,此表格还显示了我们建议您在此场景中采取的操作。
子类型 | 信号 | 观察期 | 详细信息 | 建议 |
---|---|---|---|---|
CLUSTER_UNDERPROVISIONED |
CPU 或内存用量偏高 | 过去 30 天 | 如果 GKE 集群在过去 30 天内每小时的平均 CPU 和内存利用率均高于 80%,则表示该集群预配不足。 | 扩容集群以提高可靠性 |
CLUSTER_OVERPROVISIONED |
CPU 和内存用量较低 | 过去 30 天 | 如果 GKE 集群在过去 30 天内每小时的平均 CPU 和内存利用率介于 7% 到 20% 之间,则表示该集群超额预配。 | 缩容集群规模以节省费用 |
GKE 不会针对创建时间不到 30 天的集群发送建议。
了解预估的费用或节省金额
如果可能,GKE 的建议会包含一个估算值,该估算值预测了在您合理调整集群大小后每月的费用或节省金额。此预计费用是根据过去 30 天的集群费用估算的。
任何预计费用或节省金额都是基于先前支出的预测值,并不能保证未来的费用或节省金额。
如需查看这些估算值,请确保您拥有所需的 billing.accounts.getSpendingInformation
权限来获取支出信息。如需了解详情,请参阅 Cloud Billing 访问权限。
如需详细了解所有 GKE 集群的费用,包括基于命名空间和工作负载的更精细的费用明细,请参阅获取 GKE 资源分配和集群费用的关键支出分析。
如需详细了解运行 GKE 集群的费用,请参阅 GKE 价格。
合理调整集群大小的注意事项
按照建议对集群进行扩容或缩容之前,请考虑以下事项:
- 查看集群上运行的应用的资源利用率,了解它们的运行情况,以及它们使用的 CPU 和内存是否超出或低于预期。如需查看相关说明,请参阅分析资源请求。
- 为了提高成本效益,批处理工作负载可能会有意保持较高的集群资源利用率。如果分配的集群资源足以满足集群上运行的批量作业,则无需扩容被确定为预配不足的高利用率集群。
实施合理调整集群大小的建议
请查看以下内容,了解如何调整集群的大小,以更好地匹配资源利用率。
合理调整预配不足的集群的大小
如需实施相关建议,即通过合理调整预配不足的集群的大小来最大限度地降低可靠性风险,请增加集群上的资源。您可以执行以下某些操作来解决此问题:
- 请启用集群自动扩缩器和节点自动预配,或调整设置以实现更大的扩容。
- 通过增加节点数来横向扩容集群。按照说明通过更改节点数进行横向扩缩。
- 为节点池选择更大的机器类型。按照说明通过更改节点机器属性进行纵向扩缩。
- 监控并查看集群上运行的应用的 CPU 和内存资源用量。查看是否可以对应用进行缩容。如需了解如何监控资源使用情况,请参阅分析资源请求。
实施此建议时,您可以确保您的集群可靠,因为它具有适合其应用的资源量。
合理调整超额预配的集群的大小
如需实施相关建议,即通过合理调整超额预配的集群的大小来节省费用,请减少集群上的资源。根据工作负载需求调整集群 CPU 和内存分配。为此,您可以采取以下一些措施:
- 调整集群自动扩缩器和节点自动预配,以更主动地对未充分利用的资源进行缩容。
- 通过减少节点数量对集群进行横向缩容。按照说明通过更改节点数进行横向扩缩。
- 为节点池选择更小的机器类型。按照说明通过更改节点机器属性进行纵向扩缩。
- 监控并查看集群上运行的应用的 CPU 和内存资源用量。查看是否可以对应用进行扩容。如需了解如何监控资源使用情况,请参阅分析资源请求。
实施此建议时,您可以确保仅使用运行集群应用所需的资源。
后续步骤
- 查看与费用相关的优化指标
- 在非高峰时段缩容 GKE 集群以减少费用
- 利用分析洞见和建议优化 GKE 使用
- 在 GKE 上运行费用经过优化的 Kubernetes 应用的最佳实践
- 5 项可帮助您优化集群的 GKE 功能