本文档介绍如何在挂接了 GPU 的虚拟机 (VM) 实例的托管式实例组 (MIG) 中创建规模调整请求。如需详细了解规模调整请求,请参阅关于 MIG 中的规模调整请求。
创建 MIG 规模调整请求有助于您获取 GPU 等高需求资源,并通过一次性创建确切数量的所有虚拟机来优化成本。如需创建可使用 Cluster Director 提供的功能和服务的 MIG 规模调整请求,请参阅 AI Hypercomputer 文档中的创建 MIG 和规模调整请求。
准备工作
- 为确保您有足够的 GPU 配额可以用于请求的资源,请检查您的 GPU 配额。
-
如果您尚未设置身份验证,请进行设置。身份验证是通过其进行身份验证以访问 Trusted Cloud by S3NS 服务和 API 的过程。如需从本地开发环境运行代码或示例,您可以通过选择以下选项之一向 Compute Engine 进行身份验证:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:
gcloud init
- Set a default region and zone.
-
如需创建实例模板:针对项目的
compute.instanceTemplates.create
权限 -
如需创建可用区级 MIG:针对项目的
compute.instanceGroupManagers.create
权限 -
创建 MIG 规模调整请求:针对项目的
compute.instanceGroupManagers.update
权限 在 Trusted Cloud 控制台中,转到实例模板页面。
点击创建实例模板。 系统会打开创建实例模板页面。
在名称字段中,输入实例模板的名称。
在位置部分,选择以下选项之一:
如需创建区域级实例模板,请选择区域级(推荐),然后选择要创建模板的区域。
如需创建全球实例模板,请选择全球。
在机器配置部分中,执行以下操作:
点击 GPU 标签页。
在 GPU 类型列表中,选择 GPU 类型。
在 GPU 数量列表中,选择 GPU 的数量。
可选:如果您的 GPU 型号支持适用于图形工作负载的 NVIDIA RTX 虚拟工作站 (vWS),并且您计划运行图形密集型工作负载,请选择启用虚拟工作站 (NVIDIA GRID)。
在机器类型部分中,选择一种机器类型。
在预配模型部分中,执行以下操作:
在虚拟机预配模型列表中,选择弹性启动。
如需为通过实例模板创建的虚拟机设置运行时长,请在输入小时数字段中输入小时数。该值必须介于 1 小时 (
1
) 到 7 天 (168
) 之间。
可选:如需更改启动磁盘类型或映像的默认值,请在启动磁盘部分中,点击更改。然后,按照提示更改启动磁盘。
点击创建。
将
--maintenance-policy
标志设置为TERMINATE
。将
--instance-termination-action
标志设置为DELETE
。--max-run-duration
标志。将
--provisioning-model
标志设置为FLEX_START
。将
--reservation-affinity
标志设置为none
。INSTANCE_TEMPLATE_NAME
:要创建的实例模板的名称。IMAGE_PROJECT
:映像所属的映像项目;例如debian-cloud
。如需详细了解支持的映像项目,请参阅公共映像。IMAGE_FAMILY
:映像系列。此项指定最新的未弃用操作系统映像。例如,如果您指定debian-12
,则系统会使用 Debian 12 映像系列中的最新版本。如需详细了解如何使用映像系列,请参阅映像系列最佳实践。REGION
:要在其中创建实例模板的区域。MACHINE_TYPE
:GPU 机器类型。如果您指定 N1 机器类型,请添加--accelerator
标志以定义要挂接到虚拟机的 GPU 数量和类型。RUN_DURATION
:您希望请求的虚拟机运行的时长。您必须将该值的格式设置为天数、小时数、分钟数或秒数,并分别添加对应的后缀d
、h
、m
或s
。例如,指定30m
表示 30 分钟,或指定1d2h3m4s
表示 1 天 2 小时 3 分钟 4 秒。该值必须介于 10 分钟到 7 天之间。如需创建区域级实例模板:
beta.regionInstanceTemplates.insert
方法如需创建全球实例模板:
beta.instanceTemplates.insert
方法设置为
TERMINATE
的scheduling.onHostMaintenance
字段。设置为
DELETE
的scheduling.instanceTerminationAction
字段。scheduling.maxRunDuration
字段。设置为
FLEX_START
的scheduling.provisioningModel
字段。设置为
NO_RESERVATION
的reservationAffinity.consumeReservationType
字段。PROJECT_ID
:要创建实例模板的项目 ID。REGION
:要在其中创建实例模板的区域。INSTANCE_TEMPLATE_NAME
:要创建的实例模板的名称。IMAGE_PROJECT
:映像所属的映像项目;例如debian-cloud
。如需详细了解支持的映像项目,请参阅公共映像。IMAGE
:指定以下其中一项:MACHINE_TYPE
:GPU 机器类型。如果您指定 N1 机器类型,请在请求正文中添加guestAccelerators
字段,以定义要挂接到虚拟机的 GPU 数量和类型。RUN_DURATION
:您希望请求的虚拟机运行的时长(以秒为单位)。该值必须介于600
(600 秒,即 10 分钟)到604800
(604,800 秒,即 7 天)之间。将 MIG 的更新类型设置为寻机更新(默认)。
如果您在 MIG 中配置了自动扩缩,请删除自动扩缩配置。
如果您使用的是区域级 MIG,请将目标分布形状设置为
ANY_SINGLE_ZONE
。在 Trusted Cloud 控制台中,前往实例群组页面。
点击创建实例组。 此时会打开创建实例组页面。
在名称字段中,输入 MIG 的名称。
在选择实例模板之前,您必须删除自动扩缩配置并关闭修复,如下所示:
如需删除自动扩缩配置,请执行以下操作:
在自动扩缩部分中,点击自动扩缩模式列表,然后点击删除自动扩缩配置。
在确认对话框中点击删除。
如需关闭修复功能,请在虚拟机实例生命周期部分中,点击失败时的默认操作列表,然后选择无操作。
返回到实例模板字段。在实例模板列表中,选择您在上一部分中创建的实例模板。 如果您选择区域级实例模板,则系统会将区域列表设置为该模板的区域。
执行下列其中一项操作:
如需在创建 MIG 时创建规模调整请求,请执行以下操作:
在实例数字段中,输入您要一次性创建的所有虚拟机的数量。
选中使用规模调整请求,一次创建所有虚拟机复选框。
可选:如需为虚拟机指定与在实例模板中设置的运行时长不同的运行时长,请在请求的运行时长字段和单位列表中指定运行时长。时长必须介于 1 小时到 7 天之间。
如需在创建 MIG 后创建调整大小请求,请在实例数量字段中输入
0
。
在位置部分中,指定您是要创建可用区级 MIG 还是区域级 MIG,如下所示:
如需创建可用区级 MIG,请选择单个可用区。或者,如需创建区域 MIG,请选择多个可用区。
选择 MIG 的区域和可用区。
如果您要创建区域级 MIG,请执行以下操作:
在目标分布形状字段中,选择任意单个可用区。
在显示的对话框中,点击停用实例重新分配。
点击创建。
如需创建可用区级 MIG,请运行以下命令:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
如需创建区域级 MIG,请运行以下命令:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --region=REGION \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none \ --default-action-on-vm-failure=do_nothing
INSTANCE_GROUP_NAME
:要创建的 MIG 的名称。INSTANCE_TEMPLATE_URL
:您在上一部分中创建的实例模板的部分网址。如果您要使用区域级实例模板创建 MIG,则只能在模板的区域内创建 MIG。请指定以下某个值:对于区域级实例模板:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
对于全球实例模板:
INSTANCE_TEMPLATE_NAME
ZONE
:要在其中创建 MIG 的可用区。REGION
:要在其中创建 MIG 的区域。如需创建可用区级 MIG,请使用
instanceGroupManagers.insert
方法发送POST
请求,如下所示:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
如需创建区域级 MIG,请使用
regionInstanceGroupManagers.insert
方法发送POST
请求,如下所示:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE" }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
PROJECT_ID
:您在上一部分中创建的实例模板所在项目的 ID。INSTANCE_TEMPLATE_URL
:您在上一部分中创建的实例模板的部分网址。如果您要使用区域级实例模板创建 MIG,则只能在模板的区域内创建 MIG。请指定以下某个值:对于区域级实例模板:
regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
对于全球实例模板:
global/instanceTemplates/INSTANCE_TEMPLATE_NAME
ZONE
:要在其中创建 MIG 的可用区。REGION
:要在其中创建 MIG 的区域。INSTANCE_GROUP_NAME
:要创建的 MIG 的名称。在 Trusted Cloud 控制台中,前往实例群组页面。
在名称列中,点击要在其中创建规模调整请求的 MIG 的名称。
系统会打开此 MIG 的概览页面。
在调整大小请求行中,点击
修改调整大小请求。点击
新建规模调整请求。系统会显示新建调整大小请求窗格。
在名称字段中,输入规模调整请求的名称。
在需要的额外实例数量字段中,输入要一次性添加到 MIG 的所有虚拟机的数量。
可选:如需为虚拟机指定与在实例模板中设置的运行时长不同的运行时长,请在请求的运行时长和单位字段中指定运行时长。时长必须介于 1 小时到 7 天之间。
点击创建。
如需在可用区级 MIG 中创建规模调整请求,请使用
instance-groups managed resize-requests create
命令。gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
如需在区域级 MIG 中创建规模调整请求,请使用
beta instance-groups managed resize-requests create
命令。gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
INSTANCE_GROUP_NAME
:已配置为在其中创建规模调整请求的 MIG 的名称。RESIZE_REQUEST_NAME
:调整大小请求的名称,该名称在指定的 MIG 中必须是唯一的。否则,创建调整大小请求的操作将失败。COUNT
:要同时添加到 MIG 的虚拟机数量。ZONE
:MIG 所在的可用区。REGION
:MIG 所在的区域。如果您想为虚拟机指定与在 MIG 的实例模板中设置的运行时长不同的运行时长,请添加
--requested-run-duration
标志。如果您的工作负载需要特定的虚拟机名称,您可以使用
beta instance-groups managed resize-requests create
命令指定要创建的虚拟机的名称列表。在该命令中,将--resize-request
标志替换为--instances
标志。如需在可用区级 MIG 中创建规模调整请求,请使用
instanceGroupManagerResizeRequests.insert
方法发送POST
请求。POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
如需在区域级 MIG 中创建规模调整请求,请使用
beta.regionInstanceGroupManagerResizeRequests.insert
方法发送POST
请求。PROJECT_ID
:指定 MIG 所在项目的 ID。ZONE
:MIG 所在的可用区。REGION
:MIG 所在的区域。INSTANCE_GROUP_NAME
:已配置为在其中创建规模调整请求的 MIG 的名称。RESIZE_REQUEST_NAME
:调整大小请求的名称,该名称在指定的 MIG 中必须是唯一的。否则,创建调整大小请求的操作将失败。COUNT
:要同时添加到 MIG 的虚拟机数量。如果您想为虚拟机指定与在 MIG 的实例模板中设置的运行时长不同的运行时长,请在请求正文中添加
requestedRunDuration
字段。如果您的工作负载需要特定的虚拟机名称,您可以指定要创建的虚拟机的名称列表。为此,请向
beta.regionInstanceGroupManagerResizeRequests.insert
方法(对于区域级 MIG)或beta.instanceGroupManagerResizeRequests.insert
方法(对于可用区级 MIG)发送POST
请求。在请求正文中,将resizeBy
字段替换为instanceNames
字段。了解如何查看有关 MIG 和拖管式虚拟机的信息。
REST
如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的凭据。
After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:
gcloud init
如需了解详情,请参阅 Trusted Cloud 身份验证文档中的使用 REST 时进行身份验证。
所需的角色
如需获得创建 MIG 规模调整请求所需的权限,请让您的管理员为您授予项目的 Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) IAM 角色。如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。此预定义角色包含创建 MIG 规模调整请求所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
您需要具备以下权限才能创建 MIG 规模调整请求:
为调整大小请求准备 MIG
如需创建 MIG 规模调整请求,您必须按以下部分所述配置实例模板和 MIG。
创建实例模板
如需创建为创建 MIG 规模调整请求而配置的实例模板,请在模板中指定以下内容:
如需创建为创建 MIG 规模调整请求而配置的实例模板,请选择以下选项之一:
控制台
gcloud
如需创建为创建 MIG 规模调整请求而配置的实例模板,请使用带有以下标志的
beta instance-templates create
命令:以下命令会创建一个区域级实例模板。如需创建全球实例模板,请使用相同命令,但不带
--instance-template-region
标志。gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-termination-action=DELETE \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --max-run-duration=RUN_DURATION \ --provisioning-model=FLEX_START \ --reservation-affinity=none
替换以下内容:
REST
如需创建为在 MIG 中创建规模调整请求而配置的实例模板,请向以下方法之一发出
POST
请求:在请求正文中,添加以下字段:
例如,如需创建区域级实例模板,请发出
POST
请求,如下所示:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "instanceTerminationAction": "DELETE", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE", "provisioningModel": "FLEX_START" } } }
替换以下内容:
如需详细了解如何创建实例模板,请参阅创建实例模板。
创建或更新 MIG
按照上一部分中所述创建实例模板后,使用该实例模板创建 MIG(如下所示)或更新 MIG。此外,您必须执行以下操作来准备用于处理调整大小请求的 MIG:
如需创建与规模调整请求兼容的 MIG,请选择以下选项之一:
控制台
gcloud
使用
instance-groups managed create
命令,并将--default-action-on-vm-failure
标志设置为do_nothing
。如果您要创建区域级 MIG,则还必须添加设置为any-single-zone
的--target-distribution-shape
标志以及设置为none
的--instance-redistribution-type
标志。替换以下内容:
REST
替换以下内容:
在 MIG 中创建调整大小请求
在创建 MIG 规模调整请求之前,请确保已按照上一部分所述准备好 MIG。
创建规模调整请求且所有请求的资源都可用后,MIG 会按请求的数量同时创建所有虚拟机。虚拟机会一直运行,直到 MIG 在指定运行时长结束后删除它们或直到您删除它们。
如需在 MIG 中创建规模调整请求,请选择以下选项之一。如需通过规模调整请求将具有特定名称的虚拟机添加到 MIG,请使用 gcloud CLI 或 REST API。
控制台
gcloud
替换以下内容:
您可酌情执行以下操作:
REST
在请求正文中,添加以下各项:
{ "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
替换以下内容:
您可酌情执行以下操作:
后续步骤
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-06-25。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-06-25。"],[[["This document guides users on creating resize requests in a managed instance group (MIG) for virtual machines (VMs) with attached GPUs to optimize resource allocation."],["Before creating a resize request, users must review how resize requests work, check their GPU quota, and set up authentication for Google Cloud services."],["Users must prepare a MIG for resize requests by configuring an instance template that stops VMs during host maintenance events and does not use reservations."],["To prepare the MIG for resize requests, set the MIG's update type to opportunistic, turn off repairs, delete the autoscaling configuration, and if using a regional MIG, set the target distribution shape to `ANY_SINGLE_ZONE`."],["A resize request involves specifying the number of VMs to add all at once and defining the duration these VMs will run, with a range between 1 hour and 7 days."]]],[]] -