Ce document explique comment créer des demandes de redimensionnement dans un groupe d'instances géré (MIG) constitué d'instances de machine virtuelle (VM), auxquelles des GPU sont associés. Pour en savoir plus sur les requêtes de redimensionnement, consultez À propos des requêtes de redimensionnement dans un MIG.
La création d'une requête de redimensionnement de MIG vous aide à obtenir des ressources à forte demande, comme des GPU, et à optimiser les coûts en créant le nombre exact de VM en une seule fois. Pour créer une requête de redimensionnement de MIG pouvant utiliser les fonctionnalités et les services disponibles dans Cluster Director, consultez Créer un MIG et une requête de redimensionnement dans la documentation AI Hypercomputer.
Avant de commencer
- Pour utiliser les requêtes de redimensionnement de MIG afin de créer des VM dès que des ressources sont disponibles pour les charges de travail qui s'exécutent pendant sept jours maximum, vérifiez que vous disposez d'un quota standard ou préemptible suffisant pour les ressources demandées. Pour en savoir plus, consultez Vérifier le quota de GPU.
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification est le processus permettant de valider votre identité pour accéder aux services et aux API Trusted Cloud by S3NS .
Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Installez la Google Cloud CLI, puis connectez-vous à la gcloud CLI avec votre identité fédérée. Après vous être connecté, initialisez Google Cloud CLI en exécutant la commande suivante :
gcloud init
- Set a default region and zone.
REST
Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.
Installez la Google Cloud CLI, puis connectez-vous à la gcloud CLI avec votre identité fédérée. Après vous être connecté, initialisez Google Cloud CLI en exécutant la commande suivante :
gcloud init
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Trusted Cloud .
Rôles requis
Pour obtenir les autorisations nécessaires à la création de requêtes de redimensionnement de MIG, demandez à votre administrateur de vous attribuer le rôle IAM Administrateur d'instances Compute (v1) (
roles/compute.instanceAdmin.v1
) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.Ce rôle prédéfini contient les autorisations requises pour créer des demandes de redimensionnement de MIG. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Vous devez disposer des autorisations suivantes pour créer des requêtes de redimensionnement de MIG :
-
Pour créer un modèle d'instance :
compute.instanceTemplates.create
sur le projet. -
Pour créer un MIG zonal :
compute.instanceGroupManagers.create
sur le projet. -
Pour créer une demande de redimensionnement de MIG :
compute.instanceGroupManagers.update
sur le projet
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Préparer un MIG pour les demandes de redimensionnement
Pour créer des demandes de redimensionnement de MIG, vous devez configurer un modèle d'instance et le MIG comme décrit dans les sections suivantes.
Créer un modèle d'instance
En fonction de votre cas d'utilisation pour les demandes de redimensionnement de MIG, créez un modèle d'instance à l'aide de l'une des méthodes suivantes :
Si vous souhaitez créer des VM dès que des ressources sont disponibles pour les charges de travail qui s'exécutent pendant sept jours maximum, créez un modèle d'instance à l'aide du modèle de provisionnement Démarrage flexible.
Si vous souhaitez créer des VM en consommant une réservation créée automatiquement pour une réservation future en mode calendrier, créez un modèle d'instance à l'aide du modèle de provisionnement lié à la réservation.
Utiliser le modèle de provisionnement Démarrage flexible
Pour créer un modèle d'instance configuré pour les demandes de redimensionnement de MIG et pour créer des VM dès que des ressources sont disponibles, vous devez spécifier les éléments suivants dans le modèle :
Utilisez un type de machine GPU, à l'exception du type de machine A4X.
Arrêt des VM lors des événements de maintenance de l'hôte.
Supprimez les VM à la fin de leur durée d'exécution à l'aide des champs
maxRunDuration
etinstanceTerminationAction
.Utilisez le modèle de provisionnement Démarrage flexible.
Pour créer un modèle d'instance, sélectionnez l'une des options suivantes :
Console
Dans la console Trusted Cloud , accédez à la page Modèles d'instances.
Cliquez sur Créer un modèle d'instance. La page Créer un modèle d'instance s'ouvre.
Dans le champ Nom, saisissez un nom pour le modèle d'instance.
Dans la section Emplacement, sélectionnez l'une des options suivantes :
Pour créer un modèle d'instance régional, sélectionnez Régional (recommandé), puis sélectionnez la région dans laquelle créer le modèle.
Pour créer un modèle d'instance global, sélectionnez Global.
Dans la section Configuration de la machine, procédez comme suit :
Cliquez sur l'onglet GPU.
Dans la liste Type de GPU, sélectionnez un type de GPU.
Dans la liste Nombre de GPU, sélectionnez le nombre de GPU.
Facultatif : Si le type de GPU choisi est compatible avec les postes de travail virtuels NVIDIA RTX (vWS) pour les charges de travail graphiques et que vous prévoyez d'exécuter des charges de travail graphiques lourdes, sélectionnez Activer le poste de travail virtuel (NVIDIA GRID).
Dans la section Type de machine, sélectionnez un type de machine.
Dans la section Modèle de provisionnement, procédez comme suit :
Dans le champ Modèle de provisionnement de VM, sélectionnez Démarrage flexible.
Développez Paramètres avancés du modèle de provisionnement de VM.
Cochez la case Définir une limite de temps pour la VM.
Pour définir une durée d'exécution pour les VM créées à partir du modèle d'instance, saisissez le nombre d'heures dans le champ Saisissez le nombre d'heures. La valeur doit être comprise entre 36 secondes (
0.01
) et sept jours (168
).
Pour modifier le type ou l'image de disque de démarrage par défaut, cliquez sur Modifier dans la section Disque de démarrage. Suivez ensuite les instructions pour modifier le disque de démarrage.
Cliquez sur Créer.
gcloud
Pour créer un modèle d'instance, utilisez la commande
beta instance-templates create
avec les options suivantes :L'option
--instance-termination-action
est définie surDELETE
.L'option
--maintenance-policy
est définie surTERMINATE
.L'option
--max-run-duration
L'option
--provisioning-model
est définie surFLEX_START
.L'option
--reservation-affinity
est définie surnone
.
Par exemple, pour créer un modèle d'instance régional, exécutez la commande suivante. Si vous souhaitez créer un modèle d'instance global, utilisez la même commande sans l'option
--instance-template-region
.gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-template-region=REGION \ --instance-termination-action=DELETE \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --max-run-duration=RUN_DURATION \ --provisioning-model=FLEX_START \ --reservation-affinity=none
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME
: nom du modèle d'instance à créer.IMAGE_PROJECT
: projet contenant l'image, par exemple,debian-cloud
. Pour en savoir plus sur les projets d'image compatibles, consultez la page Images publiques.IMAGE_FAMILY
: famille d'images. Cela permet de spécifier l'image d'OS non obsolète la plus récente. Par exemple, si vous spécifiezdebian-12
, la dernière version de la famille d'images Debian 12 est utilisée. Pour en savoir plus sur l'utilisation des familles d'images, consultez la page Bonnes pratiques concernant les familles d'images.REGION
: région dans laquelle créer le modèle d'instance.MACHINE_TYPE
: type de machine GPU à utiliser pour les VM. Si vous spécifiez un type de machine N1, vous devez inclure l'option--accelerator
pour définir le nombre et le type de GPU à associer à vos VM.RUN_DURATION
: durée d'exécution des VM demandées. Vous devez formater la valeur en nombre de jours, d'heures, de minutes ou de secondes, suivis respectivement ded
,h
,m
ets
. Par exemple, spécifiez30m
pour 30 minutes ou1d2h3m4s
pour un jour, deux heures, trois minutes et quatre secondes. Cette valeur doit être comprise entre 10 minutes et sept jours.
REST
Pour créer un modèle d'instance, envoyez une requête
POST
à l'une des méthodes suivantes :Pour créer un modèle d'instance régional : méthode
regionInstanceTemplates.insert
en version bêtaPour créer un modèle d'instance global : méthode
instanceTemplates.insert
bêta
Dans le corps de la requête, incluez les champs suivants :
Le champ
reservationAffinity.consumeReservationType
est défini surNO_RESERVATION
.Le champ
scheduling.instanceTerminationAction
défini surDELETE
.Le champ
scheduling.maxRunDuration
Le champ
scheduling.onHostMaintenance
défini surTERMINATE
.Le champ
scheduling.provisioningModel
défini surFLEX_START
.
Par exemple, pour créer un modèle d'instance régional, envoyez une requête comme suit :
POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "instanceTerminationAction": "DELETE", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE", "provisioningModel": "FLEX_START" } } }
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel créer le modèle d'instance.REGION
: région dans laquelle créer le modèle d'instance.INSTANCE_TEMPLATE_NAME
: nom du modèle d'instance à créer.IMAGE_PROJECT
: projet contenant l'image, par exemple,debian-cloud
. Pour en savoir plus sur les projets d'image compatibles, consultez la page Images publiques.IMAGE
: spécifiez l'une des options suivantes :Version spécifique de l'image de l'OS. Exemple :
debian-12-bookworm-v20240617
Une famille d'images, qui doit être au format
family/IMAGE_FAMILY
. Cela permet de spécifier l'image d'OS non obsolète la plus récente. Par exemple, si vous spécifiezfamily/debian-12
, la dernière version de la famille d'images Debian 12 est utilisée. Pour en savoir plus sur l'utilisation des familles d'images, consultez la page Bonnes pratiques concernant les familles d'images.
MACHINE_TYPE
: type de machine GPU à utiliser pour les VM. Si vous spécifiez un type de machine N1, vous devez inclure le champguestAccelerators
pour définir le nombre et le type de GPU à associer à vos VM.RUN_DURATION
: durée, en secondes, pendant laquelle vous souhaitez que les VM demandées s'exécutent. La valeur doit être comprise entre600
, soit 600 secondes (10 minutes), et604800
, soit 604 800 secondes (sept jours).
Pour en savoir plus sur la création d'un modèle d'instance, consultez la section Créer des modèles d'instances.
Utiliser le modèle de provisionnement lié à une réservation
Pour créer un modèle d'instance configuré pour les demandes de redimensionnement de MIG et pour l'utilisation d'une réservation, vous devez spécifier les éléments suivants dans le modèle :
Utilisez un type de machine A4 ou A3 Ultra, comme indiqué dans la réservation.
Arrêt des VM lors des événements de maintenance de l'hôte.
Supprimez les VM à la fin de la période de réservation à l'aide du champ
instanceTerminationAction
.Utilisez le modèle de provisionnement lié à une réservation.
Pour créer un modèle d'instance, sélectionnez l'une des options suivantes :
Console
Dans la console Trusted Cloud , accédez à la page Modèles d'instances.
Cliquez sur Créer un modèle d'instance. La page Créer un modèle d'instance s'ouvre.
Dans le champ Nom, saisissez un nom pour le modèle d'instance.
Dans la section Emplacement, sélectionnez l'une des options suivantes :
Pour créer un modèle d'instance régional, sélectionnez Régional (recommandé), puis sélectionnez la région dans laquelle créer le modèle.
Pour créer un modèle d'instance global, sélectionnez Global.
Dans la section Configuration de la machine, procédez comme suit :
Cliquez sur l'onglet GPU.
Dans la liste Type de GPU, sélectionnez l'une des options suivantes, comme indiqué dans la réservation que vous souhaitez utiliser :
Pour utiliser les VM A4 : NVIDIA B200 180 Go
Pour utiliser les VM A3 Ultra : NVIDIA H200 141 Go
Cette action définit automatiquement le modèle de provisionnement du modèle d'instance sur Lié à une réservation.
Dans la liste Nombre de GPU, sélectionnez le nombre de GPU.
Facultatif : Si le type de GPU choisi est compatible avec les postes de travail virtuels NVIDIA RTX (vWS) pour les charges de travail graphiques et que vous prévoyez d'exécuter des charges de travail graphiques lourdes, sélectionnez Activer le poste de travail virtuel (NVIDIA GRID).
Dans la section Type de machine, sélectionnez un type de machine.
Dans la section Modèle de provisionnement, procédez comme suit :
Développez Paramètres avancés du modèle de provisionnement de VM.
Dans la liste À l'arrêt de la VM, sélectionnez Supprimer.
Pour modifier le type ou l'image de disque de démarrage par défaut, cliquez sur Modifier dans la section Disque de démarrage. Suivez ensuite les instructions pour modifier le disque de démarrage.
Développez la section Options avancées et procédez comme suit :
Développez la section Gestion.
Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation. Dans le volet qui s'affiche, suivez les instructions pour sélectionner la réservation que vous souhaitez utiliser.
Cliquez sur Créer.
gcloud
Pour créer un modèle d'instance, utilisez la commande
instance-templates create
avec les options suivantes :L'option
--instance-termination-action
est définie surDELETE
.L'option
--maintenance-policy
est définie surTERMINATE
.L'option
--provisioning-model
est définie surRESERVATION_BOUND
.L'option
--reservation-affinity
est définie surspecific
.L'option
--reservation
Par exemple, pour créer un modèle d'instance régional, exécutez la commande suivante. Si vous souhaitez créer un modèle d'instance global, utilisez la même commande sans l'option
--instance-template-region
.gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-termination-action=DELETE \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME
: nom du modèle d'instance à créer.IMAGE_PROJECT
: projet contenant l'image, par exemple,debian-cloud
. Pour en savoir plus sur les projets d'image compatibles, consultez la page Images publiques.IMAGE_FAMILY
: famille d'images. Cela permet de spécifier l'image d'OS non obsolète la plus récente. Par exemple, si vous spécifiezdebian-12
, la dernière version de la famille d'images Debian 12 est utilisée. Pour en savoir plus sur l'utilisation des familles d'images, consultez la page Bonnes pratiques concernant les familles d'images.REGION
: région dans laquelle créer le modèle d'instance.MACHINE_TYPE
: type de machine A4 ou A3 Ultra spécifié dans la réservation que vous souhaitez consommer.RESERVATION_URL
: URL de la réservation créée automatiquement pour une réservation future en mode calendrier que vous souhaitez utiliser. Spécifiez une des valeurs suivantes :Si la réservation créée automatiquement existe dans votre projet :
RESERVATION_NAME
.Si la réservation créée automatiquement existe dans un autre projet :
projects/PROJECT_ID/reservations/RESERVATION_NAME
.
REST
Pour créer un modèle d'instance, envoyez une requête
POST
à l'une des méthodes suivantes :Pour créer un modèle d'instance régional : méthode
regionInstanceTemplates.insert
Pour créer un modèle d'instance global : méthode
instanceTemplates.insert
Dans le corps de la requête, incluez les champs suivants :
Le champ
reservationAffinity.consumeReservationType
est défini surSPECIFIC_RESERVATION
.Le champ
reservationAffinity.key
est défini surcompute.googleapis.com/reservation-name
.Le champ
reservationAffinity.values
défini sur l'URL de la réservation créée automatiquement.Le champ
scheduling.instanceTerminationAction
défini surDELETE
.Le champ
scheduling.onHostMaintenance
défini surTERMINATE
.Le champ
scheduling.provisioningModel
défini surRESERVATION_BOUND
.
Par exemple, pour créer un modèle d'instance régional, envoyez une requête comme suit :
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values": [ "RESERVATION_URL" ] }, "scheduling": { "instanceTerminationAction": "DELETE", "onHostMaintenance": "TERMINATE", "provisioningModel": "RESERVATION_BOUND" } } }
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel créer le modèle d'instance.REGION
: région dans laquelle créer le modèle d'instance.INSTANCE_TEMPLATE_NAME
: nom du modèle d'instance à créer.IMAGE_PROJECT
: projet contenant l'image, par exemple,debian-cloud
. Pour en savoir plus sur les projets d'image compatibles, consultez la page Images publiques.IMAGE
: spécifiez l'une des options suivantes :Version spécifique de l'image de l'OS. Exemple :
debian-12-bookworm-v20240617
Une famille d'images, qui doit être au format
family/IMAGE_FAMILY
. Cela permet de spécifier l'image d'OS non obsolète la plus récente. Par exemple, si vous spécifiezfamily/debian-12
, la dernière version de la famille d'images Debian 12 est utilisée. Pour en savoir plus sur l'utilisation des familles d'images, consultez la page Bonnes pratiques concernant les familles d'images.
MACHINE_TYPE
: type de machine A4 ou A3 Ultra spécifié dans la réservation que vous souhaitez consommer.RESERVATION_URL
: URL de la réservation créée automatiquement pour une réservation future en mode calendrier que vous souhaitez utiliser. Spécifiez une des valeurs suivantes :Si la réservation créée automatiquement existe dans votre projet :
RESERVATION_NAME
Si la réservation créée automatiquement existe dans un autre projet :
projects/PROJECT_ID/reservations/RESERVATION_NAME
Pour en savoir plus sur la création d'un modèle d'instance, consultez la section Créer des modèles d'instances.
Créer ou mettre à jour un MIG
Après avoir créé le modèle d'instance comme décrit dans la section précédente, utilisez-le pour créer un MIG comme suit ou pour mettre à jour un MIG. En outre, vous devez effectuer les opérations suivantes pour préparer le MIG aux requêtes de redimensionnement :
Définissez le type de mise à jour du MIG sur une mise à jour opportuniste (par défaut).
Si vous avez configuré l'autoscaling dans le MIG, supprimez la configuration de l'autoscaling.
Si vous utilisez un MIG régional, définissez la forme de distribution cible sur
ANY_SINGLE_ZONE
.
Pour créer un MIG compatible avec les demandes de redimensionnement, sélectionnez l'une des options suivantes :
Console
Dans la console Trusted Cloud , accédez à la page Groupes d'instances.
Cliquez sur Créer un groupe d'instances. La page Créer un groupe d'instances s'ouvre.
Dans le champ Nom, saisissez un nom pour le MIG.
Avant de sélectionner un modèle d'instance, vous devez supprimer la configuration d'autoscaling et désactiver les réparations comme suit :
Pour supprimer la configuration d'autoscaling, procédez comme suit :
Dans la section Autoscaling, cliquez sur la liste Mode d'autoscaling, puis sur Supprimer la configuration d'autoscaling.
Dans la boîte de dialogue de confirmation, cliquez sur Supprimer.
Pour désactiver les réparations, dans la section Cycle de vie d'une instance de VM, cliquez sur la liste Action par défaut en cas d'échec, puis sélectionnez Aucune action.
Revenez au champ Modèle d'instance. Dans la liste Modèle d'instance, sélectionnez le modèle d'instance que vous avez créé dans la section précédente. Si vous sélectionnez un modèle d'instance régional, la liste Région est définie sur la région du modèle.
Effectuez l'une des opérations suivantes :
Pour créer une demande de redimensionnement lorsque vous créez le MIG, procédez comme suit :
Dans le champ Nombre d'instances, saisissez le nombre de VM que vous souhaitez créer simultanément.
Cochez la case Utiliser la requête de redimensionnement pour créer plusieurs VM à la fois.
Facultatif : Si le modèle d'instance du MIG spécifie une durée d'exécution, vous pouvez en spécifier une autre. Pour ce faire, spécifiez une durée d'exécution dans le champ Durée d'exécution demandée et dans la liste Unité. Vous devez spécifier une durée comprise entre une heure et sept jours.
Pour créer une demande de redimensionnement après avoir créé le MIG, saisissez
0
dans le champ Nombre d'instances.
Dans la section Emplacement, indiquez si vous souhaitez créer un MIG zonal ou régional :
Pour créer un MIG zonal, sélectionnez Zone unique. Pour créer un MIG régional, sélectionnez Plusieurs zones.
Sélectionnez la région et les zones du MIG.
Si vous créez un MIG régional, procédez comme suit :
Dans le champ Forme de distribution cible, sélectionnez Une des zones.
Dans la boîte de dialogue qui s'affiche, cliquez sur Désactiver la redistribution des instances.
Cliquez sur Créer.
gcloud
Exécutez la commande
instance-groups managed create
avec l'option--default-action-on-vm-failure
définie surdo_nothing
. Si vous créez un MIG régional, vous devez également inclure l'option--target-distribution-shape
définie surany-single-zone
et l'option--instance-redistribution-type
définie surnone
.Pour créer un MIG zonal, exécutez la commande suivante :
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Pour créer un MIG régional, exécutez la commande suivante :
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --region=REGION \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none \ --default-action-on-vm-failure=do_nothing
Remplacez les éléments suivants :
INSTANCE_GROUP_NAME
: nom du MIG à créer.INSTANCE_TEMPLATE_URL
: URL partielle du modèle d'instance que vous avez créé dans la section précédente. Si vous souhaitez utiliser un modèle d'instance régional pour créer le MIG, vous ne pouvez le créer que dans la région du modèle. Spécifiez l'une des valeurs suivantes :Pour un modèle d'instance régional :
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
Pour un modèle d'instance global :
INSTANCE_TEMPLATE_NAME
ZONE
: zone dans laquelle créer le MIG.REGION
: région dans laquelle créer le MIG.
REST
Pour créer un MIG zonal, envoyez une requête
POST
à l'aide de la méthodeinstanceGroupManagers.insert
comme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Pour créer un MIG régional, envoyez une requête
POST
à l'aide de la méthoderegionInstanceGroupManagers.insert
comme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE" }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel se trouve le modèle d'instance que vous avez créé dans la section précédente.INSTANCE_TEMPLATE_URL
: URL partielle du modèle d'instance que vous avez créé dans la section précédente. Si vous souhaitez utiliser un modèle d'instance régional pour créer le MIG, vous ne pouvez le créer que dans la région du modèle. Spécifiez l'une des valeurs suivantes :Pour un modèle d'instance régional :
regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
Pour un modèle d'instance global :
global/instanceTemplates/INSTANCE_TEMPLATE_NAME
ZONE
: zone dans laquelle créer le MIG.REGION
: région dans laquelle créer le MIG.INSTANCE_GROUP_NAME
: nom du MIG à créer.
Créer une demande de redimensionnement dans un MIG
Avant de créer des demandes de redimensionnement de MIG, assurez-vous d'avoir préparé le MIG comme décrit dans la section précédente.
Une fois que vous avez créé une requête de redimensionnement et que toutes les ressources demandées sont disponibles, le MIG crée le nombre de VM demandé en une fois. Les VM s'exécutent jusqu'à ce que le MIG les supprime, à l'issue de la durée d'exécution spécifiée, ou jusqu'à ce que vous supprimiez les VM.
Pour créer une demande de redimensionnement dans un MIG, sélectionnez l'une des options suivantes. Pour ajouter des VM avec des noms spécifiques au MIG via une demande de redimensionnement, utilisez la gcloud CLI ou l'API REST.
Console
Dans la console Trusted Cloud , accédez à la page Groupes d'instances.
Dans la colonne Nom, cliquez sur le nom du MIG dans lequel vous souhaitez créer la demande de redimensionnement.
La page de présentation du MIG s'affiche.
Sur la ligne Demandes de redimensionnement, cliquez sur
Modifier les demandes de redimensionnement.Cliquez sur
Nouvelle demande de redimensionnement.Le volet Nouvelles demandes de redimensionnement s'affiche.
Dans le champ Nom, saisissez le nom de la demande de redimensionnement.
Dans le champ Nombre d'instances supplémentaires nécessaires, saisissez le nombre de VM à ajouter simultanément au MIG.
Facultatif : Si le modèle d'instance du MIG spécifie une durée d'exécution, vous pouvez en spécifier une autre. Pour ce faire, spécifiez une durée d'exécution dans le champ Durée d'exécution demandée et dans la liste Unité. Vous devez spécifier une durée comprise entre une heure et sept jours.
Cliquez sur Créer.
gcloud
Pour créer une demande de redimensionnement dans un MIG zonal, utilisez la commande
instance-groups managed resize-requests create
.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
Pour créer une demande de redimensionnement dans un MIG régional, utilisez la commande
beta instance-groups managed resize-requests create
.gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
Remplacez les éléments suivants :
INSTANCE_GROUP_NAME
: nom du MIG configuré pour y créer des demandes de redimensionnement.RESIZE_REQUEST_NAME
: nom de la requête de redimensionnement, qui doit être unique dans le MIG spécifié. Sinon, la création de la demande de redimensionnement échoue.COUNT
: nombre de VM à ajouter simultanément au MIG.ZONE
: zone où se trouve le MIG.REGION
: région où se trouve le MIG.
Vous pouvez également effectuer les opérations suivantes :
Si le modèle d'instance du MIG spécifie une durée d'exécution, vous pouvez en spécifier une autre. Pour ce faire, incluez l'option
--requested-run-duration
dans la commande. Vous devez spécifier une durée comprise entre 10 minutes et sept jours.Si votre charge de travail nécessite des noms de VM spécifiques, vous pouvez spécifier une liste de noms de VM à créer à l'aide de la commande
beta instance-groups managed resize-requests create
. Dans la commande, remplacez l'option--resize-request
par l'option--instances
.
REST
Pour créer une demande de redimensionnement dans un MIG zonal, envoyez une requête
POST
à l'aide de la méthodeinstanceGroupManagerResizeRequests.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
Pour créer une demande de redimensionnement dans un MIG régional, envoyez une requête
POST
à l'aide de la méthodebeta.regionInstanceGroupManagerResizeRequests.insert
.
Dans le corps de la requête, incluez les éléments suivants :
{ "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel se trouve le MIG spécifié.ZONE
: zone où se trouve le MIG.REGION
: région où se trouve le MIG.INSTANCE_GROUP_NAME
: nom du MIG configuré pour y créer des demandes de redimensionnement.RESIZE_REQUEST_NAME
: nom de la requête de redimensionnement, qui doit être unique dans le MIG spécifié. Sinon, la création de la demande de redimensionnement échoue.COUNT
: nombre de VM à ajouter simultanément au MIG.
Vous pouvez également effectuer les opérations suivantes :
Si le modèle d'instance du MIG spécifie une durée d'exécution, vous pouvez en spécifier une autre. Pour ce faire, incluez le champ
requestedRunDuration
dans le corps de la requête. Vous devez spécifier une durée, en secondes, comprise entre 10 minutes et sept jours.Si votre charge de travail nécessite des noms de VM spécifiques, vous pouvez spécifier une liste de noms de VM à créer. Pour ce faire, envoyez une requête
POST
à la méthodebeta.regionInstanceGroupManagerResizeRequests.insert
pour un MIG régional ou à la méthodebeta.instanceGroupManagerResizeRequests.insert
pour un MIG zonal. Dans le corps de la requête, remplacez le champresizeBy
par le champinstanceNames
.
Étapes suivantes
Découvrez comment afficher, annuler ou supprimer des demandes de redimensionnement dans un MIG.
Découvrez comment afficher des informations sur les MIG et les VM gérées.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/08 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/08/08 (UTC)."],[[["This document guides users on creating resize requests in a managed instance group (MIG) for virtual machines (VMs) with attached GPUs to optimize resource allocation."],["Before creating a resize request, users must review how resize requests work, check their GPU quota, and set up authentication for Google Cloud services."],["Users must prepare a MIG for resize requests by configuring an instance template that stops VMs during host maintenance events and does not use reservations."],["To prepare the MIG for resize requests, set the MIG's update type to opportunistic, turn off repairs, delete the autoscaling configuration, and if using a regional MIG, set the target distribution shape to `ANY_SINGLE_ZONE`."],["A resize request involves specifying the number of VMs to add all at once and defining the duration these VMs will run, with a range between 1 hour and 7 days."]]],[]] -