Ce document explique comment créer une instance Compute Engine autonome à l'aide du modèle de provisionnement lié à une réservation. Ce modèle de provisionnement vous permet de créer des instances A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High avec 8 GPU, A3 Edge ou H4D en utilisant la capacité pré-réservée.
Pour connaître d'autres méthodes de création d'instances de calcul à l'aide du modèle de provisionnement lié à une réservation, consultez la présentation des options de déploiement dans la documentation d'AI Hypercomputer.
Avant de commencer
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification permet de valider votre identité pour accéder aux Cloud de Confiance by S3NS services et aux API. Pour exécuter
du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de
Compute Engine en sélectionnant l'une des options suivantes :
Sélectionnez l'onglet correspondant à la façon dont vous prévoyez d'utiliser les exemples de cette page :
Console
Lorsque vous utilisez la Cloud de Confiance console pour accéder aux Cloud de Confiance by S3NS services et aux API, vous n'avez pas besoin de configurer l'authentification.
gcloud
-
Installez la Google Cloud CLI, puis connectez-vous à la gcloud CLI avec votre identité fédérée. Après vous être connecté, initialisez la Google Cloud CLI en exécutant la commande suivante :
gcloud init
-
- Définissez une région et une zone par défaut.
REST
Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.
Installez la Google Cloud CLI, puis connectez-vous à la gcloud CLI avec votre identité fédérée.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l' Cloud de Confiance authentification.
Rôles requis
Pour obtenir les autorisations nécessaires à la création d'instances de calcul à l'aide du modèle de provisionnement lié à une réservation, demandez à votre administrateur de vous attribuer le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour créer des instances de calcul à l'aide du modèle de provisionnement lié à une réservation. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer des instances de calcul à l'aide du modèle de provisionnement lié à une réservation :
-
compute.instances.createsur le projet -
Pour créer la VM à l'aide d'une image personnalisée :
compute.images.useReadOnlysur l'image -
Pour créer la VM à l'aide d'un instantané :
compute.snapshots.useReadOnlysur l'instantané -
Pour créer la VM à l'aide d'un modèle d'instance :
compute.instanceTemplates.useReadOnlysur le modèle d'instance -
Pour spécifier un sous-réseau pour la VM :
compute.subnetworks.usesur le projet ou sur le sous-réseau choisi -
Pour spécifier une adresse IP statique pour la VM :
compute.addresses.usesur le projet -
Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un réseau VPC :
compute.subnetworks.useExternalIpsur le projet ou sur le sous-réseau choisi -
Pour attribuer un ancien réseau à la VM :
compute.networks.usesur le projet -
Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un ancien réseau :
compute.networks.useExternalIpsur le projet -
Pour définir les métadonnées d'instance de VM pour la VM :
compute.instances.setMetadatasur le projet -
Pour définir des tags pour la VM :
compute.instances.setTagssur la VM -
Pour définir des étiquettes pour la VM :
compute.instances.setLabelssur la VM -
Pour définir un compte de service que doit utiliser la VM :
compute.instances.setServiceAccountsur la VM -
Pour créer un disque pour la VM :
compute.disks.createsur le projet -
Pour associer un disque existant en mode lecture seule ou en mode lecture-écriture :
compute.disks.usesur le disque -
Pour associer un disque existant en mode lecture seule :
compute.disks.useReadOnlysur le disque
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Créer une instance qui utilise le modèle de provisionnement lié à une réservation
Pour créer une instance A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High avec 8 GPU ou H4D à l'aide du modèle de provisionnement lié à une réservation, vous devez attendre que la réservation créée automatiquement que vous souhaitez utiliser atteigne son heure de début. De plus, l'instance de calcul que vous comptez créer doit répondre à toutes les exigences suivantes :
L'instance de calcul et la réservation doivent avoir des propriétés correspondantes.
L'instance de calcul doit cibler spécifiquement la réservation à utiliser.
L'instance de calcul doit être arrêtée ou supprimée à l'heure de fin de la réservation.
L'exemple suivant crée une demande de réservation future en mode Agenda pour cinq instances A3 Ultra, puis crée une instance A3 Ultra en utilisant la réservation créée automatiquement pour la demande.
Pour créer un exemple d'instance de calcul à l'aide du modèle de provisionnement lié à une réservation, sélectionnez l'une des options suivantes :
Console
Créez un exemple de demande pour cinq instances A3 Ultra et envoyez-le pour examen :
Dans la Cloud de Confiance console, accédez à la page Réservations.
Cliquez sur l'onglet Réservations futures.
Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche.
Cliquez sur l'onglet GPU, puis, dans la liste Type de GPU, sélectionnez NVIDIA H200 141 Go. Cette action spécifie une instance A3 Ultra.
Dans le champ Capacité totale requise, saisissez
5.Dans la section Période de réservation, spécifiez l'heure de début et la durée de votre période de réservation.
Cliquez sur Rechercher de la capacité, puis, dans la section Capacité disponible, sélectionnez l'une des machines disponibles.
Cliquez sur Créer.
À l'heure de début de la demande, pour créer une instance A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, procédez comme suit :
Dans la Cloud de Confiance console, accédez à la page **Créer une instance**.
Dans le champ Nom, saisissez un nom pour l'instance de calcul. Pour cet exemple, saisissez
example-instance.Spécifiez la région et la zone dans lesquelles la réservation créée automatiquement existe. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-b.
Cliquez sur l'onglet GPU, puis, dans la liste Type de GPU, sélectionnez NVIDIA H200 141 Go. Cette action spécifie une instance A3 Ultra et définit le modèle de provisionnement sur Lié à une réservation.
Dans le menu de navigation, cliquez sur Avancé.
Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation.
Dans le volet Choisir une réservation, procédez comme suit :
Sélectionnez l'exemple de réservation créée automatiquement.
Cliquez sur Choisir.
Dans la section Modèle de provisionnement, développez la section Paramètres avancés du modèle de provisionnement de VM.
Dans la liste À l'arrêt de la VM, sélectionnez Arrêter (sélection par défaut) ou Supprimer.
Cliquez sur Créer.
gcloud
Pour créer un exemple de demande pour cinq instances A3 Ultra et l'envoyer pour examen, utilisez la
gcloud beta compute future-reservations createcommande :gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bSupposons que Cloud de Confiance approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 mars 2026, Compute Engine augmente le nombre d'instances de GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.
À l'heure de début de la demande, pour créer une instance A3 Ultra afin d'utiliser l' exemple de réservation créée automatiquement, utilisez la
gcloud compute instances createcommande avec les options suivantes :L'option
--instance-termination-actionL'option
--provisioning-modeldéfinie surRESERVATION_BOUNDL'option
--reservationL'option
--reservation-affinitydéfinie surspecific
La commande est semblable à la suivante. Pour connaître toutes les exigences permettant de créer une instance A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...La commande inclut les valeurs suivantes :
TERMINATION_ACTION: indique si Compute Engine arrête (STOP) ou supprime (DELETE) l'instance de calcul à la fin de la période de réservation.RESERVATION_URL: URL de la réservation, qui est au format suivant :Si la réservation créée automatiquement existe dans votre projet :
example-reservation.Si la réservation créée automatiquement existe dans un autre projet:
projects/PROJECT_ID/reservations/example-reservation.
REST
Pour créer un exemple de demande pour cinq instances A3 Ultra et l'envoyer pour examen, envoyez une
POSTrequête à la méthodefutureReservations.insertbêta :POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Supposons que Cloud de Confiance approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 mars 2026, Compute Engine augmente le nombre d'instances de GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.
À l'heure de début de la demande, pour créer une instance A3 Ultra afin d'utiliser l' exemple de réservation créée automatiquement, envoyez une
POSTrequête à lainstances.insertméthode. Dans le corps de la requête, incluez les champs suivants :Le champ
reservationAffinity.consumeReservationTypedéfini surSPECIFIC_RESERVATIONLe champ
reservationAffinity.keydéfini surcompute.googleapis.com/reservation-nameLe champ
reservationAffinity.valuesdéfini sur l'URL de la réservationLe champ
scheduling.instanceTerminationActionLe champ
scheduling.provisioningModeldéfini surRESERVATION_BOUND
La requête est semblable à la suivante. Pour connaître toutes les exigences permettant de créer une instance A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Le corps de la requête inclut les valeurs suivantes :
RESERVATION_URL: URL de la réservation, qui est au format suivant :Si la réservation créée automatiquement existe dans votre projet :
example-reservation.Si la réservation créée automatiquement existe dans un autre projet:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: indique si Compute Engine arrête (STOP) ou supprime (DELETE) l'instance de calcul à la fin de la période de réservation.