Questo documento spiega come creare un'istanza Compute Engine autonoma utilizzando il modello di provisioning vincolato alla prenotazione. Questo modello di provisioning ti consente di creare istanze A4X Max, A4X, A4 o A3 Ultra utilizzando la capacità prenotata in anticipo.
Per altri metodi di creazione di istanze utilizzando il modello di provisioning con prenotazione, consulta Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer.
Prima di iniziare
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione verifica la tua identità per l'accesso ad API e servizi Cloud de Confiance by S3NS . Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Cloud de Confiance console to access Cloud de Confiance by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Installa Google Cloud CLI, quindi accedi a gcloud CLI con la tua identità federata. Dopo aver eseguito l'accesso, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud init - Set a default region and zone.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.
Installa Google Cloud CLI, quindi accedi a gcloud CLI con la tua identità federata. Dopo aver eseguito l'accesso, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud initPer saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Cloud de Confiance .
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare istanze di computing utilizzando il modello di provisioning vincolato alla prenotazione, chiedi all'amministratore di concederti il ruolo IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.Questo ruolo predefinito contiene le autorizzazioni necessarie per creare istanze di computing utilizzando il modello di provisioning vincolato alla prenotazione. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare istanze di computing utilizzando il modello di provisioning con prenotazione, sono necessarie le seguenti autorizzazioni:
-
compute.instances.createsul progetto -
Per utilizzare un'immagine personalizzata per creare la VM:
compute.images.useReadOnlysull'immagine -
Per utilizzare uno snapshot per creare la VM:
compute.snapshots.useReadOnlysullo snapshot -
Per utilizzare un template di istanza per creare la VM:
compute.instanceTemplates.useReadOnlysul template di istanza -
Per specificare una subnet per la VM:
compute.subnetworks.usesul progetto o sulla subnet scelta -
Per specificare un indirizzo IP statico per la VM:
compute.addresses.usesul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC:
compute.subnetworks.useExternalIpsul progetto o sulla subnet scelta -
Per assegnare una rete legacy alla VM:
compute.networks.usesul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy:
compute.networks.useExternalIpsul progetto -
Per impostare i metadati dell'istanza VM per la VM:
compute.instances.setMetadatasul progetto -
Per impostare i tag per la VM:
compute.instances.setTagssulla VM -
Per impostare le etichette per la VM:
compute.instances.setLabelssulla VM -
Per impostare un service account che la VM possa utilizzare:
compute.instances.setServiceAccountsulla VM -
Per creare un nuovo disco per la VM:
compute.disks.createsul progetto -
Per collegare un disco esistente in modalità di sola lettura o di lettura e scrittura:
compute.disks.usesul disco -
Per collegare un disco esistente in modalità di sola lettura:
compute.disks.useReadOnlysul disco
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Crea un'istanza che utilizza il modello di provisioning con prenotazione
Per creare un'istanza di calcolo A4X Max, A4X, A4 o A3 Ultra utilizzando il modello di provisioning con prenotazione, devi attendere che la prenotazione creata automaticamente che vuoi utilizzare raggiunga l'ora di inizio. Inoltre, l'istanza che intendi creare deve soddisfare tutti i seguenti requisiti:
L'istanza e la prenotazione devono avere proprietà corrispondenti.
L'istanza deve avere come target specifico la prenotazione per il consumo.
L'istanza deve essere arrestata o eliminata all'ora di fine della prenotazione.
Il seguente esempio crea una richiesta di prenotazione futura in modalità calendario per cinque istanze A3 Ultra, quindi crea un'istanza A3 Ultra utilizzando la prenotazione creata automaticamente per la richiesta.
Per creare un'istanza di esempio utilizzando il modello di provisioning con prenotazione, seleziona una delle seguenti opzioni:
Console
Crea una richiesta di esempio per cinque istanze A3 Ultra e inviala per la revisione:
Nella console Cloud de Confiance , vai alla pagina Prenotazioni.
Fai clic sulla scheda Prenotazioni future.
Fai clic su Crea prenotazione futura. Viene visualizzata la pagina Crea una prenotazione futura.
Fai clic sulla scheda GPU, quindi seleziona NVIDIA H200 141 GB nell'elenco Tipo di GPU. Questa azione specifica un'istanza A3 Ultra.
Nel campo Capacità totale necessaria, inserisci
5.Nella sezione Periodo di prenotazione, specifica l'ora di inizio e la durata del periodo di prenotazione.
Fai clic su Cerca capacità e poi, nella sezione Capacità disponibile, seleziona una delle macchine disponibili.
Fai clic su Crea.
All'ora di inizio della richiesta, per creare un'istanza A3 Ultra che utilizzi la prenotazione creata automaticamente di esempio, procedi nel seguente modo:
Nella console Cloud de Confiance , vai alla pagina Crea un'istanza.
Nel campo Nome, inserisci un nome per l'istanza. Per questo esempio, inserisci
example-instance.Specifica la Regione e la Zona in cui esiste la prenotazione creata automaticamente. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-b.
Fai clic sulla scheda GPU, quindi seleziona NVIDIA H200 141 GB nell'elenco Tipo di GPU. Questa azione specifica un'istanza A3 Ultra e imposta il modello di provisioning su Con prenotazione.
Nel menu di navigazione, fai clic su Avanzate.
Nella sezione Prenotazioni, seleziona Scegli una prenotazione, quindi fai clic su Scegli una prenotazione.
Nel riquadro Scegli una prenotazione:
Seleziona la prenotazione di esempio creata automaticamente.
Fai clic su Scegli.
Nella sezione Modello di provisioning, espandi la sezione Impostazioni avanzate del modello di provisioning delle VM.
Nell'elenco Informazioni sulla terminazione delle VM, seleziona Arresta (impostazione predefinita) o Elimina.
Fai clic su Crea.
gcloud
Per creare una richiesta di esempio per cinque istanze A3 Ultra e inviarla per la revisione, utilizza il comando
gcloud beta compute future-reservations create:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bSupponiamo che Cloud de Confiance approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 marzo 2026, Compute Engine aumenta il numero di istanze GPU dedicate nella prenotazione. A questo punto puoi utilizzare la prenotazione.
All'ora di inizio della richiesta, per creare un'istanza A3 Ultra che consumi la prenotazione di esempio creata automaticamente, utilizza il comando
gcloud compute instances createcon i seguenti flag:Il flag
--instance-termination-action.Il flag
--provisioning-modelimpostato suRESERVATION_BOUND.Il flag
--reservation.Il flag
--reservation-affinityimpostato suspecific.
Il comando è simile al seguente. Per i requisiti completi per creare un'istanza A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...Il comando include i seguenti valori:
TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) l'istanza al termine del periodo di prenotazione.RESERVATION_URL: l'URL della prenotazione, formattato come segue:Se la prenotazione creata automaticamente esiste nel tuo progetto:
example-reservation.Se la prenotazione creata automaticamente si trova in un progetto diverso:
projects/PROJECT_ID/reservations/example-reservation.
REST
Per creare una richiesta di esempio per cinque istanze A3 Ultra e inviarla per la revisione, invia una richiesta
POSTal metodofutureReservations.insertbeta:POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Supponiamo che Cloud de Confiance approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 marzo 2026, Compute Engine aumenta il numero di istanze GPU dedicate nella prenotazione. A questo punto puoi utilizzare la prenotazione.
All'ora di inizio della richiesta, per creare un'istanza A3 Ultra che utilizzi la prenotazione di esempio creata automaticamente, invia una richiesta
POSTal metodoinstances.insert. Nel corpo della richiesta, includi i seguenti campi:Il campo
reservationAffinity.consumeReservationTypeimpostato suSPECIFIC_RESERVATION.Il campo
reservationAffinity.keyimpostato sucompute.googleapis.com/reservation-name.Il campo
reservationAffinity.valuesimpostato sull'URL della prenotazione.Il campo
scheduling.instanceTerminationAction.Il campo
scheduling.provisioningModelimpostato suRESERVATION_BOUND.
La richiesta è simile alla seguente. Per i requisiti completi per creare un'istanza A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Il corpo della richiesta include i seguenti valori:
RESERVATION_URL: l'URL della prenotazione, formattato come segue:Se la prenotazione creata automaticamente esiste nel tuo progetto:
example-reservation.Se la prenotazione creata automaticamente esiste in un progetto diverso:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) l'istanza al termine del periodo di prenotazione.
Passaggi successivi
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2026-01-31 UTC.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2026-01-31 UTC."],[],[]] -