Questo documento descrive come creare istanze con GPU collegate dalle serie di macchine A3 Ultra o A4. Per scoprire di più sulla creazione di istanze con GPU collegate, consulta la Panoramica della creazione di un'istanza con GPU collegate.
Le serie di macchine A4 e A3 Ultra sono progettate per consentirti di eseguire cluster AI/ML su larga scala con funzionalità come il posizionamento mirato dei workload, controlli avanzati di manutenzione dei cluster e pianificazione in base alla topologia. Per ulteriori informazioni, consulta Panoramica della gestione dei cluster.
Prima di iniziare
- Per esaminare le limitazioni e i passaggi preliminari aggiuntivi per la creazione di istanze con GPU collegate, ad esempio come selezionare un'immagine sistema operativo o controllare la quota di GPU, consulta la Panoramica della creazione di un'istanza con GPU collegate.
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione verifica la tua identità per l'accesso a Trusted Cloud by S3NS servizi e API. Per eseguire
codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su
Compute Engine selezionando una delle seguenti opzioni:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Installa Google Cloud CLI, quindi accedi a gcloud CLI con la tua identità federata. Dopo aver eseguito l'accesso, inizializza Google Cloud CLI eseguendo il seguente comando:
gcloud init
- Set a default region and zone.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali che fornisci a gcloud CLI.
Installa Google Cloud CLI, quindi accedi a gcloud CLI con la tua identità federata. Dopo aver eseguito l'accesso, inizializza Google Cloud CLI eseguendo il seguente comando:
gcloud init
Per saperne di più, consulta Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Trusted Cloud .
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare istanze, chiedi all'amministratore di concederti il ruolo IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.Questo ruolo predefinito contiene le autorizzazioni necessarie per creare istanze. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare istanze sono necessarie le seguenti autorizzazioni:
-
compute.instances.create
sul progetto -
Per utilizzare un'immagine personalizzata per creare la VM:
compute.images.useReadOnly
sull'immagine -
Per utilizzare uno snapshot per creare la VM:
compute.snapshots.useReadOnly
sullo snapshot -
Per utilizzare un template di istanza per creare la VM:
compute.instanceTemplates.useReadOnly
sul template di istanza -
Per specificare una subnet per la VM:
compute.subnetworks.use
sul progetto o sulla subnet scelta -
Per specificare un indirizzo IP statico per la VM:
compute.addresses.use
sul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC:
compute.subnetworks.useExternalIp
sul progetto o sulla subnet scelta -
Per assegnare una rete legacy alla VM:
compute.networks.use
sul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy:
compute.networks.useExternalIp
sul progetto -
Per impostare i metadati dell'istanza VM per la VM:
compute.instances.setMetadata
sul progetto -
Per impostare i tag per la VM:
compute.instances.setTags
sulla VM -
Per impostare le etichette per la VM:
compute.instances.setLabels
sulla VM -
Per impostare un service account che la VM possa utilizzare:
compute.instances.setServiceAccount
sulla VM -
Per creare un nuovo disco per la VM:
compute.disks.create
sul progetto -
Per collegare un disco esistente in modalità di sola lettura o di lettura e scrittura:
compute.disks.use
sul disco -
Per collegare un disco esistente in modalità di sola lettura:
compute.disks.useReadOnly
sul disco
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Determina come creare istanze A3 Ultra o A4
Per determinare le opzioni che vuoi utilizzare per creare istanze A3 Ultra o A4, completa i seguenti passaggi:
Scegli un'opzione di consumo: per scoprire come scegliere un'opzione di consumo per un'istanza A3 Ultra o A4, consulta Scegli un'opzione di consumo nella documentazione di AI Hypercomputer.
Ottieni capacità: per scoprire come ottenere capacità per le istanze A3 Ultra o A4 per l'opzione di consumo che hai scelto, consulta Panoramica della capacità nella documentazione di AI Hypercomputer.
Seleziona le istruzioni di creazione: per scoprire tutte le opzioni che puoi utilizzare per creare istanze A3 Ultra o A4, come gruppi di istanze gestite (MIG) o cluster, consulta Panoramica della creazione di VM e cluster nella documentazione di AI Hypercomputer.
Se vuoi utilizzare le funzionalità di gestione dei cluster di A3 Ultra o A4 oppure se non vuoi creare istanze autonome, seleziona un'opzione di creazione nella documentazione di AI Hypercomputer.
Crea un'istanza A3 Ultra o A4
Per creare un'istanza A3 Ultra o A4, completa i seguenti passaggi:
Crea reti VPC
Per configurare la rete per il tipo di macchina A4 o A3 Ultra, crea tre reti VPC per le seguenti interfacce di rete:
- 2 reti VPC standard per le interfacce di rete (NIC) gVNIC. Vengono utilizzati per la comunicazione da host a host.
- Per le NIC CX-7 è necessaria una rete VPC con il profilo di rete RoCE. La rete VPC RoCE deve avere 8 subnet, una per ogni NIC CX-7. Queste NIC utilizzano RDMA su Converged Ethernet (RoCE), fornendo la comunicazione a larghezza di banda elevata e bassa latenza essenziale per la comunicazione da GPU a GPU.
Per ulteriori informazioni sulla disposizione del NIC, consulta Controlla la larghezza di banda della rete e la disposizione del NIC.
Crea le reti manualmente seguendo le guide alle istruzioni o automaticamente utilizzando lo script fornito.
Guide con istruzioni
Per creare le reti, puoi utilizzare le seguenti istruzioni:
- Per creare le normali reti VPC per le gNIC, consulta Crea e gestisci le reti Virtual Private Cloud.
- Per creare la rete VPC RoCE, consulta Crea una rete Virtual Private Cloud per le NIC RDMA.
Per queste reti VPC, ti consigliamo di impostare l'unità massima di trasmissione (MTU) su un valore maggiore. Per il tipo di macchina A4 o A3 Ultra, l'MTU consigliata è di
8896
byte. Per esaminare le impostazioni MTU consigliate per altri tipi di macchine GPU, consulta Impostazioni MTU per i tipi di macchine GPU.Script
Per creare le emittenti, segui questi passaggi.
Per queste reti VPC, ti consigliamo di impostare l'unità massima di trasmissione (MTU) su un valore maggiore. Per il tipo di macchina A4 o A3 Ultra, l'MTU consigliata è di
8896
byte. Per esaminare le impostazioni MTU consigliate per altri tipi di macchine GPU, consulta Impostazioni MTU per i tipi di macchine GPU.Utilizza il seguente script per creare reti VPC per le NIC gVNIC e CX-7.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs done
Sostituisci quanto segue:
GVNIC_NAME_PREFIX
: il prefisso del nome personalizzato da utilizzare per le reti VPC e le subnet regolari per le gNIC.RDMA_NAME_PREFIX
: il prefisso del nome personalizzato da utilizzare per la rete VPC e le subnet RoCE per le NIC CX-7.ZONE
: specifica una zona in cui è disponibile il tipo di macchina che vuoi utilizzare, ad esempious-central1-a
. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.REGION
: la regione in cui vuoi creare le subnet. Questa regione deve corrispondere alla zona specificata. Ad esempio, se la tua zona èus-central1-a
, la tua regione èus-central1
.IP_RANGE
: l'intervallo IP da utilizzare per le regole firewall SSH.
- (Facoltativo) Per verificare che le risorse di rete VPC siano state create correttamente, controlla le impostazioni di rete nella console Trusted Cloud :
- Nella console Trusted Cloud , vai alla pagina Reti VPC.
- Cerca nell'elenco le reti che hai creato nel passaggio precedente.
- Per visualizzare le subnet, le regole firewall e altre impostazioni di rete, fai clic sul nome della rete.
Crea l'istanza
Per creare un'istanza, utilizza una delle seguenti opzioni.
Console
Nella console Trusted Cloud , vai alla pagina Crea un'istanza.
Viene visualizzata la schermata Crea un'istanza, che mostra il riquadro Configurazione macchina.
Nel riquadro Configurazione macchina, completa i seguenti passaggi:
Specifica un Nome per l'istanza. Consulta Convenzione di denominazione delle risorse.
Seleziona la regione e la zona in cui hai prenotato la capacità.
Fai clic sulla scheda GPU e poi completa i seguenti passaggi:
Nell'elenco Tipo di GPU, seleziona il tipo di GPU.
Per le istanze A4, seleziona NVIDIA B200.
Per le istanze A3 Ultra, seleziona NVIDIA H200 141 GB.
Nell'elenco Numero di GPU, seleziona 8.
Nel menu di navigazione, fai clic su Sistema operativo e spazio di archiviazione. Nel riquadro Sistema operativo e spazio di archiviazione visualizzato, completa i seguenti passaggi:
Fai clic su Cambia. Viene visualizzato il riquadro Configurazione del disco di avvio.
Nella scheda Immagini pubbliche, seleziona un'immagine consigliata. Per un elenco di immagini consigliate, vedi Sistemi operativi.
Per confermare le opzioni relative al disco di avvio, fai clic su Seleziona.
Per creare un'istanza con più NIC, completa i seguenti passaggi. In caso contrario, per creare un'istanza con una sola NIC, salta questi passaggi.
Nel menu di navigazione, fai clic su Networking. Nel riquadro Networking visualizzato, completa i seguenti passaggi:
Nella sezione Interfacce di rete, completa questi passaggi:
Elimina l'interfaccia di rete predefinita. Per eliminare l'interfaccia, fai clic su
Elimina.Fai clic su Aggiungi un'interfaccia di rete. Utilizza questa opzione per aggiungere interfacce di rete che si collegano alle reti VPC che hai creato nella sezione precedente. Quando aggiungi le interfacce di rete, ricorda quanto segue:
Per un'interfaccia di rete utilizzata per la comunicazione host-host, seleziona una rete VPC e una subnet normali dagli elenchi Rete e Subnet e imposta l'elenco Scheda di interfaccia di rete su gVNIC.
Per un'interfaccia di rete utilizzata per la comunicazione da GPU a GPU, seleziona la rete VPC e la subnet RoCE dagli elenchi Rete e Subnet e imposta l'elenco Scheda di interfaccia di rete su MRDMA per queste interfacce di rete.
Nel menu di navigazione, fai clic su Avanzate. Quindi, completa i passaggi seguenti per il modello di provisioning che vuoi utilizzare.
Avvio flessibile
- Nella sezione Modello di provisioning, nell'elenco Modello di provisioning delle VM, seleziona Avvio flessibile.
In Inserisci il numero di ore, inserisci la quantità massima di tempo per cui vuoi che la VM venga eseguita. Il valore deve essere compreso tra 46 secondi (
0.01
) e sette giorni (168
o 168 ore).Seleziona Imposta un tempo di attesa per la creazione della VM.
In base ai requisiti di zona per il tuo carico di lavoro, ti consigliamo di specificare una delle seguenti durate per aumentare le probabilità di riuscita della richiesta di creazione della VM:
- Workload con requisiti di zona rigorosi: se il tuo workload richiede la creazione della VM in una zona specifica, specifica una durata compresa tra 90 secondi e 2 ore. Le durate più lunghe aumentano le probabilità di ottenere risorse.
- Workload senza requisiti di zona rigorosi: se la VM può essere eseguita in qualsiasi zona della regione, specifica una durata di 0 secondi o deseleziona la casella di controllo Imposta un tempo di attesa per la creazione della VM. Questa azione specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta di creazione della VM non va a buon fine perché le risorse non sono disponibili, riprova a inviare la richiesta in un'altra zona.
Con prenotazione
Fai clic su Scegli una prenotazione. Questa azione apre un riquadro con un elenco delle prenotazioni disponibili all'interno della zona selezionata. Nell'elenco delle prenotazioni, completa i seguenti passaggi:
- Seleziona la prenotazione che vuoi utilizzare per la VM. Puoi anche selezionare un blocco specifico all'interno della prenotazione.
- Fai clic su Scegli.
Spot
- Nella sezione Modello di provisioning, seleziona Spot dall'elenco Modello di provisioning delle VM.
(Facoltativo) Per selezionare l'azione di terminazione che si verifica quando Compute Engine esegue il prerilascio della VM, completa i seguenti passaggi:
- Espandi la sezione Impostazioni avanzate del modello di provisioning delle VM.
- Nell'elenco Alla terminazione della VM, seleziona una delle seguenti
opzioni:
- Per arrestare la VM durante il prerilascio, seleziona Arresta (valore predefinito).
- Per eliminare la VM durante il prerilascio, seleziona Elimina.
Per creare e avviare l'istanza, fai clic su Crea.
gcloud
Per creare la VM, utilizza il comando
gcloud compute instances create
.I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questa implementazione. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.
Avvio flessibile
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=none \ --provisioning-model=FLEX_START \ --request-valid-for-duration=REQUEST_VALID_FOR_DURATION \ --max-run-duration=MAX_RUN_DURATION \ --instance-termination-action=DELETE \ --maintenance-policy=TERMINATE
Sostituisci quanto segue:
VM_NAME
: il nome della VM.MACHINE_TYPE
: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.IMAGE_FAMILY
: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.IMAGE_PROJECT
: l'ID progetto dell'immagine del sistema operativo.ZONE
: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.DISK_SIZE
: le dimensioni del disco di avvio in GB.GVNIC_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.RDMA_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.REQUEST_VALID_FOR_DURATION
: la durata per cui è valida la richiesta di creazione della VM. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguiti rispettivamente dad
,h
,m
es
. Ad esempio, specifica30m
per 30 minuti o1d2h3m4s
per un giorno, due ore, tre minuti e quattro secondi. Se non specifichi una durata, la durata predefinita è 90 secondi.In base ai requisiti di zona per il tuo carico di lavoro, ti consigliamo di specificare una delle seguenti durate per aumentare le probabilità di riuscita della richiesta di creazione della VM:
- Workload con requisiti di zona rigorosi: se il tuo workload richiede la creazione della VM in una zona specifica, specifica una durata compresa tra 90 secondi e 2 ore. Le durate più lunghe aumentano le probabilità di ottenere risorse.
- Workload senza requisiti di zona rigorosi: se la VM può essere eseguita in qualsiasi zona all'interno della
regione, specifica una durata di zero secondi (
0
). Questa azione specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta di creazione della VM non va a buon fine perché le risorse non sono disponibili, riprova a inviare la richiesta in un'altra zona.
MAX_RUN_DURATION
: la durata per cui vuoi eseguire le VM richieste. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguito rispettivamente dad
,h
,m
es
. Ad esempio, specifica30m
per 30 minuti o1d2h3m4s
per un giorno, due ore, tre minuti e quattro secondi. Il valore deve essere compreso tra 10 minuti e sette giorni.
Con prenotazione
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=specific \ --reservation=RESERVATION \ --provisioning-model=RESERVATION_BOUND \ --instance-termination-action=TERMINATION_ACTION \ --maintenance-policy=TERMINATE
Sostituisci quanto segue:
VM_NAME
: il nome della VM.MACHINE_TYPE
: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.IMAGE_FAMILY
: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.IMAGE_PROJECT
: l'ID progetto dell'immagine del sistema operativo.ZONE
: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.DISK_SIZE
: le dimensioni del disco di avvio in GB.GVNIC_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.RDMA_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.-
RESERVATION
: il nome della prenotazione o un blocco specifico all'interno di una prenotazione. Per ottenere il nome della prenotazione o i blocchi disponibili, vedi Visualizzare la capacità riservata. In base al tuo requisito per il posizionamento dell'istanza, scegli una delle seguenti opzioni:Per creare l'istanza su un blocco:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Inoltre, per creare più istanze nello stesso blocco, applica la stessa policy di posizionamento compatto che specifica una collocazione di blocchi (
maxDistance=2
) quando crei ogni istanza. Compute Engine applica quindi la policy alla prenotazione e crea istanze sullo stesso blocco.Per creare l'istanza su un blocco specifico:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: indica se Compute Engine arresta (STOP
) o elimina (DELETE
) la VM al termine del periodo di prenotazione.
Spot
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --provisioning-model=SPOT \ --instance-termination-action=TERMINATION_ACTION
Sostituisci quanto segue:
VM_NAME
: il nome della VM.MACHINE_TYPE
: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.IMAGE_FAMILY
: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.IMAGE_PROJECT
: l'ID progetto dell'immagine del sistema operativo.ZONE
: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.DISK_SIZE
: le dimensioni del disco di avvio in GB.GVNIC_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.RDMA_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.TERMINATION_ACTION
: l'azione da intraprendere quando Compute Engine prerilascia l'istanza, ovveroSTOP
(impostazione predefinita) oDELETE
.
REST
Per creare la VM, invia una richiesta
POST
al metodoinstances.insert
.I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questa implementazione. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.
Avvio flessibile
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType": "NO_RESERVATION", }, "scheduling":{ "provisioningModel": "FLEX_START", "requestValidForDuration": { "seconds": REQUEST_VALID_FOR_DURATION }, "maxRunDuration": { "seconds": MAX_RUN_DURATION }, "instanceTerminationAction": "DELETE", "onHostMaintenance": "TERMINATE", } }
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del progetto in cui vuoi creare la VM.ZONE
: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.MACHINE_TYPE
: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.VM_NAME
: il nome della VM.DISK_SIZE
: le dimensioni del disco di avvio in GB.IMAGE_PROJECT
: l'ID progetto dell'immagine del sistema operativo.IMAGE_FAMILY
: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.NETWORK_PROJECT_ID
: l'ID progetto della rete.GVNIC_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.REGION
: la regione della subnet.RDMA_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.REQUEST_VALID_FOR_DURATION
: la durata per cui è valida la richiesta di creazione della VM. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguiti rispettivamente dad
,h
,m
es
. Ad esempio, specifica30m
per 30 minuti o1d2h3m4s
per un giorno, due ore, tre minuti e quattro secondi. Se non specifichi una durata, la durata predefinita è 90 secondi.In base ai requisiti di zona per il tuo carico di lavoro, ti consigliamo di specificare una delle seguenti durate per aumentare le probabilità di riuscita della richiesta di creazione della VM:
- Workload con requisiti di zona rigorosi: se il tuo workload richiede la creazione della VM in una zona specifica, specifica una durata compresa tra 90 secondi e 2 ore. Le durate più lunghe aumentano le probabilità di ottenere risorse.
- Workload senza requisiti di zona rigorosi: se la VM può essere eseguita in qualsiasi zona all'interno della
regione, specifica una durata di zero secondi (
0
). Questa azione specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta di creazione della VM non va a buon fine perché le risorse non sono disponibili, riprova a inviare la richiesta in un'altra zona.
MAX_RUN_DURATION
: la durata per cui vuoi eseguire le VM richieste. Devi formattare il valore come numero di secondi. Ad esempio, specifica86400
per un giorno. Il valore deve essere compreso tra 10 minuti e sette giorni.
Con prenotazione
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION" ] }, "scheduling":{ "provisioningModel": "RESERVATION_BOUND", "instanceTerminationAction": "TERMINATION_ACTION", "onHostMaintenance": "TERMINATE", "automaticRestart": true } }
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del progetto in cui vuoi creare la VM.ZONE
: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.MACHINE_TYPE
: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.VM_NAME
: il nome della VM.DISK_SIZE
: le dimensioni del disco di avvio in GB.IMAGE_PROJECT
: l'ID progetto dell'immagine del sistema operativo.IMAGE_FAMILY
: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.NETWORK_PROJECT_ID
: l'ID progetto della rete.GVNIC_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.REGION
: la regione della subnet.RDMA_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.-
RESERVATION
: il nome della prenotazione o un blocco specifico all'interno di una prenotazione. Per ottenere il nome della prenotazione o i blocchi disponibili, vedi Visualizzare la capacità riservata. In base al tuo requisito per il posizionamento dell'istanza, scegli una delle seguenti opzioni:Per creare l'istanza su un blocco:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Inoltre, per creare più istanze nello stesso blocco, applica la stessa policy di posizionamento compatto che specifica una collocazione di blocchi (
maxDistance=2
) quando crei ogni istanza. Compute Engine applica quindi la policy alla prenotazione e crea istanze sullo stesso blocco.Per creare l'istanza su un blocco specifico:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: indica se Compute Engine arresta (STOP
) o elimina (DELETE
) la VM al termine del periodo di prenotazione.
Spot
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name": "VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb": "DISK_SIZE", "diskType": "hyperdisk-balanced", "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode": "READ_WRITE", "type": "PERSISTENT" } ], "serviceAccounts": [ { "email": "default", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "scheduling": { "provisioningModel": "SPOT", "instanceTerminationAction": "TERMINATION_ACTION" } }
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del progetto in cui vuoi creare la VM.ZONE
: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.MACHINE_TYPE
: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.VM_NAME
: il nome della VM.DISK_SIZE
: le dimensioni del disco di avvio in GB.IMAGE_PROJECT
: l'ID progetto dell'immagine del sistema operativo.IMAGE_FAMILY
: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.NETWORK_PROJECT_ID
: l'ID progetto della rete.GVNIC_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.REGION
: la regione della subnet.RDMA_NAME_PREFIX
: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.TERMINATION_ACTION
: l'azione da intraprendere quando Compute Engine prerilascia l'istanza, ovveroSTOP
(impostazione predefinita) oDELETE
.
Preparare l'istanza per l'uso
Per preparare un'istanza con GPU collegate per l'utilizzo, completa i seguenti passaggi:
Per consentire a un'istanza A4 o A3 Ultra di utilizzare le GPU collegate, è necessario che sull'istanza siano installati i driver GPU. A meno che l'immagine nell'istanza non includa già i driver GPU richiesti,installa i driver GPU.
Se hai creato una VM spot nella sezione precedente, completa i seguenti passaggi:
Per preparare la VM spot a un potenziale prerilascio, consulta Gestisci il prerilascio delle VM spot.
(Facoltativo) Scopri di più sulle best practice per le VM spot.
Passaggi successivi
Per monitorare le prestazioni della GPU, vedi Monitora le prestazioni della GPU.
Per risolvere i problemi relativi alle istanze GPU, consulta Risoluzione dei problemi relativi alle VM GPU.
Scopri di più sulle piattaforme GPU.
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-09-30 UTC.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-30 UTC."],[],[],null,[]] -