Questo documento fornisce una panoramica delle richieste di prenotazione futura in modalità calendario.
Utilizza le richieste di prenotazione futura in modalità calendario per ottenere risorse ad alta richiesta, ad esempio per creare istanze di macchine virtuali (VM) con GPU o TPU collegate. Se Cloud de Confiance by S3NS approva una richiesta di prenotazione, Compute Engine esegue il provisioning delle risorse prenotate alla data e all'ora specificate e per una durata massima di 90 giorni. Puoi quindi utilizzare le risorse prenotate per creare VM GPU, VM H4D o VM TPU per eseguire i seguenti workload:
Job di pre-addestramento dei modelli
Job di ottimizzazione dei modelli
Workload di simulazione per computing ad alte prestazioni (HPC)
Aumenti dei workload di inferenza previsti nel breve termine
Per ulteriori informazioni su altri modi per prenotare le risorse in Compute Engine, vedi Scegli un tipo di prenotazione.
Creare una richiesta in modalità calendario
Le sezioni seguenti spiegano come visualizzare la disponibilità delle risorse e quali dettagli specificare quando crei una richiesta di prenotazione futura in modalità calendario.
Visualizzare la disponibilità futura delle risorse
Prima di creare una richiesta di prenotazione futura in modalità calendario, puoi visualizzare la disponibilità futura in una regione delle seguenti risorse:
Per le VM GPU o H4D, fino a 60 giorni in anticipo
Per le TPU, fino a 120 giorni in anticipo
Compute Engine utilizza il Dynamic Workload Scheduler (DWS) per visualizzare quando le risorse richieste sono disponibili. Quando crei una richiesta, specifica il numero, il tipo e il periodo di prenotazione delle risorse di cui hai confermato la disponibilità. Cloud de Confiance è più probabile che approvi la tua richiesta se fornisci queste informazioni.
Definire le proprietà della richiesta
Quando crei una richiesta di prenotazione futura in modalità calendario, devi specificare le seguenti proprietà:
Eliminazione automatica. Questa proprietà determina se Compute Engine elimina la prenotazione creata automaticamente (creata automaticamente) per la tua richiesta all'ora di fine, anche se la prenotazione non è stata utilizzata completamente. Per creare una richiesta in modalità calendario, devi attivare l'opzione di eliminazione automatica.
Tipo di utilizzo. Questa proprietà definisce il modo in cui le VM utilizzano la prenotazione creata automaticamente. Quando crei una richiesta in modalità calendario, devi specificare che vuoi creare prenotazioni con target specifico. Questa impostazione indica che solo le VM che hanno come target la prenotazione possono utilizzarla.
Tipo di deployment. Questa proprietà definisce la collocazione delle risorse prenotate. Compute Engine prenota le risorse in base al tipo di risorsa:
Per le VM GPU o H4D, devi specificare il tipo di deployment denso (
DENSE) quando crei una richiesta. Questa configurazione specifica di prenotare le risorse in modo denso per una latenza di rete minima.Per le TPU, Compute Engine utilizza il tipo di deployment flessibile (
FLEXIBLE) per impostazione predefinita. Questa configurazione specifica di prenotare le risorse il più vicino possibile in base al principio del best effort.
Nome. Il nome della richiesta, che deve essere univoco all'interno del progetto.
Numero di risorse. Il numero di VM GPU, VM H4D o TPU da prenotare all'ora di inizio richiesta.
Stato della pianificazione. Questa proprietà definisce se invii immediatamente la richiesta a Cloud de Confiance per la revisione o se la salvi come bozza e la invii in un secondo momento. Quando crei una richiesta in modalità calendario, devi specificare di inviarla immediatamente per la revisione.
Modalità di prenotazione. Questa proprietà definisce il metodo per prenotare le risorse, che devi impostare su
CALENDARper una richiesta in modalità calendario.Nome della prenotazione. Il nome della prenotazione che Compute Engine crea automaticamente se Cloud de Confiance approva la tua richiesta.
Tipo di condivisione. Questa proprietà definisce se altri progetti della tua organizzazione possono utilizzare la prenotazione creata automaticamente per la tua richiesta approvata. Puoi specificare una delle seguenti opzioni:
Progetto singolo. Solo il tuo progetto può utilizzare la capacità prenotata.
Condivisa. Puoi condividere la capacità prenotata con un massimo di altri 100 progetti della tua organizzazione. Se specifichi questa opzione, devi specificare i progetti con cui condividere la prenotazione creata automaticamente. Per ulteriori informazioni, consulta le best practice per le prenotazioni condivise.
Periodo di prenotazione. La data e l'ora in cui Compute Engine esegue il provisioning della capacità richiesta e puoi utilizzarla. Il periodo di prenotazione include quanto segue:
Ora di inizio. Quando vuoi iniziare a utilizzare la capacità prenotata. A seconda delle risorse che prenoti, l'ora di inizio deve essere almeno uno dei seguenti valori dal momento in cui crei e invii una richiesta:
Per le VM GPU e H4D, 87 ore (tre giorni e 15 ore)
Per le TPU, sei ore
Ora di fine. Quando la capacità richiesta non è più prenotata per te. A questo punto, Compute Engine elimina la prenotazione creata automaticamente e arresta o elimina le VM che utilizzano la prenotazione in base all' azione di terminazione specificata per le VM.
Proprietà delle risorse. I requisiti hardware delle VM GPU, delle VM H4D o delle TPU che vuoi prenotare. Le VM possono utilizzare una prenotazione solo se le relative proprietà corrispondono a quelle della prenotazione. Per ulteriori informazioni, consulta i requisiti per utilizzare le prenotazioni.
Zona. La zona in cui vuoi prenotare la capacità.
Procedura di revisione delle richieste
Per prenotare la capacità utilizzando una richiesta di prenotazione futura in modalità calendario, devi creare e inviare la richiesta a Cloud de Confiance per la revisione. Dopo aver creato e inviato una richiesta, Cloud de Confiance la esamina entro un minuto e si verifica una delle seguenti condizioni:
Cloud de Confiance approva la tua richiesta: Compute Engine prenota le risorse richieste e, entro un minuto dall'approvazione, crea automaticamente una prenotazione vuota. All'ora di inizio della richiesta, Compute Engine esegue il provisioning della capacità richiesta aumentando il numero di VM GPU, VM H4D o TPU nella prenotazione.
Si verifica un errore. La richiesta non va a buon fine perché la zona della richiesta non dispone di risorse sufficienti. Ti consigliamo di visualizzare di nuovo la disponibilità futura delle risorse, quindi di creare e inviare una nuova richiesta per la revisione.
Ciclo di vita della richiesta
Il seguente diagramma mostra i diversi stati in cui Compute Engine può impostare una richiesta di prenotazione futura in modalità calendario:

Gli stati e il flusso di eventi mostrati nel diagramma precedente sono i seguenti:
PENDING_APPROVAL: hai creato e inviato una richiesta per la revisione. Entro un minuto, Cloud de Confiance approva la richiesta.APPROVED: Cloud de Confiance ha approvato la tua richiesta. Quindi, entro un minuto, Compute Engine crea automaticamente una prenotazione vuota e cambia lo stato della richiesta inPROCURING.PROCURING: Compute Engine pianifica il provisioning delle risorse prenotate. Prima dell'ora di inizio della richiesta, lo stato della richiesta cambia inPROVISIONING.PROVISIONING: Compute Engine sta eseguendo il provisioning delle risorse prenotate aumentando il numero di VM GPU, VM H4D o TPU prenotate nella prenotazione creata automaticamente. All'ora di inizio della richiesta, lo stato della richiesta cambia inFULFILLED.FULFILLED: Compute Engine ha eseguito il provisioning delle risorse prenotate e ti vengono addebitati i costi. Puoi utilizzare la prenotazione creata automaticamente creando VM fino all'ora di fine della richiesta.
All'ora di fine della richiesta, Compute Engine elimina la richiesta e la prenotazione creata automaticamente. Arresta o elimina anche le VM che utilizzano la prenotazione in base all' azione di terminazione specificata per le VM.
Utilizzare la capacità di cui è stato eseguito il provisioning
Dopo che Cloud de Confiance ha approvato una richiesta di prenotazione futura in modalità calendario, Compute Engine crea automaticamente una prenotazione con le seguenti caratteristiche:
La prenotazione creata automaticamente non ha VM GPU, VM H4D o TPU prenotate; non puoi ancora utilizzarla.
La prenotazione creata automaticamente eredita le proprietà VM o TPU specificate nella richiesta.
All'ora di inizio della richiesta, Compute Engine esegue il provisioning della capacità richiesta aumentando il numero di VM GPU, VM H4D o TPU nella prenotazione creata automaticamente. Puoi quindi utilizzare la prenotazione creando VM GPU, VM H4D o VM TPU che soddisfano tutte le seguenti condizioni:
Le VM e la prenotazione hanno proprietà corrispondenti.
Le VM utilizzano il modello di provisioning con prenotazione.
Le VM devono essere arrestate o eliminate all'ora di fine della prenotazione.
Puoi creare VM finché la prenotazione non viene utilizzata completamente o fino all'ora di fine della richiesta. All'ora di fine della richiesta, Compute Engine elimina la prenotazione creata automaticamente e arresta o elimina le VM che utilizzano la prenotazione.
Quota
I requisiti di quota per le richieste di prenotazione futura in modalità calendario dipendono dal tipo di macchina come segue:
Tipi di macchine GPU e TPU: non è richiesta alcuna quota per prenotare la capacità.
Tipi di macchine H4D: quota CPU viene utilizzata.
Quando crei VM utilizzando la capacità prenotata, devi disporre di una quota sufficiente per le risorse che non fanno parte della prenotazione, come dischi o indirizzi IP. In caso contrario, la creazione delle VM non va a buon fine.
Prezzi
Quando crei e invii una richiesta di prenotazione futura in modalità calendario e Cloud de Confiance approva la tua richiesta, non ti vengono addebitati costi immediatamente. Ti vengono addebitati costi quando si verifica quanto segue:
Compute Engine esegue il provisioning della capacità richiesta. Quando la tua richiesta raggiunge lo stato
FULFILLEDall'ora di inizio della richiesta, ti vengono addebitati i costi per le risorse di cui è stato eseguito il provisioning in base ai prezzi di DWS. Questo modello di prezzi offre vCPU, memoria, GPU e TPU a un prezzo scontato rispetto ai prezzi standard.Utilizzi risorse al di fuori della prenotazione. Quando crei VM che utilizzano una prenotazione creata automaticamente, non ti vengono addebitati costi aggiuntivi per le risorse utilizzate. Ti vengono addebitati costi solo per le risorse che non fanno parte della prenotazione, come dischi o indirizzi IP.
I costi per le risorse prenotate non vengono più addebitati all'ora di fine della richiesta. A questo punto, Compute Engine elimina la prenotazione creata automaticamente e arresta o elimina le VM che utilizzano la prenotazione in base all'azione di terminazione.
Limitazioni
Le sezioni seguenti spiegano le limitazioni per le richieste di prenotazione futura in modalità calendario.
Limitazioni per tutte le richieste
Tutte le richieste di prenotazione futura in modalità calendario sono soggette alle seguenti limitazioni:
Puoi prenotare le risorse per un periodo compreso tra 1 e 90 giorni.
Dopo aver creato e inviato una richiesta, non puoi annullarla, eliminarla o modificarla.
Limitazioni per le richieste di VM GPU o H4D
Puoi prenotare VM GPU o VM H4D solo nel seguente modo:
Puoi prenotare il seguente numero di VM per richiesta:
Per le VM GPU, da 1 a 80 VM
Per le VM H4D, da 1 a 256 VM
Puoi prenotare le seguenti serie di macchine:
Puoi prenotare VM GPU o H4D solo in zone specifiche. Per ulteriori informazioni, consulta quanto segue:
Per le VM GPU, vedi Località GPU.
Per le VM H4D, vedi Regioni e zone disponibili.
Non puoi utilizzare un template di istanza per creare richieste di VM GPU o H4D.
Limitazioni per le richieste di VM TPU
Puoi prenotare VM TPU solo nel seguente modo:
Puoi prenotare 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024 chip TPU per richiesta.
Puoi prenotare le seguenti versioni di TPU:
Puoi prenotare le TPU solo nelle seguenti zone:
TPU7x:
us-central1-c
TPU v6e:
asia-northeast1-beurope-west4-aus-east5-aus-east5-bus-south1-ai1b
TPU v5p:
us-east5-a
Limitazioni per tutte le prenotazioni create automaticamente
Una prenotazione creata automaticamente per una richiesta è soggetta alle seguenti limitazioni:
Puoi modificare la prenotazione solo nel seguente modo:
Per consentire o impedire ai job di Vertex AI di utilizzarla.
Dopo l'ora di inizio della prenotazione.
Non puoi applicare sconti per impegno di utilizzo (CUD) o sconti per utilizzo sostenuto (SUD) alla prenotazione.
Non puoi eliminare la prenotazione; Compute Engine la elimina all'ora di fine della prenotazione.