Informazioni sulle VM con avvio flessibile

Questo documento fornisce una panoramica delle VM con avvio flessibile, descrivendone le caratteristiche principali, nonché i requisiti e le limitazioni che si applicano quando le crei.

Le VM con avvio flessibile sono istanze di macchina virtuale (VM) che crei utilizzando il modello di provisioning con avvio flessibile. Questo modello utilizza Dynamic Workload Scheduler (DWS) per eseguire il provisioning di risorse di calcolo scontate da un pool sicuro di capacità, migliorando le tue possibilità di ottenere risorse molto richieste come le GPU. Dopo aver creato le VM con avvio flessibile, Compute Engine tenta di allocare le risorse richieste entro un periodo di tempo specifico. Se l'operazione va a buon fine, le VM con inizio flessibile iniziano a essere eseguite e continuano a essere eseguite per un massimo di sette giorni.

Per i workload che richiedono risorse per più di sette giorni o con una maggiore garanzia di capacità, puoi creare una richiesta di prenotazione futura in modalità calendario per continuare a usufruire degli sconti DWS.

Casi d'uso delle VM con avvio flessibile

Le VM con inizio flessibile sono ideali per l'esecuzione di workload che possono iniziare in qualsiasi momento, ad esempio:

  • Pre-addestramento di modelli di piccole dimensioni

  • Ottimizzazione del modello

  • Simulazione di computing ad alte prestazioni (HPC)

  • Inferenza batch

Caratteristiche principali delle VM con avvio flessibile

Rispetto ad altri tipi di istanze Compute Engine, le VM flessibili hanno le seguenti caratteristiche:

  • Un tempo di attesa per l'allocazione delle risorse: puoi creare VM flessibili prima che Compute Engine possa allocare le risorse richieste. Tuttavia, le VM vengono avviate solo se le risorse diventano disponibili entro il periodo di tempo specificato. Se le risorse non sono disponibili, la richiesta di creazione della VM non va a buon fine.

    Per ulteriori informazioni, consulta la sezione Tempo di attesa della VM con avvio flessibile di questo documento.

  • Durata di esecuzione limitata: le VM con inizio flessibile vengono eseguite ininterrottamente per un massimo di sette giorni. Trascorso questo periodo di tempo, Compute Engine arresta o elimina automaticamente le VM in base all'azione di terminazione specificata nelle proprietà della VM.

    Per ulteriori informazioni, consulta Durata di esecuzione limitata della VM con avvio flessibile in questo documento.

  • Come Compute Engine alloca le VM: Compute Engine tenta di creare VM Flex-start in prossimità per ridurre al minimo la latenza di rete. Per controllare il posizionamento delle VM con avvio flessibile, puoi utilizzare facoltativamente policy di posizionamento compatto o policy del workload.

    Per ulteriori informazioni, consulta la sezione Allocazione di VM con avvio flessibile in questo documento.

  • Modello di provisioning con avvio flessibile: crei VM con avvio flessibile utilizzando il modello di provisioning con avvio flessibile. Questo modello di provisioning offre una migliore disponibilità delle risorse e prezzi scontati rispetto alle VM create utilizzando il modello di provisioning standard.

    Per saperne di più su ciascun modello di provisioning, consulta Modelli di provisioning delle istanze Compute Engine.

Tempo di attesa della VM con avvio flessibile

Quando crei una Flex-start VM, la VM non viene avviata immediatamente. Compute Engine tenta di allocare le risorse richieste e avvia la VM entro un periodo di tempo specifico. Se disponi di una quota sufficiente per le risorse richieste e Compute Engine le alloca entro la fine del tempo di attesa, la Flex-start VM viene avviata entro due minuti dalla disponibilità della capacità. In caso contrario, la richiesta di creazione della VM non va a buon fine.

Il tempo di attesa varia in base al metodo utilizzato per creare le VM:

Tempo di attesa per le VM con avvio flessibile autonome

Per creare una Flex-start VM autonoma, devi specificare un tempo di attesa utilizzando il campo requestValidForDuration. Puoi impostare un tempo di attesa pari a zero secondi o compreso tra 90 secondi e 7200 secondi (due ore).

In base ai requisiti di zona del tuo carico di lavoro, ti consigliamo i seguenti tempi di attesa per aumentare le probabilità di riuscita della richiesta di creazione della VM Flex-start:

  • Requisiti di zona rigorosi: se il tuo workload richiede la creazione di una Flex-start VM in una zona specifica, ti consigliamo di impostare il campo requestValidForDuration su 90 secondi o più, fino a due ore. Tempi di attesa più lunghi aumentano le probabilità di ottenere risorse. Durante questo periodo, la VM rimane nello stato PENDING.

  • Nessun requisito di zona: se la VM Flex-start può essere eseguita in qualsiasi zona della regione, ti consigliamo di impostare il campo requestValidForDuration su zero secondi. Questo valore specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta non va a buon fine perché le risorse non sono disponibili, prova a creare la VM con avvio flessibile in una zona diversa.

Per interrompere una richiesta di creazione di VM mentre Compute Engine tenta di allocare le risorse, elimina la VM Flex-start.

Tempo di attesa dei MIG con VM con avvio flessibile

Se aggiungi VM Flex-start a un gruppo di istanze gestite (MIG), Compute Engine continua a tentare di eseguire il provisioning delle risorse richieste finché non riesce o non annulli la richiesta. Il modo in cui Compute Engine aggiunge le VM al tuo MIG varia in base al metodo di creazione:

  • Richieste di ridimensionamento del MIG: Compute Engine aggiunge le VM richieste al MIG contemporaneamente quando tutte le risorse diventano disponibili. A meno che tu non elimini le VM prima della fine della durata di esecuzione, Compute Engine le elimina contemporaneamente. Per saperne di più, consulta la pagina Informazioni sulle richieste di ridimensionamento dei MIG.

  • MIG con una dimensione target: Compute Engine crea singolarmente ogni VM quando la capacità diventa disponibile. Pertanto, il MIG potrebbe inizialmente creare solo una parte delle VM richieste e poi aggiungere le VM rimanenti in un secondo momento, quando la capacità lo consente. A meno che tu non elimini le VM prima della fine della loro durata di esecuzione, Compute Engine elimina ogni VM in base al proprio tempo di creazione. Per saperne di più, consulta Crea un MIG che utilizza VM Flex-start.

Durata di esecuzione limitata della VM con avvio flessibile

Quando crei una Flex-start VM, devi specificare quanto segue:

  • Durata di esecuzione della VM: devi specificare per quanto tempo possono essere eseguite le VM. La durata dell'esecuzione può essere fino a sette giorni. Se il tuo workload viene completato prima del termine della durata di esecuzione delle VM, puoi arrestare o eliminare le VM autonome oppure eliminare le VM in un gruppo di istanze gestite per evitare costi non necessari.

  • L'azione di terminazione della VM: devi scegliere se Compute Engine arresta o elimina automaticamente le VM al termine della durata di esecuzione. Per le VM con avvio flessibile in un MIG, puoi specificare solo l'eliminazione delle VM al termine della loro durata di esecuzione.

Allocazione di VM con avvio flessibile

Compute Engine tenta di creare le VM Flex-start in modo denso in base alla disponibilità. Questo posizionamento denso riduce al minimo gli hop di rete e ottimizza la bassa latenza, ideale per i workload che richiedono una comunicazione costante tra le VM, come i workload di AI o ML. Se vuoi controllare il posizionamento delle VM Flex-start per evitare che vengano create in modo imprevisto a grande distanza l'una dall'altra, procedi nel seguente modo:

Quota

Per creare o riavviare una Flex-start VM, devi disporre di una quota preemptible sufficiente per le vCPU, la memoria e le GPU o i dischi SSD locali collegati richiesti.

Se tenti di creare o riavviare una VM Flex-start senza quota sufficiente, si verifica una delle seguenti situazioni:

  • Richieste di creazione di VM: la tua richiesta rimane in attesa finché non acquisisci una quota sufficiente. Se non acquisisci la quota richiesta prima della fine del periodo di attesa, la richiesta non va a buon fine.

  • Richieste di riavvio della VM: la richiesta non riesce immediatamente.

Prezzi

Per le VM con avvio flessibile, i costi vengono addebitati come segue:

  • Paghi in base al consumo (PAYG). Per saperne di più sui prezzi di una VM durante il suo ciclo di vita, consulta Prezzi.

  • Per i tipi di macchine A4, A3, A2, G4 e H4D, ottieni vCPU, memoria e GPU collegate a un prezzo scontato. Gli altri tipi di macchine ottimizzati per l'acceleratore supportati non sono idonei per gli sconti. Per ulteriori informazioni, vedi Prezzi di DWS.

Limitazioni

Le sezioni seguenti descrivono le limitazioni per le VM Flex-start.

Limitazioni per tutte le VM con avvio flessibile

Tutte le VM Flex-start presentano le seguenti limitazioni:

  • Le VM con avvio flessibile possono utilizzare solo i seguenti tipi di macchine:

    • Qualsiasi tipo di macchina ottimizzato per l'acceleratore, ad eccezione di A4X Max e A4X

    • Tipi di macchine H4D

  • Devi creare VM con avvio flessibile utilizzando il modello di provisioning con avvio flessibile.

  • Devi specificare se arrestare o eliminare le VM con avvio flessibile al termine della durata di esecuzione utilizzando i campi instanceTerminationAction e maxRunDuration. Per i MIG, puoi specificare solo l'eliminazione delle VM con avvio flessibile.

  • Devi arrestare le VM con avvio flessibile durante gli eventi di manutenzione dell'host.

  • Puoi applicare policy di posizionamento compatto solo alle VM Flex-start autonome.

  • Non puoi applicare policy di posizionamento distribuito alle VM con avvio flessibile.

  • Non puoi utilizzare le prenotazioni.

Limitazioni per i MIG con VM con avvio flessibile

Tutti i MIG con VM con avvio flessibile presentano le seguenti limitazioni:

Inoltre, se vuoi creare VM Flex-start utilizzando le richieste di ridimensionamento del MIG, consulta le limitazioni per le richieste di ridimensionamento del MIG.

Passaggi successivi