Informazioni sulle VM con avvio flessibile

Questo documento fornisce una panoramica delle VM con avvio flessibile, descrivendone le caratteristiche principali, nonché i requisiti e le limitazioni che si applicano quando le crei.

Le VM con avvio flessibile sono istanze di macchine virtuali (VM) che crei utilizzando il modello di provisioning con avvio flessibile. Questo modello utilizza il Dynamic Workload Scheduler (DWS) per eseguire il provisioning di risorse di computing scontate da un pool di capacità sicuro, migliorando le tue possibilità di ottenere risorse ad alta richiesta come le GPU. Dopo aver creato le VM Flex-start, Compute Engine tenta di allocare le risorse richieste entro un periodo di tempo specifico. Se l'operazione va a buon fine, le VM con avvio flessibile iniziano a essere eseguite e continuano a essere eseguite per un massimo di sette giorni.

Per i workload che richiedono risorse per più di sette giorni o con una maggiore garanzia di capacità, puoi creare una richiesta di prenotazione futura in modalità calendario per usufruire comunque degli sconti DWS.

Casi d'uso delle VM con avvio flessibile

Le VM con avvio flessibile sono ideali per l'esecuzione di workload che possono essere avviati in qualsiasi momento, ad esempio:

  • Pre-addestramento di modelli di piccole dimensioni

  • Ottimizzazione dei modelli

  • Simulazione di computing ad alte prestazioni (HPC)

  • Inferenza batch

Caratteristiche principali delle VM con avvio flessibile

Rispetto ad altri tipi di istanze di Compute Engine, le VM con avvio flessibile hanno le seguenti caratteristiche:

  • Tempo di attesa per l'allocazione delle risorse: puoi creare VM con avvio flessibile prima che Compute Engine possa allocare le risorse richieste. Tuttavia, le VM vengono avviate solo se le risorse diventano disponibili entro il periodo di tempo specificato. Se le risorse non sono disponibili, la richiesta di creazione della VM non va a buon fine.

    Per ulteriori informazioni, consulta la sezione Tempo di attesa delle VM con avvio flessibile in questo documento.

  • Durata di esecuzione limitata: le VM con avvio flessibile possono essere eseguite per un massimo di sette giorni. Trascorso questo periodo di tempo, Compute Engine arresta o elimina automaticamente le VM in base all'azione di terminazione specificata nelle proprietà della VM.

    Per ulteriori informazioni, consulta la sezione Durata di esecuzione limitata delle VM con avvio flessibile in questo documento.

  • Modalità di allocazione delle VM da parte di Compute Engine: Compute Engine tenta di creare VM con avvio flessibile in stretta prossimità per ridurre al minimo la latenza di rete. Per controllare il posizionamento delle VM con avvio flessibile, puoi utilizzare facoltativamente policy di posizionamento compatto o policy di workload.

    Per ulteriori informazioni, consulta la sezione Allocazione delle VM Flex-start in questo documento.

  • Modello di provisioning con avvio flessibile: crei VM con avvio flessibile utilizzando il modello di provisioning con avvio flessibile. Questo modello di provisioning offre una maggiore disponibilità delle risorse e prezzi scontati rispetto alle VM create utilizzando il modello di provisioning standard.

    Per ulteriori informazioni su ciascun modello di provisioning, consulta Modelli di provisioning delle istanze Compute Engine.

Tempo di attesa delle VM Flex-start

Quando crei una Flex-start VM, la VM non viene avviata immediatamente. Compute Engine tenta di allocare le risorse richieste e di avviare la VM entro un periodo di tempo specifico. Se hai una quota sufficiente per le risorse richieste e Compute Engine le alloca entro la fine del tempo di attesa, la Flex-start VM viene avviata entro due minuti dalla disponibilità della capacità. In caso contrario, la richiesta di creazione della VM non va a buon fine.

Il tempo di attesa varia in base al metodo utilizzato per creare le VM:

Tempo di attesa delle VM con avvio flessibile autonome

Per creare una Flex-start VM autonoma, devi specificare un tempo di attesa utilizzando il campo requestValidForDuration. Puoi impostare un tempo di attesa di zero secondi o compreso tra 90 secondi e 7200 secondi (due ore).

In base ai requisiti zonali del tuo workload, ti consigliamo i seguenti tempi di attesa per aumentare le probabilità di successo della richiesta di creazione della VM Flex-start:

  • Requisiti zonali rigorosi: se il tuo workload richiede la creazione di una Flex-start VM in una zona specifica, ti consigliamo di impostare il campo requestValidForDuration su 90 secondi o più, fino a due ore. Tempi di attesa più lunghi aumentano le probabilità di ottenere risorse. Durante questo periodo di tempo, la VM rimane nello stato PENDING

  • Nessun requisito zonale: se la VM con avvio flessibile può essere eseguita in qualsiasi zona della regione, ti consigliamo di impostare il requestValidForDuration campo su zero secondi. Questo valore specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta non va a buon fine perché le risorse non sono disponibili, prova a creare la Flex-start VM in un'altra zona.

Per interrompere una richiesta di creazione di VM mentre Compute Engine tenta di allocare le risorse, elimina la VM Flex-start.

Tempo di attesa delle richieste di ridimensionamento del MIG

Se aggiungi VM con avvio flessibile in una sola operazione a un gruppo di istanze gestite (MIG) utilizzando le richieste di ridimensionamento, il tempo di attesa per il provisioning di tutte le risorse richieste è indefinito. Dopo aver creato una richiesta di ridimensionamento del MIG, la richiesta rimane nello stato ACCEPTED finché le risorse non diventano disponibili. Quando le risorse richieste diventano disponibili, lo stato della richiesta di ridimensionamento del MIG cambia in SUCCEEDED e Compute Engine crea le VM con avvio flessibile.

Per interrompere una richiesta di creazione di VM mentre Compute Engine tenta di allocare le risorse, annulla la richiesta di ridimensionamento del MIG. Per ulteriori informazioni, consulta la sezione Informazioni sulle richieste di ridimensionamento del MIG.

Durata di esecuzione limitata delle VM Flex-start

Quando crei una Flex-start VM, devi specificare quanto segue:

  • Durata di esecuzione della VM: devi specificare per quanto tempo le VM possono essere eseguite. La durata di esecuzione può essere di massimo sette giorni. Se il workload viene completato prima della fine della durata di esecuzione delle VM, puoi arrestare o eliminare le VM autonome oppure eliminare le VM create tramite una richiesta di ridimensionamento del MIG per evitare addebiti non necessari.

  • Azione di terminazione della VM: devi scegliere se Compute Engine deve arrestare o eliminare automaticamente le VM al termine della durata di esecuzione.

Allocazione delle VM Flex-start

Compute Engine tenta di creare le VM con avvio flessibile in modo denso in base alla disponibilità. Questo posizionamento denso riduce al minimo gli hop di rete e ottimizza la latenza ridotta, ideale per i workload che richiedono una comunicazione costante tra le VM, come i workload di AI o ML. Se vuoi controllare il posizionamento delle VM con avvio flessibile per evitare che vengano create in modo imprevisto a distanza, procedi nel seguente modo:

Quota

Per creare o riavviare una VM con avvio flessibile, devi disporre di una quota preemptible sufficiente per le vCPU, la memoria e le GPU o i dischi SSD locali collegati richiesti.

Se tenti di creare o riavviare una Flex-start VM senza una quota sufficiente, si verifica una delle seguenti situazioni:

  • Richieste di creazione di VM: la richiesta rimane in sospeso finché non acquisisci una quota sufficiente. Se non acquisisci la quota richiesta prima della fine del tempo di attesa, la richiesta non va a buon fine.

  • Richieste di riavvio della VM: la richiesta non va a buon fine immediatamente.

Prezzi

Per le VM con avvio flessibile, vengono addebitati i costi come segue:

  • Paghi in base al consumo (PAYG). Per ulteriori informazioni sui prezzi di una VM durante il suo ciclo di vita, consulta Prezzi.

  • Per i tipi di macchine A4, A3, A2, G4 e H4D, ottieni vCPU, memoria e GPU collegate a un prezzo scontato. Altri tipi di macchine ottimizzate per l'acceleratore supportati non sono idonei per gli sconti. Per ulteriori informazioni, consulta i prezzi di DWS.

Limitazioni

Le VM con avvio flessibile presentano le seguenti limitazioni:

  • Le VM con avvio flessibile possono utilizzare solo i seguenti tipi di macchine:

    • Qualsiasi tipo di macchina ottimizzata per l'acceleratore, ad eccezione di A4X Max e A4X

    • Tipi di macchine H4D

  • Devi creare VM con avvio flessibile utilizzando il modello di provisioning con avvio flessibile.

  • Devi specificare se arrestare o eliminare le VM con avvio flessibile al termine della durata di esecuzione utilizzando i instanceTerminationAction e maxRunDuration campi.

  • Devi arrestare le VM con avvio flessibile durante gli eventi di manutenzione dell'host.

  • Non puoi applicare policy di posizionamento compatto alle VM con avvio flessibile create da Compute Engine tramite una richiesta di ridimensionamento del MIG.

  • Non puoi applicare policy di posizionamento distribuito alle VM con avvio flessibile.

  • Non puoi creare prenotazioni.

Passaggi successivi