Informazioni sulla flessibilità delle istanze per le VM create in blocco

Questo documento descrive la flessibilità delle istanze durante la creazione di VM in blocco utilizzando Compute Engine.

Quando crei macchine virtuali (VM) in blocco in una regione, se la tua applicazione non è limitata a un singolo tipo di macchina, puoi aumentare la percentuale di successo del provisioning del numero di VM richiesto configurando la flessibilità delle istanze. La flessibilità delle istanze ti consente di specificare uno o più tipi di macchine adatti al tuo carico di lavoro. Compute Engine esegue il provisioning delle VM utilizzando uno di questi tipi di macchine, in base alla capacità e alla disponibilità della quota.

Utilizzare la flessibilità delle istanze

Per configurare la flessibilità delle istanze, elenca i tipi di macchine adatti definendo una o più selezioni di istanze nella richiesta di inserimento in blocco a livello di regione. Ad esempio, in una richiesta REST, includi l'oggetto instanceFlexibilityPolicy, all'interno del quale definisci uno o più oggetti instanceSelections, ognuno contenente un elenco di tipi di macchine.

Quando Compute Engine riceve la richiesta, convalida prima i tipi di macchine e la loro compatibilità zonale, escludendo eventuali voci non valide. Se esiste almeno una configurazione valida, l'operazione continua.

Compute Engine tenta quindi di eseguire il provisioning delle VM in base all'hardware, alla quota e alle prenotazioni disponibili. Se configuri i ranking per le selezioni delle istanze, le selezioni con un ranking inferiore hanno la priorità. All'interno di ogni ranking, Compute Engine considera le prenotazioni inutilizzate e le indicazioni per le VM spot per selezionare i tipi di macchine con una probabilità di prerilascio inferiore.

Selezione della zona quando viene definita una forma di distribuzione target

Quando utilizzi la flessibilità delle istanze con una richiesta bulkInsert a livello di regione, puoi specificare una forma di distribuzione target per controllare la modalità di distribuzione delle VM tra le zone della regione. Compute Engine seleziona le zone per il provisioning delle VM in base a questa forma, come segue:

  • ANY_SINGLE_ZONE: Compute Engine seleziona una singola zona con la capacità maggiore per i tipi di macchine con una preferenza più alta.
  • BALANCED: Compute Engine distribuisce le VM nel modo più uniforme possibile tra le zone con risorse disponibili. All'interno di ogni zona, Compute Engine assegna la priorità ai tipi di macchine con una preferenza più alta.
  • ANY: Compute Engine seleziona le zone con risorse disponibili. Se i ranking sono configurati, Compute Engine assegna la priorità alle zone per eseguire il provisioning delle VM con tipi di macchine con una preferenza più alta.

Per ulteriori informazioni, consulta Creare VM in blocco in una regione.

Provisioning minimo delle VM e flessibilità delle istanze

Se definisci un valore per il numero minimo di VM richieste (minCount) nella richiesta bulkInsert, l'API tenta di creare almeno quel numero di VM. Se Compute Engine non riesce a eseguire il provisioning del numero minimo di VM richieste (minCount), l'intera operazione non va a buon fine e Compute Engine non crea alcuna VM. Quando utilizzi minCount con la flessibilità delle istanze, Compute Engine assegna la priorità al provisioning delle VM in base alla disponibilità rispetto al ranking, come segue:

  • Compute Engine assegna la priorità al provisioning del numero massimo di VM fino a count, anche se ciò significa utilizzare macchine con una preferenza inferiore. Ad esempio, se la richiesta specifica un minimo di una VM richiesta (minCount=1) e un massimo di 10 VM (count=10) e se Compute Engine ha la capacità di eseguire il provisioning di una VM con una preferenza più alta o di sei VM con una preferenza inferiore, Compute Engine esegue il provisioning delle sei VM con una preferenza inferiore.
  • Se Compute Engine può eseguire il provisioning dello stesso numero massimo di VM fino a count utilizzando selezioni di istanze diverse, assegna la priorità alla selezione con una preferenza più alta. Ad esempio, se la richiesta specifica un minimo di una VM richiesta (minCount=1) e un massimo di 10 VM (count=10) e se Compute Engine può eseguire il provisioning di sei VM utilizzando una selezione di istanze con una preferenza più alta o una preferenza inferiore, Compute Engine esegue il provisioning delle sei VM dalla selezione con una preferenza più alta.

Per ulteriori informazioni, consulta la proprietà minCount in bulkInsert.

Scenari di convalida e di errore dell'inserimento in blocco

Compute Engine esegue una convalida iniziale dei tipi di macchine e della loro compatibilità zonale, escludendo eventuali voci non valide dalla considerazione. Se dopo questo controllo iniziale rimane almeno una configurazione valida, Compute Engine procede con la creazione della VM.

Tuttavia, alcune convalide della configurazione possono essere eseguite solo dopo che Compute Engine ha selezionato le zone e i tipi di macchine da utilizzare per il provisioning, in base alla policy di flessibilità delle istanze e alla capacità disponibile. Se, durante questa fase di convalida successiva, la combinazione specifica di tipo di macchina e zona scelta per il provisioning risulta non valida, l'intera richiesta di inserimento in blocco non va a buon fine con errori di convalida. Questo errore può verificarsi anche se altre configurazioni all'interno di instanceFlexibilityPolicy erano inizialmente valide.

Limitazioni

Quando utilizzi la flessibilità delle istanze per la creazione di VM in blocco, si applicano le seguenti limitazioni:

  • Puoi specificare la flessibilità delle istanze solo per le richieste bulkInsert a livello di regione; non puoi utilizzarla con le richieste a livello di zona.
  • La flessibilità delle istanze non supporta le funzionalità di AI Hypercomputer, tra cui le prenotazioni future, il modello di provisioning di avvio flessibile e le GPU A3 Ultra, A4 e più recenti.
  • Puoi specificare un massimo di 10 tipi di macchine diversi in un massimo di 10 selezioni di istanze diverse.

Passaggi successivi