Modelli di provisioning delle istanze Compute Engine

Questo documento descrive i modelli di provisioning per le istanze Compute Engine. Per scoprire di più sulle opzioni di deployment, consulta Scegli una strategia di deployment di Compute Engine per il tuo workload.

I modelli di provisioning determinano la disponibilità, la durata e i prezzi delle istanze. Comprendendo questi modelli, puoi scegliere l'opzione migliore per il tuo workload.

Modelli di provisioning disponibili

Quando crei un'istanza di computing, puoi specificare uno dei seguenti modelli di provisioning. Se non specifichi un modello di provisioning, Compute Engine utilizza per impostazione predefinita il modello di provisioning standard.

  • Standard

  • Spot

  • Con prenotazione

La tabella seguente consente di mettere a confronto i casi d'uso e i prezzi di ciascun modello di provisioning:

Standard Spot Con prenotazione
Riepilogo
  • In base alla disponibilità delle risorse puoi creare immediatamente le istanze.
  • Puoi controllare quando arrestare o eliminare le istanze.
  • In base alla disponibilità delle risorse puoi creare immediatamente le istanze.
  • Puoi controllare quando arrestare o eliminare le istanze. Tuttavia, consenti anche a Compute Engine di arrestare o eliminare le istanze in qualsiasi momento per recuperare la capacità.
  • Puoi richiedere di prenotare la capacità in una data futura per creare istanze con GPU collegate. Se Trusted Cloud by S3NS approva la richiesta, crea una prenotazione che puoi iniziare a utilizzare nella data che hai indicato.
  • Durante il periodo di prenotazione approvato, puoi arrestare, riavviare, eliminare e ricreare istanze per utilizzare la prenotazione in base alle tue esigenze. Al termine del periodo di prenotazione, Compute Engine elimina automaticamente la prenotazione e le eventuali istanze che la stanno utilizzando.
Casi d'uso Ideale per i workload che richiedono stabilità e funzionamento continuo, ad esempio:
  • Server web
  • Database
  • Applicazioni aziendali
  • Sviluppo e test
Ideale per i workload che possono tollerare interruzioni, ad esempio:
  • Elaborazione batch
  • Computing ad alte prestazioni (HPC)
  • Integrazione e il deployment continui (CI/CD)
  • Analisi di dati
  • Codifica dei contenuti multimediali
Ideale per i workload che richiedono stabilità e un tempo di esecuzione specifico. A seconda di come prenoti la capacità per la creazione di istanze, utilizza questo modello di provisioning nei seguenti scenari:
  • Per workload di breve durata:
    • Job di pre-addestramento dei modelli
    • Job di ottimizzazione dei modelli
    • Workload di simulazione HPC
    • Aumenti dei workload di inferenza previsti nel breve termine
  • Per i workload a lungo termine:
    • Workload di addestramento
    • Workload di inferenza
Prezzi Ti vengono addebitati i prezzi standard per le istanze. Per ulteriori informazioni, consulta Prezzi delle istanze VM. La maggior parte delle vCPU, delle GPU e delle unità SSD locali è disponibile con uno sconto del 60-91%. Per ulteriori informazioni, consulta Prezzi delle VM spot. In base alla famiglia di macchine utilizzata dalle tue istanze, puoi ottenere fino al 53% di sconto per vCPU e GPU. Per ulteriori informazioni, consulta i prezzi delle VM ottimizzate per gli acceleratori.
Quota Quando crei un'istanza, viene utilizzata la quota standard. Quando crei un'istanza, viene utilizzata la quota preemptible. Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard. I Trusted Cloud crediti del Livello gratuito non si applicano alle VM spot. La quota non si applica al modello di provisioning con prenotazione.

Disponibilità e durata delle istanze

La tabella seguente mostra la disponibilità e la durata delle istanze di computing per ogni modello di provisioning:

Standard Spot Con prenotazione
Prerequisiti per la creazione Nessun prerequisito per la creazione. Nessun prerequisito per la creazione. Per creare istanze, devi prima prenotare la capacità creando richieste di prenotazione futura per più blocchi. Alla data e all'ora specificate, Compute Engine esegue il provisioning della capacità richiesta. Quindi, puoi iniziare a utilizzarla creando istanze.
Serie di macchine supportate Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4 e A3 Ultra. Puoi utilizzare qualsiasi serie di macchine, ad eccezione delle seguenti:
  • M2 e M3
  • Istanze bare metal C3 e X4
Puoi utilizzare solo le serie di macchine A4 e A3 Ultra.
Disponibilità delle istanze Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. Puoi creare istanze solo dopo aver prenotato la capacità per una data futura. Alla data della richiesta, Compute Engine fornisce la capacità desiderata, che puoi utilizzare per creare istanze.
Durata dell'istanza Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
  • Se il tipo di macchina utilizzato dall'istanza non supporta la migrazione live, Compute Engine arresta le istanze durante gli eventi di manutenzione dell'host.
  • In rari casi, l'istanza potrebbe arrestarsi a causa di un errore dell'host.
Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
  • Compute Engine potrebbe arrestare o eliminare l'istanza in qualsiasi momento al fine di recuperare capacità. Questo processo è chiamato prerilascio.
  • In rari casi, l'istanza potrebbe arrestarsi a causa di un errore dell'host.
Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
  • Se il tipo di macchina dell'istanza non supporta la migrazione live, Compute Engine arresta l'istanza durante gli eventi di manutenzione dell'host.
  • La prenotazione creata automaticamente per eseguire il provisioning della capacità richiesta raggiunge la fine del periodo di impegno di prenotazione. A quel punto, Compute Engine elimina automaticamente la prenotazione e le eventuali istanze che la utilizzano.
  • In rari casi, l'istanza potrebbe arrestarsi a causa di un errore dell'host.

Passaggi successivi