Informazioni sui carichi di lavoro in modalità Autopilot in GKE Standard

Puoi utilizzare ComputeClasses per eseguire i carichi di lavoro di Google Kubernetes Engine (GKE) Autopilot nei cluster in modalità GKE Standard. Questo documento descrive i metodi che puoi utilizzare per eseguire i carichi di lavoro in modalità Autopilot e ti aiuta a decidere quando eseguire un carico di lavoro in una modalità specifica.

Queste informazioni sono destinate alle seguenti persone:

  • Architetti cloud che vogliono ottimizzare i costi operativi nelle organizzazioni.
  • Amministratori di piattaforme che vogliono ridurre l'overhead della gestione manuale dell'infrastruttura.
  • Site Reliability Engineer (SRE) che vogliono spostare la manutenzione, gli upgrade e la scalabilità dell'infrastruttura, quando possibile. Cloud de Confiance by S3NS

Dovresti già conoscere i seguenti concetti:

Informazioni su GKE Autopilot

Autopilot è una modalità operativa in GKE in cui Google gestisce l'infrastruttura dei nodi, la scalabilità, la sicurezza e le funzionalità preconfigurate. La modalità Autopilot è ottimizzata per l'esecuzione della maggior parte dei carichi di lavoro di produzione in un ambiente che applica le impostazioni consigliate per sicurezza, affidabilità, prestazioni e scalabilità. Per decidere tra la modalità Autopilot e la modalità Standard in base ai tuoi requisiti, consulta Informazioni sulle modalità operative di GKE.

Puoi utilizzare la modalità Autopilot nei seguenti modi:

  • Crea un cluster che utilizza la modalità Autopilot: Google gestisce l'intero cluster e applica le best practice per automazione, affidabilità, sicurezza e costi.
  • Esegui i carichi di lavoro in modalità Autopilot nei cluster Standard: esegui il deployment di ComputeClasses Autopilot e selezionali nei carichi di lavoro. Google gestisce i nodi creati da GKE per questi carichi di lavoro specifici in un pool di nodi gestito da Autopilot. Puoi controllare il cluster ed eseguire i tuoi pool di nodi Standard insieme ai nodi gestiti da GKE.

Informazioni sulla modalità Autopilot per ComputeClasses

Una ComputeClass è una risorsa personalizzata di Kubernetes che definisce un elenco di configurazioni dei nodi, come tipi di macchine o impostazioni delle funzionalità. Puoi selezionare ComputeClasses specifiche nelle specifiche dei carichi di lavoro Kubernetes. Quando un carico di lavoro che seleziona una ComputeClass ha bisogno di un nuovo nodo, GKE tenta di eseguire il provisioning del nodo con una delle configurazioni dichiarate dalla ComputeClass. GKE prova ogni configurazione nella ComputeClass in ordine e torna alla configurazione successiva se la creazione del nodo non riesce. Per ulteriori informazioni, consulta Informazioni su ComputeClasses personalizzate.

Per eseguire i carichi di lavoro Autopilot nei cluster GKE Standard, devi abilitare la modalità Autopilot in una ComputeClass e selezionarla in carichi di lavoro specifici. Google gestisce tutti i nuovi nodi di cui GKE esegue il provisioning per questi carichi di lavoro, in modo simile a come Google gestisce i nodi nei cluster Autopilot. La maggior parte dei vantaggi e delle funzionalità di sicurezza della modalità Autopilot si applicano a questi carichi di lavoro e ai nodi host.

Le ComputeClasses in modalità Autopilot offrono agli amministratori dei cluster una maggiore flessibilità nella scelta del livello di controllo che vogliono esercitare su carichi di lavoro e infrastrutture specifici nel cluster, ad esempio nei seguenti modi:

  • Puoi consentire a GKE di gestire completamente carichi di lavoro specifici eseguendoli in modalità Autopilot.
  • Mantieni il controllo completo sui carichi di lavoro e sull'infrastruttura che non utilizzano la modalità Autopilot, ad esempio i pool di nodi creati manualmente.
  • Puoi impostare una ComputeClass Autopilot come predefinita per il cluster o lo spazio dei nomi, in modo che i carichi di lavoro vengano eseguiti in modalità Autopilot a meno che non richiedano esplicitamente un'opzione diversa.

Queste opzioni consentono agli amministratori dei cluster di decidere il livello e l'ambito con cui utilizzare Autopilot.

Vantaggi di ComputeClasses Autopilot nei cluster Standard

L'esecuzione di alcuni carichi di lavoro in modalità Autopilot offre vantaggi come i seguenti:

Molti di questi vantaggi sono forniti anche dai cluster Autopilot, che offrono anche un'esperienza più gestita rispetto ai cluster Standard e includono diversi vantaggi in termini di sicurezza, networking e gestione delle risorse. Per ulteriori informazioni, consulta Panoramica di Autopilot.

Selezione dell'hardware in ComputeClasses Autopilot

In ComputeClasses Autopilot, puoi selezionare hardware specifico per i nodi (come GPU o tipi di macchine) oppure puoi consentire a GKE di inserire i pod su una piattaforma di calcolo per uso generico ottimizzata per i container. L'opzione per uso generico è consigliata per la maggior parte dei carichi di lavoro di produzione che non richiedono hardware specifico per essere eseguiti correttamente. Supporta le architetture x86 e Arm.

La tabella seguente descrive queste opzioni di configurazione, come sceglierne una in una ComputeClass e in che modo questa scelta influisce sul modello di fatturazione:

Tabella 1. Selezione dell'hardware in ComputeClasses Autopilot
Requisito del carico di lavoro Configurazione di ComputeClass consigliata Modello di fatturazione
Carichi di lavoro per uso generico

Utilizza una ComputeClass Autopilot con la podFamily regola di priorità per eseguire i carichi di lavoro che non richiedono hardware specifico sulla piattaforma di calcolo ottimizzata per i container Autopilot. Questa piattaforma è adatta per carichi di lavoro per uso generico come i seguenti:

  • Server web
  • Job basati su eventi
  • Elaborazione batch
  • Pipeline CI/CD

Le ComputeClasses Autopilot integrate utilizzano solo regole di priorità podFamily. Puoi anche aggiungere podFamily regole di priorità a ComputeClasses Autopilot personalizzate.

Modello di fatturazione basato su pod
Carichi di lavoro che richiedono hardware specifico

Utilizza una ComputeClass che utilizza qualsiasi regola di configurazione hardware disponibile, ad esempio la regola machineFamily o la regola gpus.

Modello di fatturazione basato sui nodi

Configurazione di Autopilot in ComputeClasses

Puoi utilizzare la modalità Autopilot in un cluster Standard utilizzando una ComputeClass Autopilot integrata fornita da GKE oppure abilitando Autopilot in qualsiasi ComputeClass personalizzata che crei. Le sezioni seguenti descrivono ogni opzione.

ComputeClasses Autopilot integrate

GKE configura ComputeClasses Autopilot specifiche per te. Puoi selezionare queste classi Autopilot integrate in qualsiasi cluster idoneo. Le ComputeClasses Autopilot integrate nei cluster Standard utilizzano la regola di priorità podFamily per eseguire i pod sulla piattaforma di calcolo ottimizzata per i container. Per ulteriori informazioni, consulta Informazioni su ComputeClasses integrate in GKE.

ComputeClasses Autopilot personalizzate

Puoi abilitare Autopilot in qualsiasi ComputeClass personalizzata che gestisci utilizzando il campo autopilot nella specifica ComputeClass. Le ComputeClasses Autopilot personalizzate sono utili in situazioni come le seguenti:

  • I carichi di lavoro hanno requisiti hardware specifici, ad esempio acceleratori.
  • Vuoi modificare determinate opzioni dei nodi, ad esempio impostare zone o applicare taint, pur utilizzando la piattaforma di calcolo ottimizzata per i container Autopilot.

Per abilitare Autopilot in una ComputeClass esistente, devi eliminarla, aggiornare la configurazione e poi ricrearla nel cluster. Le modifiche si applicano a tutti i nuovi nodi creati da GKE per i carichi di lavoro di cui esegui il deployment dopo aver aggiornato la ComputeClass Autopilot.

Per ulteriori informazioni sull'abilitazione di Autopilot nelle ComputeClasses personalizzate, consulta Selezionare hardware specifico per i pod Autopilot.

Prezzi

I prezzi di GKE Autopilot si applicano ai nodi e ai carichi di lavoro creati da GKE per una ComputeClass Autopilot. Il modello di fatturazione Autopilot applicato a un carico di lavoro specifico dipende dalla regola di priorità ComputeClass utilizzata da GKE per creare i nodi per quel carico di lavoro.

La tabella seguente descrive il modello di fatturazione applicato alle diverse configurazioni di ComputeClass Autopilot nei cluster in modalità Standard:

Tabella 2. Prezzi per ComputeClasses Autopilot
Modelli di fatturazione per diverse configurazioni di ComputeClass
Modello di fatturazione basato su pod Il modello di fatturazione basato su pod si applica quando GKE utilizza una podFamily regola di priorità per creare i nodi per un carico di lavoro. Le ComputeClasses Autopilot integrate, utilizzano sempre il modello di fatturazione basato su pod.
Modello di fatturazione basato sui nodi Il modello di fatturazione basato sui nodi si applica quando GKE utilizza una regola di priorità ComputeClass che richiede esplicitamente hardware specifico, ad esempio una determinata famiglia di macchine o GPU.

I prezzi di Autopilot si applicano solo ai carichi di lavoro e ai nodi che utilizzano una ComputeClass Autopilot. Il cluster in modalità Standard e tutti gli altri pool di nodi che esegui continuano a utilizzare i prezzi della modalità GKE Standard.

Impostazioni preconfigurate per i nodi gestiti da Autopilot

Prima di abilitare la modalità Autopilot in ComputeClasses, scopri cosa aspettarti dai nodi creati da GKE per eseguire i carichi di lavoro Autopilot. Google configura funzionalità e vincoli di sicurezza specifici nei nodi Autopilot. Di conseguenza, i carichi di lavoro di cui viene eseguito il deployment e che funzionano correttamente nei nodi in modalità Standard potrebbero essere rifiutati dalla modalità Autopilot se non soddisfano i requisiti di sicurezza di Autopilot.

La tabella seguente descrive le configurazioni delle funzionalità che sostituiscono le impostazioni corrispondenti nel cluster Standard. Se una configurazione non è presente in questa tabella, i nodi Autopilot utilizzano l'impostazione del cluster Standard. Ad esempio, Workload Identity Federation for GKE non è presente in questa tabella, il che significa che l'impostazione Workload Identity Federation for GKE del cluster Standard si applica ai nodi Autopilot creati da GKE.

Tabella 3. Impostazioni preconfigurate per i nodi Autopilot
Funzionalità Impostazione a livello di cluster Standard Impostazione dei nodi gestiti da Autopilot
Upgrade e manutenzione dei nodi

Configurabile:

Preconfigurato:

  • Riparazione automatica dei nodi: abilitata
  • Upgrade automatico dei nodi: abilitato
  • Strategia di upgrade dei nodi: upgrade di sovraccarico con parametri preconfigurati
Scalabilità automatica Configurabile: profilo di scalabilità automatica Preconfigurato: profilo di scalabilità automatica optimize-utilization
Networking Nativo VPC o basato su route Richiede un cluster nativo di VPC
Sicurezza

Configurabile:

Preconfigurato:

Sistema operativo dei nodi

Configurabile:

Preconfigurato:

Disco di avvio dei nodi

Configurabile:

Configurabile:

Metadati dei nodi

Richieste di risorse per i carichi di lavoro Autopilot

Affinché i carichi di lavoro Autopilot vengano eseguiti in modo efficiente, GKE applica determinati valori minimi e massimi per le richieste di CPU, memoria e spazio di archiviazione temporaneo nei pod. GKE applica anche richieste predefinite ai pod che non richiedono esplicitamente una di queste risorse. I valori specifici per i requisiti minimi, massimi e predefiniti delle risorse nei carichi di lavoro GKE Autopilot variano in base al tipo di hardware utilizzato dai pod.

Per lo spazio di archiviazione temporaneo, il valore predefinito se non richiedi spazio di archiviazione temporaneo è lo stesso per tutte le ComputeClasses e le selezioni hardware. Per ulteriori informazioni, consulta Richieste di risorse predefinite.

La tabella seguente fornisce link ai requisiti di CPU e memoria per le richieste dei pod, a seconda del tipo di hardware:

Tabella 4. Requisiti di CPU e memoria di Autopilot
Tipo di risorsa Richieste minime e massime Richieste predefinite
Pod per uso generico
GPU e TPU Dipende dal tipo e dalla quantità di acceleratore hardware. Per ulteriori informazioni, consulta Valori minimi e massimi per la ComputeClass dell'acceleratore. Dipende dal tipo e dalla quantità di acceleratore hardware. Per ulteriori informazioni, consulta Richieste predefinite per gli acceleratori.
Tipi di macchine e famiglie di macchine Compute Engine specifici
  • Minimo: nessun valore minimo per CPU o memoria.
  • Massimo: il valore massimo è la capacità delle risorse dell'istanza Compute Engine.
Per qualsiasi tipo di macchina o famiglia di macchine Compute Engine, le richieste predefinite nella riga "Per uso generico" nella Richieste predefinite per ComputeClasses tabella.

Passaggi successivi