Puoi utilizzare ComputeClasses per eseguire i carichi di lavoro di Google Kubernetes Engine (GKE) Autopilot nei cluster in modalità GKE Standard. Questo documento descrive i metodi che puoi utilizzare per eseguire i carichi di lavoro in modalità Autopilot e ti aiuta a decidere quando eseguire un carico di lavoro in una modalità specifica.
Queste informazioni sono destinate alle seguenti persone:
- Architetti cloud che vogliono ottimizzare i costi operativi nelle organizzazioni.
- Amministratori di piattaforme che vogliono ridurre l'overhead della gestione manuale dell'infrastruttura.
- Site Reliability Engineer (SRE) che vogliono spostare la manutenzione, gli upgrade e la scalabilità dell'infrastruttura, quando possibile. Cloud de Confiance by S3NS
Dovresti già conoscere i seguenti concetti:
Informazioni su GKE Autopilot
Autopilot è una modalità operativa in GKE in cui Google gestisce l'infrastruttura dei nodi, la scalabilità, la sicurezza e le funzionalità preconfigurate. La modalità Autopilot è ottimizzata per l'esecuzione della maggior parte dei carichi di lavoro di produzione in un ambiente che applica le impostazioni consigliate per sicurezza, affidabilità, prestazioni e scalabilità. Per decidere tra la modalità Autopilot e la modalità Standard in base ai tuoi requisiti, consulta Informazioni sulle modalità operative di GKE.
Puoi utilizzare la modalità Autopilot nei seguenti modi:
- Crea un cluster che utilizza la modalità Autopilot: Google gestisce l'intero cluster e applica le best practice per automazione, affidabilità, sicurezza e costi.
- Esegui i carichi di lavoro in modalità Autopilot nei cluster Standard: esegui il deployment di ComputeClasses Autopilot e selezionali nei carichi di lavoro. Google gestisce i nodi creati da GKE per questi carichi di lavoro specifici in un pool di nodi gestito da Autopilot. Puoi controllare il cluster ed eseguire i tuoi pool di nodi Standard insieme ai nodi gestiti da GKE.
Informazioni sulla modalità Autopilot per ComputeClasses
Una ComputeClass è una risorsa personalizzata di Kubernetes che definisce un elenco di configurazioni dei nodi, come tipi di macchine o impostazioni delle funzionalità. Puoi selezionare ComputeClasses specifiche nelle specifiche dei carichi di lavoro Kubernetes. Quando un carico di lavoro che seleziona una ComputeClass ha bisogno di un nuovo nodo, GKE tenta di eseguire il provisioning del nodo con una delle configurazioni dichiarate dalla ComputeClass. GKE prova ogni configurazione nella ComputeClass in ordine e torna alla configurazione successiva se la creazione del nodo non riesce. Per ulteriori informazioni, consulta Informazioni su ComputeClasses personalizzate.
Per eseguire i carichi di lavoro Autopilot nei cluster GKE Standard, devi abilitare la modalità Autopilot in una ComputeClass e selezionarla in carichi di lavoro specifici. Google gestisce tutti i nuovi nodi di cui GKE esegue il provisioning per questi carichi di lavoro, in modo simile a come Google gestisce i nodi nei cluster Autopilot. La maggior parte dei vantaggi e delle funzionalità di sicurezza della modalità Autopilot si applicano a questi carichi di lavoro e ai nodi host.
Le ComputeClasses in modalità Autopilot offrono agli amministratori dei cluster una maggiore flessibilità nella scelta del livello di controllo che vogliono esercitare su carichi di lavoro e infrastrutture specifici nel cluster, ad esempio nei seguenti modi:
- Puoi consentire a GKE di gestire completamente carichi di lavoro specifici eseguendoli in modalità Autopilot.
- Mantieni il controllo completo sui carichi di lavoro e sull'infrastruttura che non utilizzano la modalità Autopilot, ad esempio i pool di nodi creati manualmente.
- Puoi impostare una ComputeClass Autopilot come predefinita per il cluster o lo spazio dei nomi, in modo che i carichi di lavoro vengano eseguiti in modalità Autopilot a meno che non richiedano esplicitamente un'opzione diversa.
Queste opzioni consentono agli amministratori dei cluster di decidere il livello e l'ambito con cui utilizzare Autopilot.
Vantaggi di ComputeClasses Autopilot nei cluster Standard
L'esecuzione di alcuni carichi di lavoro in modalità Autopilot offre vantaggi come i seguenti:
- Riduci i costi di gestione dell'infrastruttura: Google esegue l'upgrade, la manutenzione, la configurazione e l'ottimizzazione di nodi specifici per te.
- Utilizza il modello di prezzi di Autopilot: i carichi di lavoro che utilizzano una ComputeClass Autopilot vengono fatturati utilizzando il modello di prezzi di Autopilot. Questo modello di prezzi include la fatturazione per pod per i carichi di lavoro che non richiedono hardware specifico. Per ulteriori informazioni, consulta la sezione Prezzi.
- Migliora la scalabilità e la sicurezza: i carichi di lavoro Autopilot usufruiscono di vantaggi come l'accesso alla piattaforma di calcolo ottimizzata per i container, vincoli di sicurezza predefiniti migliorati e scalabilità automatica dei nodi in base alle richieste di risorse. I nodi per questi carichi di lavoro utilizzano funzionalità come gli upgrade automatici dei nodi e le riparazioni automatiche.
- Migliora l'affidabilità: l'accordo sul livello del servizio (SLA) di GKE include un obiettivo del livello di servizio (SLO) di uptime dei pod per Autopilot.
Molti di questi vantaggi sono forniti anche dai cluster Autopilot, che offrono anche un'esperienza più gestita rispetto ai cluster Standard e includono diversi vantaggi in termini di sicurezza, networking e gestione delle risorse. Per ulteriori informazioni, consulta Panoramica di Autopilot.
Selezione dell'hardware in ComputeClasses Autopilot
In ComputeClasses Autopilot, puoi selezionare hardware specifico per i nodi (come GPU o tipi di macchine) oppure puoi consentire a GKE di inserire i pod su una piattaforma di calcolo per uso generico ottimizzata per i container. L'opzione per uso generico è consigliata per la maggior parte dei carichi di lavoro di produzione che non richiedono hardware specifico per essere eseguiti correttamente. Supporta le architetture x86 e Arm.
La tabella seguente descrive queste opzioni di configurazione, come sceglierne una in una ComputeClass e in che modo questa scelta influisce sul modello di fatturazione:
| Requisito del carico di lavoro | Configurazione di ComputeClass consigliata | Modello di fatturazione |
|---|---|---|
| Carichi di lavoro per uso generico | Utilizza una ComputeClass Autopilot con la
Le
ComputeClasses Autopilot integrate
utilizzano solo regole di priorità |
Modello di fatturazione basato su pod |
| Carichi di lavoro che richiedono hardware specifico | Utilizza una ComputeClass che utilizza qualsiasi regola di configurazione hardware disponibile, ad esempio la regola |
Modello di fatturazione basato sui nodi |
Configurazione di Autopilot in ComputeClasses
Puoi utilizzare la modalità Autopilot in un cluster Standard utilizzando una ComputeClass Autopilot integrata fornita da GKE oppure abilitando Autopilot in qualsiasi ComputeClass personalizzata che crei. Le sezioni seguenti descrivono ogni opzione.
ComputeClasses Autopilot integrate
GKE configura ComputeClasses Autopilot specifiche per te. Puoi
selezionare queste classi Autopilot integrate
in qualsiasi cluster idoneo. Le ComputeClasses Autopilot integrate nei cluster Standard utilizzano la regola di priorità podFamily per eseguire i pod sulla piattaforma di calcolo ottimizzata per i container. Per ulteriori informazioni, consulta
Informazioni su ComputeClasses integrate in GKE.
ComputeClasses Autopilot personalizzate
Puoi abilitare Autopilot in qualsiasi ComputeClass personalizzata che gestisci utilizzando il campo autopilot nella specifica ComputeClass. Le ComputeClasses Autopilot personalizzate sono utili in situazioni come le seguenti:
- I carichi di lavoro hanno requisiti hardware specifici, ad esempio acceleratori.
- Vuoi modificare determinate opzioni dei nodi, ad esempio impostare zone o applicare taint, pur utilizzando la piattaforma di calcolo ottimizzata per i container Autopilot.
Per abilitare Autopilot in una ComputeClass esistente, devi eliminarla, aggiornare la configurazione e poi ricrearla nel cluster. Le modifiche si applicano a tutti i nuovi nodi creati da GKE per i carichi di lavoro di cui esegui il deployment dopo aver aggiornato la ComputeClass Autopilot.
Per ulteriori informazioni sull'abilitazione di Autopilot nelle ComputeClasses personalizzate, consulta Selezionare hardware specifico per i pod Autopilot.
Prezzi
I prezzi di GKE Autopilot si applicano ai nodi e ai carichi di lavoro creati da GKE per una ComputeClass Autopilot. Il modello di fatturazione Autopilot applicato a un carico di lavoro specifico dipende dalla regola di priorità ComputeClass utilizzata da GKE per creare i nodi per quel carico di lavoro.
La tabella seguente descrive il modello di fatturazione applicato alle diverse configurazioni di ComputeClass Autopilot nei cluster in modalità Standard:
| Modelli di fatturazione per diverse configurazioni di ComputeClass | |
|---|---|
| Modello di fatturazione basato su pod | Il modello di fatturazione basato su pod si applica quando GKE utilizza una
podFamily regola di priorità per creare i nodi per un carico di lavoro. Le
ComputeClasses Autopilot integrate,
utilizzano sempre il modello di fatturazione basato su pod. |
| Modello di fatturazione basato sui nodi | Il modello di fatturazione basato sui nodi si applica quando GKE utilizza una regola di priorità ComputeClass che richiede esplicitamente hardware specifico, ad esempio una determinata famiglia di macchine o GPU. |
I prezzi di Autopilot si applicano solo ai carichi di lavoro e ai nodi che utilizzano una ComputeClass Autopilot. Il cluster in modalità Standard e tutti gli altri pool di nodi che esegui continuano a utilizzare i prezzi della modalità GKE Standard.
Impostazioni preconfigurate per i nodi gestiti da Autopilot
Prima di abilitare la modalità Autopilot in ComputeClasses, scopri cosa aspettarti dai nodi creati da GKE per eseguire i carichi di lavoro Autopilot. Google configura funzionalità e vincoli di sicurezza specifici nei nodi Autopilot. Di conseguenza, i carichi di lavoro di cui viene eseguito il deployment e che funzionano correttamente nei nodi in modalità Standard potrebbero essere rifiutati dalla modalità Autopilot se non soddisfano i requisiti di sicurezza di Autopilot.
La tabella seguente descrive le configurazioni delle funzionalità che sostituiscono le impostazioni corrispondenti nel cluster Standard. Se una configurazione non è presente in questa tabella, i nodi Autopilot utilizzano l'impostazione del cluster Standard. Ad esempio, Workload Identity Federation for GKE non è presente in questa tabella, il che significa che l'impostazione Workload Identity Federation for GKE del cluster Standard si applica ai nodi Autopilot creati da GKE.
| Funzionalità | Impostazione a livello di cluster Standard | Impostazione dei nodi gestiti da Autopilot |
|---|---|---|
| Upgrade e manutenzione dei nodi |
Configurabile: |
Preconfigurato:
|
| Scalabilità automatica | Configurabile: profilo di scalabilità automatica | Preconfigurato: profilo di scalabilità automatica optimize-utilization |
| Networking | Nativo VPC o basato su route | Richiede un cluster nativo di VPC |
| Sicurezza |
Configurabile:
|
Preconfigurato:
|
| Sistema operativo dei nodi |
Configurabile: |
Preconfigurato:
|
| Disco di avvio dei nodi |
Configurabile: |
Configurabile:
|
| Metadati dei nodi |
|
|
Richieste di risorse per i carichi di lavoro Autopilot
Affinché i carichi di lavoro Autopilot vengano eseguiti in modo efficiente, GKE applica determinati valori minimi e massimi per le richieste di CPU, memoria e spazio di archiviazione temporaneo nei pod. GKE applica anche richieste predefinite ai pod che non richiedono esplicitamente una di queste risorse. I valori specifici per i requisiti minimi, massimi e predefiniti delle risorse nei carichi di lavoro GKE Autopilot variano in base al tipo di hardware utilizzato dai pod.
Per lo spazio di archiviazione temporaneo, il valore predefinito se non richiedi spazio di archiviazione temporaneo è lo stesso per tutte le ComputeClasses e le selezioni hardware. Per ulteriori informazioni, consulta Richieste di risorse predefinite.
La tabella seguente fornisce link ai requisiti di CPU e memoria per le richieste dei pod, a seconda del tipo di hardware:
| Tipo di risorsa | Richieste minime e massime | Richieste predefinite |
|---|---|---|
| Pod per uso generico |
|
|
| GPU e TPU | Dipende dal tipo e dalla quantità di acceleratore hardware. Per ulteriori informazioni, consulta Valori minimi e massimi per la ComputeClass dell'acceleratore. | Dipende dal tipo e dalla quantità di acceleratore hardware. Per ulteriori informazioni, consulta Richieste predefinite per gli acceleratori. |
| Tipi di macchine e famiglie di macchine Compute Engine specifici |
|
Per qualsiasi tipo di macchina o famiglia di macchine Compute Engine, le richieste predefinite nella riga "Per uso generico" nella Richieste predefinite per ComputeClasses tabella. |
Passaggi successivi
- Esegui il deployment dei carichi di lavoro in modalità Autopilot nei cluster Standard
- Informazioni su ComputeClasses personalizzate