Questo documento mostra come controllare l'infrastruttura di computing e il comportamento di scalabilità automatica dei cluster Google Kubernetes Engine (GKE) in base alle esigenze specifiche dei tuoi carichi di lavoro utilizzando ComputeClass personalizzate.
Questo documento è destinato agli amministratori delle piattaforme che vogliono definire in modo dichiarativo i profili di scalabilità automatica per i nodi e agli operatori dei cluster che vogliono eseguire i propri carichi di lavoro su ComputeClass specifiche.
Informazioni sulle ComputeClass personalizzate
Le ComputeClass personalizzate sono risorse personalizzate di Kubernetes che ti consentono di definire le priorità che GKE deve seguire durante il provisioning dei nodi per eseguire i tuoi carichi di lavoro. Puoi utilizzare una ComputeClass personalizzata per:
- Fornire a GKE un insieme di priorità da seguire in sequenza durante il provisioning dei nodi, ognuna con parametri specifici come una serie di macchine Compute Engine o una capacità di risorse minima
- Definire le soglie e i parametri di scalabilità automatica per rimuovere i nodi sottoutilizzati e consolidare in modo efficiente i carichi di lavoro sulla capacità di computing esistente
- Indicare a GKE di sostituire automaticamente le configurazioni dei nodi meno preferite con configurazioni dei nodi più preferite per prestazioni ottimali dei carichi di lavoro
Per comprendere tutte le opzioni di configurazione e il modo in cui interagiscono tra loro e con la modalità GKE Autopilot e la modalità GKE Standard, consulta Informazioni sulle ComputeClass personalizzate.
Prezzi
La risorsa personalizzata ComputeClass è fornita senza costi aggiuntivi in GKE. Si applicano le seguenti considerazioni sui prezzi:
Modalità GKE Autopilot: la fatturazione viene eseguita utilizzando la modalità di fatturazione basata sui nodi. Per i dettagli, consulta Prezzi della modalità Autopilot.
Modalità GKE Standard: consulta Prezzi della modalità Standard.
Limitazioni
Il nome della ComputeClass non può iniziare con gke o autopilot.
Prima di iniziare
Prima di iniziare, assicurati di aver eseguito le seguenti attività:
- Abilita l'API Google Kubernetes Engine. Abilita l'API Google Kubernetes Engine
- Se vuoi utilizzare Google Cloud CLI per questa attività,
installala e poi
inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica l'ultima
versione eseguendo il
gcloud components updatecomando. Le versioni precedenti di gcloud CLI potrebbero non supportare l'esecuzione dei comandi in questo documento.
- Assicurati di avere un cluster GKE esistente che esegue la versione 1.30.3-gke.1451000 o successive. Per saperne di più, consulta Crea un cluster Autopilot.
Se utilizzi un cluster in modalità Standard, assicurati di soddisfare uno dei seguenti requisiti:
- Abilita la scalabilità automatica in almeno un pool di nodi del cluster.
- Se il cluster standard esegue una versione precedente alla 1.33.3-gke.1136000 e non è registrato nel canale di rilascio rapido , abilita il provisioning automatico dei nodi a livello di cluster.
Scenario di esempio per ComputeClass
Questo documento presenta uno scenario di esempio per il quale definisci una ComputeClass personalizzata. In pratica, devi considerare i requisiti dei tuoi carichi di lavoro e della tua organizzazione specifici e definire le ComputeClass che soddisfano questi requisiti. Per le descrizioni complete di tutte le opzioni per le ComputeClass, e per le considerazioni speciali, consulta Informazioni sulle ComputeClass personalizzate.
Considera il seguente scenario di esempio:
- Il tuo obiettivo è ottimizzare i costi di esecuzione dei carichi di lavoro
- I carichi di lavoro sono a tolleranza di errore e non richiedono un arresto normale o un runtime esteso
- I carichi di lavoro richiedono almeno 64 vCPU per essere eseguiti in modo ottimale
- Sei limitato alla serie di macchine N4 di Compute Engine
In base allo scenario di esempio, decidi di utilizzare una ComputeClass che:
- Dà la priorità ai nodi N4 Spot con almeno 64 vCPU
- Consente a GKE di eseguire il fallback a qualsiasi nodo N4 Spot, indipendentemente dalla capacità di computing
- Se non sono disponibili nodi N4 Spot, consente a GKE di utilizzare nodi N4 on demand
- Indica a GKE di spostare i carichi di lavoro sui nodi Spot ogni volta che sono di nuovo disponibili
Configura una ComputeClass in modalità Autopilot
In GKE Autopilot, definisci una ComputeClass, la esegui il deployment nel cluster e la richiedi nei carichi di lavoro. GKE esegue per te tutti i passaggi di configurazione dei nodi, come l'applicazione di etichette e taint.
Salva il seguente manifest come compute-class.yaml:
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: cost-optimized
spec:
priorities:
- machineFamily: n4
spot: true
minCores: 64
- machineFamily: n4
spot: true
- machineFamily: n4
spot: false
activeMigration:
optimizeRulePriority: true
nodePoolAutoCreation:
enabled: true
Configura una ComputeClass in modalità Standard
Nei cluster in modalità GKE Standard, potresti dover eseguire una configurazione manuale per assicurarti che i pod ComputeClass vengano pianificati come previsto. La configurazione manuale dipende dalla creazione automatica dei node pool, come segue:
- Node pool creati automaticamente: non è richiesta alcuna configurazione manuale. GKE esegue automaticamente i passaggi di configurazione di ComputeClass. Per i dettagli, consulta Creazione automatica di node pool e ComputeClass.
- Node pool creati manualmente: è richiesta una configurazione manuale. Devi aggiungere etichette e taint dei nodi ai node pool creati manualmente per associare i nodi a una ComputeClass specifica. Per i dettagli, consulta Configura i node pool creati manualmente per l'utilizzo di ComputeClass.
Per consentire a GKE di creare automaticamente i node pool per la ComputeClass, segui questi passaggi:
- Per i cluster in modalità Standard che eseguono una versione precedente alla 1.33.3-gke.1136000 e non sono registrati nel canale di rilascio rapido, abilita il provisioning automatico dei nodi a livello di cluster.
Salva il seguente manifest di esempio come
compute-class.yaml:apiVersion: cloud.google.com/v1 kind: ComputeClass metadata: name: cost-optimized spec: priorities: - machineFamily: n4 spot: true minCores: 64 - machineFamily: n4 spot: true - machineFamily: n4 spot: false activeMigration: optimizeRulePriority: true nodePoolAutoCreation: enabled: trueQuando esegui il deployment dei pod che richiedono questa ComputeClass di esempio e devono essere creati nuovi nodi, GKE dà la priorità alla creazione dei nodi nell'ordine degli elementi nel campo
priorities. Se necessario, GKE crea nuovi node pool che soddisfano i requisiti hardware della ComputeClass.
Puoi anche specificare un preciso
tipo di macchina personalizzato
nelle priorità. L'utilizzo di tipi di macchine personalizzati richiede GKE versione 1.33.2-gke.1111000 o successive. L'esempio seguente configura una ComputeClass che dà la priorità alle VM spot per il tipo di macchina personalizzata n4-custom-8-20480 ed esegue il fallback alle VM on demand dello stesso tipo se la capacità spot non è disponibile:
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: custom-machine-type
spec:
priorities:
- machineType: n4-custom-8-20480
spot: true
- machineType: n4-custom-8-20480
spot: false
nodePoolAutoCreation:
enabled: true
Utilizza ComputeClass con node pool creati manualmente
Questa sezione mostra come definire una ComputeClass in un cluster che utilizza solo node pool creati manualmente.
Salva il seguente manifest come
compute-class.yaml:apiVersion: cloud.google.com/v1 kind: ComputeClass metadata: name: cost-optimized spec: priorities: - machineFamily: n4 spot: true minCores: 64 - machineFamily: n4 spot: true - machineFamily: n4 spot: false activeMigration: optimizeRulePriority: trueCrea un nuovo pool di nodi con scalabilità automatica che utilizzi VM spot e associalo alla ComputeClass:
gcloud container node-pools create cost-optimized-pool \ --location=LOCATION \ --cluster=CLUSTER_NAME \ --machine-type=n4-standard-64 \ --spot \ --enable-autoscaling \ --max-nodes=9 \ --node-labels="cloud.google.com/compute-class=cost-optimized" \ --node-taints="cloud.google.com/compute-class=cost-optimized:NoSchedule"Sostituisci quanto segue:
LOCATION: la località del cluster.CLUSTER_NAME: il nome del cluster esistente.
Crea un nuovo pool di nodi con scalabilità automatica con VM on demand e associalo alla ComputeClass:
gcloud container node-pools create on-demand-pool \ --location=LOCATION \ --cluster=CLUSTER_NAME \ --machine-type=n4-standard-64 \ --enable-autoscaling \ --max-nodes=9 \ --num-nodes=0 \ --node-labels="cloud.google.com/compute-class=cost-optimized" \ --node-taints="cloud.google.com/compute-class=cost-optimized:NoSchedule"
Quando esegui il deployment dei pod che richiedono questa ComputeClass e devono essere creati nuovi nodi, GKE dà la priorità alla creazione dei nodi nel pool di nodi cost-optimized-pool. Se non è possibile creare nuovi nodi, GKE crea i nodi nel pool di nodi on-demand-pool.
Per maggiori dettagli su come i node pool creati manualmente interagiscono con le ComputeClass personalizzate, consulta Configura i node pool creati manualmente per l'utilizzo di ComputeClass.
Personalizza le soglie di scalabilità automatica per il consolidamento dei nodi
Per impostazione predefinita, GKE rimuove i nodi sottoutilizzati e ripianifica i carichi di lavoro su altri nodi disponibili. Puoi personalizzare ulteriormente le soglie e la tempistica dopo le quali un nodo diventa un candidato per la rimozione utilizzando il campo autoscalingPolicy nella definizione di ComputeClass, come nell'esempio seguente:
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: cost-optimized
spec:
priorities:
- machineFamily: n4
spot: true
minCores: 64
- machineFamily: n4
spot: true
- machineFamily: n4
spot: false
activeMigration:
optimizeRulePriority: true
autoscalingPolicy:
consolidationDelayMinutes : 5
consolidationThreshold : 70
Questo esempio fa sì che un nodo diventi un candidato per la rimozione se è sottoutilizzato del 70% della capacità di CPU e memoria disponibile per più di cinque minuti. Per un elenco dei parametri disponibili, consulta Imposta i parametri di scalabilità automatica per il consolidamento dei nodi.
Esegui il deployment di una ComputeClass in un cluster
Dopo aver definito una ComputeClass, esegui il deployment nel cluster:
kubectl apply -f compute-class.yaml
Questa ComputeClass è pronta per essere utilizzata nel cluster. Puoi richiedere la ComputeClass nelle specifiche dei pod o, facoltativamente, impostarla come ComputeClass predefinita in uno spazio dei nomi specifico.
Richiedi una ComputeClass in un carico di lavoro
Per richiedere una ComputeClass in un carico di lavoro, aggiungi un selettore di nodi per quella ComputeClass nel manifest, come nei seguenti passaggi:
Salva il seguente manifest come
cc-workload.yaml:apiVersion: apps/v1 kind: Deployment metadata: name: custom-workload spec: replicas: 2 selector: matchLabels: app: custom-workload template: metadata: labels: app: custom-workload spec: nodeSelector: cloud.google.com/compute-class: cost-optimized containers: - name: test image: registry.k8s.io/pause resources: requests: cpu: 1.5 memory: "4Gi"Esegui il deployment del carico di lavoro:
kubectl apply -f cc-workload.yaml
Quando esegui il deployment di questo carico di lavoro, GKE aggiunge automaticamente una tolleranza ai pod che corrisponde al taint del nodo per la ComputeClass richiesta. Questa tolleranza contribuisce a garantire che solo i pod che richiedono la ComputeClass vengano eseguiti sui nodi ComputeClass.
Aggiorna una ComputeClass di cui è stato eseguito il deployment
Per aggiornare una ComputeClass di cui è stato eseguito il deployment, modifica il manifest YAML per la ComputeClass. Quindi, esegui il deployment del manifest modificato eseguendo il seguente comando:
kubectl apply -f PATH_TO_FILE
Sostituisci PATH_TO_FILE con il percorso del manifest modificato. Assicurati che il valore nel campo name rimanga invariato.
Quando esegui il deployment della ComputeClass aggiornata, GKE utilizza la configurazione aggiornata per creare nuovi nodi. GKE non modifica i nodi esistenti con la configurazione aggiornata.
Nel tempo, GKE potrebbe spostare i pod esistenti sui nodi che utilizzano la configurazione aggiornata se la ComputeClass utilizza la migrazione attiva e se i pod esistenti sono idonei alla migrazione.
Passaggi successivi
- Scopri di più sulle ComputeClass personalizzate.
- Applica le ComputeClass personalizzate ai pod per impostazione predefinita.
- Risolvi i problemi relativi alle ComputeClass personalizzate.