Controlla gli attributi dei nodi con scalabilità automatica con ComputeClass personalizzate

Questo documento mostra come controllare l'infrastruttura di computing e il comportamento di scalabilità automatica dei cluster Google Kubernetes Engine (GKE) in base alle esigenze specifiche dei tuoi carichi di lavoro utilizzando ComputeClass personalizzate.

Questo documento è destinato agli amministratori delle piattaforme che vogliono definire in modo dichiarativo i profili di scalabilità automatica per i nodi e agli operatori dei cluster che vogliono eseguire i propri carichi di lavoro su ComputeClass specifiche.

Informazioni sulle ComputeClass personalizzate

Le ComputeClass personalizzate sono risorse personalizzate di Kubernetes che ti consentono di definire le priorità che GKE deve seguire durante il provisioning dei nodi per eseguire i tuoi carichi di lavoro. Puoi utilizzare una ComputeClass personalizzata per:

  • Fornire a GKE un insieme di priorità da seguire in sequenza durante il provisioning dei nodi, ognuna con parametri specifici come una serie di macchine Compute Engine o una capacità di risorse minima
  • Definire le soglie e i parametri di scalabilità automatica per rimuovere i nodi sottoutilizzati e consolidare in modo efficiente i carichi di lavoro sulla capacità di computing esistente
  • Indicare a GKE di sostituire automaticamente le configurazioni dei nodi meno preferite con configurazioni dei nodi più preferite per prestazioni ottimali dei carichi di lavoro

Per comprendere tutte le opzioni di configurazione e il modo in cui interagiscono tra loro e con la modalità GKE Autopilot e la modalità GKE Standard, consulta Informazioni sulle ComputeClass personalizzate.

Prezzi

La risorsa personalizzata ComputeClass è fornita senza costi aggiuntivi in GKE. Si applicano le seguenti considerazioni sui prezzi:

Limitazioni

Il nome della ComputeClass non può iniziare con gke o autopilot.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti attività:

  • Abilita l'API Google Kubernetes Engine.
  • Abilita l'API Google Kubernetes Engine
  • Se vuoi utilizzare Google Cloud CLI per questa attività, installala e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica l'ultima versione eseguendo il gcloud components update comando. Le versioni precedenti di gcloud CLI potrebbero non supportare l'esecuzione dei comandi in questo documento.

Scenario di esempio per ComputeClass

Questo documento presenta uno scenario di esempio per il quale definisci una ComputeClass personalizzata. In pratica, devi considerare i requisiti dei tuoi carichi di lavoro e della tua organizzazione specifici e definire le ComputeClass che soddisfano questi requisiti. Per le descrizioni complete di tutte le opzioni per le ComputeClass, e per le considerazioni speciali, consulta Informazioni sulle ComputeClass personalizzate.

Considera il seguente scenario di esempio:

  • Il tuo obiettivo è ottimizzare i costi di esecuzione dei carichi di lavoro
  • I carichi di lavoro sono a tolleranza di errore e non richiedono un arresto normale o un runtime esteso
  • I carichi di lavoro richiedono almeno 64 vCPU per essere eseguiti in modo ottimale
  • Sei limitato alla serie di macchine N4 di Compute Engine

In base allo scenario di esempio, decidi di utilizzare una ComputeClass che:

  • Dà la priorità ai nodi N4 Spot con almeno 64 vCPU
  • Consente a GKE di eseguire il fallback a qualsiasi nodo N4 Spot, indipendentemente dalla capacità di computing
  • Se non sono disponibili nodi N4 Spot, consente a GKE di utilizzare nodi N4 on demand
  • Indica a GKE di spostare i carichi di lavoro sui nodi Spot ogni volta che sono di nuovo disponibili

Configura una ComputeClass in modalità Autopilot

In GKE Autopilot, definisci una ComputeClass, la esegui il deployment nel cluster e la richiedi nei carichi di lavoro. GKE esegue per te tutti i passaggi di configurazione dei nodi, come l'applicazione di etichette e taint.

Salva il seguente manifest come compute-class.yaml:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: cost-optimized
spec:
  priorities:
  - machineFamily: n4
    spot: true
    minCores: 64
  - machineFamily: n4
    spot: true
  - machineFamily: n4
    spot: false
  activeMigration:
    optimizeRulePriority: true
  nodePoolAutoCreation:
    enabled: true

Configura una ComputeClass in modalità Standard

Nei cluster in modalità GKE Standard, potresti dover eseguire una configurazione manuale per assicurarti che i pod ComputeClass vengano pianificati come previsto. La configurazione manuale dipende dalla creazione automatica dei node pool, come segue:

Per consentire a GKE di creare automaticamente i node pool per la ComputeClass, segui questi passaggi:

  1. Per i cluster in modalità Standard che eseguono una versione precedente alla 1.33.3-gke.1136000 e non sono registrati nel canale di rilascio rapido, abilita il provisioning automatico dei nodi a livello di cluster.
  2. Salva il seguente manifest di esempio come compute-class.yaml:

    apiVersion: cloud.google.com/v1
    kind: ComputeClass
    metadata:
      name: cost-optimized
    spec:
      priorities:
      - machineFamily: n4
        spot: true
        minCores: 64
      - machineFamily: n4
        spot: true
      - machineFamily: n4
        spot: false
      activeMigration:
        optimizeRulePriority: true
      nodePoolAutoCreation:
        enabled: true
    

    Quando esegui il deployment dei pod che richiedono questa ComputeClass di esempio e devono essere creati nuovi nodi, GKE dà la priorità alla creazione dei nodi nell'ordine degli elementi nel campo priorities. Se necessario, GKE crea nuovi node pool che soddisfano i requisiti hardware della ComputeClass.

Puoi anche specificare un preciso tipo di macchina personalizzato nelle priorità. L'utilizzo di tipi di macchine personalizzati richiede GKE versione 1.33.2-gke.1111000 o successive. L'esempio seguente configura una ComputeClass che dà la priorità alle VM spot per il tipo di macchina personalizzata n4-custom-8-20480 ed esegue il fallback alle VM on demand dello stesso tipo se la capacità spot non è disponibile:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: custom-machine-type
spec:
  priorities:
  - machineType: n4-custom-8-20480
    spot: true
  - machineType: n4-custom-8-20480
    spot: false
  nodePoolAutoCreation:
    enabled: true

Utilizza ComputeClass con node pool creati manualmente

Questa sezione mostra come definire una ComputeClass in un cluster che utilizza solo node pool creati manualmente.

  1. Salva il seguente manifest come compute-class.yaml:

    apiVersion: cloud.google.com/v1
    kind: ComputeClass
    metadata:
      name: cost-optimized
    spec:
      priorities:
      - machineFamily: n4
        spot: true
        minCores: 64
      - machineFamily: n4
        spot: true
      - machineFamily: n4
        spot: false
      activeMigration:
        optimizeRulePriority: true
    
  2. Crea un nuovo pool di nodi con scalabilità automatica che utilizzi VM spot e associalo alla ComputeClass:

    gcloud container node-pools create cost-optimized-pool \
        --location=LOCATION \
        --cluster=CLUSTER_NAME \
        --machine-type=n4-standard-64 \
        --spot \
        --enable-autoscaling \
        --max-nodes=9 \
        --node-labels="cloud.google.com/compute-class=cost-optimized" \
        --node-taints="cloud.google.com/compute-class=cost-optimized:NoSchedule"
    

    Sostituisci quanto segue:

    • LOCATION: la località del cluster.
    • CLUSTER_NAME: il nome del cluster esistente.
  3. Crea un nuovo pool di nodi con scalabilità automatica con VM on demand e associalo alla ComputeClass:

    gcloud container node-pools create on-demand-pool \
        --location=LOCATION \
        --cluster=CLUSTER_NAME \
        --machine-type=n4-standard-64 \
        --enable-autoscaling \
        --max-nodes=9 \
        --num-nodes=0 \
        --node-labels="cloud.google.com/compute-class=cost-optimized" \
        --node-taints="cloud.google.com/compute-class=cost-optimized:NoSchedule"
    

Quando esegui il deployment dei pod che richiedono questa ComputeClass e devono essere creati nuovi nodi, GKE dà la priorità alla creazione dei nodi nel pool di nodi cost-optimized-pool. Se non è possibile creare nuovi nodi, GKE crea i nodi nel pool di nodi on-demand-pool.

Per maggiori dettagli su come i node pool creati manualmente interagiscono con le ComputeClass personalizzate, consulta Configura i node pool creati manualmente per l'utilizzo di ComputeClass.

Personalizza le soglie di scalabilità automatica per il consolidamento dei nodi

Per impostazione predefinita, GKE rimuove i nodi sottoutilizzati e ripianifica i carichi di lavoro su altri nodi disponibili. Puoi personalizzare ulteriormente le soglie e la tempistica dopo le quali un nodo diventa un candidato per la rimozione utilizzando il campo autoscalingPolicy nella definizione di ComputeClass, come nell'esempio seguente:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: cost-optimized
spec:
  priorities:
  - machineFamily: n4
    spot: true
    minCores: 64
  - machineFamily: n4
    spot: true
  - machineFamily: n4
    spot: false
  activeMigration:
    optimizeRulePriority: true
  autoscalingPolicy:
    consolidationDelayMinutes : 5
    consolidationThreshold    : 70

Questo esempio fa sì che un nodo diventi un candidato per la rimozione se è sottoutilizzato del 70% della capacità di CPU e memoria disponibile per più di cinque minuti. Per un elenco dei parametri disponibili, consulta Imposta i parametri di scalabilità automatica per il consolidamento dei nodi.

Esegui il deployment di una ComputeClass in un cluster

Dopo aver definito una ComputeClass, esegui il deployment nel cluster:

kubectl apply -f compute-class.yaml

Questa ComputeClass è pronta per essere utilizzata nel cluster. Puoi richiedere la ComputeClass nelle specifiche dei pod o, facoltativamente, impostarla come ComputeClass predefinita in uno spazio dei nomi specifico.

Richiedi una ComputeClass in un carico di lavoro

Per richiedere una ComputeClass in un carico di lavoro, aggiungi un selettore di nodi per quella ComputeClass nel manifest, come nei seguenti passaggi:

  1. Salva il seguente manifest come cc-workload.yaml:

    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: custom-workload
    spec:
      replicas: 2
      selector:
        matchLabels:
          app: custom-workload
      template:
        metadata:
          labels:
            app: custom-workload
        spec:
          nodeSelector:
            cloud.google.com/compute-class: cost-optimized
          containers:
          - name: test
            image: registry.k8s.io/pause
            resources:
              requests:
                cpu: 1.5
                memory: "4Gi"
    
  2. Esegui il deployment del carico di lavoro:

    kubectl apply -f cc-workload.yaml
    

Quando esegui il deployment di questo carico di lavoro, GKE aggiunge automaticamente una tolleranza ai pod che corrisponde al taint del nodo per la ComputeClass richiesta. Questa tolleranza contribuisce a garantire che solo i pod che richiedono la ComputeClass vengano eseguiti sui nodi ComputeClass.

Aggiorna una ComputeClass di cui è stato eseguito il deployment

Per aggiornare una ComputeClass di cui è stato eseguito il deployment, modifica il manifest YAML per la ComputeClass. Quindi, esegui il deployment del manifest modificato eseguendo il seguente comando:

kubectl apply -f PATH_TO_FILE

Sostituisci PATH_TO_FILE con il percorso del manifest modificato. Assicurati che il valore nel campo name rimanga invariato.

Quando esegui il deployment della ComputeClass aggiornata, GKE utilizza la configurazione aggiornata per creare nuovi nodi. GKE non modifica i nodi esistenti con la configurazione aggiornata.

Nel tempo, GKE potrebbe spostare i pod esistenti sui nodi che utilizzano la configurazione aggiornata se la ComputeClass utilizza la migrazione attiva e se i pod esistenti sono idonei alla migrazione.

Passaggi successivi