À propos du démarrage plus rapide des charges de travail avec les nœuds à démarrage rapide

Cette page explique comment déployer et mettre à l'échelle plus rapidement des charges de travail dans des clusters Google Kubernetes Engine (GKE) à l'aide de nœuds à démarrage rapide. Les nœuds à démarrage rapide sont utilisés dans GKE avec le mode Autopilot au mieux de leurs capacités lorsque les charges de travail utilisent des configurations compatibles.

Les nœuds GKE à démarrage rapide ont un temps de démarrage nettement inférieur pour les familles de machines compatibles. Le temps de démarrage accéléré présente les avantages suivants :

  • Démarrage à froid plus rapide
  • Autoscaling plus rapide
  • Latence de longue traîne améliorée pour la planification des pods
  • Rentabilité améliorée de l'infrastructure

Avec les nœuds à démarrage rapide, GKE pré-initialise les ressources matérielles pour accélérer le temps de démarrage. Les ressources pré-initialisées sont disponibles au mieux de leurs capacités. Les requêtes de surtension ne peuvent être traitées que partiellement. Sans les nœuds à démarrage rapide, les ressources sont initialisées à la demande et les nœuds sont traités au temps de démarrage normal.

Conditions requises

Les nœuds à démarrage rapide ne nécessitent aucune configuration supplémentaire. GKE utilise automatiquement des nœuds à démarrage rapide si vos charges de travail utilisent des configurations compatibles. Vous devez répondre à toutes les exigences suivantes pour utiliser des nœuds à démarrage rapide :

Limites

Les fonctionnalités suivantes ne sont pas compatibles avec les nœuds GKE à démarrage rapide. Si vous utilisez l'une de ces fonctionnalités, GKE provisionne des nœuds avec le temps de démarrage habituel :

Charges de travail GPU Autopilot

La demande de GPU compatibles en mode Autopilot entraîne un temps de démarrage des nœuds jusqu'à quatre fois plus rapide et un temps de planification des pods jusqu'à deux fois plus rapide que les requêtes similaires en mode GKE Standard, car les charges de travail GPU Autopilot peuvent utiliser des nœuds à démarrage rapide.

Voici quelques exemples de cas d'utilisation. Toutefois, tous les pods répondant aux conditions de la section Conditions requises sont compatibles avec les nœuds à démarrage rapide.

ComputeClass

Demandez un type et un nombre d'accélérateurs compatibles dans une ComputeClass, comme dans l'exemple suivant :

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Lorsque vous sélectionnez cette ComputeClass dans un pod, comme dans l'exemple suivant, GKE utilise des nœuds à démarrage rapide :

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Remplacez les valeurs suivantes :

  • ACCELERATOR_COMPUTE_CLASS_NAME: nom de la ComputeClass qui demande les accélérateurs.
  • ACCELERATOR_TYPE : type d'accélérateur.
  • ACCELERATOR_COUNT: nombre d'accélérateurs requis par le pod. Cette valeur doit être inférieure ou égale à la valeur du champ spec.priorities.gpu.count dans la ComputeClass.
  • POD_NAME : nom de votre pod.

Pour en savoir plus sur ComputeClass, consultez la section À propos des classes de calcul personnalisées.

Pod specification

Sélectionnez un type et un nombre d'accélérateurs compatibles dans la spécification de votre pod, comme dans l'exemple suivant :

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Remplacez les valeurs suivantes :

  • POD_NAME : nom de votre pod.
  • ACCELERATOR_NAME: nom de l'accélérateur requis par le pod.
  • ACCELERATOR_COUNT: nombre d'accélérateurs requis par le pod.

Exigences de configuration pour les ressources de calcul éligibles

Les tableaux des sections suivantes décrivent les exigences spécifiques pour que GKE provisionne les ressources de calcul pertinentes en tant que nœuds à démarrage rapide.

Plate-forme de calcul optimisée pour les conteneurs Autopilot

Consultez les exigences suivantes pour que GKE provisionne des nœuds à démarrage rapide avec la plate-forme de calcul optimisée pour les conteneurs Autopilot.

Ressource de calcul Canal de publication et compatibilité des versions Disques compatibles
Plate-forme de calcul optimisée pour les conteneurs Autopilot
  • Canal rapide
  • 1.33.0-gke.1696000 ou version ultérieure

Série de machines G2

Consultez les exigences suivantes pour que GKE provisionne des machines G2 en tant que nœuds à démarrage rapide.

Ressource de calcul Canal de publication et compatibilité des versions Disques compatibles
Série de machines G2
  • Canaux rapide et régulier
  • 1.31 ou version ultérieure

Série de machines A2

Consultez les exigences suivantes pour que GKE provisionne des machines A2 en tant que nœuds à démarrage rapide.

Ressource de calcul Canal de publication et compatibilité des versions Disques compatibles
Types de machines A2 Standard
  • Canaux rapide et régulier
  • 1.32.0-gke.1008000 ou version ultérieure
  • Disques de démarrage pd-balanced ou pd-ssd jusqu'à 1 000 Gio.
  • Aucun disque SSD local.
Types de machines A2 Ultra
  • Canaux rapide et régulier
  • 1.32.0-gke.1008000 ou version ultérieure
  • pd-balanced ou pd-ssd disques de démarrage jusqu'à 1 000 Gio, avec des limites plus élevées pour a2‑ultragpu‑4g (1 500 Gio) et a2‑ultragpu‑8g (3 000 Gio).
  • Avec des disques SSD locaux associés automatiquement .

Type de machine A3 Mega

Consultez les exigences suivantes pour que GKE provisionne des machines A3 Mega en tant que nœuds à démarrage rapide.

Ressource de calcul Canal de publication et compatibilité des versions Disques compatibles
Type de machine A3 Mega
  • Canal rapide
  • 1.34.4-gke.1130000 ou version ultérieure
  • Disques de démarrage hyperdisk-balanced, pd-ssd ou pd-balanced.
  • Avec des disques SSD locaux associés automatiquement .

Série de machines G4

Consultez les exigences suivantes pour que GKE provisionne des machines G4 en tant que nœuds à démarrage rapide.

Ressource de calcul Canal de publication et compatibilité des versions Disques compatibles
Série de machines G4
  • Canal rapide
  • 1.34.4-gke.1130000 ou version ultérieure

Tarifs

Les nœuds à démarrage rapide sont disponibles dans GKE Autopilot sans frais supplémentaires. Pour en savoir plus sur les tarifs de GKE Autopilot, consultez la section Mode Autopilot sur la page Tarifs de Google Kubernetes Engine.

Étape suivante