Cette page explique comment déployer et mettre à l'échelle plus rapidement des charges de travail dans des clusters Google Kubernetes Engine (GKE) à l'aide de nœuds à démarrage rapide. Les nœuds à démarrage rapide sont utilisés dans GKE avec le mode Autopilot au mieux de leurs capacités lorsque les charges de travail utilisent des configurations compatibles.
Les nœuds GKE à démarrage rapide ont un temps de démarrage nettement inférieur pour les familles de machines compatibles. Le temps de démarrage accéléré présente les avantages suivants :
- Démarrage à froid plus rapide
- Autoscaling plus rapide
- Latence de longue traîne améliorée pour la planification des pods
- Rentabilité améliorée de l'infrastructure
Avec les nœuds à démarrage rapide, GKE pré-initialise les ressources matérielles pour accélérer le temps de démarrage. Les ressources pré-initialisées sont disponibles au mieux de leurs capacités. Les requêtes de surtension ne peuvent être traitées que partiellement. Sans les nœuds à démarrage rapide, les ressources sont initialisées à la demande et les nœuds sont traités au temps de démarrage normal.
Conditions requises
Les nœuds à démarrage rapide ne nécessitent aucune configuration supplémentaire. GKE utilise automatiquement des nœuds à démarrage rapide si vos charges de travail utilisent des configurations compatibles. Vous devez répondre à toutes les exigences suivantes pour utiliser des nœuds à démarrage rapide :
- Utilisez des clusters Autopilot ou exécutez des charges de travail en mode Autopilot dans vos clusters Standard.
- N'utilisez aucune fonctionnalité incompatible avec les nœuds à démarrage rapide. Pour en savoir plus, consultez la section Limites.
Utilisez l'une des ressources de calcul suivantes, décrites dans les tableaux respectifs de la section Exigences de configuration pour les ressources de calcul éligibles :
Limites
Les fonctionnalités suivantes ne sont pas compatibles avec les nœuds GKE à démarrage rapide. Si vous utilisez l'une de ces fonctionnalités, GKE provisionne des nœuds avec le temps de démarrage habituel :
- G2 avec la version du pilote GPU
DEFAULTsur les versions de GKE antérieures à 1.33.0-gke.1304000. Pour la version 1.33.0-gke.1304000 ou ultérieure,LATESTetDEFAULTfonctionnent avec les nœuds à démarrage rapide. - Disques de démarrage secondaires sur les versions antérieures à 1.33.2-gke.1015000.
- Clés de chiffrement gérées par le client (CMEK)
- Spot VM
- Stratégies d'emplacement
- Prise en charge de plusieurs réseaux
Charges de travail GPU Autopilot
La demande de GPU compatibles en mode Autopilot entraîne un temps de démarrage des nœuds jusqu'à quatre fois plus rapide et un temps de planification des pods jusqu'à deux fois plus rapide que les requêtes similaires en mode GKE Standard, car les charges de travail GPU Autopilot peuvent utiliser des nœuds à démarrage rapide.
Voici quelques exemples de cas d'utilisation. Toutefois, tous les pods répondant aux conditions de la section Conditions requises sont compatibles avec les nœuds à démarrage rapide.
ComputeClass
Demandez un type et un nombre d'accélérateurs compatibles dans une ComputeClass, comme dans l'exemple suivant :
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
priorities:
- gpu:
type: ACCELERATOR_TYPE
count: ACCELERATOR_COUNT
nodePoolAutoCreation:
enabled: true
Lorsque vous sélectionnez cette ComputeClass dans un pod, comme dans l'exemple suivant, GKE utilise des nœuds à démarrage rapide :
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
# Select a ComputeClass that requests compatible GPUs
cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
containers:
- name: my-container
image: registry.k8s.io/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
Remplacez les valeurs suivantes :
ACCELERATOR_COMPUTE_CLASS_NAME: nom de la ComputeClass qui demande les accélérateurs.ACCELERATOR_TYPE: type d'accélérateur.ACCELERATOR_COUNT: nombre d'accélérateurs requis par le pod. Cette valeur doit être inférieure ou égale à la valeur du champspec.priorities.gpu.countdans la ComputeClass.POD_NAME: nom de votre pod.
Pour en savoir plus sur ComputeClass, consultez la section À propos des classes de calcul personnalisées.
Pod specification
Sélectionnez un type et un nombre d'accélérateurs compatibles dans la spécification de votre pod, comme dans l'exemple suivant :
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
cloud.google.com/gke-accelerator: ACCELERATOR_NAME
containers:
- name: my-container
image: registry.k8s.io/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
Remplacez les valeurs suivantes :
POD_NAME: nom de votre pod.ACCELERATOR_NAME: nom de l'accélérateur requis par le pod.ACCELERATOR_COUNT: nombre d'accélérateurs requis par le pod.
Exigences de configuration pour les ressources de calcul éligibles
Les tableaux des sections suivantes décrivent les exigences spécifiques pour que GKE provisionne les ressources de calcul pertinentes en tant que nœuds à démarrage rapide.
Plate-forme de calcul optimisée pour les conteneurs Autopilot
Consultez les exigences suivantes pour que GKE provisionne des nœuds à démarrage rapide avec la plate-forme de calcul optimisée pour les conteneurs Autopilot.
| Ressource de calcul | Canal de publication et compatibilité des versions | Disques compatibles |
|---|---|---|
| Plate-forme de calcul optimisée pour les conteneurs Autopilot |
|
|
Série de machines G2
Consultez les exigences suivantes pour que GKE provisionne des machines G2 en tant que nœuds à démarrage rapide.
| Ressource de calcul | Canal de publication et compatibilité des versions | Disques compatibles |
|---|---|---|
| Série de machines G2 |
|
|
Série de machines A2
Consultez les exigences suivantes pour que GKE provisionne des machines A2 en tant que nœuds à démarrage rapide.
| Ressource de calcul | Canal de publication et compatibilité des versions | Disques compatibles |
|---|---|---|
| Types de machines A2 Standard |
|
|
| Types de machines A2 Ultra |
|
Type de machine A3 Mega
Consultez les exigences suivantes pour que GKE provisionne des machines A3 Mega en tant que nœuds à démarrage rapide.
| Ressource de calcul | Canal de publication et compatibilité des versions | Disques compatibles |
|---|---|---|
| Type de machine A3 Mega |
|
Série de machines G4
Consultez les exigences suivantes pour que GKE provisionne des machines G4 en tant que nœuds à démarrage rapide.
| Ressource de calcul | Canal de publication et compatibilité des versions | Disques compatibles |
|---|---|---|
| Série de machines G4 |
|
|
Tarifs
Les nœuds à démarrage rapide sont disponibles dans GKE Autopilot sans frais supplémentaires. Pour en savoir plus sur les tarifs de GKE Autopilot, consultez la section Mode Autopilot sur la page Tarifs de Google Kubernetes Engine.
Étape suivante
- À propos de la plate-forme de calcul optimisée pour les conteneurs Autopilot
- À propos des classes de calcul personnalisées
- Présentation des performances des disques persistants