Ce document explique comment créer des stratégies pour les groupes d'instances gérés (MIG) qui comportent des instances Compute Engine A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D. Pour en savoir plus sur les exigences et les limites que vous appliquez lorsque vous créez des stratégies de charge de travail, consultez À propos des stratégies de charge de travail.
Une stratégie de charge de travail vous permet de spécifier l'emplacement ou la topologie des instances Compute Engine de votre MIG. Par exemple, vous pouvez utiliser des stratégies de charge de travail pour rapprocher les instances de calcul les unes des autres, ce qui réduit la latence réseau pour les charges de travail d'intelligence artificielle (IA), de machine learning (ML) ou de calcul haute performance (HPC).
Avant de commencer
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification permet de valider votre identité pour accéder aux Cloud de Confiance by S3NS services et aux API. Pour exécuter
du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de
Compute Engine en sélectionnant l'une des options suivantes :
Sélectionnez l'onglet correspondant à la façon dont vous prévoyez d'utiliser les exemples de cette page :
gcloud
-
Installez la Google Cloud CLI, puis connectez-vous à la gcloud CLI avec votre identité fédérée. Après vous être connecté, initialisez la Google Cloud CLI en exécutant la commande suivante :
gcloud init
-
- Définissez une région et une zone par défaut.
REST
Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.
Installez la Google Cloud CLI, puis connectez-vous à la gcloud CLI avec votre identité fédérée.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l' Cloud de Confiance authentification.
Rôles requis
Pour obtenir les autorisations nécessaires pour créer et appliquer des stratégies de charge de travail aux MIG, demandez à votre administrateur de vous accorder le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour créer et appliquer des stratégies de charge de travail aux MIG. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer et appliquer des stratégies de charge de travail aux MIG :
-
Pour créer une stratégie de charge de travail :
compute.resourcePolicies.createsur le projet
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Créer une stratégie de charge de travail
Pour créer une stratégie de charge de travail, utilisez l'une des méthodes suivantes en fonction de la série de machines utilisée par les instances de calcul de votre MIG :
Créer une stratégie de charge de travail pour les instances A4X Max ou A4X
Si vous appliquez une stratégie de charge de travail aux instances A4X Max ou A4X d'un MIG, vous devez spécifier une valeur de topologie d'accélérateur lorsque vous créez votre stratégie. Cette action permet à vos charges de travail d'atteindre des performances réseau à grande échelle et sans blocage.
Pour créer une stratégie de charge de travail pour les instances A4X Max ou A4X, sélectionnez l'une des options suivantes :
gcloud
Pour créer une stratégie de charge de travail pour les instances A4X Max ou A4X, utilisez la
gcloud compute resource-policies create workload-policy commande
avec l'option --accelerator-topology=1x72 :
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Remplacez les éléments suivants :
WORKLOAD_POLICY_NAME: nom de votre stratégie de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines A4X Max ou A4X sont disponibles, consultez Régions et zones disponibles.
REST
Pour créer une stratégie de charge de travail pour les instances A4X Max ou A4X, envoyez une POST
requête à la
resourcePolicies.insert méthode.
Dans le corps de la requête, incluez le champ acceleratorTopology défini sur 1x72 :
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Remplacez les éléments suivants :
PROJECT_ID: ID du projet dans lequel créer votre stratégie de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines A4X Max ou A4X sont disponibles, consultez Régions et zones disponibles.WORKLOAD_POLICY_NAME: nom de votre stratégie de charge de travail.
Créer une stratégie de charge de travail pour les instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D
Si vous souhaitez appliquer une stratégie de charge de travail aux instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D d'un MIG, nous vous recommandons de spécifier une valeur de distance de topologie maximale lorsque vous créez votre stratégie. Cette action permet de rapprocher vos instances de calcul. Toutefois, plus l'emplacement que vous spécifiez est compact, moins de ressources peuvent être disponibles dans la zone où vous souhaitez créer vos instances de calcul.
Pour créer une stratégie de charge de travail pour les instances A4, A3 Ultra, A3 Mega ou A3 High (8 GPU), sélectionnez l'une des options suivantes :
gcloud
Pour créer une stratégie de charge de travail, utilisez la
gcloud compute resource-policies create workload-policy commande. En fonction de la proximité souhaitée des instances de calcul dans un MIG, incluez les options suivantes dans la commande :
Pour placer vos instances de calcul à proximité les unes des autres au mieux, incluez l'option
--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONPour mieux contrôler l'emplacement de vos instances de calcul, incluez les options
--max-topology-distanceet--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Remplacez les éléments suivants :
WORKLOAD_POLICY_NAME: nom de votre stratégie de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines GPU sont disponibles, consultez Régions et zones disponibles.TOPOLOGY_DISTANCE: distance maximale de la topologie. Une distance maximale plus courte peut réduire la probabilité de disponibilité des VM. Spécifiez une des valeurs suivantes :Pour placer des instances A4 ou H4D dans le même cluster :
CLUSTERPour placer des instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D dans le même bloc :
BLOCKPour placer des instances A4, A3 Ultra ou H4D dans le même sous-bloc :
SUBBLOCK
REST
Pour créer une stratégie de charge de travail, envoyez une POST requête à la
resourcePolicies.insert méthode. En fonction de la proximité souhaitée des instances de calcul dans un MIG, incluez les champs suivants dans le corps de la requête :
Pour placer vos instances de calcul à proximité les unes des autres au mieux, incluez le champ
typedans le corps de la requête :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Pour mieux contrôler l'emplacement de vos instances de calcul, incluez les champs
maxTopologyDistanceettypedans le corps de la requête :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Remplacez les éléments suivants :
PROJECT_ID: ID du projet dans lequel créer votre stratégie de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines GPU sont disponibles, consultez Régions et zones disponibles.WORKLOAD_POLICY_NAME: nom de votre stratégie de charge de travail.TOPOLOGY_DISTANCE: distance maximale de la topologie. Une distance maximale plus courte peut réduire la probabilité de disponibilité des VM. Spécifiez une des valeurs suivantes :Pour placer des instances A4 ou H4D dans le même cluster :
CLUSTERPour placer des instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D dans le même bloc :
BLOCKPour placer des instances A4, A3 Ultra ou H4D dans le même sous-bloc :
SUBBLOCK
Étape suivante
Une fois que vous avez créé une stratégie de charge de travail, découvrez comment l'appliquer à un MIG :
Découvrez comment afficher la topologie d'une instance de calcul.
Découvrez comment afficher les stratégies de charge de travail.
Découvrez comment remplacer, supprimer ou supprimer des stratégies de charge de travail.