Ce document explique les exigences et les limites que vous appliquez lorsque vous utilisez des règles de charge de travail avec des groupes d'instances gérés (MIG). Par défaut, vous ne gérez l'emplacement de vos instances Compute Engine qu'en spécifiant leurs zones. Les règles de charge de travail vous permettent de définir l'emplacement physique et la topologie de vos instances de calcul dans une zone. Cette approche vous aide, par exemple, à minimiser la latence réseau entre vos instances de calcul en les plaçant plus près les unes des autres.
Vous ne pouvez appliquer des règles de charge de travail qu'aux MIG qui utilisent des instances A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D. Si vous utilisez des instances A4X Max ou A4X, une règle de charge de travail est requise, sauf si vous créez une seule instance de calcul à des fins de test. Pour les autres séries de machines compatibles, les règles de charge de travail sont facultatives.
Pour contrôler l'emplacement des instances de calcul qui utilisent d'autres séries de machines, utilisez des règles d'emplacement.
Comprendre les règles de charge de travail
Les sections suivantes décrivent les cas d'utilisation des règles de charge de travail et les propriétés que vous spécifiez lorsque vous créez des règles de charge de travail.
Gérer l'emplacement et la topologie des instances de calcul
Une fois que vous avez créé une règle de charge de travail et que vous l'avez appliquée à un MIG, elle vous aide à effectuer les opérations suivantes :
Créer des instances de calcul à proximité les unes des autres : si la capacité est disponible, Compute Engine crée des instances de calcul à proximité les unes des autres. Sinon, Compute Engine ne crée qu'une partie ou aucune des instances de calcul demandées.
Obtenir de la visibilité sur la topologie de votre instance de calcul : après avoir appliqué une règle de charge de travail de type haut débit (
HIGH_THROUGHPUT) à un MIG et que le MIG a créé des instances de calcul, vous pouvez afficher la position des instances de calcul les unes par rapport aux autres. Ces informations vous aident à minimiser la latence réseau et à résoudre les erreurs. Pour en savoir plus, consultez Afficher la topologie des instances Compute Engine.
Vous pouvez appliquer la même règle de charge de travail à plusieurs MIG. Dans ce cas, Compute Engine applique les règles d'emplacement à chaque MIG indépendamment.
La section suivante décrit les propriétés que vous devez spécifier lorsque vous créez des règles de charge de travail.
Configurer les propriétés des règles de charge de travail
Lorsque vous créez une règle de charge de travail, vous devez spécifier les propriétés suivantes :
Type de charge de travail (
type) : ce champ définit l'objectif général de votre cluster. Vous ne pouvez spécifier queHIGH_THROUGHPUT, ce qui indique à Compute Engine de placer les instances de calcul aussi près que possible les unes des autres pour accélérer la communication.En fonction de la série de machines utilisée par les instances de calcul de votre MIG, vous pouvez éventuellement spécifier l'une des propriétés suivantes :
Topologie de l'accélérateur (
acceleratorTopology) : cette propriété vous permet d'obtenir des performances élevées pour les charges de travail distribuées qui s'exécutent sur plusieurs instances A4X Max ou A4X utilisant une configuration réseau inter-accélérateur spécialisée. Pour en savoir plus, consultez la propriété de topologie de l'accélérateur .Distance maximale de la topologie (
maxTopologyDistance) : cette propriété définit la limite physique la plus stricte pour la création de vos instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D, par exemple le même bloc ou sous-bloc. Si Compute Engine ne peut pas respecter cette limite stricte en raison d'erreurs de disponibilité des ressources, il ne crée qu'une partie ou aucune des instances de calcul demandées. Pour en savoir plus, consultez la propriété de distance maximale de la topologie .
Propriété de topologie de l'accélérateur
Pour obtenir des performances réseau à grande échelle et sans blocage, Compute Engine organise les instances A4X Max et A4X dans une hiérarchie physique de blocs et sous-blocs.
Pour créer un MIG avec des instances A4X Max ou A4X, vous devez appliquer une règle de charge de travail au MIG qui spécifie la propriété de topologie de l'accélérateur (acceleratorTopology). Cette propriété définit la configuration réseau physique d'une tranche d'instances de calcul. Une tranche agit comme un accélérateur unique et massif qui offre un débit maximal pour vos charges de travail d'IA ou de ML distribuées.
Le tableau suivant indique les valeurs de topologie d'accélérateur compatibles pour les règles de charge de travail et les séries de machines qu'elles prennent en charge :
| Valeur de topologie de l'accélérateur | Description | Séries de machines compatibles | Nombre maximal d'instances de calcul |
|---|---|---|---|
1x72 |
Compute Engine organise les instances de calcul en sous-blocs à allocation dense de 18 instances de calcul, pour un total de 72 GPU. Étant donné que chaque sous-bloc nécessite son propre MIG, vous pouvez créer un maximum de 18 instances de calcul par MIG. Un bloc complet se compose de 25 MIG, pour un total de 450 instances de calcul. | A4X Max et A4X | 18 |
Pour en savoir plus sur les instances A4X Max et A4X, consultez la section Séries de machines A4X Max et A4X.
Propriété de distance maximale de la topologie
Lorsque vous créez et appliquez une règle de charge de travail à un MIG, Compute Engine tente de créer vos instances de calcul à proximité les unes des autres. Si vous avez besoin d'une compacité maximale dans une zone, nous vous recommandons de spécifier la propriété de distance maximale de la topologie (maxTopologyDistance). Une valeur de distance maximale de la topologie
spécifie la création d'instances A4, A3 Ultra, A3 Mega, A3 High (8
GPU) ou H4D dans le même
cluster, bloc ou sous-bloc.
Le tableau suivant indique les valeurs de distance maximale de la topologie et les séries de machines qu'elles prennent en charge :
| Valeur de distance maximale de la topologie | Description | Séries de machines compatibles | Nombre maximal d'instances de calcul |
|---|---|---|---|
| Non spécifié (non recommandé) | Compute Engine tente de placer les instances de calcul aussi près que possible les unes des autres, mais sans garantie de distance maximale entre les instances de calcul dans une zone. | A4, A3 Ultra, A3 Mega, A3 High (8 GPU) et H4D | 1 500 |
CLUSTER |
Compute Engine crée des instances de calcul dans des blocs adjacents au sein d'un cluster. | A4 et H4D | 1 500 |
BLOCK |
Compute Engine crée des instances de calcul dans le même bloc. | A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D |
|
SUBBLOCK |
Compute Engine crée des instances de calcul dans le même sous-bloc, ce qui minimise autant que possible la latence réseau. | A4, A3 Ultra et H4D | 22 |
Tarifs
La création, la suppression ou l'application de règles de charge de travail à un MIG n'entraîne aucuns frais supplémentaires.
Limites
Les limites suivantes s'appliquent aux règles de charge de travail dans les MIG :
Vous ne pouvez appliquer une règle de charge de travail à un MIG existant ou modifier sa règle de charge de travail que s'il ne contient aucune instance de calcul.
Vous ne pouvez appliquer des règles de charge de travail qu'aux MIG avec des instances de calcul qui utilisent les combinaisons suivantes de types de machines et de modèles de provisionnement :
Série de machines Modèle de provisionnement A4, A3 Ultra et H4D Démarrage flexible A4, A3 Ultra, A3 Mega, A3 High (8 GPU) et H4D Spot A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) et H4D Liée à la réservation Vous ne pouvez appliquer des règles de charge de travail aux MIG régionaux que si ces derniers utilisent les formes de distribution cibles suivantes :
Pour les MIG avec une taille cible :
ANYouANY_SINGLE_ZONEPour les requêtes de redimensionnement de MIG :
ANY_SINGLE_ZONE
Vous ne pouvez pas mettre à jour une règle de charge de travail après l'avoir créée.
Vous ne pouvez pas configurer de deuxième modèle d'instance si votre MIG utilise une règle de charge de travail.
Vous ne pouvez pas utiliser de règles de charge de travail avec des règles d'emplacement.
Étape suivante
Découvrez comment créer des règles de charge de travail pour les MIG.
Découvrez comment afficher les règles de charge de travail.