Este documento explica como criar políticas para grupos gerenciados de instâncias (MIGs) que têm instâncias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) ou H4D do Compute Engine. Para saber mais sobre os requisitos e limitações que você aplica ao criar políticas de carga de trabalho, consulte Sobre as políticas de carga de trabalho.
Uma política de carga de trabalho permite especificar o posicionamento ou a topologia das instâncias do Compute Engine no MIG. Por exemplo, é possível usar políticas de carga de trabalho para colocar instâncias de computação mais próximas umas das outras, minimizando a latência de rede para cargas de trabalho de inteligência artificial (IA), machine learning (ML) ou computação de alto desempenho (HPC).
Antes de começar
-
Configure a autenticação, caso ainda não tenha feito isso.
Com isso, você confirma sua identidade para acesso a Cloud de Confiance by S3NS serviços e APIs do. Para executar
código ou exemplos de um ambiente de desenvolvimento local, faça a autenticação no
Compute Engine com uma destas opções:
Selecione a guia para como planeja usar as amostras nesta página:
gcloud
-
Instale a Google Cloud CLI e faça login na CLI gcloud com sua identidade federada. Depois de fazer login, inicialize a Google Cloud CLI executando o seguinte comando:
gcloud init
-
- Defina uma região e uma zona padrão.
REST
Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.
Instale a Google Cloud CLI e faça login na CLI gcloud com sua identidade federada.
Saiba mais em Autenticar para usar REST na documentação de autenticação do Cloud de Confiance .
Funções exigidas
Para receber as permissões necessárias para criar e aplicar políticas de carga de trabalho a MIGs,
peça ao administrador para conceder a você o
papel do IAM de Administrador da instância do Compute (v1) (roles/compute.instanceAdmin.v1)
no projeto.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esse papel predefinido contém as permissões necessárias para criar e aplicar políticas de carga de trabalho a MIGs. Para acessar as permissões exatas que são necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As permissões a seguir são necessárias para criar e aplicar políticas de carga de trabalho a MIGs:
-
Para criar uma política de carga de trabalho:
compute.resourcePolicies.createno projeto
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Criar uma política de carga de trabalho
Para criar uma política de carga de trabalho, use um dos seguintes métodos com base na série de máquinas que as instâncias de computação no MIG usam:
Criar uma política de carga de trabalho para instâncias A4X Max ou A4X
Se você aplicar uma política de carga de trabalho a instâncias A4X Max ou A4X em um MIG, então você deve especificar um valor de topologia do acelerador ao criar sua política. Essa ação ajuda as cargas de trabalho a alcançar um desempenho de rede não bloqueador em grande escala.
Para criar uma política de carga de trabalho para instâncias A4X Max ou A4X, selecione uma das seguintes opções:
gcloud
Para criar uma política de carga de trabalho para instâncias A4X Max ou A4X, use o
gcloud compute resource-policies create workload-policy comando
com a --accelerator-topology=1x72 flag:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Substitua:
WORKLOAD_POLICY_NAME: o nome da política de carga de trabalho.REGION: a região em que a política de carga de trabalho será criada. Especifique uma região em que você quer criar o MIG e onde o tipo de máquina que você quer usar está disponível. Para conferir as regiões em que os tipos de máquina A4X Max ou A4X estão disponíveis, consulte Regiões e zonas disponíveis.
REST
Para criar uma política de carga de trabalho para instâncias A4X Max ou A4X, faça uma POST
solicitação para o
resourcePolicies.insert método.
No corpo da solicitação, inclua o campo acceleratorTopology definido como 1x72:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Substitua:
PROJECT_ID: o ID do projeto em que a política de carga de trabalho será criada.REGION: a região em que a política de carga de trabalho será criada. Especifique uma região em que você quer criar o MIG e onde o tipo de máquina que você quer usar está disponível. Para conferir as regiões em que os tipos de máquina A4X Max ou A4X estão disponíveis, consulte Regiões e zonas disponíveis.WORKLOAD_POLICY_NAME: o nome da política de carga de trabalho.
Criar uma política de carga de trabalho para instâncias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) ou H4D
Se você quiser aplicar uma política de carga de trabalho a instâncias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) ou H4D em um MIG, recomendamos especificar um valor máximo de distância da topologia ao criar a política. Essa ação ajuda a garantir um posicionamento mais próximo entre as instâncias de computação. No entanto, quanto mais compacto for o posicionamento especificado, menos recursos poderão estar disponíveis na zona em que você quer criar as instâncias de computação.
Para criar uma política de carga de trabalho para instâncias A4, A3 Ultra, A3 Mega ou A3 High (8 GPUs), selecione uma das seguintes opções:
gcloud
Para criar uma política de carga de trabalho, use o
gcloud compute resource-policies create workload-policy comando. Com base na proximidade das instâncias de computação em um MIG, inclua as seguintes flags no comando:
Para colocar as instâncias de computação próximas umas das outras da melhor maneira possível, inclua a flag
--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONPara controlar ainda mais o posicionamento das instâncias de computação, inclua as flags
--max-topology-distancee--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Substitua:
WORKLOAD_POLICY_NAME: o nome da política de carga de trabalho.REGION: a região em que a política de carga de trabalho será criada. Especifique uma região em que você quer criar o MIG e onde o tipo de máquina que você quer usar está disponível. Para conferir as regiões em que os tipos de máquina de GPU estão disponíveis, consulte Regiões e zonas disponíveis.TOPOLOGY_DISTANCE: a distância máxima da topologia. Uma distância máxima menor pode reduzir a probabilidade de disponibilidade da VM. Especifique um dos seguintes valores:Para colocar instâncias A4 ou H4D no mesmo cluster:
CLUSTERPara colocar instâncias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) ou H4D no mesmo bloco:
BLOCKPara colocar instâncias A4, A3 Ultra ou H4D no mesmo sub-bloco:
SUBBLOCK
REST
Para criar uma política de carga de trabalho, faça uma POST solicitação para o
resourcePolicies.insert método. Com base na proximidade das instâncias de computação em um MIG, inclua os seguintes campos no corpo da solicitação:
Para colocar as instâncias de computação próximas umas das outras da melhor maneira possível, inclua o campo
typeno corpo da solicitação:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Para controlar ainda mais o posicionamento das instâncias de computação, inclua os campos
maxTopologyDistanceetypeno corpo da solicitação:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Substitua:
PROJECT_ID: o ID do projeto em que a política de carga de trabalho será criada.REGION: a região em que a política de carga de trabalho será criada. Especifique uma região em que você quer criar o MIG e onde o tipo de máquina que você quer usar está disponível. Para conferir as regiões em que os tipos de máquina de GPU estão disponíveis, consulte Regiões e zonas disponíveis.WORKLOAD_POLICY_NAME: o nome da política de carga de trabalho.TOPOLOGY_DISTANCE: a distância máxima da topologia. Uma distância máxima menor pode reduzir a probabilidade de disponibilidade da VM. Especifique um dos seguintes valores:Para colocar instâncias A4 ou H4D no mesmo cluster:
CLUSTERPara colocar instâncias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) ou H4D no mesmo bloco:
BLOCKPara colocar instâncias A4, A3 Ultra ou H4D no mesmo sub-bloco:
SUBBLOCK
A seguir
Depois de criar uma política de carga de trabalho, saiba como aplicá-la a um MIG:
Saiba como consultar a topologia da instância de computação.
Saiba como consultar políticas de carga de trabalho.
Saiba como substituir, remover ou excluir políticas de carga de trabalho.