Neste documento, descrevemos como criar instâncias com GPUs anexadas das séries de máquinas A3 Ultra ou A4. Para saber mais sobre como criar instâncias com GPUs anexadas, consulte Visão geral da criação de uma instância com GPUs anexadas.
Antes de começar
- Para analisar limitações e outras etapas de pré-requisito para criar uma instância com GPUs anexadas, como selecionar uma imagem do SO ou verificar a cota de GPU, consulte Visão geral da criação de uma instância com GPUs anexadas.
-
Configure a autenticação, caso ainda não tenha feito isso.
A autenticação é
o processo de verificação da sua identidade para acesso a serviços e APIs do Trusted Cloud by S3NS .
Para executar códigos ou amostras de um ambiente de desenvolvimento local, autentique-se no
Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Instale a Google Cloud CLI e faça login nela com sua identidade federada. Depois de fazer login, inicialize a Google Cloud CLI executando o seguinte comando:
gcloud init
- Set a default region and zone.
REST
Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.
Instale a Google Cloud CLI e faça login nela com sua identidade federada. Depois de fazer login, inicialize a Google Cloud CLI executando o seguinte comando:
gcloud init
Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Trusted Cloud .
Funções exigidas
Para receber as permissões necessárias para criar instâncias, peça ao administrador para conceder a você o papel do IAM de Administrador da instância da computação (v1) (
roles/compute.instanceAdmin.v1
) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.Esse papel predefinido contém as permissões necessárias para criar instâncias. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para criar instâncias:
-
compute.instances.create
no projeto -
Usar uma imagem personalizada a fim de criar a VM:
compute.images.useReadOnly
na imagem -
Usar um snapshot para criar a VM:
compute.snapshots.useReadOnly
no snapshot -
Usar um modelo de instância para criar a VM:
compute.instanceTemplates.useReadOnly
no modelo de instância -
Atribuir uma rede legada à VM:
compute.networks.use
no projeto -
Especificar um endereço IP estático para a VM:
compute.addresses.use
no projeto -
Atribuir um endereço IP externo à VM ao usar uma rede legada:
compute.networks.useExternalIp
no projeto -
Especificar uma sub-rede para a VM:
compute.subnetworks.use
no projeto ou na sub-rede escolhida -
Atribuir um endereço IP externo à VM ao usar uma rede VPC:
compute.subnetworks.useExternalIp
no projeto ou na sub-rede escolhida -
Definir os metadados da instância de VM para a VM:
compute.instances.setMetadata
no projeto -
Definir tags para a VM:
compute.instances.setTags
na VM -
Definir rótulos para a VM:
compute.instances.setLabels
na VM -
Definir uma conta de serviço a ser usada pela VM:
compute.instances.setServiceAccount
na VM -
Criar um disco para a VM:
compute.disks.create
no projeto -
Anexar um disco atual no modo somente leitura ou de leitura e gravação:
compute.disks.use
no disco -
Anexar um disco atual no modo somente leitura:
compute.disks.useReadOnly
no disco
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Determinar como criar instâncias A3 Ultra ou A4
As instâncias A3 Ultra ou A4 estão disponíveis nas seguintes opções de criação, que têm procedimentos, disponibilidade de recursos e preços diferentes. Identifique qual opção você quer usar com base na sua carga de trabalho.
Se você precisar executar cargas de trabalho de IA e ML de longa duração, como treinamento e inferência de modelos grandes, que exigem a menor latência, crie VMs ou clusters que usem os recursos e serviços disponíveis no Cluster Director. Com o Cluster Director, é possível reservar máquinas alocadas de forma densa que oferecem programação com reconhecimento de topologia, além de monitoramento e manutenção aprimorados. Para saber mais sobre o Cluster Director, consulte Cluster Director na documentação do hipercomputador de IA.
Para instruções sobre como criar instâncias A3 Ultra ou A4, consulte Visão geral da criação de VMs e clusters na documentação do AI Hypercomputer.
Se você precisar de cargas de trabalho de IA e ML de duração mais curta, escolha uma das seguintes opções:
Se as cargas de trabalho precisarem ser executadas por até 90 dias com latência de rede mínima, reserve máquinas densamente alocadas para uma data futura usando solicitações de reserva adiantada no modo de calendário. No início do período de reserva, é possível criar instâncias A3 Ultra ou A4 usando a capacidade reservada. No final do período de reserva, o Compute Engine exclui a reserva e todas as VMs que a consomem.
Para instruções sobre como criar instâncias A3 Ultra ou A4 que usam uma reserva, consulte Criar uma instância A3 Ultra ou A4 neste documento.
Se as cargas de trabalho puderem ser iniciadas a qualquer momento e precisarem de um número exato de VMs para começar, use solicitações de redimensionamento em um grupo gerenciado de instâncias (MIG). Com solicitações de redimensionamento do MIG, você pede ao Compute Engine para adicionar VMs de uma só vez ao MIG sempre que os recursos estiverem disponíveis. Essas VMs podem ser executadas por até sete dias. Como os recursos são entregues de um pool seguro, você tem mais chances de conseguir GPUs do que se fizesse uma solicitação sob demanda.
Para mais informações sobre solicitações de redimensionamento de MIGs, consulte Sobre solicitações de redimensionamento em um MIG.
Se as cargas de trabalho tolerarem interrupções de disponibilidade, use VMs spot para receber descontos significativos. É possível criar e excluir VMs spot conforme necessário. No entanto, as VMs spot são recursos finitos, e o Compute Engine pode forçar a interrupção (parar ou excluir automaticamente) as VMs spot a qualquer momento para recuperar a capacidade. Para saber mais sobre as VMs spot, consulte VMs spot.
Para instruções sobre como criar instâncias A3 Ultra ou A4 usando VMs spot, consulte Criar uma instância A3 Ultra ou A4 neste documento.
Criar uma instância A3 Ultra ou A4
Para criar uma instância A3 Ultra ou A4 usando uma reserva ou VMs Spot, siga estas etapas:
Criar redes VPC
Para o tipo de máquina A4 ou A3 Ultra, crie três redes VPC para as seguintes interfaces de rede:
- Duas redes VPC para as interfaces de rede (NIC) gVNIC. Eles são usados para comunicação entre hosts.
- Uma rede VPC com o perfil de rede RDMA é necessária para as NICs CX7. Essa rede precisa ter oito sub-redes, uma para cada NIC CX7, e é usada para comunicação entre GPUs.
Para mais informações sobre a organização da NIC, consulte Analisar a largura de banda da rede e a organização da NIC.
Configure as redes manualmente seguindo os guias de instruções ou automaticamente usando o script fornecido.
Guias de instruções
Para criar as redes, use as seguintes instruções:
- Para criar as redes VPC para as gVNICs, consulte Criar e gerenciar redes de nuvem privada virtual.
- Para criar a rede VPC com o perfil de rede RDMA, consulte Criar uma rede de nuvem privada virtual para NICs RDMA.
Para essas redes VPC, recomendamos definir a unidade máxima de transmissão (MTU) para um valor maior. Para o tipo de máquina A4 ou A3 Ultra, o MTU recomendado é de
8896
bytes. Para conferir as configurações de MTU recomendadas para outros tipos de máquina de GPU, consulte Configurações de MTU para tipos de máquina de GPU.Script
Para criar as redes, siga estas etapas:
- Use este script para criar a rede.
Para essas redes VPC, recomendamos definir a unidade máxima de transmissão (MTU) para um valor maior. Para o tipo de máquina A4 ou A3 Ultra, o MTU recomendado é de
8896
bytes. Para conferir as configurações de MTU recomendadas para outros tipos de máquina de GPU, consulte Configurações de MTU para tipos de máquina de GPU.#!/bin/bash # Create standard VPCs (network and subnets) for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs done
Substitua:
GVNIC_NAME_PREFIX
: o prefixo de nome personalizado a ser usado para as redes e sub-redes VPC padrão das gVNICs.RDMA_NAME_PREFIX
: o prefixo de nome personalizado a ser usado para a rede VPC e as sub-redes com o perfil de rede RDMA para as NICs CX7.ZONE
: especifique uma zona em que o tipo de máquina que você quer usar esteja disponível, comous-central1-a
. Para informações sobre regiões, consulte Disponibilidade de GPUs por regiões e zonas.REGION
: a região em que você quer criar as sub-redes. Essa região precisa corresponder à zona especificada. Por exemplo, se a zona forus-central1-a
, a região seráus-central1
.IP_RANGE
: o intervalo de IP a ser usado para as regras de firewall SSH.
-
Opcional: para verificar se os recursos de rede VPC foram criados, confira as configurações de rede no console Trusted Cloud :
- No console Trusted Cloud , acesse a página Redes VPC.
- Pesquise na lista as redes que você criou na etapa anterior.
- Para conferir as sub-redes, regras de firewall e outras configurações de rede, clique no nome da rede.
Criar instância
Para criar uma instância A3 Ultra ou A4, selecione um dos seguintes métodos:
Criar uma instância que use uma reserva
Para criar uma instância que usa uma reserva, use uma das seguintes opções:
Console
No console Trusted Cloud , acesse a página Criar uma instância.
A tela Criar uma instância aparece e mostra o painel Configuração da máquina.
No painel Configuração da máquina, siga estas etapas:
Especifique um Nome para sua instância. Consulte a Convenção de nomenclatura de recursos.
Selecione a região e a zona em que você reservou capacidade.
Clique na guia GPUs e siga estas etapas:
Na lista Tipo de GPU, selecione o tipo de GPU.
Para instâncias A4, selecione NVIDIA B200.
Para instâncias A3 Ultra, selecione NVIDIA H200 de 141 GB.
Na lista Número de GPUs, selecione 8.
No menu de navegação, clique em SO e armazenamento. No painel SO e armazenamento que aparece, siga estas etapas:
Clique em Alterar. O painel Configuração do disco de inicialização é exibido.
Na guia Imagens públicas, selecione uma imagem recomendada. Para uma lista de imagens recomendadas, consulte Sistemas operacionais.
Para confirmar as opções do disco de inicialização, clique em Selecionar.
Para criar uma instância com várias NICs, siga estas etapas. Caso contrário, para criar uma instância de NIC única, pule estas etapas.
No menu de navegação, clique em Rede. No painel Rede que aparece, conclua as etapas a seguir:
Na seção Interfaces de rede, siga estas etapas:
Exclua a interface de rede padrão. Para excluir a interface, clique em
Excluir.Clique em Adicionar uma interface de rede. Use essa opção para adicionar as redes gVNIC e RDMA criadas na seção anterior. Ao adicionar as redes, lembre-se do seguinte:
Especifique as redes host nas listas Rede e Sub-rede e defina a lista Card da interface de rede como gVNIC.
Especifique suas redes de GPU nas listas Rede e Sub-rede e defina a lista Placa de interface de rede como MRDMA para essas redes.
No menu de navegação, clique em Avançado. No painel Avançado que aparece, conclua as etapas a seguir:
Na seção Reservas, selecione Escolher uma reserva e clique em Escolher reserva. Essa ação abre um painel com uma lista de reservas disponíveis na zona selecionada. Na lista de reservas, siga estas etapas:
Selecione a reserva que você quer usar para a VM. Também é possível selecionar um bloco específico na reserva.
Clique em Escolher.
Na seção Modelo de provisionamento, expanda a seção Configurações avançadas do modelo de provisionamento de VM.
Na lista No encerramento da VM, selecione Parar (padrão) ou Excluir.
Para criar e iniciar a instância, clique em Criar.
gcloud
Para criar a VM, use o comando
gcloud compute instances create
.gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=specific \ --reservation=RESERVATION \ --provisioning-model=RESERVATION_BOUND \ --instance-termination-action=TERMINATION_ACTION \ --maintenance-policy=TERMINATE
Substitua:
VM_NAME
: o nome da VM.MACHINE_TYPE
: o tipo de máquina a ser usado para a VM. Especifique um tipo de máquina A4 ou A3 Ultra. Para mais informações, consulte Tipos de máquinas com GPU.IMAGE_FAMILY
: a família de imagens da imagem do SO que você quer usar. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.IMAGE_PROJECT
: o ID do projeto da imagem do SO.ZONE
: a zona em que o tipo de máquina que você quer usar está disponível. Para informações sobre regiões, consulte Regiões e zonas de GPU.DISK_SIZE
: o tamanho do disco de inicialização em GB.GVNIC_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.RDMA_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes da VPC que usam NICs RDMA.-
RESERVATION
: o nome da reserva ou um bloco específico dentro de uma reserva. Para conferir o nome da reserva ou os blocos disponíveis, consulte Ver capacidade reservada. Com base na sua exigência de posicionamento de instâncias, escolha uma das seguintes opções:Para criar a instância em qualquer bloco:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Além disso, para criar várias instâncias no mesmo bloco, aplique a mesma política de posicionamento compacto que especifica uma colocação de bloco (
maxDistance=2
) ao criar cada instância. Em seguida, o Compute Engine aplica a política à reserva e cria instâncias no mesmo bloco.Para criar a instância em um bloco específico:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: se o Compute Engine vai parar (STOP
) ou excluir (DELETE
) a VM ao final do período de reserva.
REST
Para criar a VM, faça uma solicitação
POST
para o métodoinstances.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name":"VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb":"DISK_SIZE", "diskType":"hyperdisk-balanced", "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode":"READ_WRITE", "type":"PERSISTENT" } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType":"SPECIFIC_RESERVATION", "key":"compute.googleapis.com/reservation-name", "values":[ "RESERVATION" ] }, "scheduling":{ "provisioningModel":"RESERVATION_BOUND", "instanceTerminationAction":"TERMINATION_ACTION", "onHostMaintenance": "TERMINATE", "automaticRestart":true } }
Substitua:
PROJECT_ID
: o ID do projeto em que você quer criar a VM.ZONE
: a zona em que o tipo de máquina que você quer usar está disponível. Para informações sobre regiões, consulte Regiões e zonas de GPU.MACHINE_TYPE
: o tipo de máquina a ser usado para a VM. Especifique um tipo de máquina A4 ou A3 Ultra. Para mais informações, consulte Tipos de máquinas com GPU.VM_NAME
: o nome da VM.DISK_SIZE
: o tamanho do disco de inicialização em GB.IMAGE_PROJECT
: o ID do projeto da imagem do SO.IMAGE_FAMILY
: a família de imagens da imagem do SO que você quer usar. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.NETWORK_PROJECT_ID
: o ID do projeto da rede.GVNIC_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.REGION
: a região da sub-rede.RDMA_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes da VPC que usam NICs RDMA.-
RESERVATION
: o nome da reserva ou um bloco específico dentro de uma reserva. Para conferir o nome da reserva ou os blocos disponíveis, consulte Ver capacidade reservada. Com base na sua exigência de posicionamento de instâncias, escolha uma das seguintes opções:Para criar a instância em qualquer bloco:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Além disso, para criar várias instâncias no mesmo bloco, aplique a mesma política de posicionamento compacto que especifica uma colocação de bloco (
maxDistance=2
) ao criar cada instância. Em seguida, o Compute Engine aplica a política à reserva e cria instâncias no mesmo bloco.Para criar a instância em um bloco específico:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: se o Compute Engine vai parar (STOP
) ou excluir (DELETE
) a VM ao final do período de reserva.
Criar uma VM do Spot
Para criar a VM spot, use uma das seguintes opções:
Console
No console Trusted Cloud , acesse a página Criar uma instância.
A tela Criar uma instância aparece e mostra o painel Configuração da máquina.
No painel Configuração da máquina, siga estas etapas:
Especifique um Nome para sua instância. Consulte a Convenção de nomenclatura de recursos.
Selecione a Região e a Zona em que você quer criar uma VM. Para ver em quais regiões e zonas as GPUs estão disponíveis, consulte Regiões e zonas de GPU.
Clique na guia GPUs e siga estas etapas:
Na lista Tipo de GPU, selecione o tipo de GPU.
Para instâncias A4, selecione NVIDIA B200.
Para instâncias A3 Ultra, selecione NVIDIA H200 de 141 GB.
Na lista Número de GPUs, selecione 8.
No menu de navegação, clique em SO e armazenamento. No painel SO e armazenamento que aparece, siga estas etapas:
Clique em Alterar. O painel Configuração do disco de inicialização é exibido.
Na guia Imagens públicas, selecione uma imagem recomendada. Para uma lista de imagens recomendadas, consulte Sistemas operacionais.
Para confirmar as opções do disco de inicialização, clique em Selecionar.
Para criar uma instância com várias NICs, siga estas etapas. Caso contrário, para criar uma instância de NIC única, pule estas etapas.
No menu de navegação, clique em Rede. No painel Rede que aparece, conclua as etapas a seguir:
Na seção Interfaces de rede, siga estas etapas:
Exclua a interface de rede padrão. Para excluir a interface, clique em
Excluir.Clique em Adicionar uma interface de rede. Use essa opção para adicionar as redes gVNIC e RDMA criadas na seção anterior. Ao adicionar as redes, faça o seguinte:
Especifique as redes host nas listas Rede e Sub-rede e defina a lista Card da interface de rede como gVNIC.
Especifique suas redes de GPU nas listas Rede e Sub-rede e defina a lista Placa de interface de rede como MRDMA para essas redes.
No menu de navegação, clique em Avançado. No painel Avançado que aparece, conclua as etapas a seguir:
Na seção Modelo de provisionamento, selecione Spot na lista Modelo de provisionamento de VM.
Opcional: para especificar a ação a ser tomada quando o Compute Engine forçar a interrupção da instância, siga estas etapas:
Expanda a seção Configurações avançadas do modelo de provisionamento de VM.
Na lista No encerramento da VM, selecione Parar ou Excluir.
Para criar e iniciar a instância, clique em Criar.
gcloud
Para criar a VM, use o comando
gcloud compute instances create
.gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --provisioning-model=SPOT \ --instance-termination-action=TERMINATION_ACTION
Substitua:
VM_NAME
: o nome da VM.MACHINE_TYPE
: o tipo de máquina a ser usado para a VM. Especifique um tipo de máquina A4 ou A3 Ultra. Para mais informações, consulte Tipos de máquinas com GPU.IMAGE_FAMILY
: a família de imagens da imagem do SO que você quer usar. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.IMAGE_PROJECT
: o ID do projeto da imagem do SO.ZONE
: a zona em que o tipo de máquina que você quer usar está disponível. Para informações sobre regiões, consulte Regiões e zonas de GPU.DISK_SIZE
: o tamanho do disco de inicialização em GB.GVNIC_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.RDMA_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes da VPC que usam NICs RDMA.TERMINATION_ACTION
: a ação a ser tomada quando o Compute Engine forçar a interrupção da instância,STOP
(padrão) ouDELETE
.
REST
Para criar a VM, faça uma solicitação
POST
para o métodoinstances.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name":"VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb":"DISK_SIZE", "diskType":"hyperdisk-balanced", "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode":"READ_WRITE", "type":"PERSISTENT" } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "scheduling": { "provisioningModel": "SPOT", "instanceTerminationAction": "TERMINATION_ACTION" } }
Substitua:
PROJECT_ID
: o ID do projeto em que você quer criar a VM.ZONE
: a zona em que o tipo de máquina que você quer usar está disponível. Para informações sobre regiões, consulte Regiões e zonas de GPU.MACHINE_TYPE
: o tipo de máquina a ser usado para a VM. Especifique um tipo de máquina A4 ou A3 Ultra. Para mais informações, consulte Tipos de máquinas com GPU.VM_NAME
: o nome da VM.DISK_SIZE
: o tamanho do disco de inicialização em GB.IMAGE_PROJECT
: o ID do projeto da imagem do SO.IMAGE_FAMILY
: a família de imagens da imagem do SO que você quer usar. Para uma lista de sistemas operacionais compatíveis, consulte Detalhes do sistema operacional.NETWORK_PROJECT_ID
: o ID do projeto da rede.GVNIC_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes VPC padrão que usam gVNICs.REGION
: a região da sub-rede.RDMA_NAME_PREFIX
: o prefixo de nome especificado ao criar as redes e sub-redes da VPC que usam NICs RDMA.TERMINATION_ACTION
: a ação a ser tomada quando o Compute Engine forçar a interrupção da instância,STOP
(padrão) ouDELETE
.
Preparar a instância para uso
Para preparar uma instância com GPUs anexadas para uso, siga estas etapas:
Para permitir que uma instância A4 ou A3 Ultra use as GPUs anexadas, ela precisa ter drivers de GPU instalados. A menos que a imagem na instância já inclua os drivers de GPU necessários, instale os drivers de GPU.
Se você criou uma VM Spot na seção anterior, conclua as etapas a seguir:
Para preparar sua VM spot para uma possível preempção, consulte Gerenciar a preempção de VMs spot.
Opcional: saiba mais sobre práticas recomendadas para VMs spot.
A seguir
Consulte Monitorar o desempenho da GPU.
Para resolver problemas de instâncias de GPU, consulte Resolver problemas de VMs de GPU.
Saiba mais sobre as plataformas de GPU.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-08 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-08 UTC."],[[["This document guides you through creating instances with attached GPUs using the A3 Ultra or A4 machine series."],["Before creating instances, you must review the limitations, prerequisite steps, OS image selection, and GPU quota."],["Authentication setup is required for accessing Google Cloud services and APIs if you are not using the Google Cloud Console."],["To create A3 Ultra or A4 instances, you can use Hypercompute Cluster for low-latency workloads or Spot VMs for lower-priority workloads that can tolerate availability disruptions."],["Creating a multi-NIC A3 Ultra or A4 instance requires setting up Virtual Private Cloud (VPC) networks and subnets for gVNICs and RDMA NICs, which you can manually create or using the provided script."]]],[]] -