Neste documento, explicamos como criar uma instância independente do Compute Engine usando o modelo de provisionamento vinculado à reserva. Esse modelo de provisionamento permite criar instâncias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs, A3 Edge ou H4D consumindo capacidade pré-reservada.
Para outros métodos de criação de instâncias de computação usando o modelo de provisionamento vinculado à reserva, consulte Visão geral das opções de implantação na documentação do Hipercomputador de IA.
Antes de começar
-
Configure a autenticação, caso ainda não tenha feito isso.
Com isso, você confirma sua identidade para acesso a Cloud de Confiance by S3NS serviços e APIs do. Para executar
código ou amostras de um ambiente de desenvolvimento local, faça a autenticação no
Compute Engine com uma destas opções:
Selecione a guia para como planeja usar as amostras nesta página:
Console
Quando você usa o Cloud de Confiance console para acessar Cloud de Confiance by S3NS serviços e APIs, não é necessário configurar a autenticação.
gcloud
-
Instale a Google Cloud CLI e faça login na CLI gcloud com sua identidade federada. Depois de fazer login, inicialize a Google Cloud CLI executando o seguinte comando:
gcloud init
-
- Defina uma região e uma zona padrão.
REST
Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.
Instale a Google Cloud CLI e faça login na CLI gcloud com sua identidade federada.
Saiba mais em Autenticar para usar REST na documentação de autenticação do Cloud de Confiance .
Funções exigidas
Para receber as permissões necessárias para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva, peça ao administrador para conceder a você o papel do IAM de Administrador da instância do Compute (v1) (roles/compute.instanceAdmin.v1) no projeto.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esse papel predefinido contém as permissões necessárias para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva. Para acessar as permissões exatas que são necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As permissões a seguir são necessárias para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva:
-
compute.instances.createno projeto -
Usar uma imagem personalizada a fim de criar a VM:
compute.images.useReadOnlyna imagem -
Usar um snapshot para criar a VM:
compute.snapshots.useReadOnlyno snapshot -
Usar um modelo de instância para criar a VM:
compute.instanceTemplates.useReadOnlyno modelo de instância -
Especificar uma sub-rede para a VM:
compute.subnetworks.useno projeto ou na sub-rede escolhida -
Especificar um endereço IP estático para a VM:
compute.addresses.useno projeto -
Atribuir um endereço IP externo à VM ao usar uma rede VPC:
compute.subnetworks.useExternalIpno projeto ou na sub-rede escolhida -
Atribuir uma rede legada à VM:
compute.networks.useno projeto -
Atribuir um endereço IP externo à VM usando uma rede legada:
compute.networks.useExternalIpno projeto -
Definir os metadados da instância de VM para a VM:
compute.instances.setMetadatano projeto -
Definir tags para a VM:
compute.instances.setTagsna VM -
Definir rótulos para a VM:
compute.instances.setLabelsna VM -
Definir uma conta de serviço a ser usada pela VM:
compute.instances.setServiceAccountna VM -
Criar um disco para a VM:
compute.disks.createno projeto -
Anexar um disco atual no modo somente leitura ou de leitura e gravação:
compute.disks.useno disco -
Anexar um disco atual no modo somente leitura:
compute.disks.useReadOnlyno disco
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Criar uma instância que usa o modelo de provisionamento vinculado à reserva
Para criar uma instância A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs ou H4D usando o modelo de provisionamento vinculado à reserva, aguarde até que a reserva criada automaticamente que você quer usar atinja o horário de início. Além disso, a instância de computação que você pretende criar precisa atender a todos os requisitos a seguir:
A instância de computação e a reserva precisam ter propriedades correspondentes.
A instância de computação precisa visar especificamente a reserva para consumo.
A instância de computação precisa ser interrompida ou excluída no horário de término da reserva.
O exemplo a seguir cria uma solicitação de reserva adiantada no modo de calendário para cinco instâncias A3 Ultra e, em seguida, cria uma instância A3 Ultra consumindo a reserva criada automaticamente para a solicitação.
Para criar uma instância de computação de exemplo usando o modelo de provisionamento vinculado à reserva, selecione uma das seguintes opções:
Console
Crie uma solicitação de exemplo para cinco instâncias A3 Ultra e envie para análise:
No Cloud de Confiance console, acesse a página Reservas.
Clique na guia Reservas adiantadas.
Clique em Criar reserva adiantada. A página Criar uma reserva adiantada aparece.
Clique na guia GPUs e, na lista Tipo de GPU , selecione NVIDIA H200 141 GB. Essa ação especifica uma instância A3 Ultra.
No campo Capacidade total necessária, digite
5.Na seção Período de reserva, especifique o horário de início e a duração do período de reserva.
Clique em Pesquisar capacidade e, na seção Capacidade disponível , selecione uma das máquinas disponíveis.
Clique em Criar.
No horário de início da solicitação, para criar uma instância A3 Ultra para consumir a reserva criada automaticamente, faça o seguinte:
No Cloud de Confiance console do, acesse a Criar uma instância página.
No campo Nome, digite um nome para a instância de computação. Para este exemplo, digite
example-instance.Especifique a Região e a Zona em que a reserva criada automaticamente existe. Para este exemplo, selecione us-central1 e us-central1-b , respectivamente.
Clique na guia GPUs e, na lista Tipo de GPU , selecione NVIDIA H200 141 GB. Essa ação especifica uma instância A3 Ultra e define o modelo de provisionamento como Vinculado à reserva.
No menu de navegação, clique em Avançado.
Na seção Reservas, selecione Escolher uma reserva, e clique em Escolher uma reserva.
No painel Escolher uma reserva, faça o seguinte:
Selecione a reserva criada automaticamente.
Clique em Escolher.
Na seção Modelo de provisionamento, abra a seção Configurações avançadas do modelo de provisionamento de VM.
Na lista No encerramento da VM, selecione Parar (padrão) ou Excluir.
Clique em Criar.
gcloud
Para criar uma solicitação de exemplo para cinco instâncias A3 Ultra e enviar para análise, use o
gcloud beta compute future-reservations createcomando:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bSuponha que Cloud de Confiance aprove a solicitação e o Compute Engine crie automaticamente uma reserva vazia. No horário de início da solicitação, em 5 de março de 2026, o Compute Engine aumenta o número de instâncias de GPU reservadas na reserva. Em seguida, você pode consumir a reserva.
No horário de início da solicitação, para criar uma instância A3 Ultra para consumir a reserva criada automaticamente, use o
gcloud compute instances createcomando com as flags a seguir:A flag
--instance-termination-action.A flag
--provisioning-modeldefinida comoRESERVATION_BOUND.A flag
--reservation.A flag
--reservation-affinitydefinida comospecific.
O comando é semelhante ao seguinte. Para conferir os requisitos completos para criar uma instância A3 Ultra, consulte Criar uma instância A3 Ultra ou A4.
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...O comando inclui os seguintes valores:
TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a instância de computação ao final do período de reserva.RESERVATION_URL: o URL da reserva, que é formatado da seguinte maneira:Se a reserva criada automaticamente existir no seu projeto:
example-reservation.Se a reserva criada automaticamente existir em um projeto diferente:
projects/PROJECT_ID/reservations/example-reservation.
REST
Para criar uma solicitação de exemplo para cinco instâncias A3 Ultra e enviar para análise, faça uma
POSTsolicitação para o métodofutureReservations.insertda versão Beta:POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }Suponha que Cloud de Confiance aprove a solicitação e o Compute Engine crie automaticamente uma reserva vazia. No horário de início da solicitação, em 5 de março de 2026, o Compute Engine aumenta o número de instâncias de GPU reservadas na reserva. Em seguida, você pode consumir a reserva.
No horário de início da solicitação, para criar uma instância A3 Ultra para consumir a reserva criada automaticamente, faça uma solicitação
POSTpara oinstances.insertmétodo. No corpo da solicitação, inclua estes campos:O campo
reservationAffinity.consumeReservationTypedefinido comoSPECIFIC_RESERVATION.O campo
reservationAffinity.keydefinido comocompute.googleapis.com/reservation-name.O campo
reservationAffinity.valuesdefinido como o URL da reserva.O campo
scheduling.instanceTerminationAction.O campo
scheduling.provisioningModeldefinido comoRESERVATION_BOUND.
A solicitação é semelhante à seguinte. Para conferir os requisitos completos para criar uma instância A3 Ultra, consulte Criar uma instância A3 Ultra ou A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }O corpo da solicitação inclui os seguintes valores:
RESERVATION_URL: o URL da reserva, que é formatado da seguinte maneira:Se a reserva criada automaticamente existir no seu projeto:
example-reservation.Se a reserva criada automaticamente existir em um projeto diferente:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a instância de computação ao final do período de reserva.