Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance da S3NS. Consulte Diferenças do Google Cloud para saber mais.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Criar uma instância com o modelo vinculado à reserva

Neste documento, explicamos como criar uma instância independente do Compute Engine usando o modelo de provisionamento vinculado à reserva. Com esse modelo de provisionamento, é possível criar instâncias A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs, A3 Edge ou H4D consumindo capacidade pré-reservada.

Para outros métodos de criação de instâncias de computação usando o modelo de provisionamento vinculado à reserva, consulte Visão geral das opções de implantação na documentação do Hipercomputador de IA.

Antes de começar

Configure a autenticação, caso ainda não tenha feito isso. Com isso, você confirma sua identidade para acesso a serviços e APIs do Cloud de Confiance by S3NS . Para executar códigos ou amostras de um ambiente de desenvolvimento local, autentique-se no Compute Engine selecionando uma das seguintes opções:
Selecione a guia para como planeja usar as amostras nesta página:
Console

Quando você usa o console Cloud de Confiance para acessar serviços Cloud de Confiance by S3NS e APIs, não é necessário configurar a autenticação.
gcloud
1. Instale a Google Cloud CLI e faça login na CLI gcloud com sua identidade federada. Depois de fazer login, inicialize a Google Cloud CLI executando o seguinte comando:
  gcloud init
  Observação:se você já instalou a CLI gcloud, execute o comando gcloud components update para verificar se tem a versão mais recente.
Defina uma região e uma zona padrão.

REST

Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para CLI gcloud.

Instale a Google Cloud CLI e faça login na CLI gcloud com sua identidade federada.

Saiba mais em Autenticar para usar REST na documentação de autenticação do Cloud de Confiance .

Funções exigidas

Para receber as permissões necessárias para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva, peça ao administrador para conceder a você o papel do IAM de Administrador da instância do Compute (v1) (roles/compute.instanceAdmin.v1) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva. Para acessar as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As seguintes permissões são necessárias para criar instâncias de computação usando o modelo de provisionamento vinculado à reserva:

compute.instances.create no projeto
Usar uma imagem personalizada para criar a VM: compute.images.useReadOnly na imagem
Usar um snapshot para criar a VM: compute.snapshots.useReadOnly no snapshot
Usar um modelo de instância para criar a VM: compute.instanceTemplates.useReadOnly no modelo de instância
Especificar uma sub-rede para a VM: compute.subnetworks.use no projeto ou na sub-rede escolhida
Especificar um endereço IP estático para a VM: compute.addresses.use no projeto
Atribuir um endereço IP externo à VM ao usar uma rede VPC: compute.subnetworks.useExternalIp no projeto ou na sub-rede escolhida
Atribuir uma rede legada à VM: compute.networks.use no projeto
Atribuir um endereço IP externo à VM usando uma rede legada: compute.networks.useExternalIp no projeto
Definir os metadados da instância de VM para a VM: compute.instances.setMetadata no projeto
Definir tags para a VM: compute.instances.setTags na VM
Definir rótulos para a VM: compute.instances.setLabels na VM
Definir uma conta de serviço a ser usada pela VM: compute.instances.setServiceAccount na VM
Criar um disco para a VM: compute.disks.create no projeto
Anexar um disco atual no modo somente leitura ou de leitura e gravação: compute.disks.use no disco
Anexar um disco atual no modo somente leitura: compute.disks.useReadOnly no disco

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Criar uma instância que usa o modelo de provisionamento vinculado à reserva

Para criar uma instância A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High com 8 GPUs ou H4D usando o modelo de provisionamento vinculado à reserva, aguarde até que a reserva criada automaticamente que você quer usar atinja o horário de início. Além disso, a instância de computação que você pretende criar precisa atender a todos os seguintes requisitos:

A instância de computação e a reserva precisam ter propriedades correspondentes.
A instância de computação precisa visar especificamente a reserva para consumo.
A instância de computação precisa ser interrompida ou excluída até o horário de término da reserva.

O exemplo a seguir cria uma solicitação de reserva adiantada no modo de calendário para cinco instâncias A3 Ultra e, em seguida, cria uma instância A3 Ultra consumindo a reserva criada automaticamente para a solicitação.

Para criar uma instância de computação de exemplo usando o modelo de provisionamento vinculado à reserva, selecione uma das seguintes opções:

Console

Crie um exemplo de solicitação para cinco instâncias A3 Ultra e envie para análise:
1. No console do Cloud de Confiance , acesse a página Reservas.
  
  Acesse "Reservas"
2. Clique na guia Reservas adiantadas.
3. Clique em Criar reserva adiantada. A página Criar uma reserva adiantada é exibida.
4. Clique na guia GPUs e, na lista Tipo de GPU, selecione NVIDIA H200 141 GB. Essa ação especifica uma instância A3 Ultra.
5. No campo Capacidade total necessária, insira 5.
6. Na seção Período de reserva, especifique o horário de início e a duração do período de reserva.
7. Clique em Pesquisar capacidade e, na seção Capacidade disponível, selecione uma das máquinas disponíveis.
8. Clique em Criar.
No horário de início da solicitação, para criar uma instância A3 Ultra e consumir a reserva de exemplo criada automaticamente, faça o seguinte:

Importante: as etapas a seguir mostram como criar uma instância A3 Ultra de NIC único, o que é útil para testes rápidos. Para criar uma instância A3 Ultra multi-NIC, consulte Criar uma instância A3 Ultra ou A4.
1. No console do Cloud de Confiance , acesse a página Criar uma instância.
  
  Acesse "Criar uma instância"
2. No campo Nome, insira um nome para a instância de computação. Para este exemplo, insira example-instance.
3. Especifique a Região e a Zona em que a reserva criada automaticamente está. Para este exemplo, selecione us-central1 e us-central1-b, respectivamente.
4. Clique na guia GPUs e, na lista Tipo de GPU, selecione NVIDIA H200 141 GB. Essa ação especifica uma instância A3 Ultra e define o modelo de provisionamento como Vinculado à reserva.
5. No menu de navegação, clique em Avançado.
6. Na seção Reservas, selecione Escolher uma reserva e clique em Escolher reserva.
7. No painel Escolher uma reserva, faça o seguinte:
  1. Selecione o exemplo de reserva criada automaticamente.
  2. Clique em Escolher.
8. Na seção Modelo de provisionamento, abra a seção Configurações avançadas do modelo de provisionamento de VM.
9. Na lista No encerramento da VM, selecione Parar (padrão) ou Excluir.
10. Clique em Criar.

gcloud

Para criar um exemplo de solicitação de cinco instâncias A3 Ultra e enviar para análise, use o comando gcloud beta compute future-reservations create:

gcloud beta compute future-reservations create example-fr \
    --auto-delete-auto-created-reservations \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=example-reservation \
    --share-setting=local \
    --start-time=2026-03-05T00:00:00Z \
    --end-time=2026-03-19T00:00:00Z \
    --machine-type=a3-ultragpu-8g \
    --total-count=5 \
    --zone=us-central1-b

Suponha que Cloud de Confiance aprove a solicitação e o Compute Engine crie automaticamente uma reserva vazia. No horário de início da solicitação, em 5 de março de 2026, o Compute Engine aumenta o número de instâncias de GPU reservadas na reserva. Em seguida, você pode consumir a reserva.

No horário de início da solicitação, para criar uma instância A3 Ultra e consumir a reserva de exemplo criada automaticamente, use o comando gcloud compute instances create com as seguintes flags:
- A sinalização --instance-termination-action
- A flag --provisioning-model definida como RESERVATION_BOUND.
- A sinalização --reservation
- A flag --reservation-affinity definida como specific.
O comando é semelhante a este: Para conferir todos os requisitos para criar uma instância A3 Ultra, consulte Criar uma instância A3 Ultra ou A4.
```
gcloud compute instance create example-a3ultra-instance  \
    --machine-type=a3-ultragpu-8g \
    --instance-termination-action=TERMINATION_ACTION \
    --provisioning-model=RESERVATION_BOUND \
    --reservation-affinity=specific \
    --reservation=RESERVATION_URL \
    --zone=us-central1-b \
    ...
```
O comando inclui os seguintes valores:
- TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a instância de computação ao final do período de reserva.
- RESERVATION_URL: o URL da reserva, formatado da seguinte maneira:
  - Se a reserva criada automaticamente existir no seu projeto: example-reservation.
  - Se a reserva criada automaticamente estiver em outro projeto: projects/PROJECT_ID/reservations/example-reservation.

REST

Para criar um exemplo de solicitação de cinco instâncias A3 Ultra e enviar para análise, faça uma solicitação POST para o método futureReservations.insert da versão Beta:

POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations

{
  "name": "example-request-calendar-mode",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "example-reservation",
  "shareSettings": {
    "shareType": "LOCAL"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "machineType": "a3-ultragpu-8g",
    "totalCount": 5
  },
  "timeWindow": {
    "startTime": "2026-03-05T00:00:00Z",
    "endTime": "2026-03-19T00:00:00Z"
  }
}

No horário de início da solicitação, para criar uma instância A3 Ultra e consumir a reserva de exemplo criada automaticamente, faça uma solicitação POST para o método instances.insert. No corpo da solicitação, inclua estes campos:
- O campo reservationAffinity.consumeReservationType definido como SPECIFIC_RESERVATION.
- O campo reservationAffinity.key definido como compute.googleapis.com/reservation-name.
- O campo reservationAffinity.values definido como o URL da reserva.
- O campo scheduling.instanceTerminationAction.
- O campo scheduling.provisioningModel definido como RESERVATION_BOUND.
A solicitação é semelhante a esta. Para conferir todos os requisitos para criar uma instância A3 Ultra, consulte Criar uma instância A3 Ultra ou A4.
```
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances

{
  {
    "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
    "name": "example-a3ultra-instance",
    "reservationAffinity": {
      "consumeReservationType": "SPECIFIC_RESERVATION",
      "key": "compute.googleapis.com/reservation-name",
      "values":[
        "RESERVATION_URL"
      ],
    },
    "scheduling": {
      "instanceTerminationAction": "TERMINATION_ACTION",
      "provisioningModel": "RESERVATION_BOUND"
    },
    ...
  }
}
```
O corpo da solicitação inclui os seguintes valores:
- RESERVATION_URL: o URL da reserva, formatado da seguinte maneira:
  - Se a reserva criada automaticamente existir no seu projeto: example-reservation.
  - Se a reserva criada automaticamente estiver em outro projeto: projects/PROJECT_ID/reservations/example-reservation.
- TERMINATION_ACTION: se o Compute Engine interrompe (STOP) ou exclui (DELETE) a instância de computação ao final do período de reserva.

Criar uma instância com o modelo vinculado à reserva

Antes de começar

Console

gcloud

REST

Funções exigidas

Permissões necessárias

Criar uma instância que usa o modelo de provisionamento vinculado à reserva

Console

gcloud

REST

A seguir