Modelos de aprovisionamento de instâncias do Compute Engine

Este documento descreve os modelos de aprovisionamento para instâncias do Compute Engine. Para saber mais sobre as opções de implementação, consulte o artigo Escolha uma estratégia de implementação do Compute Engine para a sua carga de trabalho.

Os modelos de aprovisionamento determinam a disponibilidade, a duração e os preços das suas instâncias. Se compreender estes modelos, pode escolher a melhor opção para a sua carga de trabalho.

Modelos de aprovisionamento disponíveis

Quando cria uma instância de computação, pode especificar um dos seguintes modelos de aprovisionamento. Se não especificar um modelo de aprovisionamento, o Compute Engine usa o modelo de aprovisionamento padrão por predefinição.

  • Standard

  • Espaço

  • Flex-start

  • Restrito a reserva

A tabela seguinte ajuda a comparar os exemplos de utilização e os preços de cada modelo de aprovisionamento:

Standard Espaço Flex-start Restrito a reserva
Resumo
  • Com base na disponibilidade de recursos, pode criar imediatamente instâncias.
  • Pode controlar quando parar ou eliminar instâncias.
  • Com base na disponibilidade de recursos, pode criar imediatamente instâncias.
  • Pode controlar quando parar ou eliminar instâncias. No entanto, também permite que o Compute Engine pare ou elimine instâncias em qualquer altura para reaver capacidade.
  • Depois de criar um grupo de instâncias geridas (MIG) zonal, pede ao Compute Engine para adicionar instâncias com GPUs anexadas ao MIG. O Compute Engine agenda o aprovisionamento das instâncias com base na disponibilidade de recursos.
  • Pode controlar quando eliminar instâncias. No entanto, não pode pará-los, suspender nem recriá-los. As instâncias são executadas durante um máximo de sete dias. Em seguida, o Compute Engine elimina-os.
  • Pode pedir para reservar capacidade numa data futura para criar instâncias com GPUs anexadas. Se a Google Trusted Cloud by S3NS aprovar o seu pedido, o Compute Engine cria uma reserva. No início do período de reserva, pode consumir a reserva criando instâncias de GPU que correspondam à reserva.
  • Durante o período de reserva aprovado, pode parar, reiniciar, eliminar e recriar instâncias para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva.
Exemplos de utilização

Ideais para cargas de trabalho que requerem estabilidade e funcionamento contínuo, como as seguintes cargas de trabalho:

  • Servidores Web
  • Bases de dados
  • Aplicações empresariais
  • Desenvolvimento e testes

Ideais para cargas de trabalho que podem tolerar interrupções, como as seguintes cargas de trabalho:

  • Processamento em lote
  • Informática de elevado desempenho (HPC)
  • Integração contínua e implementação contínua (CI/CD)
  • Análise de dados
  • Codificação de multimédia
  • Inferência online

Cargas de trabalho que requerem estabilidade e têm de ser executadas durante, no máximo, sete dias, como as seguintes cargas de trabalho:

  • Pré-treino de modelos pequenos
  • Ajuste do modelo
  • Simulação de HPC
  • Inferência em lote

Ideal para cargas de trabalho que requerem estabilidade e um tempo de execução específico, como as seguintes:

  • Para cargas de trabalho com duração máxima de 90 dias:

    • Tarefas de pré-treino de modelos
    • Tarefas de ajuste do modelo
    • Cargas de trabalho de simulação de HPC
    • Aumentos esperados a curto prazo nas cargas de trabalho de inferência
  • Para cargas de trabalho com mais de 90 dias:

    • Cargas de trabalho de preparação
    • Cargas de trabalho de inferência
Preços
  • Incorre em preços padrão para instâncias. Veja os preços das instâncias de VM.
  • Incorre em custos com base no método que usa para criar instâncias:

    • Se criar instâncias imediatamente, paga à medida que usa (PAYG).
    • Se criar instâncias através de uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, então é-lhe cobrado o valor até a reserva existir. Para mais informações, consulte a faturação de reservas.
  • Recebe descontos entre 60% e 91% na maioria das vCPUs, na memória e nas GPUs. Além disso, recebe descontos mais pequenos para quaisquer tipos de máquinas A4 ou A3 e GPUs, discos SSD locais, endereços IP externos e custos de rede de Tier_1. Para mais informações, consulte os preços das VMs de capacidade instantânea.
  • Paga à medida que usa.
  • Com base na série de máquinas que as suas instâncias usam, recebe um desconto da seguinte forma:

    • Para as séries de máquinas A4, A3 e A2, recebe um desconto de 53% nas vCPUs, na memória e nas GPUs.
    • Para a série de máquinas H4D, recebe um desconto de 25% nas vCPUs e na memória.
    Outras séries de máquinas suportadas não são elegíveis para descontos. Para mais informações, consulte os preços do Dynamic Workload Scheduler (DWS).
  • Paga à medida que usa.
Quota Quando cria uma instância, é consumida a quota padrão. Quando cria uma instância, é consumida a quota de instâncias preemptíveis . Se o seu projeto não tiver quota preemptível, é consumida a quota padrão. Trusted Cloud Os créditos do nível gratuito não se aplicam a VMs do Spot. Quando o MIG adiciona instâncias ao grupo, a quota preemptível é consumida. Se o seu projeto não tiver quota preemptível, a quota padrão é consumida. A quota não se aplica ao modelo de aprovisionamento associado a reservas.

Disponibilidade e duração das instâncias

A tabela seguinte mostra a disponibilidade e a duração das instâncias de computação para cada modelo de aprovisionamento:

Standard Espaço Flex-start Restrito a reserva
Pré-requisitos de criação Não existem pré-requisitos de criação. Não existem pré-requisitos de criação. Não existem pré-requisitos de criação.

Para criar instâncias, primeiro tem de reservar capacidade através de um dos seguintes métodos:

Na data e hora de entrega escolhidas, o Compute Engine aprovisiona a capacidade pedida. Em seguida, pode consumir a capacidade criando instâncias.

Séries de máquinas suportadas Pode usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra. Pode usar qualquer série de máquinas, exceto instâncias A4X, G4, X4 e bare metal.

Só pode usar as seguintes séries de máquinas:

Com base na forma como reserva capacidade para criar VMs, só pode usar as seguintes séries de máquinas:

Disponibilidade da instância Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis. Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis.

Pode criar instâncias da seguinte forma:

O Compute Engine usa o DWS para agendar o aprovisionamento da capacidade pedida com base na disponibilidade de recursos. O DWS ajuda a obter recursos de elevada procura, como GPUs.

Só pode criar instâncias depois de reservar capacidade para uma data futura. Na data pedida, o Compute Engine fornece a capacidade pedida, que pode usar para criar instâncias. Se reservar recursos através de reservas futuras no modo de calendário, o Compute Engine usa o DWS para aprovisionar a capacidade pedida. O DWS ajuda a obter recursos de elevada procura, como GPUs.
Garantia de capacidade Com base no método de criação. A garantia de capacidade varia consoante o método que usa para criar instâncias, da seguinte forma:
  • Se criar instâncias imediatamente, o Compute Engine faz tentativas de melhor esforço para aprovisionar a capacidade pedida.
  • Se criar instâncias consumindo uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, tem uma garantia muito elevada de que o Compute Engine aprovisiona a capacidade pedida se a reserva tiver capacidade reservada disponível.
Melhor esforço. Quando cria VMs Spot, o Compute Engine faz tentativas de melhor esforço para aprovisionar a capacidade pedida. Melhor esforço. Quando cria um pedido de redimensionamento de MIG, o Compute Engine faz tentativas de melhor esforço para agendar o aprovisionamento da capacidade pedida. Muito elevado. Se o Google Cloud Platform aprovar o seu pedido de reserva, tem uma garantia muito elevada de que o Compute Engine aprovisiona a sua capacidade reservada na data e hora de entrega escolhidas. Trusted Cloud Tem acesso exclusivo à capacidade reservada durante o período de reserva.
Ciclo de vida da instância

Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos:

  • Se o tipo de máquina que a instância usa não for compatível com a migração em direto, o Compute Engine para as suas instâncias durante os eventos de manutenção do anfitrião.
  • Em casos raros, a instância pode parar devido a um erro do anfitrião.

Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos:

  • O Compute Engine pode parar ou eliminar a instância em qualquer altura para recuperar capacidade. Este processo é denominado preempção.
  • Se o tipo de máquina que a instância usa não for compatível com a migração em direto, o Compute Engine para as suas instâncias durante os eventos de manutenção do anfitrião.
  • Em casos raros, a instância pode parar devido a um erro do anfitrião.

As instâncias aprovisionadas são executadas durante a duração escolhida, que pode ser de até sete dias. Não pode parar, suspender nem recriar instâncias.

O Compute Engine elimina instâncias quando ocorre uma das seguintes situações:

  • Pede para eliminar instâncias.
  • As instâncias atingem o fim da respetiva duração de execução.

Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos:

  • O Compute Engine para a sua instância durante os eventos de manutenção do anfitrião.
  • A reserva criada automaticamente para aprovisionar a capacidade pedida atinge o fim do respetivo período de reserva comprometido. Nessa altura, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva.
  • Em casos raros, a instância pode parar devido a um erro do anfitrião.

O que se segue?