Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance da S3NS. Consulte Diferenças do Google Cloud para saber mais.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelos de provisionamento de instâncias do Compute Engine

Ao criar uma instância do Compute Engine, é necessário definir o método, chamado de modelo de provisionamento, que você quer usar para receber os recursos solicitados. Cada modelo de provisionamento determina a disponibilidade, o ciclo de vida e os preços das instâncias de computação.

Este documento explica os diferentes modelos de provisionamento que podem ser especificados ao criar instâncias de computação. Ao entender esses modelos, você pode escolher a melhor opção para sua carga de trabalho.

Modelos de provisionamento disponíveis

Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.

Padrão
Spot
Início flexível
Vinculada à reserva

A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:

	Padrão	Spot	Início flexível	Vinculada à reserva
Resumo	Com base na disponibilidade de recursos, você pode criar instâncias de computação imediatamente. Você pode controlar quando interromper ou excluir instâncias de computação.	Com base na disponibilidade de recursos, você pode criar instâncias de computação imediatamente. Você pode controlar quando interromper ou excluir instâncias de computação. No entanto, você também permite que o Compute Engine interrompa ou exclua instâncias de computação a qualquer momento para recuperar a capacidade.	Com base na disponibilidade de recursos, é possível criar instâncias de computação em um tempo de espera especificado. Para uma VM flex-start independente, é possível especificar um tempo de espera de até duas horas. Para um MIG, o Compute Engine continua tentando criar instâncias de computação até que os recursos fiquem disponíveis ou você cancele a solicitação de criação. Você pode controlar quando interromper ou excluir instâncias de computação. No entanto, não é possível suspender ou recriar essas contas. As instâncias de computação são executadas por um mínimo de 10 minutos e até um máximo de sete dias. Quando as instâncias de computação atingem o fim da duração da execução, o Compute Engine as interrompe ou exclui com base na ação de encerramento.	É possível solicitar a reserva de capacidade em uma data futura para criar instâncias de computação. Se Cloud de Confiance aprovar sua solicitação, o Compute Engine vai criar uma reserva. No início do período de reserva, é possível consumir a reserva criando instâncias de computação que correspondam a ela. Durante o período de reserva aprovado, é possível parar, reiniciar, excluir e recriar instâncias de computação para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias de computação que consomem a reserva com base na ação de encerramento.
Casos de uso	Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como: Servidores da Web Bancos de dados Aplicativos empresariais Desenvolvimento e teste	Ideal para cargas de trabalho que podem tolerar interrupções, como as seguintes: Processamento em lote Computação de alto desempenho (HPC) Integração e implantação contínuas (CI/CD) Análise de dados Codificação de mídia Inferência on-line	Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como: Pré-treinamento de modelo pequeno Ajuste fino de modelos Simulação de HPC Inferência em lote	Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como: Para cargas de trabalho que duram até 90 dias: Jobs de pré-treinamento de modelos Jobs de ajuste de modelo Cargas de trabalho de simulação de HPC Aumentos esperados de curto prazo nas cargas de trabalho de inferência Para cargas de trabalho com mais de 90 dias: Cargas de trabalho de treinamento Cargas de trabalho de inferência
Alocação de recursos	Melhor esforço. O Compute Engine coloca fisicamente os recursos próximos uns dos outros com base no melhor esforço. Para controlar o posicionamento, use políticas de posicionamento.	Melhor esforço. O Compute Engine coloca fisicamente os recursos próximos uns dos outros com base no melhor esforço. Para controlar o posicionamento, use políticas de posicionamento.	Dense na medida do possível. O Compute Engine faz o possível para posicionar os recursos de forma densa e próximos uns dos outros. Para controlar o posicionamento das VMs de início flexível, use uma das seguintes opções: Para VMs de início flexível independentes: políticas de posicionamento compacto Para VMs de início flexível em um MIG: políticas de carga de trabalho	Dense. O Compute Engine posiciona fisicamente os recursos em hosts de acoplamento rígido conectados por uma estrutura de rede de alta velocidade para minimizar a latência da rede.
Preços	Você vai pagar os preços padrão das instâncias de computação. Consulte Preços de instâncias de VM. Você recebe cobranças com base no método usado para criar instâncias de computação: Se você criar instâncias de computação imediatamente, vai pagar conforme o uso (PAYG). Se você criar instâncias de computação usando uma reserva sob demanda ou uma reserva criada automaticamente para uma reserva adiantada, será cobrado enquanto a reserva existir. Para mais informações, consulte faturamento de reservas.	Você recebe descontos de até 60% nas séries de máquinas C3, M3 e A3. Para mais informações, consulte a página de preços. Você usa o PAYG.	Com base na série de máquinas usada pelas instâncias de computação, você recebe um desconto da seguinte forma: Para as séries de máquinas A4, A3 e A2, você recebe um desconto de 53% em vCPUs, memória e GPUs. Para a série de máquinas H4D, você recebe um desconto de 25% em vCPUs e memória. Outras famílias de máquinas compatíveis não se qualificam para descontos. Para mais informações, consulte Preços do programador dinâmico de cargas de trabalho (DWS). Você usa o PAYG.	Você recebe cobranças com base na forma como reserva capacidade para criar instâncias de computação da seguinte maneira: Se você reservar capacidade no Hipercomputador de IA, vai receber cobranças com base nos preços das VMs otimizadas para aceleradores. Se você reservar recursos por um ano ou mais, será necessário comprar e anexar um compromisso baseado em recursos aos recursos reservados. Se você reservar capacidade usando reservas adiantadas no modo de calendário, vai incorrer em cobranças com base nos preços do Programador dinâmico de cargas de trabalho (DWS). Você recebe uma cobrança pelo período da reserva. Para mais informações, consulte Faturamento de reservas.
Cota	Quando você cria uma instância de computação, a cota padrão é consumida.	Quando você cria uma VM spot, a cota padrão é consumida.	Ao criar uma VM flex-start, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida.	O consumo de cota varia de acordo com o método usado para reservar recursos: Reservas futuras com o Hipercomputador de IA ou clusters de HPC: o Google gerencia a cota dos recursos reservados. Não é necessário solicitar cota manualmente. No horário de início da sua reserva adiantada aprovada, o Google aumenta automaticamente a cota se o projeto não tiver uma. Reservas adiantadas no modo calendário: para reservar tipos de máquina H4D, a cota de CPU é consumida. Para reservar tipos de máquina de GPU ou TPU, não é necessário ter cota.

Disponibilidade e vida útil da instância de computação

A tabela a seguir mostra a disponibilidade e o ciclo de vida da instância de computação para cada modelo de provisionamento:

	Padrão	Spot	Início flexível	Vinculada à reserva
Pré-requisitos para a criação	Não há pré-requisitos de criação.	Não há pré-requisitos de criação.	Não há pré-requisitos de criação.	Para criar instâncias de computação, primeiro reserve capacidade usando um dos seguintes métodos: Para reservar capacidade para cargas de trabalho de longa duração, use reservas futuras com o Hipercomputador de IA ou reservas futuras com clusters de HPC. Para reservar capacidade para cargas de trabalho que são executadas por até 90 dias, use reservas adiantadas no modo de calendário. Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, é possível consumir a capacidade criando instâncias de computação.
Série de máquinas compatível	Você pode usar qualquer série de máquinas, exceto A4X Max, A4X, A4 e A3 Ultra.	É possível usar todas as séries de máquinas (C3, M3 e A3). O Spot para TPU7x é restrito por uma lista de permissões. Consulte esta observação.	Você só pode usar as seguintes séries de máquinas: Séries de máquinas A4, A3, A2, G4 e G2 TPU7x¹, TPU v6e e TPU v5p Instâncias de máquina virtual (VM) N1 com GPUs anexadas Série de máquinas H4D	Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas: Se você reservar capacidade no Hipercomputador de IA, só poderá usar A4X Max, A4X, A4, A3 Ultra, A3 Mega com 8 GPUs, A3 High com 8 GPUs e A3 Edge. Se você criar uma reserva adiantada no modo de calendário, só poderá usar as seguintes séries: GPUs: A4, A3 Ultra, A3 Mega com 8 GPUs, A3 High com 8 GPUs e série de máquinas H4D. TPUs: TPU7x^*, v6e, v5p
Disponibilidade de instâncias de computação	É possível criar instâncias de computação a qualquer momento, desde que os recursos solicitados estejam disponíveis. Para reduzir as chances de encontrar erros de disponibilidade de recursos, confira a disponibilidade de VMs spot antes de criá-las.	É possível criar instâncias de computação a qualquer momento, desde que os recursos solicitados estejam disponíveis.	É possível criar instâncias de computação da seguinte maneira: Crie uma instância de computação independente. Crie um MIG que crie individualmente instâncias de computação com base na disponibilidade. Crie um MIG que crie instâncias de computação de uma só vez. O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.	Só é possível criar instâncias de computação depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias de computação. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará o DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Garantia de capacidade	Com base no método de criação. A garantia de capacidade varia de acordo com o método usado para criar instâncias de computação, da seguinte forma: Se você criar instâncias de computação imediatamente, o Compute Engine fará o possível para provisionar a capacidade solicitada. Se você criar instâncias de computação consumindo uma reserva sob demanda ou uma reserva criada automaticamente para uma reserva adiantada, terá uma garantia muito alta de que o Compute Engine provisionará a capacidade solicitada se a reserva tiver capacidade reservada disponível.	Melhor esforço. Ao criar Spot VMs, o Compute Engine faz o possível para provisionar a capacidade solicitada.	Melhor esforço. Quando você cria uma solicitação de redimensionamento de MIG, o Compute Engine faz o possível para programar o provisionamento da capacidade solicitada.	Muito alto. Se o Cloud de Confiance aprovar seu pedido de reserva, você terá uma garantia muito alta de que o Compute Engine vai provisionar a capacidade reservada na data e hora de entrega escolhidas. Você tem acesso exclusivo à capacidade reservada durante o período da reserva.
Ciclo de vida da instância de computação	Você pode controlar quando interromper ou excluir uma instância de computação. No entanto, se o tipo de máquina usado pela instância de computação não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância durante os eventos de manutenção do host.	Você pode controlar quando interromper ou excluir uma instância de computação, exceto nos seguintes casos: O Compute Engine interrompe ou exclui a instância de computação para recuperar a capacidade. Esse processo é chamado de preempção. Se o tipo de máquina usado pela instância de computação não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância de computação durante os eventos de manutenção do host.	Antes que uma instância de computação chegue ao fim da duração da execução, você pode fazer o seguinte: Interrompa a instância de computação: se você criou sua VM flex-start como uma instância de computação independente ou individualmente em um MIG à medida que a capacidade fica disponível, é possível interromper as instâncias de computação a qualquer momento. Não é possível parar VMs flex-start criadas em uma solicitação de redimensionamento de MIG. Exclua a instância de computação: é possível excluir a instância de computação a qualquer momento. Quando uma instância de computação atinge o fim da duração da execução, o Compute Engine a interrompe ou exclui com base na ação de encerramento.	Você pode controlar quando interromper ou excluir uma instância de computação, exceto nos seguintes casos: O Compute Engine interrompe a instância de computação durante eventos de manutenção do host. A reserva criada automaticamente para provisionar a capacidade solicitada atinge o fim do período de reserva comprometida. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias de computação que a consomem com base na ação de encerramento especificada na configuração delas.

¹ As reservas Spot, de início flexível e adiantadas no modo de agenda para TPU7x são restritas por uma lista de permissões. Para solicitar acesso, entre em contato com sua equipe de contas ou a equipe de vendas.

A seguir

Leia uma visão geral da criação de instâncias do Compute Engine.
Saiba mais sobre VMs spot.
Saiba mais sobre as VMs de início flexível.
Saiba mais sobre instâncias de computação que usam o modelo de provisionamento vinculado à reserva.