Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance by S3NS. Consulte o artigo Diferenças em relação ao Google Cloud para mais detalhes.

Esta página foi traduzida pela API Cloud Translation.

Modelos de aprovisionamento de instâncias do Compute Engine

Este documento descreve os modelos de aprovisionamento para instâncias do Compute Engine.

Quando cria uma instância, tem de definir o método, denominado modelo de aprovisionamento, que quer usar para obter os recursos pedidos. Cada modelo de aprovisionamento determina a disponibilidade, a duração e os preços das suas instâncias. Compreender estes modelos permite-lhe escolher a melhor opção para a sua carga de trabalho.

Modelos de aprovisionamento disponíveis

Quando cria uma instância de computação, pode especificar um dos seguintes modelos de aprovisionamento. Se não especificar um modelo de aprovisionamento, o Compute Engine usa o modelo de aprovisionamento padrão por predefinição.

Standard
Espaço
Flex-start
Associado a reserva

A tabela seguinte ajuda a comparar os exemplos de utilização e os preços de cada modelo de aprovisionamento:

	Standard	Espaço	Flex-start	Associado a reserva
Resumo	Com base na disponibilidade de recursos, pode criar imediatamente instâncias. Pode controlar quando parar ou eliminar instâncias.	Com base na disponibilidade de recursos, pode criar imediatamente instâncias. Pode controlar quando parar ou eliminar instâncias. No entanto, também permite que o Compute Engine pare ou elimine instâncias em qualquer altura para reaver capacidade.	Com base na disponibilidade de recursos, pode criar instâncias num tempo de espera especificado. Para uma instância autónoma, pode especificar um tempo de espera de até duas horas. Para um pedido de redimensionamento de MIG, o tempo de espera é indefinido. Pode controlar quando parar ou eliminar instâncias. No entanto, não pode suspender nem recriar os mesmos. As instâncias são executadas durante um mínimo de 10 minutos e um máximo de sete dias. Quando as instâncias atingem a duração de execução, o Compute Engine para ou elimina as instâncias com base na respetiva ação de encerramento.	Pode pedir para reservar capacidade numa data futura para criar instâncias com GPUs anexadas. Se a Google Cloud de Confiance by S3NS aprovar o seu pedido, o Compute Engine cria uma reserva. No início do período de reserva, pode consumir a reserva criando instâncias de GPU que correspondam à reserva. Durante o período de reserva aprovado, pode parar, reiniciar, eliminar e recriar instâncias para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva com base na respetiva ação de rescisão.
Exemplos de utilização	Ideais para cargas de trabalho que requerem estabilidade e funcionamento contínuo, como as seguintes cargas de trabalho: Servidores Web Bases de dados Aplicações empresariais Desenvolvimento e testes	Ideais para cargas de trabalho que podem tolerar interrupções, como as seguintes cargas de trabalho: Processamento em lote Informática de elevado desempenho (HPC) Integração contínua e implementação contínua (CI/CD) Análise de dados Codificação de multimédia Inferência online	Cargas de trabalho que requerem estabilidade e têm de ser executadas durante, no máximo, sete dias, como as seguintes cargas de trabalho: Pré-treino de modelos pequenos Ajuste do modelo Simulação de HPC Inferência em lote	Ideal para cargas de trabalho que requerem estabilidade e um tempo de execução específico, como as seguintes: Para cargas de trabalho com duração máxima de 90 dias: Tarefas de pré-treino de modelos Tarefas de ajuste do modelo Cargas de trabalho de simulação de HPC Aumentos esperados a curto prazo nas cargas de trabalho de inferência Para cargas de trabalho com mais de 90 dias: Cargas de trabalho de preparação Cargas de trabalho de inferência
Preços	Incorre em preços padrão para instâncias. Veja os preços das instâncias de VM. Incorre em custos com base no método que usa para criar instâncias: Se criar instâncias imediatamente, paga à medida que usa (PAYG). Se criar instâncias através de uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, então é-lhe cobrado o valor até a reserva existir. Para mais informações, consulte a faturação de reservas.	Recebe descontos até 91% em muitos tipos de máquinas, GPUs, TPUs e discos SSD locais. Para mais informações, consulte os preços das VMs de capacidade instantânea. Paga à medida que usa.	Com base na série de máquinas que as suas instâncias usam, recebe um desconto da seguinte forma: Para as séries de máquinas A4, A3 e A2, recebe um desconto de 53% nas vCPUs, na memória e nas GPUs. Para a série de máquinas H4D, recebe um desconto de 25% nas vCPUs e na memória. Outras séries de máquinas suportadas não são elegíveis para descontos. Para mais informações, consulte os preços do Dynamic Workload Scheduler (DWS). Paga à medida que usa.	Incorre em custos com base na forma como reserva capacidade para criar instâncias da seguinte forma: Se reservar capacidade no AI Hypercomputer, incorre em custos com base nos preços das VMs otimizadas para aceleradores. Se reservar recursos durante um ano ou mais, tem de comprar e anexar um compromisso baseado em recursos aos seus recursos reservados. Se reservar capacidade através de reservas futuras no modo de calendário, incorre em custos com base nos preços do Dynamic Workload Scheduler (DWS). É-lhe cobrado o período de reserva. Para mais informações, consulte a faturação de reservas.
Quota	Quando cria uma instância, é consumida a quota padrão.	Quando cria uma instância, é consumida a quota de instâncias preemptíveis . Se o seu projeto não tiver quota preemptível, é consumida a quota padrão. Cloud de Confiance Os créditos do nível gratuito não se aplicam a VMs do Spot.	Quando o MIG adiciona instâncias ao grupo, a quota preemptível é consumida. Se o seu projeto não tiver quota preemptível, a quota padrão é consumida.	A quota não se aplica ao modelo de aprovisionamento associado a reservas.

Disponibilidade e duração das instâncias

A tabela seguinte mostra a disponibilidade e a duração das instâncias de computação para cada modelo de aprovisionamento:

	Standard	Espaço	Flex-start	Associado a reserva
Pré-requisitos de criação	Não existem pré-requisitos de criação.	Não existem pré-requisitos de criação.	Não existem pré-requisitos de criação.	Para criar instâncias, primeiro tem de reservar capacidade através de um dos seguintes métodos: Para reservar capacidade para cargas de trabalho de longa duração, use reservas futuras no AI Hypercomputer. Para reservar capacidade para cargas de trabalho que são executadas durante um período máximo de 90 dias, use reservas futuras no modo de calendário. Na data e hora de entrega escolhidas, o Compute Engine aprovisiona a capacidade pedida. Em seguida, pode consumir a capacidade criando instâncias.
Séries de máquinas suportadas	Pode usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra.	Pode usar qualquer série de máquinas, exceto instâncias A4X, X4 e bare metal.	Só pode usar as seguintes séries de máquinas: Séries de máquinas A4, A3, A2 e G2 Instâncias de máquinas virtuais (VMs) N1 com GPUs anexadas H4D machine series	Com base na forma como reserva capacidade para criar VMs, só pode usar as seguintes séries de máquinas: Se reservar capacidade no hipercomputador de IA, só pode usar as séries de máquinas A4X, A4 ou A3 Ultra. Se criar uma reserva futura no modo de calendário, só pode usar A4, A3 Ultra, A3 Mega ou A3 High com a série de máquinas de 8 GPUs.
Disponibilidade da instância	Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis.	Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis.	Pode criar instâncias da seguinte forma: Crie uma instância autónoma. Criar um pedido de redimensionamento do MIG. O Compute Engine usa o DWS para agendar o aprovisionamento da capacidade pedida com base na disponibilidade de recursos. O DWS ajuda a obter recursos de elevada procura, como GPUs.	Só pode criar instâncias depois de reservar capacidade para uma data futura. Na data pedida, o Compute Engine fornece a capacidade pedida, que pode usar para criar instâncias. Se reservar recursos através de reservas futuras no modo de calendário, o Compute Engine usa o DWS para aprovisionar a capacidade pedida. O DWS ajuda a obter recursos de elevada procura, como GPUs.
Garantia de capacidade	Com base no método de criação. A garantia de capacidade varia consoante o método que usa para criar instâncias, da seguinte forma: Se criar instâncias imediatamente, o Compute Engine faz tentativas da melhor forma possível para aprovisionar a capacidade pedida. Se criar instâncias consumindo uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, tem uma garantia muito elevada de que o Compute Engine aprovisiona a capacidade pedida se a reserva tiver capacidade reservada disponível.	Melhor esforço. Quando cria VMs Spot, o Compute Engine faz tentativas de melhor esforço para aprovisionar a capacidade pedida.	Melhor esforço. Quando cria um pedido de redimensionamento de MIG, o Compute Engine faz tentativas de melhor esforço para agendar o aprovisionamento da capacidade pedida.	Muito elevado. Se o Google Cloud Platform aprovar o seu pedido de reserva, tem uma garantia muito elevada de que o Compute Engine aprovisiona a sua capacidade reservada na data e hora de entrega escolhidas. Cloud de Confiance Tem acesso exclusivo à capacidade reservada durante o período de reserva.
Ciclo de vida da instância	Pode controlar quando parar ou eliminar uma instância. No entanto, se o tipo de máquina que a instância usa não suportar a migração em direto, o Compute Engine para a instância durante os eventos de manutenção do anfitrião.	Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos: O Compute Engine para ou elimina a instância para recuperar a capacidade. Este processo é denominado preempção. Se o tipo de máquina que a instância usa não suportar a migração em direto, o Compute Engine para a instância durante os eventos de manutenção do anfitrião.	Antes de uma instância atingir o fim da respetiva duração de execução, pode fazer o seguinte: Parar a instância: pode parar a instância em qualquer altura apenas se tiver sido criada como uma instância autónoma. Eliminar a instância: pode eliminar a instância em qualquer altura. Quando uma instância atinge o fim da duração da execução, o Compute Engine elimina-a.	Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos: O Compute Engine para a instância durante os eventos de manutenção do anfitrião. A reserva criada automaticamente para aprovisionar a capacidade pedida atinge o fim do respetivo período de reserva comprometido. Nessa altura, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva com base na ação de rescisão especificada na respetiva configuração.

Modelos de aprovisionamento para implementações densas

Para implementar cargas de trabalho de computação de elevado desempenho (HPC), inteligência artificial (IA) e aprendizagem automática (AA) no Cloud de Confiance by S3NS, os recursos de computação têm de estar fisicamente próximos uns dos outros para minimizar os saltos de rede e otimizar para a latência mais baixa. O Compute Engine oferece métodos de aprovisionamento que lhe permitem reservar grupos de anfitriões fortemente acoplados interligados por uma estrutura de rede de alta velocidade num único centro de dados.

Para mais informações sobre os métodos de aprovisionamento para implementações densas, consulte o seguinte:

Instâncias H4D: vista geral da criação de clusters de HPC
Instâncias de GPU: vista geral da capacidade na documentação do hipercálculo de IA.

O que se segue?

Leia uma vista geral da criação de instâncias do Compute Engine.
Saiba mais sobre as VMs do Spot.
Saiba mais sobre as VMs de início flexível.
Saiba mais sobre as MV que usam o modelo de aprovisionamento associado a reservas.