Sobre as VMs de início flexível

Este documento oferece uma visão geral das VMs de início flexível, detalhando as principais características delas, bem como os requisitos e as limitações aplicados ao criá-las.

As VMs de início flexível são instâncias de máquina virtual (VMs) criadas usando o modelo de provisionamento de início flexível. Esse modelo usa o Programador Dinâmico de Cargas de Trabalho (DWS, na sigla em inglês) para provisionar recursos de computação com desconto de um pool seguro de capacidade, melhorando suas chances de conseguir recursos de alta demanda, como GPUs. Depois de criar VMs de início flexível, o Compute Engine tenta alocar os recursos solicitados em um período específico. Se isso acontecer, as VMs de início flexível vão começar a ser executadas e continuarão funcionando por no máximo sete dias.

Para cargas de trabalho que exigem recursos por mais de sete dias ou com uma garantia de capacidade maior, é possível criar uma solicitação de reserva adiantada no modo de calendário para ainda se beneficiar dos descontos do DWS.

Casos de uso de VMs de início flexível

As VMs de início flexível são ideais para executar cargas de trabalho que podem começar a qualquer momento, como as seguintes:

  • Pré-treinamento de modelos pequenos

  • Ajuste de modelos

  • Simulação de computação de alto desempenho (HPC)

  • Inferência em lote

Principais características das VMs de início flexível

Em comparação com outros tipos de instâncias do Compute Engine, as VMs de início flexível têm as seguintes características:

  • Um tempo de espera para alocar recursos: é possível criar VMs de início flexível antes que o Compute Engine possa alocar os recursos solicitados. No entanto, as VMs só serão iniciadas se os recursos ficarem disponíveis dentro do período especificado. Se os recursos não estiverem disponíveis, a solicitação de criação da VM falhará.

    Para mais informações, consulte Tempo de espera da VM flex-start neste documento.

  • Uma duração de execução limitada: as VMs de início flexível são executadas sem interrupção por até sete dias. Depois desse período, o Compute Engine interrompe ou exclui automaticamente as VMs com base na ação de encerramento especificada nas propriedades da VM.

    Para mais informações, consulte Duração de execução limitada da VM flex-start neste documento.

  • Como o Compute Engine aloca VMs: o Compute Engine faz o possível para criar VMs de início flexível em proximidade para minimizar a latência da rede. Para controlar o posicionamento das VMs de início flexível, é possível usar políticas de posicionamento compactas ou políticas de carga de trabalho.

    Para mais informações, consulte VM flex-start neste documento.

  • O modelo de provisionamento de início flexível: crie VMs de início flexível usando o modelo de provisionamento de início flexível. Esse modelo de provisionamento oferece melhor disponibilidade de recursos e preços com desconto em comparação com as VMs criadas usando o modelo de provisionamento padrão.

    Para mais informações sobre cada modelo de provisionamento, consulte Modelos de provisionamento de instâncias do Compute Engine.

Tempo de espera da VM flex-start

Quando você cria uma VM flex-start, a VM não é iniciada imediatamente. O Compute Engine tenta alocar os recursos solicitados e iniciar a VM dentro de um período específico. Se você tiver cota suficiente para os recursos solicitados e o Compute Engine os alocar até o final do tempo de espera, a VM flex-start será iniciada em até dois minutos após a capacidade ficar disponível. Caso contrário, a solicitação de criação da VM falhará.

O tempo de espera varia de acordo com o método usado para criar VMs:

Tempo de espera de VMs de início flexível independentes

Para criar uma VM flex-start independente, especifique um tempo de espera usando o campo requestValidForDuration. É possível definir um tempo de espera de zero segundos ou entre 90 segundos e 7.200 segundos (duas horas).

Com base nos requisitos zonais da carga de trabalho, recomendamos os seguintes tempos de espera para aumentar as chances de sucesso da solicitação de criação de VM flex-start:

  • Requisitos zonais estritos: se a carga de trabalho exigir que você crie uma VM flex-start em uma zona específica, recomendamos que você defina o campo requestValidForDuration como 90 segundos ou mais, até duas oras. Tempos de espera mais longos ajudam a aumentar suas chances de conseguir recursos. A VM permanece no estado PENDING durante todo esse período.

  • Sem requisitos zonais: se a VM flex-start puder ser executada em qualquer zona da região, recomendamos que você defina o requestValidForDuration campo como zero segundos. Esse valor especifica que o Compute Engine só aloca recursos se eles estiverem disponíveis imediatamente. Se a solicitação falhar porque os recursos não estão disponíveis, tente criar a VM flex-start em uma zona diferente.

Para interromper uma solicitação de criação de VM enquanto o Compute Engine tenta alocar recursos, exclua a VM de início flexível.

Tempo de espera de MIGs com VMs de início flexível

Se você adicionar VMs de início flexível a um grupo gerenciado de instâncias (MIG), o Compute Engine continuará tentando provisionar os recursos solicitados até que ele seja bem-sucedido ou você cancele a solicitação. A maneira como o Compute Engine adiciona VMs ao MIG varia de acordo com o método de criação:

  • Solicitações de redimensionamento do MIG: o Compute Engine adiciona as VMs solicitadas ao MIG de uma só vez quando todos os recursos ficam disponíveis. A menos que você exclua as VMs antes do final da duração da execução, o Compute Engine as exclui ao mesmo tempo. Para mais informações, consulte Sobre solicitações de redimensionamento do MIG.

  • MIGs com um tamanho de destino: o Compute Engine cria individualmente cada VM quando a capacidade fica disponível. Assim, o MIG pode criar inicialmente apenas uma parte das VMs solicitadas e, em seguida, adicionar as VMs restantes mais tarde, conforme a capacidade permitir. A menos que você exclua as VMs antes do final da duração da execução, o Compute Engine exclui cada VM em relação ao próprio horário de criação. Para mais informações, consulte Criar um MIG que usa VMs de início flexível.

Duração de execução limitada da VM flex-start

Ao criar uma VM flex-start, é necessário especificar o seguinte:

  • A duração da execução da VM: especifique por quanto tempo as VMs podem ser executadas. A duração da execução pode ser de até sete dias. Se a carga de trabalho for concluída antes do término da duração da execução das VMs, será possível interromper ou excluir as VMs independentes ou excluir as VMs em um MIG para evitar custos desnecessários.

  • A ação de encerramento da VM: escolha se o Compute Engine interrompe ou exclui automaticamente as VMs no final da duração da execução. Para VMs de início flexível em um MIG, só é possível especificar a exclusão de VMs no final da duração da execução.

Alocação de VM flex-start

O Compute Engine faz o possível para criar suas VMs de início flexível com base na disponibilidade. Esse posicionamento denso minimiza os saltos de rede e otimiza a baixa latência, o que é ideal para cargas de trabalho que exigem comunicação constante de VM, como cargas de trabalho de IA ou ML. Se você quiser controlar o posicionamento das VMs de início flexível para evitar que elas sejam criadas inesperadamente muito distantes, faça o seguinte:

Quota

Para criar ou reiniciar uma VM flex-start, é necessário ter cota preemptiva suficiente para as vCPUs, a memória e todas as GPUs ou discos SSD locais anexados solicitados.

Se você tentar criar ou reiniciar uma VM flex-start sem cota suficiente, uma das seguintes situações ocorrerá:

  • Solicitações de criação de VM: sua solicitação permanecerá pendente até que você adquira cota suficiente. Se você não adquirir a cota necessária antes do término do tempo de espera, a solicitação falhará.

  • Solicitações de reinicialização de VM: sua solicitação falha imediatamente.

Preços

Para VMs de início flexível, você incorre em cobranças da seguinte maneira:

  • Você paga conforme o uso (PAYG, na sigla em inglês). Para mais informações sobre os preços de uma VM durante o ciclo de vida dela, consulte Preços.

  • Para os tipos de máquina A4, A3, A2, G4 e H4D, você recebe vCPUs, memória e todas as GPUs anexadas a um preço com desconto. Outros tipos de máquina otimizados para aceleradores não estão qualificados para descontos. Para mais informações, consulte Preços do DWS.

Limitações

As seções a seguir descrevem as limitações das VMs de início flexível.

Limitações para todas as VMs de início flexível

Todas as VMs de início flexível têm as seguintes limitações:

  • As VMs de início flexível só podem usar os seguintes tipos de máquina:

    • Todos os tipos de máquina de GPU, exceto A4X Max e A4X

    • Versões de TPU nas seguintes zonas:

      • TPU7x: us-central1-c

      • TPU v6e: asia-northeast1-b, us-east5-a e us-south1-ai1b

      • TPU v5p: us-east5-a

    • Tipos de máquina H4D

  • É necessário criar VMs de início flexível usando o modelo de provisionamento de início flexível.

  • É necessário especificar se as VMs de início flexível serão interrompidas ou excluídas no final da duração da execução usando os instanceTerminationAction e maxRunDuration campos. Para MIGs, só é possível especificar a exclusão de VMs de início flexível.

  • É necessário interromper as VMs de início flexível durante eventos de manutenção do host.

  • Só é possível aplicar políticas de posicionamento compactas a VMs de início flexível independentes.

  • Não é possível aplicar políticas de posicionamento expandidas a VMs de início flexível.

  • Não é possível usar reservas.

Limitações para MIGs com VMs de início flexível

Todos os MIGs com VMs de início flexível têm as seguintes limitações:

Além disso, se você quiser criar VMs de início flexível usando solicitações de redimensionamento do MIG, consulte Limitações para solicitações de redimensionamento do MIG.

A seguir