Processo de migração em tempo real durante eventos de manutenção

Durante um evento de manutenção planejada para o hardware subjacente de uma instância de máquina virtual (VM), o servidor host fica indisponível. Para manter uma instância em execução durante um evento de host, o Compute Engine faz uma migração em tempo real da instância para outro servidor host na mesma zona. Para mais informações sobre eventos de host, consulte Sobre eventos de host.

A migração em tempo real permite que o Trusted Cloud by S3NS realize a manutenção sem interromper uma carga de trabalho, reiniciar uma instância ou modificar qualquer uma das propriedades dela, como endereços IP, metadados, dados de armazenamento em blocos, estado do aplicativo ou configurações de rede.

A migração em tempo real mantém as instâncias em execução nas seguintes situações:

  • Manutenção da infraestrutura. A manutenção da infraestrutura inclui hardware de host, redes e redes elétricas em data centers, além de sistema operacional (SO) e BIOS de host.

  • Atualizações relacionadas à segurança e alterações na configuração do sistema. Isso inclui eventos como a instalação de patches de segurança e a alteração do tamanho da partição raiz do host para armazenamento dos pacotes e da imagem do SO do host.

  • Falhas de hardware. Isso inclui falhas de memória, CPUs, placas de rede e discos. Se a falha for detectada antes de uma falha completa do servidor, o Compute Engine vai realizar uma migração preventiva a quente da instância para um novo servidor host. Se o hardware falhar completamente ou impedir a migração em tempo real, a instância será encerrada e reiniciada automaticamente.

O Compute Engine só faz uma migração em tempo real de VMs que têm a política de manutenção do host definida para migração. Para informações sobre como mudar a política de manutenção do host, consulte Definir política de manutenção do host da VM.

Limitações

A migração em tempo real não é compatível com os seguintes tipos de VM:

  • Instâncias bare metal. As instâncias criadas com um tipo de máquina bare metal não são compatíveis com a migração em tempo real. O comportamento de manutenção dessas instâncias está definido como TERMINATE e RESTART, respectivamente.
  • Instâncias de VM confidencial. Todos os tipos de VMs confidenciais precisam ser definidos para interrupção e reinicialização opcional. Consulte Migração em tempo real para mais detalhes.

Como funciona o processo de migração em tempo real?

Quando uma VM é programada para migração em tempo real, o Compute Engine envia uma notificação para que você possa preparar suas cargas de trabalho e aplicativos para essa interrupção. Durante a migração em tempo real, Trusted Cloud by S3NS observa um tempo mínimo de interrupção, que costuma ser menos de um segundo. Se uma VM não estiver configurada para migração em tempo real, o Compute Engine vai encerrá-la durante a manutenção do host. As VMs definidas para serem encerradas durante um evento de host são interrompidas e (opcionalmente) reiniciadas.

Quando o Trusted Cloud by S3NS migra uma VM em execução de um host para outro, ele move o estado completo da VM da origem para o destino de uma maneira transparente ao SO convidado e a tudo que se comunique com ele. Há muitos componentes envolvidos para fazer isso funcionar perfeitamente.

O processo começa com uma notificação de que uma VM precisa ser movida da máquina host atual. A notificação pode começar com uma mudança de arquivo indicando que uma nova versão de BIOS está disponível, uma manutenção de programação de operação de hardware ou um sinal automático de uma falha de hardware iminente.

O software de gerenciamento de cluster doTrusted Cloud by S3NSvigia constantemente esses eventos e os programa com base em políticas que controlam os data centers, como taxas de utilização de capacidade e o número de VMs que apenas um cliente pode migrar de uma só vez.

Depois que uma VM é selecionada para migração,o Trusted Cloud by S3NS envia uma notificação para o convidado informando que uma migração acontecerá em breve. Após um período de espera, um host de destino é selecionado e solicitado a configurar uma nova VM "de destino" vazia para receber a VM "de origem" de migração. A autenticação é usada para estabelecer uma conexão entre a origem e o destino.

Há três estágios envolvidos na migração da VM:

  1. Bblecaute parcial na origem. A VM ainda está sendo executada na origem, enquanto a maioria dos estados é enviada da origem ao destino. Por exemplo, o Trusted Cloud by S3NS copia toda a memória do convidado para o destino, enquanto rastreia as páginas que foram alteradas na origem. O tempo gasto no blecaute parcial da origem é uma função do tamanho da memória do convidado e da taxa em que as páginas estão sendo alteradas.

  2. Indisponível. Um momento muito breve em que a VM não está sendo executada em lugar algum, a VM de origem está pausada, e todo o estado restante necessário para começar a executar a VM no destino é enviado. A VM entra no estágio de blecaute quando o envio de estado durante o estágio de blecaute parcial atinge um ponto de redução de retornos. Um algoritmo é usado para equilibrar o número de bytes da memória que está sendo enviada em relação à taxa em que a VM convidada está fazendo mudanças.

    Observação: durante eventos de indisponibilidade, o relógio do sistema parece adiantar até cinco segundos. Se um evento de indisponibilidade for superior a 5 segundos,o Trusted Cloud by S3NS interromperá e sincronizará o relógio usando um daemon incluído nos pacotes de convidado da VM.

  3. Bblecaute parcial no destino. A VM é executada na VM de destino. A VM de origem está presente e pode oferecer suporte à VM de destino. Por exemplo, até que a estrutura de rede alcance o novo local da VM de destino, a VM de origem fornece serviços de encaminhamento de pacotes para e da VM de destino.

Por fim, a migração está completa e o sistema exclui a VM de origem. Veja se a migração ocorreu nos registros do Cloud Logging da VM.

Migração em tempo real de VMs de locatário individual

À medida que a carga de trabalho é executada, é recomendado mover as VMs para um nó ou grupo de nós de locatário individual diferente. Se você mover uma VM para um grupo de nós, o Compute Engine determinará o nó em que ela será colocada. Para informações sobre locatário individual, consulte Visão geral sobre locatário individual.

Para remover VMs de locatário individual para um nó ou grupo de nós diferente, inicie manualmente uma migração em tempo real. Também é possível iniciar manualmente uma migração em tempo real para mover uma VM em um host de vários locatários para um nó de locatário individual. Para mais informações, consulte Migração em tempo real manual de VMs.

A seguir