Es posible que parte o toda la información de esta página no se aplique a Cloud de Confiance de S3NS. Para obtener más información, consulta Diferencias con respecto a Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Acerca de los eventos de anfitrión

Durante el ciclo de vida de una instancia de máquina virtual o de una instancia de hardware desnudo, la máquina host en la que se ejecuta tu instancia puede experimentar varios eventos de host. Un evento de host puede incluir el mantenimiento periódico de la infraestructura de Compute Engine o, en raras ocasiones, un error de host. Puedes elegir cómo responden tus instancias de VM y de hardware desnudo durante o después de un evento del host configurando la política de mantenimiento del host.

De forma predeterminada, la mayoría de las instancias están configuradas para migrarse automáticamente durante los eventos del host. En todas las series de máquinas, excepto Z3, puedes anular este comportamiento y definir explícitamente que las instancias finalicen y, opcionalmente, se reinicien. Algunos tipos de máquinas no admiten la migración en tiempo real, como las instancias H4D, las instancias de hardware desnudo, las instancias con GPUs conectadas o las instancias Z3 con más de 18 TiB de SSD Titanium conectada. Estas instancias finalizan durante los eventos del host. Para obtener más información, consulta Comportamientos de mantenimiento y reinicio.

Tipos de eventos de anfitrión

Hay dos tipos de eventos de anfitrión, que se describen con más detalle en las siguientes secciones:

Eventos de mantenimiento
Errores de host

Si tu instancia deja de responder, también se puede activar un reinicio o una finalización de la instancia.

Eventos de mantenimiento

Un evento de mantenimiento se produce cuando Compute Engine tiene que llevar a cabo una actividad de mantenimiento o reparación que requiere que las máquinas virtuales se trasladen del servidor host. Si habilitas la migración en tiempo real política de mantenimiento del host en un tipo de instancia compatible, Compute Engine moverá la instancia a un nuevo host y tu aplicación sufrirá interrupciones mínimas.

Compute Engine también aplica algunas actualizaciones ligeras del hipervisor y de la red en segundo plano sin interrupciones, ya que mantiene la instancia en el mismo host.

El comportamiento de una instancia durante un evento de mantenimiento puede variar en función de la tenencia de la instancia y del tipo de máquina. Puedes consultar información sobre el comportamiento del mantenimiento de cada tipo de máquina en la página de la familia de máquinas correspondiente, como se indica a continuación:

Serie C:
- C2 y C2D: familia de máquinas optimizadas para la computación
- Todas las demás series C: familia de máquinas de uso general
Series E, N y T: familia de máquinas de uso general
Serie H: familia de máquinas optimizadas para la computación
Series M y X: familia de máquinas con memoria optimizada
Serie Z: familia de máquinas con almacenamiento optimizado

Para obtener información sobre las políticas de mantenimiento de las instancias con GPUs conectadas, consulta Gestionar eventos de mantenimiento de host de GPU.

En el caso de las máquinas virtuales de único cliente, la frecuencia aproximada de los eventos de mantenimiento planificado del host es de entre 4 y 6 semanas. La compatibilidad con la migración activa depende de la política de mantenimiento del host de la máquina virtual de único cliente.

Errores de host

Un error de host (compute.instances.hostError) significa que ha habido un problema de hardware o software en la máquina física o en la infraestructura del centro de datos que aloja tu instancia de proceso, lo que ha provocado que falle. Un error de host que implique un fallo total del hardware u otros problemas de hardware puede impedir la migración en directo de tu instancia. Si tu instancia está configurada para reiniciarse automáticamente (que es el ajuste predeterminado), Compute Engine la reiniciará, normalmente en un plazo de tres minutos desde que se detectó el error. En función del problema, el reinicio puede tardar hasta 5 minutos y medio.

En ocasiones, una instancia de proceso puede dejar de responder antes de que se señale un error de host. Puedes reducir el tiempo que espera Compute Engine para reiniciar o finalizar la instancia configurando el tiempo de espera de recuperación de errores del host. Para obtener más información, consulta Definir políticas de disponibilidad.

Los fallos físicos de hardware y software pueden producirse de vez en cuando, pero son poco frecuentes. Para proteger tus aplicaciones y servicios frente a estos eventos del sistema potencialmente perjudiciales, consulta los siguientes recursos:

Información general sobre la política de mantenimiento del host

La política de mantenimiento del host de una instancia determina su comportamiento durante los siguientes eventos del host:

Evento de mantenimiento
Evento de error de host o instancia que no responde

Puedes configurar las instancias para que sigan ejecutándose durante el mantenimiento del host mientras Compute Engine las migra en tiempo real a otro host, o bien puedes detener la instancia.

Puedes cambiar la política de mantenimiento del host de una instancia configurando los siguientes ajustes:

Comportamiento durante el mantenimiento: si la instancia se migra automáticamente o se detiene cuando se produce un evento de mantenimiento.
Comportamiento al reiniciar: si Compute Engine reinicia o finaliza la instancia si esta falla, experimenta un error de host o deja de responder.
Tiempo de detección de errores del host: el tiempo máximo que espera Compute Engine para reiniciar o finalizar una instancia después de detectar que no responde.

Puedes actualizar la política de mantenimiento del host de una instancia en cualquier momento para controlar cómo quieres que se comporten tus instancias.

Comportamientos de mantenimiento y reinicio

Cuando se produce un evento de anfitrión, la instancia de computación puede usar la migración en vivo o se puede terminar la instancia. Si se termina una instancia, puedes reiniciarla tú mismo o dejar que Compute Engine lo haga automáticamente.

Es posible que las siguientes series de máquinas no admitan la migración en tiempo real y, en su lugar, requieran la finalización durante los eventos del host:

Las instanciasBare Metal se cancelan y se reinician, lo que significa que pueden reiniciarse en un host diferente. Para obtener más información, consulta la documentación "Experiencia de mantenimiento" de la serie de máquinas. Por ejemplo, en el caso de los tipos de máquinas C3 de metal desnudo, consulta Experiencia de mantenimiento de instancias C3.
Instancias de máquinas virtuales confidenciales excepto los tipos de máquinas N2D con plataformas de CPU AMD EPYC Milan que ejecutan AMD SEV.
Instancias con GPUs
Instancias con TPUs

Migrar en tiempo real

De forma predeterminada, la mayoría de los tipos de instancia están configurados para migrar en directo, excepto los tipos de instancia mencionados en la sección anterior.

Durante la migración activa, Compute Engine migra automáticamente tu instancia para evitar un evento de mantenimiento de la infraestructura, y tu instancia sigue ejecutándose durante la migración. Es posible que tu instancia experimente un breve periodo de rendimiento reducido, pero, en general, la mayoría de las instancias no deberían tener un rendimiento significativamente diferente. Es ideal para instancias que requieren un tiempo de actividad constante y pueden tolerar un breve periodo de rendimiento reducido.

Cuando Compute Engine migra tu instancia, registra un evento del sistema que se publica en la lista de operaciones de la zona y en los registros de eventos del sistema. Puedes revisar este evento consultando las operaciones de Compute Engine de una zona específica. Los eventos de migración en directo tienen el siguiente tipo de operación:

compute.instances.migrateOnHostMaintenance

Finalizar y reiniciar

Si no quieres que tu instancia se migre en directo o si tu tipo de instancia no admite la migración en directo, puedes permitir queCloud de Confiance by S3NS detenga la instancia cuando se produzca un evento de host. Con esta configuración, si se produce un evento de host, Compute Engine envía una señal de apagado suave para apagar la instancia. A continuación, espera 60 segundos a que la instancia se apague correctamente y cambia su estado a TERMINATED. Si la instancia no se cierra correctamente en 60 segundos, se terminará de forma forzosa.

Esta opción es ideal si tus instancias requieren un rendimiento máximo constante y si tu aplicación general está diseñada para gestionar los fallos o reinicios de las instancias.

Cuando Compute Engine detiene una instancia debido a un evento del host, registra un evento del sistema que se publica en la lista de operaciones de la zona y en los registros de eventos del sistema. Puedes revisar este evento consultando las operaciones de Compute Engine de una zona específica. Los eventos de finalización de instancias tienen el siguiente tipo de operación:

compute.instances.terminateOnHostMaintenance

Reinicio automático

Si tu instancia está configurada para detenerse cuando se produzca un evento de mantenimiento o si falla debido a un problema de hardware subyacente, Compute Engine puede reiniciarla automáticamente. La instancia se reinicia en el mismo servidor host o se mueve a otro servidor de la misma zona que no participe en el evento de mantenimiento.

De forma predeterminada, Compute Engine intenta recuperar las instancias con discos SSD locales conectados durante una hora. Si se alcanza el límite de tiempo, Compute Engine intenta reiniciar la instancia en otro servidor host de la misma zona.

Para configurar el reinicio automático, asigna el valor true al campo de la política de mantenimiento del host automaticRestart. Este ajuste no se aplica si la instancia se pone fuera de línea debido a una interrupción zonal o mediante una operación manual, como llamar a sudo shutdown en el SO invitado.

Cuando Compute Engine reinicia automáticamente tu instancia, registra un evento del sistema que se publica en la lista de operaciones de la zona. Puedes revisar este evento consultando las operaciones de Compute Engine de una zona específica. Los eventos de reinicio automático tienen el siguiente tipo de operación:

compute.instances.automaticRestart

Persistencia de los discos tras la finalización de la instancia

Como Hyperdisk son almacenamiento conectado a la red, cuando se reinicia la instancia, Compute Engine vuelve a conectar el disco de arranque y cualquier disco secundario a la instancia. Los datos de esos discos se conservan durante la migración en directo y los reinicios de instancias.

Programación del mantenimiento

Cloud de Confiance by S3NS ofrece funciones que permiten un mayor control del mantenimiento. Si usas determinadas familias de máquinas, puedes especificar preferencias de mantenimiento y recibir notificaciones de los próximos eventos de mantenimiento a través de Cloud Logging, el servidor de metadatos de la instancia, el comando compute instances describe de la CLI de gcloud o el método instances.describe de REST. Cuando recibas una notificación, tendrás un periodo de tiempo para iniciar el mantenimiento programado a la hora que elijas. Si no activas el mantenimiento programado, el evento de mantenimiento se producirá al final del periodo de notificación, que es la hora programada que se indica en la notificación.

Puedes usar estas funciones junto con tu política de mantenimiento de hosts para personalizar una programación de mantenimiento que se adapte a tu carga de trabajo.

Siguientes pasos

Consulta más información sobre la migración en directo.
Más información sobre cómo definir la política de mantenimiento del anfitrión de una instancia
Consulta más información sobre cómo recibir notificaciones de migración en tiempo real.
Consulta más información sobre cómo simular el mantenimiento del anfitrión.
Consulta más información sobre cómo migrar manualmente máquinas virtuales de único cliente en tiempo real.