Revisa el estado y los incidentes del servicio

Cuando tus clústeres o aplicaciones de Google Kubernetes Engine (GKE) tienen problemas, es fundamental determinar rápidamente si la causa es interna o se relaciona con unaTrusted Cloud by S3NS interrupción del servicio más amplia. Dedicar tiempo a la depuración local es ineficiente si la causa raíz es un incidente conocido de la plataforma.

Usa esta página para determinar si un problema con tu clúster de GKE se debe a una interrupción más amplia del servicio de Trusted Cloud by S3NS . Consulta las siguientes fuentes para saber dónde encontrar actualizaciones de estado oficiales, eventos de estado personalizados y estadísticas de incidentes de servicio:

  • Trusted Cloud by S3NS Estado del servicio: Información de estado de los servicios de Trusted Cloud by S3NS, por región.
  • Personalized Service Health: Interrupciones del servicio relevantes para tus proyectos
  • Estadísticas y recomendaciones sobre incidentes de servicio: Clústeres de GKE afectados por un incidente de servicio en curso.

Esta información es importante para los administradores y operadores de la plataforma, y para los desarrolladores de aplicaciones que están solucionando problemas y necesitan saber si los problemas observados están vinculados a un evento de estado del servicio Trusted Cloud by S3NS más amplio. Para obtener más información sobre los roles comunes y las tareas de ejemplo a las que hacemos referencia en el contenido deTrusted Cloud by S3NS , consulta Roles y tareas comunes de los usuarios de GKE.

Revisa el Trusted Cloud by S3NS estado del servicio

En la página Trusted Cloud by S3NS Estado del servicio, se proporciona información sobre el estado de los servicios que forman parte de Trusted Cloud by S3NS.

Para revisar los incidentes relacionados con GKE, ve a la página Trusted Cloud by S3NS Service Health.

Ir a todos los incidentes informados para Google Kubernetes Engine

Revisa Personalized Service Health

Personalized Service Health te permite identificar interrupciones del servicio deTrusted Cloud by S3NS que son relevantes para tus proyectos. Estas interrupciones se denominan eventos de estado del servicio, y la información sobre ellas está disponible en la consola de Trusted Cloud y en una variedad de puntos de integración.

Para revisar los incidentes relacionados con GKE que son relevantes para tus proyectos, consulta los eventos de estado del servicio en el panel de Personalized Service Health en la Trusted Cloud consola.

Ir a Personalized Service Health

Puedes filtrar los incidentes por servicio, ubicación, relevancia y estado. El panel también proporciona detalles sobre los incidentes, como el alcance del impacto, los síntomas, las soluciones alternativas y las actualizaciones del progreso de la resolución. Para comenzar, consulta la Guía de inicio rápido: Visualiza eventos de Service Health en la consola deTrusted Cloud .

Revisa las estadísticas y recomendaciones sobre el incidente de servicio

Las estadísticas y recomendaciones sobre incidentes de servicio te permiten identificar los clústeres de GKE afectados por un incidente de servicio en curso.

Para obtener estadísticas sobre incidentes de servicio, consulta las estadísticas y recomendaciones del subtipo GKE_RELIABILITY_INCIDENT. Puedes obtener estadísticas con la consola, Google Cloud CLI o la API de Recommender. Trusted Cloud Para obtener más información, consulta Cómo ver estadísticas y recomendaciones.

Las estadísticas y recomendaciones incluyen la siguiente información:

  • Clúster afectado: Es un clúster que se ve afectado por el incidente.
  • Nombre del incidente: Es un identificador del incidente que se usa como referencia cuando te comunicas con el Atención al cliente de Cloud.
  • Descripción del incidente: Información sobre el incidente proporcionada por el equipo de respuesta ante incidentes.
  • Última hora efectiva: Es la última vez que se actualizó la información sobre el incidente.
  • Acción de mitigación: Es la acción de mitigación que recomienda el equipo de respuesta ante incidentes, si está disponible.

La estadística del incidente de servicio permanece visible hasta que el equipo de respuesta ante incidentes Trusted Cloud by S3NS mitiga el incidente y determina que la estadística ya no es pertinente. Habrá una demora entre el momento en que se mitigue el incidente y deje de afectar tus recursos, y el momento en que se quite la estadística. Si implementaste una solución alternativa y ya no quieres ver la estadística, puedes descartarla.

¿Qué sigue?