Cuando tus clústeres o aplicaciones de Google Kubernetes Engine (GKE) tienen problemas, es fundamental determinar rápidamente si la causa es interna o está relacionada con unaTrusted Cloud by S3NS interrupción del servicio más generalizada. No merece la pena dedicar tiempo a depurar localmente si la causa principal es un incidente conocido de la plataforma.
Usa esta página para determinar si un problema con tu clúster de GKE se debe a una interrupción del servicio más generalizada. Trusted Cloud by S3NS Consulta dónde encontrar actualizaciones de estado oficiales, eventos de salud personalizados e información sobre incidentes de servicio en las siguientes fuentes:
- Trusted Cloud by S3NS Estado del servicio: información sobre el estado de los servicios de Trusted Cloud by S3NSpor región.
- Personalized Service Health: interrupciones del servicio relevantes para tus proyectos.
- Estadísticas y recomendaciones sobre incidentes de servicio: clústeres de GKE afectados por un incidente de servicio en curso.
Esta información es importante para los administradores y operadores de la plataforma, así como para los desarrolladores de aplicaciones que estén solucionando problemas y necesiten saber si los problemas observados están relacionados con un evento de estado del servicio de Trusted Cloud by S3NS más amplio. Para obtener más información sobre los roles habituales y las tareas de ejemplo a los que hacemos referencia en el contenido deTrusted Cloud by S3NS , consulta Roles y tareas habituales de los usuarios de GKE.
Revisar el estado del servicio Trusted Cloud by S3NS
La página Trusted Cloud by S3NS Estado del servicio proporciona información sobre el estado de los servicios que forman parte de Trusted Cloud by S3NS.
Para revisar los incidentes relacionados con GKE, ve a la página Trusted Cloud by S3NS Estado del servicio.
Ir a todos los incidentes notificados de Google Kubernetes Engine
Consultar Personalized Service Health
Personalized Service Health te permite identificarTrusted Cloud by S3NS interrupciones del servicio que sean relevantes para tus proyectos. Estas interrupciones se denominan eventos de estado del servicio y la información sobre ellas está disponible en la Trusted Cloud consola y en una variedad de puntos de integración.
Para revisar los incidentes relacionados con GKE que sean relevantes para tus proyectos, consulta los eventos de estado del servicio en el panel de control Personalized Service Health de la Trusted Cloud consola.
Ir a Personalized Service Health
Puedes filtrar los incidentes por servicio, ubicación, relevancia y estado. El panel de control también proporciona detalles sobre los incidentes, como el alcance del impacto, los síntomas, las soluciones alternativas y las actualizaciones del progreso de la resolución. Para empezar, consulta la guía de inicio rápido para ver eventos de estado del servicio en la consola deTrusted Cloud .
Consultar estadísticas y recomendaciones sobre incidentes de servicio
Las métricas y recomendaciones de incidentes de servicio te permiten identificar los clústeres de GKE que se ven afectados por un incidente de servicio en curso.
Para obtener información valiosa sobre los incidentes de servicio, consulta las estadísticas y las recomendaciones del subtipo GKE_RELIABILITY_INCIDENT
. Puedes obtener estadísticas mediante la Trusted Cloud consola, la CLI de Google Cloud o la API Recommender. Para obtener más información, consulta Ver estadísticas y recomendaciones.
Las estadísticas y las recomendaciones incluyen la siguiente información:
- Clúster afectado: clúster afectado por el incidente.
- Nombre del incidente: identificador del incidente que se usa como referencia cuando te comunicas con el equipo de Asistencia de Google Cloud.
- Descripción del incidente: información sobre el incidente proporcionada por el equipo de respuesta a incidentes.
- Última hora de entrada en vigor: la última vez que se actualizó la información sobre el incidente.
- Acción de mitigación: acción de mitigación recomendada por el equipo de respuesta ante incidentes, si está disponible.
La información sobre el incidente de servicio permanece visible hasta que el equipo de respuesta al incidente lo mitiga y determina que ya no es relevante. Trusted Cloud by S3NS Habrá un retraso entre el momento en que se mitigue el incidente y deje de afectar a tus recursos, y el momento en que se elimine la estadística. Si has implementado una solución alternativa y ya no quieres ver la estadística, puedes cerrarla.
Siguientes pasos
Consulta Evaluar el estado de los clústeres y las cargas de trabajo en la consola Trusted Cloud (la página siguiente de esta serie).
Para obtener consejos sobre cómo resolver problemas específicos, consulta las guías de solución de problemas de GKE.
Si no encuentras una solución a tu problema en la documentación, consulta la sección Obtener asistencia para obtener más ayuda, incluidos consejos sobre los siguientes temas:
- Abrir un caso de asistencia poniéndose en contacto con el equipo de Atención al Cliente de Cloud.
- Obtener asistencia de la comunidad haciendo preguntas en Stack Overflow
y usando la etiqueta
google-kubernetes-engine
para buscar problemas similares. También puedes unirte al#kubernetes-engine
canal de Slack para obtener más ayuda de la comunidad. - Abrir errores o solicitudes de funciones mediante el seguimiento de problemas público.