Observabilidad de GKE

En esta página, se describe cómo puedes comprender el estado de tus aplicaciones y mantener la disponibilidad y confiabilidad de estas.

Funciones de observabilidad predeterminadas

De forma predeterminada, los clústeres de GKE están configurados para hacer lo siguiente:

Personaliza y mejora la recopilación de datos

De forma predeterminada, GKE crea un repositorio de Logging para almacenar registros de cada clúster. Puedes controlar qué registros y qué métricas, si las hay, se envían desde tu clúster de GKE a Cloud Logging y Cloud Monitoring.

También puedes controlar si habilitas Google Cloud Managed Service para Prometheus.

Para los clústeres de Autopilot de GKE, no puedes inhabilitar la integración de Cloud Monitoring y Cloud Logging.

Métricas de observabilidad adicionales

Puedes recopilar métricas de observabilidad adicionales si habilitas uno o más paquetes de métricas de observabilidad:

  • Métricas del plano de control: Supervisa el estado de los componentes de Kubernetes mediante la recopilación de métricas para el servidor de la API, Scheduler y el Administrador de controladores de Kubernetes. Estas métricas son indicadores útiles del estado del servicio para definir objetivos de nivel de servicio (SLO).
  • Kube State Metrics: supervisa el estado de los objetos de Kubernetes, como Deployments, nodos y Pods.
  • Métricas de cAdvisor/Kubelet: Supervisa el estado de los contenedores y el kubelet.

Si habilitaste GKE Enterprise en tu proyecto, estas métricas están habilitadas de forma predeterminada cuando te registras en una flota durante la creación del clúster.

Métricas definidas por el usuario y de terceros

Para supervisar las aplicaciones de terceros que se ejecutan en tus clústeres, como Postgres, MongoDB y Redis, usa exportadores de Prometheus con Google Cloud Managed Service para Prometheus.

También puedes escribir exportadores personalizados para supervisar otros indicadores de estado y rendimiento.

Usa los datos recopilados

Usa los datos que recopilas para analizar el estado de la aplicación, depurarla, solucionar problemas y realizar pruebas a medida que desarrollas, implementas y mantienes tus aplicaciones.

GKE proporciona funciones de observabilidad integradas para que puedas comenzar con rapidez:

  • Visualiza los datos recopilados para tus clústeres y cargas de trabajo en los paneles de observabilidad de GKE. Puedes personalizar los paneles proporcionados para los siguientes fines:

    • Visualizar las métricas clave del clúster, como el uso de CPU, el uso de memoria y la cantidad de incidentes abiertos.
    • Visualizar clústeres por su infraestructura, cargas de trabajo o Services.
    • Inspeccionar espacios de nombres, nodos, cargas de trabajo, Services, Pods y contenedores.
    • En el caso de los Pods y los contenedores, consultar las métricas como una función de tiempo y visualiza las entradas de registro.

    También puedes crear tus propios paneles o importar paneles de Grafana para satisfacer tus necesidades.

  • En la pestaña Observabilidad, puedes crear políticas de alertas recomendadas para que recibas notificaciones sobre los problemas. Para obtener más información sobre las alertas, consulta la Descripción general de alertas.

  • Crea SLOs para supervisar los objetivos de rendimiento del servicio mediante métricas de GKE recopiladas.

  • Usa las guías de GKE para solucionar problemas comunes, como Pods no programables y contenedores que fallan repetidamente después del reinicio.

  • Explora y analiza tus datos con herramientas como el Explorador de registros, el Explorador de métricas y Error Reporting.

  • Revisa los registros de auditoría de GKE que registran actividades y accesos administrativos como parte de los registros de auditoría de Cloud. La política de registro de auditoría determina qué eventos se registran y si una entrada de registro pertenece a un registro de actividad del administrador o a un registro de acceso a datos.

Otras funciones

GKE se integra en otros servicios de Google Cloud para ayudarte a supervisar y administrar tus clústeres y cargas de trabajo.

¿Qué sigue?