Osservabilità per GKE


Questa pagina descrive come comprendere l'integrità delle tue applicazioni e mantenere la disponibilità e l'affidabilità delle applicazioni.

Funzionalità di osservabilità predefinite

Per impostazione predefinita, i cluster GKE sono configurati per eseguire le seguenti operazioni:

Personalizzare e migliorare la raccolta dei dati

Per impostazione predefinita, GKE crea un repository Logging per archiviare i log per ogni cluster. Puoi controllare quali log e quali metriche, se presenti, vengono inviati dal tuo cluster GKE a Cloud Logging e Cloud Monitoring.

Puoi anche controllare se abilitare Google Cloud Managed Service per Prometheus.

Per i cluster GKE Autopilot, non puoi disabilitare l'integrazione di Cloud Monitoring e Cloud Logging.

Metriche di osservabilità aggiuntive

Puoi raccogliere metriche di osservabilità aggiuntive attivando uno o più pacchetti di metriche di osservabilità.

  • Metriche del control plane: monitora l'integrità dei componenti Kubernetes raccogliendo metriche per il server API Kubernetes, lo scheduler e il gestore dei controller. Queste metriche sono segnali utili dello stato del servizio per definire gli obiettivi del livello di servizio (SLO).
  • Metriche di stato di Kube: monitora l'integrità degli oggetti Kubernetes come deployment, nodi e pod.
  • Metriche cAdvisor/Kubelet: Monitora lo stato dei container e di Kubelet.

Se hai abilitato GKE Enterprise nel tuo progetto, queste metriche sono abilitate per impostazione predefinita quando ti registri a un parco risorse durante la creazione del cluster.

Metriche di terze parti e definite dall'utente

Per monitorare le applicazioni di terze parti in esecuzione sui cluster, come Postgres, MongoDB e Redis, utilizza gli exporter Prometheus con Google Cloud Managed Service per Prometheus.

Puoi anche scrivere esportatori personalizzati per monitorare altri indicatori di integrità e rendimento.

Utilizzare i dati raccolti

Utilizza i dati raccolti per analizzare l'integrità delle applicazioni, eseguire il debug, risolvere i problemi e testare durante lo sviluppo, il deployment e la manutenzione delle applicazioni.

GKE fornisce funzionalità di osservabilità integrate per iniziare rapidamente:

  • Visualizza i dati raccolti per i cluster e i carichi di lavoro nelle dashboard di osservabilità di GKE . Puoi personalizzare le dashboard fornite per i seguenti scopi:

    • Visualizza le metriche chiave del cluster, come l'utilizzo della CPU, l'utilizzo della memoria e il numero di incident aperti.
    • Visualizza i cluster in base a infrastruttura, carichi di lavoro o servizi.
    • Esamina spazi dei nomi, nodi, carichi di lavoro, servizi, pod e container.
    • Per pod e container, visualizza le metriche in funzione del tempo e le voci di log.

    Puoi anche creare dashboard personalizzate o importare dashboard Grafana per soddisfare le tue esigenze.

  • Nella scheda Osservabilità puoi creare criteri di avviso consigliati in modo da ricevere una notifica in caso di problemi. Per saperne di più sugli avvisi, consulta la Panoramica degli avvisi.

  • Crea SLO per monitorare gli obiettivi di rendimento del servizio utilizzando le metriche GKE raccolte.

  • Utilizza i playbook GKE per risolvere problemi comuni come pod non pianificabili e container che si arrestano ripetutamente in modo anomalo dopo il riavvio.

  • Esplora e analizza i tuoi dati con strumenti come Esplora log, Esplora metriche e Error Reporting.

  • Esamina gli audit log di GKE che registrano le attività amministrative e gli accessi nell'ambito di Cloud Audit Logs. Le norme per gli audit log determinano quali eventi vengono registrati e se una voce di log appartiene a un log Attività di amministrazione o a un log Accesso ai dati.

Altre caratteristiche

GKE si integra con altri servizi Trusted Cloud per aiutarti a monitorare e gestire i cluster e i carichi di lavoro.

Passaggi successivi