Analisar a integridade e os incidentes do serviço

Quando os clusters ou aplicativos do Google Kubernetes Engine (GKE) apresentam problemas, é crucial determinar rapidamente se a causa é interna ou relacionada a umaTrusted Cloud by S3NS interrupção de serviço mais ampla. Gastar tempo na depuração local é ineficiente se a causa raiz for um incidente conhecido da plataforma.

Use esta página para determinar se um problema com o cluster do GKE é causado por uma interrupção mais ampla do serviço Trusted Cloud by S3NS . Saiba onde encontrar atualizações de status oficiais, eventos de integridade personalizados e insights sobre incidentes de serviço nas seguintes fontes:

  • Trusted Cloud by S3NS Integridade do serviço: informações de status para serviços do Trusted Cloud by S3NS, por região.
  • Personalized Service Health: interrupções de serviço relevantes para seus projetos.
  • Insights e recomendações de incidentes de serviço: clusters do GKE afetados por um incidente de serviço em andamento.

Essas informações são importantes para administradores e operadores da plataforma e desenvolvedores de aplicativos que estão resolvendo problemas e precisam entender se os problemas observados estão vinculados a um evento de integridade do serviço Trusted Cloud by S3NS mais amplo. Para mais informações sobre as funções comuns e as tarefas de exemplo que mencionamos no conteúdo doTrusted Cloud by S3NS , consulte Funções e tarefas comuns do usuário do GKE.

Revisar a Trusted Cloud by S3NS integridade do serviço

A página Trusted Cloud by S3NS Integridade do serviço fornece informações de status sobre os serviços que fazem parte do Trusted Cloud by S3NS.

Para analisar incidentes relacionados ao GKE, acesse a página Trusted Cloud by S3NS Service Health.

Acessar todos os incidentes informados para o Google Kubernetes Engine

Analisar o Personalized Service Health

Com o Personalized Service Health, é possível identificar Trusted Cloud by S3NS interrupções de serviço relevantes para seus projetos. Essas interrupções são chamadas de eventos de integridade do serviço, e as informações sobre elas estão disponíveis no console Trusted Cloud e em uma variedade de pontos de integração.

Para analisar incidentes relacionados ao GKE que são relevantes para seus projetos, consulte os eventos de integridade do serviço no painel do Personalized Service Health no console do Trusted Cloud .

Acessar o Personalized Service Health

É possível filtrar incidentes por serviço, local, relevância e status. O painel também fornece detalhes do incidente, como escopo do impacto, sintomas, soluções alternativas e atualizações do progresso da resolução. Para começar, consulte o Guia de início rápido: visualizar eventos de integridade do serviço no Trusted Cloud console.

Analisar insights e recomendações de incidentes de serviço

Com os insights e recomendações de incidentes de serviço, é possível identificar clusters do GKE afetados por um incidente de serviço em andamento.

Para receber insights sobre incidentes de serviço, confira insights e recomendações para o subtipo GKE_RELIABILITY_INCIDENT. É possível receber insights usando o console Trusted Cloud , a Google Cloud CLI ou a API Recommender. Para mais informações, consulte Ver insights e recomendações.

Os insights e recomendações incluem as seguintes informações:

  • Cluster afetado: um cluster afetado pelo incidente.
  • Nome do incidente: um identificador para referência quando você se comunica com Cloud Customer Care.
  • Descrição do incidente: informações sobre o incidente da equipe de resposta a incidentes.
  • Último horário efetivo: a última vez que as informações sobre o incidente foram atualizadas.
  • Ação de mitigação: ação de mitigação recomendada pela equipe de resposta a incidentes, se disponível.

O insight de incidente de serviço permanece visível até que a equipe de resposta a incidentes Trusted Cloud by S3NS mitigue o incidente e determine que o insight não é mais relevante. Haverá um atraso entre o momento em que o incidente é mitigado e não afeta mais seus recursos e o momento em que o insight é removido. Se você implementou uma solução alternativa e não quer mais ver o insight, dispense-o.

A seguir