Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance da S3NS. Consulte
Diferenças do Google Cloud para saber mais.
Resolver problemas do GKE
Este documento lista os artigos de solução de problemas comuns que você pode encontrar ao usar o Google Kubernetes Engine (GKE). Se você estiver diagnosticando
erros de carga de trabalho, como ImagePullBackOff e CrashLoopBackOff, depurando
o comportamento do escalonamento automático de cluster, resolvendo problemas de PersistentVolume ou
solucionando problemas de registro de nós, os documentos listados aqui podem ajudar.
Se você não conhece a solução de problemas no GKE, comece com
Introdução à solução de problemas.
Para diagnosticar e resolver problemas, consulte os documentos nas seções a seguir:
Para resolver problemas de rede do GKE, consulte
Resolver problemas de rede do GKE
na documentação de rede do GKE.
Este documento é destinado a administradores, arquitetos, especialistas em segurança, Rede ou em armazenamento que resolvem problemas de
configurações do GKE. Para saber mais sobre as funções do GKE,
consulte
Funções e tarefas comuns do usuário do GKE.
Introdução à solução de problemas
Configuração do cluster
| Tópico |
Descrição |
| Criação de cluster |
Resolver problemas com a criação de clusters. |
| Clusters do Autopilot |
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo criação de clusters, exclusão de namespaces, escalonamento e problemas de carga de trabalho. |
| Ferramenta de linha de comando kubectl |
Resolver problemas da ferramenta de linha de comando kubectl no GKE, incluindo problemas de autenticação e autorização.
Esta página também inclui dicas sobre como
resolver problemas do proxy Konnectivity
para verificar se ele está fazendo com que os comandos kubectl logs, attach,
exec ou port-forward parem de
responder. |
| Pools de nós padrão |
Resolver problemas em pools de nós padrão do GKE,
incluindo problemas com a criação de pool de nós, provisionamento de melhor esforço,
metadados de instância corrompidos e migração de cargas de trabalho para novos pools de nós. |
Status do nó NotReady |
Aprenda a diagnosticar e resolver o status NotReady
do nó no GKE solucionando problemas de causas comuns, como
escassez de recursos, problemas de rede e falhas de componentes. |
| Registro de nós |
Resolver problemas que ocorrem ao adicionar nós ao cluster
GKE Standard, como falhas no registro de nós
e pré-requisitos ausentes para o registro bem-sucedido de nós. |
| Ambiente de execução do contêiner |
Resolver problemas de ambientes de execução de contêineres no GKE, incluindo
problemas com containerd e dockershim, e
registros particulares. |
Escalonamento automático
| Tópico |
Descrição |
| O escalonador automático de clusters não está reduzindo a escala vertical |
Diagnosticar e resolver motivos comuns para o cluster não remover nós subutilizados. Saiba como verificar problemas como PodDisruptionBudgets restritivos, pods com armazenamento local ou anotações específicas (por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false") que impedem a remoção de nós. |
| O escalonador automático de clusters não está escalonando verticalmente |
Saiba por que o escalonador automático de cluster não está adicionando novos nós para atender à demanda.
Verifique se há pods não programáveis, se você não atingiu os limites de tamanho do cluster ou do pool de nós e identifique possíveis problemas de cota de recursos ou de disponibilidade regional de VMs. |
| Escalonamento automático de pod horizontal |
Resolva problemas com o escalonador automático horizontal de pods que não está escalonando
as réplicas de pod do seu aplicativo. Resolva problemas comuns, como objetos HorizontalPodAutoscaler mal configurados ou problemas com o pipeline de métricas. |
Armazenamento
| Tópico |
Descrição |
| Armazenamento |
Solucione problemas de armazenamento, incluindo questões com discos permanentes regionais, desempenho do disco e expansão de volume. |
Segurança do cluster
A autoridade certificadora raiz do cluster vai expirar em breve
Cargas de trabalho
| Tópico |
Descrição |
| Cargas de trabalho implantadas |
Resolver problemas de erros em cargas de trabalho executadas em um cluster do GKE, incluindo PodUnschedulable.
Leia a seção "PodUnschedulable" para receber orientações sobre erros como
MatchNodeSelector e
Does not have minimum availability.
|
| Extrações de imagens |
Resolver problemas de extração de imagens. Saiba o que causa status como
ImagePullBackOff e ErrImagePull
e como resolver esses status corrigindo problemas comuns, como
autenticação e conectividade de rede. |
| Eventos CrashLoopBackOff |
Solucione problemas de eventos CrashLoopBackOff no GKE. Diagnosticar problemas como esgotamento de recursos, configurações incorretas de apps e falhas na sondagem de atividade. |
| Eventos de falta de memória |
Resolver problemas com eventos de memória insuficiente (OOM) do Kubernetes. Identificar causas, distinguir tipos de eventos e aplicar soluções eficazes para encerramentos por falta de memória (OOM) no nível do contêiner e do nó. |
| Cargas de trabalho do Arm |
Solucione problemas com cargas de trabalho do Arm, incluindo falhas em pods em nós do Arm. |
| TPUs |
Resolver problemas com TPUs, incluindo problemas com cota, provisionamento automático de nós, configuração e programação de carga de trabalho. |
| GPUs |
Resolver problemas de GPUs, incluindo problemas com a instalação de drivers de GPU,
erros de plug-in de dispositivo e imagens de contêiner. |
Gerenciamento de clusters
| Tópico |
Descrição |
| Upgrades de cluster |
Resolva problemas de upgrade de cluster e nó do GKE, incluindo upgrades longos ou incompletos, upgrades automáticos inesperados, falhas e problemas pós-upgrade. |
| Webhooks |
Entenda como solucionar problemas e garantir a estabilidade do plano de controle do cluster ao usar webhooks de admissão. |
Namespace travado no estado Terminating |
Para resolver problemas com namespaces travados no estado
Terminating, identifique e remova os componentes
não íntegros que estão impedindo a exclusão. |
| Operações simultâneas |
Saiba como identificar e resolver esses erros aguardando a conclusão das operações. |
Monitoramento
| Tópico |
Descrição |
| Métricas do sistema |
Resolva problemas com métricas do sistema que não aparecem no Cloud Monitoring. |
| Painéis do Monitoring |
Resolva problemas em painéis de monitoramento, incluindo problemas com a ativação
do monitoramento, recursos do Kubernetes ausentes e permissões. |
| Resolver problemas com registros ausentes |
Resolver problemas de registros ausentes do GKE. Saiba como verificar o status da API, as configurações do cluster, as permissões, as cotas, os filtros e o comportamento do aplicativo. |
Erros 4xx
Problemas conhecidos
| Tópico |
Descrição |
| Problemas conhecidos |
Identifique e resolva problemas conhecidos que possam afetar seu uso do GKE. |
A seguir
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-12-16 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-12-16 UTC."],[],[]]