Resolva problemas do GKE
Esta página apresenta páginas de resolução de problemas para problemas comuns que pode
encontrar quando usa o Google Kubernetes Engine (GKE). Esta página destina-se a
administradores e arquitetos, especialistas em segurança, especialistas em redes ou
especialistas em armazenamento que resolvem problemas de configurações do GKE. Para saber mais sobre as funções do GKE, consulte o artigo Funções e tarefas comuns de utilizadores do GKE.
Se não tem experiência na resolução de problemas no GKE ou quer uma vista geral de alto nível das ferramentas e técnicas fundamentais, comece com a Introdução à resolução de problemas.
Para diagnosticar e resolver problemas que encontrar em várias fases do trabalho com a sua infraestrutura do GKE, consulte as seguintes secções:
Esta página também oferece acesso a tópicos de resolução de problemas mais gerais:
Para resolver problemas de rede do GKE, consulte o artigo
Resolva problemas de rede do GKE
na documentação de rede do GKE.
Introdução à resolução de problemas
Configuração do cluster
| Tópico |
Descrição |
| Criação de clusters |
Resolva problemas com a criação de clusters. |
| Clusters do Autopilot |
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo a criação de clusters, a eliminação de espaços de nomes, o dimensionamento e os problemas de cargas de trabalho. |
| Ferramenta de linhas de comando Kubectl |
Resolva problemas da ferramenta de linha de comandos kubectl no GKE, incluindo problemas de autenticação e autorização.
Esta página também inclui sugestões sobre como
resolver problemas do proxy Konnectivity
para verificar se está a fazer com que os comandos kubectl logs, attach,
exec ou port-forward deixem de
responder. |
| Pools de nós padrão |
Resolva problemas com conjuntos de nós padrão do GKE,
incluindo problemas com a criação de conjuntos de nós, o aprovisionamento dentro do possível,
metadados de instâncias danificados e a migração de cargas de trabalho para novos conjuntos de nós. |
| Registo de nós |
Resolva problemas que ocorrem quando adiciona nós ao seu cluster padrão do GKE, como falhas de registo de nós e pré-requisitos em falta para o registo de nós bem-sucedido. |
| Tempo de execução do contentor |
Resolva problemas de tempos de execução de contentores no GKE, incluindo:
problemas com o containerd e o dockershim, e
registos privados. |
Escala automática
| Tópico |
Descrição |
| O redimensionador automático de clusters não está a reduzir recursos |
Diagnostique e resolva os motivos comuns pelos quais o cluster não está a remover os nós subutilizados. Saiba como verificar se existem problemas como
PodDisruptionBudgets, pods com armazenamento local ou anotações específicas
(por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false")
que impedem a remoção de nós. |
| O redimensionador automático de clusters não está a aumentar recursos |
Saiba por que motivo o redimensionador automático de clusters não está a adicionar novos nós para satisfazer a procura.
Verifique se existem pods não agendáveis, certifique-se de que não atingiu os limites de tamanho do cluster ou do conjunto de nós e identifique potenciais problemas de quota de recursos ou de disponibilidade de VMs regionais. |
| Escala automática horizontal de pods |
Resolva problemas com o redimensionador automático de pods horizontal que não dimensiona as réplicas de pods da sua aplicação. Resolva problemas comuns, como:
Objetos HorizontalPodAutoscaler configurados incorretamente ou problemas com o pipeline de métricas. |
Armazenamento
| Tópico |
Descrição |
| Armazenamento |
Resolva problemas de armazenamento, incluindo problemas com discos persistentes regionais,
desempenho do disco e expansão do volume. |
Segurança do cluster
O certificado de autoridade raiz do cluster expira em breve
Cargas de trabalho
| Tópico |
Descrição |
| Cargas de trabalho implementadas |
Resolva problemas de erros para cargas de trabalho em execução num cluster do GKE, incluindo PodUnschedulable.
Leia a secção PodUnschedulable para obter sugestões sobre erros como
MatchNodeSelector e
Does not have minimum availability.
|
| Imagens extraídas |
Resolva problemas de obtenção de imagens. Saiba o que causa estados como
ImagePullBackOff e ErrImagePull
e como resolver estes estados corrigindo problemas comuns, como
autenticação e conetividade de rede. |
| Eventos CrashLoopBackOff |
Resolva problemas de eventos CrashLoopBackOff no GKE. Diagnostique problemas como o esgotamento de recursos, as configurações incorretas das apps e as falhas de sondagem de atividade. |
| Eventos OOM |
Resolva problemas de eventos de falta de memória (OOM) do Kubernetes. Identifique as causas,
distinga os tipos de eventos e aplique soluções eficazes para eliminações por falta de memória (OOM) ao nível do contentor e do nó. |
| Cargas de trabalho Arm |
Resolva problemas com cargas de trabalho Arm, incluindo falhas de Pods em nós Arm. |
| TPUs |
Resolva problemas com as TPUs, incluindo problemas com a quota, o aprovisionamento automático de nós, a configuração da carga de trabalho e a programação. |
| GPUs |
Resolva problemas com GPUs, incluindo problemas com a instalação de controladores de GPU, erros de plug-ins de dispositivos e imagens de contentores. |
Gestão de clusters
| Tópico |
Descrição |
| Atualizações de clusters |
Resolva problemas de atualização de nós e clusters do GKE, incluindo atualizações longas ou incompletas, atualizações automáticas inesperadas, falhas e problemas pós-atualização. |
| Webhooks |
Compreenda como resolver problemas e garantir a estabilidade do plano de controlo do cluster quando usar webhooks de admissão. |
O espaço de nomes está bloqueado no estado Terminating |
Resolva problemas com espaços de nomes bloqueados no estado Terminating identificando e removendo os componentes não íntegros que estão a bloquear a eliminação. |
| Operações simultâneas |
Resolva problemas de operações simultâneas aprendendo a identificar
estes erros e resolvê-los aguardando a conclusão das operações. |
Monitorização
| Tópico |
Descrição |
| Métricas do sistema |
Resolva problemas com métricas do sistema que não aparecem no Cloud Monitoring. |
| Painéis de controlo de monitorização |
Resolva problemas com painéis de controlo de monitorização, incluindo problemas com a ativação da
monitorização, recursos do Kubernetes em falta e autorizações. |
| Registo |
Resolva problemas de registo, incluindo problemas com a ativação do registo, registos em falta e quotas. |
Erros 4xx
Problemas conhecidos
| Tópico |
Descrição |
| Problemas conhecidos |
Identifique e resolva problemas conhecidos que possam
afetar a sua utilização do GKE. |
O que se segue?
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-10-20 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-20 UTC."],[],[]]