Es posible que parte de la información de esta página (o toda) no se aplique a Cloud de Confiance de S3NS. Consulta
Diferencias con Google Cloud para obtener más detalles.
Soluciona problemas de GKE
En esta página, se enumeran las páginas de solución de problemas para los problemas comunes que puedes encontrar cuando usas Google Kubernetes Engine (GKE). Esta página está dirigida a administradores y arquitectos, especialistas en seguridad, especialistas en redes o especialistas en almacenamiento que solucionan problemas de configuraciones de GKE. Para obtener más información sobre los roles de GKE, consulta Roles y tareas comunes de los usuarios de GKE.
Si no tienes experiencia en la solución de problemas en GKE o deseas obtener una descripción general de alto nivel de las herramientas y técnicas fundamentales, comienza con la Introducción a la solución de problemas.
Para diagnosticar y resolver los problemas que encuentres en las distintas etapas de trabajo con tu infraestructura de GKE, consulta las siguientes secciones:
En esta página, también se proporciona acceso a temas más generales sobre la solución de problemas:
Para solucionar problemas de redes de GKE, consulta Soluciona problemas de redes de GKE en la documentación de redes de GKE.
Introducción a la solución de problemas
Configuración del clúster
| Tema |
Descripción |
| Creación del clúster |
Resuelve problemas relacionados con la creación de clústeres. |
| Clústeres de Autopilot |
Diagnosticar y solucionar problemas de los clústeres de Autopilot de GKE, incluidos los problemas relacionados con la creación de clústeres, la eliminación de espacios de nombres, el escalamiento y las cargas de trabajo |
| Herramienta de línea de comandos de Kubectl |
Soluciona problemas de la herramienta de línea de comandos de kubectl en GKE, incluidos los problemas de autenticación y autorización.
En esta página, también se incluye asesoramiento para solucionar problemas del proxy de Konnectivity y verificar si está provocando que los comandos kubectl logs, attach, exec o port-forward dejen de responder. |
| Grupos de nodos estándar |
Soluciona problemas de grupos de nodos de GKE Standard, incluidos los problemas relacionados con la creación de grupos de nodos, el aprovisionamiento de mejor esfuerzo, los metadatos de instancias dañados y la migración de cargas de trabajo a grupos de nodos nuevos. |
| Registro de nodos |
Soluciona problemas que ocurren cuando agregas nodos a tu
clúster de GKE Standard, como errores de registro de nodos
y requisitos previos faltantes para el registro correcto de nodos. |
| Entorno de ejecución del contenedor |
Soluciona problemas de tiempos de ejecución de contenedores en GKE, incluidos los problemas con containerd y dockershim, y los registros privados. |
Ajuste de escala automático
| Tema |
Descripción |
| El escalador automático de clústeres no reduce la escala verticalmente |
Diagnostica y resuelve los motivos comunes por los que tu clúster no quita los nodos subutilizados. Obtén información para verificar si hay problemas, como PodDisruptionBudgets restrictivos, Pods con almacenamiento local o anotaciones específicas (por ejemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false") que impiden el desalojo de nodos. |
| El escalador automático de clústeres no aumenta la escala verticalmente |
Obtén información sobre por qué el escalador automático de clústeres no agrega nodos nuevos para satisfacer la demanda.
Comprueba si hay Pods que no se pueden programar, verifica que no hayas alcanzado los límites de tamaño del clúster o del grupo de nodos, y detecta posibles problemas de cuota de recursos o disponibilidad regional de VM. |
| Ajuste automático de escala horizontal de Pods |
Soluciona problemas relacionados con el Horizontal Pod Autoscaler que no escala las réplicas de Pod de tu aplicación. Resuelve problemas habituales, como objetos HorizontalPodAutoscaler mal configurados o problemas con la canalización de métricas. |
Almacenamiento
| Tema |
Descripción |
| Almacenamiento |
Soluciona problemas de almacenamiento, incluidos los relacionados con los discos persistentes regionales, el rendimiento del disco y la expansión del volumen. |
Seguridad del clúster
La autoridad de certificación raíz del clúster vencerá pronto
Cargas de trabajo
| Tema |
Descripción |
| Cargas de trabajo implementadas |
Soluciona problemas de errores de cargas de trabajo que se ejecutan en un clúster de GKE, incluidos PodUnschedulable.
Lee la sección PodUnschedulable para obtener sugerencias sobre errores como MatchNodeSelector y Does not have minimum availability.
|
| Extracciones de imágenes |
Soluciona problemas de extracción de imágenes. Obtén información sobre las causas de los estados como
ImagePullBackOff y ErrImagePull
y cómo resolverlos corrigiendo problemas comunes, como la
autenticación y la conectividad de red. |
| Eventos de CrashLoopBackOff |
Soluciona problemas relacionados con eventos de CrashLoopBackOff en GKE. Diagnostica problemas como el agotamiento de recursos, la configuración incorrecta de la app y las fallas de los sondeos de funcionamiento. |
| Eventos de OOM |
Soluciona problemas relacionados con eventos de memoria insuficiente (OOM) de Kubernetes. Identifica las causas, distingue los tipos de eventos y aplica soluciones eficaces para los cierres por OOM a nivel del contenedor y del nodo. |
| Cargas de trabajo de Arm |
Soluciona problemas con cargas de trabajo de Arm, incluidos los Pods en nodos Arm que fallan. |
| TPUs |
Soluciona problemas relacionados con las TPU, incluidos los problemas de cuota, el aprovisionamiento automático de nodos, la configuración de cargas de trabajo y la programación. |
| GPU |
Soluciona problemas relacionados con las GPUs, incluidos los problemas con la instalación de controladores de GPU, los errores de complementos de dispositivos y las imágenes de contenedores. |
Administración de clústeres
| Tema |
Descripción |
| Actualizaciones de clústeres |
Soluciona problemas y resuelve inconvenientes relacionados con las actualizaciones de clústeres y nodos de GKE, incluidas las actualizaciones largas o incompletas, las actualizaciones automáticas inesperadas, las fallas y los problemas posteriores a la actualización. |
| Webhooks |
Comprende cómo solucionar problemas y garantizar la estabilidad del plano de control de tu clúster cuando usas webhooks de admisión. |
Espacio de nombres atascado en el estado Terminating |
Soluciona problemas relacionados con espacios de nombres atrapados en el estado
Terminating. Para ello, identifica y quita los componentes
en mal estado que bloquean la eliminación. |
| Operaciones simultáneas |
Soluciona problemas de operaciones simultáneas. Para ello, aprende a identificar estos errores y a resolverlos esperando a que se completen las operaciones. |
Supervisión
| Tema |
Descripción |
| Métricas del sistema |
Soluciona problemas relacionados con las métricas del sistema que no aparecen en Cloud Monitoring. |
| Paneles de Monitoring |
Soluciona problemas de los paneles de supervisión, incluidos los problemas relacionados con la habilitación de la supervisión, la falta de recursos de Kubernetes y los permisos. |
| Logging |
Soluciona problemas de registro, incluidos los problemas para habilitar el registro, los registros faltantes y las cuotas. |
Errores 4xx
Problemas conocidos
| Tema |
Descripción |
| Problemas conocidos |
Identifica y resuelve los problemas conocidos que podrían afectar tu uso de GKE. |
¿Qué sigue?
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-10-20 (UTC)
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-10-20 (UTC)"],[],[]]