Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Diese Seite wurde von der Cloud Translation API übersetzt.

Probleme mit bereitgestellten Arbeitslasten beheben

Autopilot Standard

Auf dieser Seite wird beschrieben, wie Sie Fehler bei bereitgestellten Arbeitslasten in Google Kubernetes Engine (GKE) beheben.

Allgemeine Informationen zur Fehlerbehebung bei Anwendungen finden Sie in der Kubernetes-Dokumentation unter Fehlerbehebung bei Anwendungen.

Alle Fehler: Pod-Status prüfen

Bei Problemen mit den Pods einer Arbeitslast wird der Pod-Status von Kubernetes mit einer Fehlermeldung aktualisiert. Sie können diese Fehler einsehen, indem Sie den Status eines Pods in der Cloud de Confiance -Konsole oder mit dem kubectl-Befehlszeilentool prüfen.

Console

Führen Sie diese Schritte aus:

Rufen Sie in der Cloud de Confiance Console die Seite Arbeitslasten auf.

Zu Arbeitslasten
Wählen Sie die Arbeitslast aus, die Sie prüfen möchten. Auf dem Tab Übersicht wird der Status der Arbeitslast angezeigt.
Klicken Sie im Abschnitt Verwaltete Pods auf eine Fehlerstatusmeldung.

kubectl

Führen Sie den folgenden Befehl aus, um alle in Ihrem Cluster ausgeführten Pods anzusehen:

kubectl get pods

Die Ausgabe sieht in etwa so aus:

NAME       READY  STATUS             RESTARTS  AGE
POD_NAME   0/1    CrashLoopBackOff   23        8d

Mögliche Fehler werden in der Spalte Status aufgeführt.

Führen Sie den folgenden Befehl aus, um weitere Details zu einem bestimmten Pod abzurufen:

kubectl describe pod POD_NAME

Ersetzen Sie POD_NAME durch den Namen des Pods, den Sie sich prüfen möchten.

In der Ausgabe enthält das Feld Events weitere Informationen zu Fehlern.

Weitere Informationen finden Sie in den Containerlogs:

kubectl logs POD_NAME

Anhand dieser Logs können Sie feststellen, ob ein Befehl oder Code im Container den Absturz des Pods verursacht hat.

Nachdem Sie den Fehler identifiziert haben, können Sie versuchen, das Problem anhand der folgenden Abschnitte zu beheben.

Fehler: CrashLoopBackOff

Ein Status von CrashLoopBackOff bedeutet nicht, dass ein bestimmter Fehler vorliegt. Er gibt stattdessen an, dass ein Container nach dem Neustart wiederholt abstürzt.

Weitere Informationen finden Sie unter Fehlerbehebung bei CrashLoopBackOff-Ereignissen.

Fehler: ImagePullBackOff und ErrImagePull

Ein Status von ImagePullBackOff oder ErrImagePull gibt an, dass das von einem Container verwendete Image nicht aus der Image-Registry geladen werden kann.

Eine Anleitung zur Fehlerbehebung bei diesen Status finden Sie unter Fehlerbehebung beim Pullen von Images.

Fehler: `OutOfPods`

Der Status OutOfPods gibt an, dass auf einem Knoten kein Pod ausgeführt werden kann, weil die maximale Pod-Kapazität des Knotens erreicht ist.

Symptome:

Möglicherweise wird in den Ereignissen des Pods eine Meldung ähnlich der folgenden angezeigt:

Node didn't have enough resource: pods, requested: 1, used: 32, capacity: 32

Ursache:

Dieser Fehler tritt auf, wenn ein Pod auf einem Knoten geplant werden soll, der bereits ausgelastet ist. Diese Situation kann häufig beim Starten von Knoten auftreten, z. B. wenn der kube-scheduler Pods einem neuen Knoten zuweist, bevor der kubelet das Vorhandensein statischer Pods wie kube-proxy gemeldet hat, die eine eigene Pod-Kapazität benötigen.

Lösung:

Führen Sie einen der folgenden Schritte aus, um dieses Problem zu beheben:

Erhöhen Sie die maximale Anzahl von Pods pro Knoten. Wenn Ihre Knoten regelmäßig das Pod-Limit erreichen, erhöhen Sie die Einstellung --max-pods-per-node für Ihre Knotenpools. Wenn Sie die Anzahl der Pods erhöhen, sind möglicherweise größere Knoten erforderlich, um den erhöhten Ressourcenanforderungen gerecht zu werden.
Aktivieren Sie Cluster-Autoscaling und automatische Knotenbereitstellung. Wenn Ihnen häufig die Pod-Kapazität ausgeht, können Sie mit dem Cluster Autoscaler und der automatischen Knotenbereitstellung dafür sorgen, dass Ihr Cluster genügend Knoten hat, um die Anforderungen Ihrer Arbeitslasten zu erfüllen.
Autoscaling-Profil ändern Wenn Sie den Cluster Autoscaler bereits verwenden, können Sie versuchen, das Autoscaling-Profil von optimize-utilization in balanced zu ändern. Das Profil optimize-utilization kann die Wahrscheinlichkeit von OutOfPods-Fehlern erhöhen, da versucht wird, Pods auf den am stärksten genutzten Knoten zu platzieren.

Fehler: Pod nicht planbar

Der Status PodUnschedulable gibt an, dass Ihr Pod aufgrund unzureichender Ressourcen oder eines Konfigurationsfehlers nicht geplant werden kann.

Wenn Sie Messwerte der Steuerungsebene konfiguriert haben, finden Sie weitere Informationen zu diesen Fehlern unter Planermesswerte und API-Servermesswerte.

Interaktives Playbook für nicht planbare Pods verwenden

Sie können PodUnschedulable-Fehler mithilfe des interaktiven Playbooks in der Cloud de Confiance Console beheben:

Rufen Sie das Interaktive Playbook für nicht planbare Pods auf:

Zum Playbook
Wählen Sie in der Drop-down-Liste Cluster den Cluster aus, für den Sie die Fehlerbehebung durchführen möchten. Wenn Sie Ihren Cluster nicht finden, geben Sie den Namen des Clusters in das Feld Filter ein.
Wählen Sie in der Drop-down-Liste Namespace den Namespace aus, für den Sie die Fehlerbehebung durchführen möchten. Wenn Sie Ihren Namespace nicht finden, geben Sie ihn in das Feld Filter ein.
Um die Ursache zu ermitteln, arbeiten Sie die einzelnen Abschnitte im Playbook durch:
1. CPU und Arbeitsspeicher untersuchen
2. Maximale Anzahl von Pods pro Knoten untersuchen
3. Autoscaling-Verhalten untersuchen
4. Andere Fehlermodi untersuchen
5. Änderungsereignisse korrelieren
Optional: Wenn Sie Benachrichtigungen zu zukünftigen PodUnschedulable-Fehlern erhalten möchten, wählen Sie im Abschnitt Future Mitigation Tips (Tipps zur zukünftigen Fehlerbehebung) die Option Create an Alert (Benachrichtigung erstellen) aus .

Fehler: Unzureichende Ressourcen

Möglicherweise stoßen Sie auf einen Fehler, der auf zu wenig CPU-Kapazität, Arbeitsspeicher oder andere Ressourcen hinweist. Beispiel: No nodes are available that match all of the predicates: Insufficient cpu (2). Dies weist darauf hin, dass auf zwei Knoten nicht genügend CPU-Kapazität verfügbar ist, um die Anfragen eines Pods zu erfüllen.

Wenn die Ressourcenanforderungen Ihres Pods die eines einzelnen Knotens aus einem der infrage kommenden Knotenpools überschreiten, plant GKE den Pod nicht und löst auch keine Aufskalierung aus, um einen neuen Knoten hinzuzufügen. Damit GKE den Pod planen kann, müssen Sie entweder weniger Ressourcen für den Pod anfordern oder einen neuen Knotenpool mit ausreichenden Ressourcen erstellen.

Sie können auch die automatische Knotenbereitstellung aktivieren, damit GKE automatisch Knotenpools mit Knoten erstellen kann, auf denen die nicht geplanten Pods ausgeführt werden können.

Die Standard-CPU-Anfrage beträgt 100 MB oder 10 % einer CPU bzw. eines Kerns. Wenn Sie mehr oder weniger Ressourcen anfordern möchten, geben Sie den Wert in der Pod-Spezifikation unter spec: containers: resources: requests an.

Fehler: MatchNodeSelector

Der Fehler MatchNodeSelector gibt an, dass keine Knoten vorhanden sind, die mit der Labelauswahl des Pods übereinstimmen.

Sehen Sie sich in der Pod-Spezifikation unter spec: nodeSelector die im Feld nodeSelector angegebenen Labels an, um das zu prüfen.

Führen Sie den folgenden Befehl aus, um sich die Labels von Knoten in Ihrem Cluster anzusehen:

kubectl get nodes --show-labels

Führen Sie den folgenden Befehl aus, um einem Knoten ein Label hinzuzufügen:

kubectl label nodes NODE_NAME LABEL_KEY=LABEL_VALUE

Ersetzen Sie Folgendes:

NODE_NAME: Der Knoten, dem Sie ein Label hinzufügen möchten.
LABEL_KEY: der Schlüssel des Labels
LABEL_VALUE: der Wert des Labels

Weitere Informationen finden Sie in der Kubernetes-Dokumentation unter Pods zu Knoten zuweisen.

Fehler: PodToleratesNodeTaints

Der Fehler PodToleratesNodeTaints gibt an, dass der Pod für keinen Knoten geplant werden kann, da der Pod keine Toleranzen hat, die den vorhandenen Knotenmarkierungen entsprechen.

Führen Sie den folgenden Befehl aus, um dies zu ermitteln:

kubectl describe nodes NODE_NAME

Prüfen Sie in der Ausgabe das Feld Taints. Darin sind Schlüssel/Wert-Paare und Planungseffekte aufgeführt.

Lautet der aufgeführte Effekt NoSchedule, können Pods auf diesem Knoten nur geplant werden, wenn sie eine übereinstimmende Toleranz haben.

Eine Möglichkeit zur Behebung dieses Problems ist, die Markierung zu entfernen. Führen Sie beispielsweise den folgenden Befehl aus, um eine NoSchedule-Markierung zu entfernen:

kubectl taint nodes NODE_NAME key:NoSchedule-

Fehler: PodFitsHostPorts

Der Fehler PodFitsHostPorts bedeutet, dass ein Knoten versucht, einen Port zu verwenden, der bereits belegt ist.

Um das Problem zu beheben, sollten Sie die Kubernetes-Best Practices beachten und einen NodePort anstelle eines hostPort verwenden.

Wenn Sie eine hostPort verwenden müssen, prüfen Sie die Manifeste der Pods und achten Sie darauf, dass für alle Pods auf demselben Knoten eindeutige Werte für hostPort definiert sind.

Fehler: Keine Mindestverfügbarkeit vorhanden

Wenn für einen Knoten genügend Ressourcen vorhanden sind, die Meldung Does not have minimum availability jedoch immer noch angezeigt wird, prüfen Sie den Status des Pods. Wenn er SchedulingDisabled oder Cordoned lautet, kann der Knoten keine neuen Pods planen. Sie können den Status eines Knotens in der Cloud de Confiance Console oder mit dem kubectl-Befehlszeilentool prüfen.

Console

Führen Sie diese Schritte aus:

Öffnen Sie in der Cloud de Confiance Console die Seite Google Kubernetes Engine.

Zur Seite "Google Kubernetes Engine"
Wählen Sie den gewünschten zu prüfenden Cluster aus. Auf dem Tab Knoten werden die Knoten und ihr Status angezeigt.

Führen Sie die folgenden Schritte aus, um die Planung auf dem Knoten zu aktivieren:

Klicken Sie in der Liste auf den Knoten, den Sie untersuchen möchten.
Klicken Sie im Bereich Knotendetails auf Entsperren.

kubectl

Führen Sie den folgenden Befehl aus, um die Status der Knoten abzurufen:

kubectl get nodes

Die Planung auf dem Knoten aktivieren Sie mit folgendem Befehl:

kubectl uncordon NODE_NAME

Fehler: Das Limit für die maximale Anzahl von Pods pro Knoten wurde erreicht

Wenn das Limit für Maximale Anzahl von Pods pro Knoten für alle Knoten im Cluster erreicht ist, bleiben die Pods im Status „Nicht planbar“ hängen. Auf dem Tab Ereignisse des Pods wird eine Nachricht mit dem Ausdruck Too many pods angezeigt.

Führen Sie folgende Schritte aus, um diesen Fehler zu beheben:

Prüfen Sie die Maximum pods per node-Konfiguration auf dem Tab „Knoten“ in den GKE-Clusterdetails in der Cloud de Confiance -Konsole.
Rufen Sie eine Liste der Knoten ab:
```
kubectl get nodes
```
Prüfen Sie für jeden Knoten die Anzahl der Pods, die auf dem Knoten ausgeführt werden:
```
kubectl get pods -o wide | grep NODE_NAME | wc -l
```
Wenn das Limit erreicht ist, fügen Sie einen neuen Knotenpool oder zusätzliche Knoten zum vorhandenen Knotenpool hinzu.

Problem: Maximale Knotenpoolgröße mit aktiviertem Cluster Autoscaler erreicht

Wenn der Knotenpool seine Maximalgröße gemäß der Cluster-Autoscaling-Konfiguration erreicht hat, löst GKE keine vertikale Skalierung für den Pod aus, der andernfalls mit diesem Knotenpool geplant wäre. Wenn Sie möchten, dass der Pod mit diesem Knotenpool geplant wird, ändern Sie die Cluster-Autoscaling-Konfiguration.

Problem: Maximale Knotenpoolgröße erreicht, Cluster Autoscaler deaktiviert

Wenn der Knotenpool die maximale Anzahl von Knoten erreicht hat und Cluster Autoscaler deaktiviert ist, kann GKE den Pod nicht mit dem Knotenpool planen. Erhöhen Sie die Größe Ihres Knotenpools oder aktivieren Sie Cluster Autoscaler für GKE, damit die Größe Ihres Clusters automatisch angepasst wird.

Fehler: Ungebundene PersistentVolumeClaims

Der Fehler Unbound PersistentVolumeClaims gibt an, dass der Pod auf einen nicht gebundenen PersistentVolumeClaim verweist. Dieser Fehler kann auftreten, wenn das PersistentVolume nicht bereitgestellt werden konnte. Sie können prüfen, ob die Bereitstellung fehlgeschlagen ist. Dazu rufen Sie die Ereignisse für den PersistentVolumeClaim ab und untersuchen sie auf Fehler.

Führen Sie den folgenden Befehl aus, um Ereignisse abzurufen:

kubectl describe pvc STATEFULSET_NAME-PVC_NAME-0

Dabei gilt:

STATEFULSET_NAME: Name des StatefulSet-Objekts.
PVC_NAME: Name des PersistentVolumeClaim-Objekts.

Dies kann auch passieren, wenn während der manuellen Vorabbereitstellung eines PersistentVolume und der Bindung an einen PersistentVolumeClaim ein Konfigurationsfehler aufgetreten ist.

Um diesen Fehler zu beheben, versuchen Sie, das Volume noch einmal vorab bereitzustellen.

Fehler: Unzureichendes Kontingent

Prüfen Sie, ob Ihr Projekt ein ausreichendes Compute Engine-Kontingent für GKE hat, um Ihren Cluster zu skalieren. Wenn GKE versucht, Ihrem Cluster einen Knoten hinzuzufügen, um den Pod zu planen, und das Hochskalieren das verfügbare Kontingent Ihres Projekts überschreiten würde, erhalten Sie die Fehlermeldung scale.up.error.quota.exceeded.

Weitere Informationen finden Sie unter ScaleUp-Fehler.

Problem: Eingestellte APIs

Achten Sie darauf, dass Sie keine verworfenen APIs verwenden, die mit der Nebenversion Ihres Clusters entfernt werden. Weitere Informationen finden Sie unter Einstellung von Funktionen und APIs.

Fehler: Es waren keine freien Ports für die angeforderten Pod-Ports verfügbar.

Wenn Sie einen Fehler wie den folgenden sehen, haben Sie wahrscheinlich mehrere Pods auf demselben Knoten, für die im Feld hostPort derselbe Wert definiert ist:

0/1 nodes are available: 1 node(s) didn't have free ports for the requested pod ports. preemption: 0/1 nodes are available: 1 No preemption victims found for incoming pod.

Durch das Binden eines Pods an ein hostPort wird eingeschränkt, wo GKE den Pod planen kann, da jede Kombination aus hostIP, hostPort und protocol eindeutig sein muss.

Um das Problem zu beheben, sollten Sie die Kubernetes-Best Practices beachten und einen NodePort anstelle eines hostPort verwenden.

Wenn Sie eine hostPort verwenden müssen, prüfen Sie die Manifeste der Pods und achten Sie darauf, dass für alle Pods auf demselben Knoten eindeutige Werte für hostPort definiert sind.

Nächste Schritte

Wenn Sie in der Dokumentation keine Lösung für Ihr Problem finden, lesen Sie den Abschnitt Support erhalten. Dort finden Sie weitere Hilfe, z. B. zu den folgenden Themen:
- Sie können eine Supportanfrage erstellen, indem Sie sich an den Cloud Customer Care wenden.
- Support von der Community erhalten, indem Sie Fragen auf Stack Overflow stellen und mit dem Tag google-kubernetes-engine nach ähnlichen Problemen suchen. Sie können auch dem #kubernetes-engine-Slack-Kanal beitreten, um weiteren Community-Support zu erhalten.
- Sie können Fehler melden oder Funktionsanfragen stellen, indem Sie die öffentliche Problemverfolgung verwenden.

Probleme mit bereitgestellten Arbeitslasten beheben

Alle Fehler: Pod-Status prüfen

Console

kubectl

Fehler: CrashLoopBackOff

Fehler: ImagePullBackOff und ErrImagePull

Fehler: OutOfPods

Fehler: Pod nicht planbar

Interaktives Playbook für nicht planbare Pods verwenden

Fehler: Unzureichende Ressourcen

Fehler: MatchNodeSelector

Fehler: PodToleratesNodeTaints

Fehler: PodFitsHostPorts

Fehler: Keine Mindestverfügbarkeit vorhanden

Console

kubectl

Fehler: Das Limit für die maximale Anzahl von Pods pro Knoten wurde erreicht

Problem: Maximale Knotenpoolgröße mit aktiviertem Cluster Autoscaler erreicht

Problem: Maximale Knotenpoolgröße erreicht, Cluster Autoscaler deaktiviert

Fehler: Ungebundene PersistentVolumeClaims

Fehler: Unzureichendes Kontingent

Problem: Eingestellte APIs

Fehler: Es waren keine freien Ports für die angeforderten Pod-Ports verfügbar.

Nächste Schritte

Fehler: `OutOfPods`