Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Diese Seite wurde von der Cloud Translation API übersetzt.

Fehlerbehebung, wenn Cluster Autoscaler nicht hochskaliert

Autopilot Standard

Wenn Ihre Pods in Google Kubernetes Engine (GKE) im Status Pending hängen bleiben und keine neuen Knoten hinzugefügt werden, deutet dies häufig auf ein Problem mit der Hochskalierungsfunktion des Cluster-Autoscalers hin. Dieses Problem kann verhindern, dass Ihre Anwendungen entsprechend der Nachfrage skaliert werden, Bereitstellungen verzögern und die Dienstverfügbarkeit beeinträchtigen.

Auf dieser Seite finden Sie Informationen zur Diagnose und Behebung häufiger Probleme, die verhindern, dass Cluster Autoscaler neue Knoten hinzufügt. Wenn Sie diese Probleme beheben, kann der Kubernetes-Scheduler Ihre Arbeitslasten rechtzeitig platzieren und Ihr Cluster kann sich an eine steigende Last anpassen.

Diese Informationen sind wichtig für Anwendungsentwickler, die sicherstellen müssen, dass ihre Anwendungen und Dienste zuverlässig geplant und ausgeführt werden, sowie für Plattformadministratoren und ‑betreiber, die dafür verantwortlich sind, dass der Cluster dynamisch Ressourcen bereitstellen kann, um die Anforderungen der Arbeitslast zu erfüllen und das Serviceniveau aufrechtzuerhalten. Weitere Informationen zu den gängigen Rollen und Beispielaufgaben, auf die wir in Cloud de Confiance by S3NS -Inhalten verweisen, finden Sie unter Häufig verwendete GKE-Nutzerrollen und -Aufgaben.

Informationen dazu, wann Cluster Autoscaler Ihre Knoten hochskaliert

Bevor Sie mit der Fehlerbehebung fortfahren, kann es hilfreich sein, zu verstehen, wann Cluster Autoscaler versucht, Ihre Knoten hochzuskalieren. Das Cluster-Autoscaling fügt Knoten nur hinzu, wenn die vorhandenen Ressourcen nicht ausreichen.

Cluster Autoscaler prüft alle 10 Sekunden, ob es nicht planbare Pods gibt. Ein Pod ist nicht mehr planbar, wenn der Kubernetes-Planer ihn aufgrund unzureichender Ressourcen, Knoteneinschränkungen oder nicht erfüllter Pod-Anforderungen nicht auf einem vorhandenen Knoten platzieren kann.

Wenn Cluster Autoscaler nicht planbare Pods findet, wird geprüft, ob das Hinzufügen eines Knotens die Planung des Pods ermöglichen würde. Wenn durch das Hinzufügen eines Knotens ein Pod geplant werden kann, fügt der Cluster Autoscaler der verwalteten Instanzgruppe (MIG) einen neuen Knoten hinzu. Der Kubernetes-Planer kann den Pod dann auf dem neu bereitgestellten Knoten planen.

Prüfen, ob Sie nicht planbare Pods haben

Prüfen Sie, ob nicht geplante Pods vorhanden sind, um festzustellen, ob Ihr Cluster skaliert werden muss:

Rufen Sie in der Cloud de Confiance Console die Seite Arbeitslasten auf.

Zu Arbeitslasten
Geben Sie im Feld Filter unschedulable ein und drücken Sie die Eingabetaste.

Wenn Pods aufgeführt sind, haben Sie nicht planbare Pods. Informationen zur Fehlerbehebung bei nicht planbaren Pods finden Sie unter Fehler: Pod nicht planbar. Wenn Sie die zugrunde liegende Ursache für nicht planbare Pods beheben, kann Cluster Autoscaler oft hochskalieren. In den folgenden Abschnitten finden Sie Informationen zum Beheben von Fehlern, die spezifisch für Cluster Autoscaler sind.

Wenn keine Pods aufgeführt sind, muss Cluster Autoscaler nicht hochskalieren und funktioniert wie erwartet.

Prüfen, ob Sie zuvor nicht planbare Pods hatten

Wenn Sie untersuchen, warum Cluster Autoscaler in der Vergangenheit fehlgeschlagen ist, suchen Sie nach zuvor nicht planbaren Pods:

Rufen Sie in der Cloud de Confiance Console die Seite Log-Explorer auf:

Zum Log-Explorer
Geben Sie einen Zeitraum für die Logeinträge an, die Sie ansehen möchten.

Geben Sie im Bereich „Abfrage“ die folgende Abfrage ein:

logName="projects/PROJECT_ID/logs/events"
jsonPayload.source.component="default-scheduler"
jsonPayload.reason="FailedScheduling"

Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID.

Klicken Sie auf Abfrage ausführen.

Wenn Ergebnisse aufgeführt sind, gab es im angegebenen Zeitraum nicht planbare Pods.

Prüfen, ob das Problem durch eine Einschränkung verursacht wird

Nachdem Sie bestätigt haben, dass Sie nicht geplante Pods haben, prüfen Sie, ob Ihr Problem mit dem Cluster-Autoscaler durch eine der Einschränkungen für das Cluster-Autoscaling verursacht wird.

Fehler ansehen

Die Ursache von Problemen beim Hochskalieren lässt sich oft anhand von Fehlermeldungen ermitteln:

Wenn Sie bereits eine Fehlermeldung erhalten haben, finden Sie in der Tabelle mit Fehlermeldungen Tipps zum Beheben des Fehlers.
Wenn Sie noch keine Nachricht erhalten haben, haben Sie folgende Möglichkeiten:
- Probleme, die weniger als 72 Stunden alt sind: Fehlermeldungen in der Cloud de Confiance Console ansehen.
- Probleme, die älter als 72 Stunden sind: Fehler in Ereignissen in Cloud Logging ansehen.

Fehler in Benachrichtigungen ansehen

Wenn das Problem, das Sie beobachtet haben, vor weniger als 72 Stunden aufgetreten ist, sehen Sie sich die Benachrichtigungen zu Fehlern in der Cloud de Confiance -Konsole an. Diese Benachrichtigungen enthalten wertvolle Informationen dazu, warum der Cluster Autoscaler nicht hochskaliert wurde. Außerdem bieten sie Ratschläge, wie Sie den Fehler beheben und relevante Logs für weitere Untersuchungen aufrufen können.

So rufen Sie die Benachrichtigungen in der Cloud de Confiance -Console auf:

Rufen Sie in der Cloud de Confiance Console die Seite Kubernetes-Cluster auf.

Zur Seite "Kubernetes-Cluster"
Sehen Sie sich die Spalte Benachrichtigungen an. Die folgenden Benachrichtigungen sind mit Problemen beim Hochskalieren verknüpft:
- Can't scale up
- Can't scale up pods
- Can't scale up a node pool
Klicken Sie auf die entsprechende Benachrichtigung, um einen Bereich mit Details zur Ursache des Problems und Empfehlungen zur Behebung aufzurufen.
Optional: Klicken Sie auf Logs, um die Protokolle für dieses Ereignis aufzurufen. Sie werden zum Log-Explorer weitergeleitet, wo eine Abfrage vorab ausgefüllt ist, mit der Sie das Skalierungsereignis weiter untersuchen können. Weitere Informationen zur Funktionsweise von Hochskalierungsereignissen finden Sie unter Cluster Autoscaler-Ereignisse ansehen.

Wenn nach dem Lesen der Hinweise in der Benachrichtigung weiterhin Probleme auftreten, sehen Sie in den Tabellen mit Fehlermeldungen nach.

Fehler in Ereignissen ansehen

Wenn das Problem, das Sie beobachtet haben, vor mehr als 72 Stunden aufgetreten ist, sehen Sie sich die Ereignisse in Cloud Logging an. Wenn ein Fehler aufgetreten ist, wird er oft in einem Ereignis aufgezeichnet.

So rufen Sie Cluster-Autoscaling-Logs in der Cloud de Confiance -Console auf:

Rufen Sie in der Cloud de Confiance Console die Seite Kubernetes-Cluster auf.

Zur Seite "Kubernetes-Cluster"
Wählen Sie den Namen des Clusters aus, den Sie untersuchen möchten, um die Seite Clusterdetails aufzurufen.
Klicken Sie auf der Seite Clusterdetails auf den Tab Logs.
Klicken Sie auf dem Tab Logs auf den Tab Autoscaling-Logs, um die Logs aufzurufen.
Optional: Wenn Sie erweiterte Filter anwenden möchten, um die Ergebnisse einzugrenzen, klicken Sie auf die Schaltfläche mit dem Pfeil rechts auf der Seite, um die Logs im Log-Explorer aufzurufen.

Weitere Informationen zu Ereignissen zum Hochskalieren finden Sie unter Cluster-Autoscaling-Ereignisse ansehen. Ein Beispiel für die Verwendung von Cloud Logging finden Sie im folgenden Beispiel für die Fehlerbehebung.

Beispiel: Ein Problem beheben, das älter als 72 Stunden ist

Das folgende Beispiel zeigt, wie Sie ein Problem mit einem Cluster untersuchen und beheben können, der nicht skaliert wird.

Szenario: Ein Pod ist seit einer Stunde als nicht planbar markiert. Cluster Autoscaler hat keine neuen Knoten für die Planung des Pods bereitgestellt.

Lösung:

Da das Problem vor mehr als 72 Stunden aufgetreten ist, untersuchen Sie es mit Cloud Logging anstatt sich die Benachrichtigungen anzusehen.
In Cloud Logging finden Sie die Logging-Details für Cluster Autoscaler-Ereignisse, wie unter Fehler in Ereignissen ansehen beschrieben.
Suchen Sie nach scaleUp-Ereignissen, die den Pod, den Sie untersuchen, im Feld triggeringPods enthalten. Sie können die Logeinträge filtern, auch nach einem bestimmten JSON-Feldwert. Weitere Informationen zu erweiterten Logabfragen
Sie finden keine Skalierungsereignisse. Wenn Sie das getan haben, können Sie versuchen, ein EventResult zu finden, das dieselbe eventId wie das scaleUp-Ereignis enthält. Sehen Sie sich dann das Feld errorMsg an und konsultieren Sie die Liste der potenziellen scaleUp-Fehlermeldungen.
Da Sie keine scaleUp-Ereignisse gefunden haben, suchen Sie weiter nach noScaleUp-Ereignissen und prüfen Sie die folgenden Felder:
- unhandledPodGroups: enthält Informationen zum Pod (oder zum Controller des Pods).
- reason: gibt globale Gründe an, warum das Hochskalieren möglicherweise blockiert wird.
- skippedMigs: gibt Gründe an, warum einige MIGs möglicherweise übersprungen werden.
Sie finden ein noScaleUp-Ereignis für Ihren Pod und alle MIGs im Feld rejectedMigs haben dieselbe Grundmeldungs-ID "no.scale.up.mig.failing.predicate" mit den zwei Parametern "NodeAffinity" und "node(s) did not match node selector".

Lösung:

Nach Durchsicht der Liste der Fehlermeldungen stellen Sie fest, dass Cluster Autoscaler einen Knotenpool aufgrund eines fehlgeschlagenen Planungsprädikats für die ausstehenden Pods nicht hochskalieren kann. Die Parameter geben den Namen des fehlgeschlagenen Prädikats und den jeweiligen Grund an.

Zum Beheben des Problems prüfen Sie das Manifest des Pods und stellen fest, dass es einen Knotenselektor enthält, der keiner MIG im Cluster entspricht. Sie löschen den Selektor aus dem Manifest des Pods und erstellen den Pod neu. Cluster Autoscaler fügt einen neuen Knoten hinzu und der Pod wird geplant.

Fehler bei der Skalierung beheben

Nachdem Sie den Fehler identifiziert haben, können Sie anhand der folgenden Tabellen die Ursache des Fehlers und die Vorgehensweise zur Behebung ermitteln.

ScaleUp-Fehler

Ereignisfehlermeldungen für scaleUp-Ereignisse finden Sie im entsprechenden eventResult-Ereignis im Feld resultInfo.results[].errorMsg.

Wenn ein Hochskalierungsvorgang fehlschlägt, weil ein Kontingent überschritten wird, handelt es sich um einen Fehler beim Erstellen von Knoten, der einen System-Backoff-Zeitraum auslöst, der bis zu 30 Minuten dauern kann. Weitere Informationen finden Sie unter Backoff-Zeiträume.

Nachricht	Details	Parameter	Risikominderung
`"scale.up.error.out.of.resources"`	Ressourcenfehler treten auf, wenn Sie versuchen, neue Ressourcen in einer Zone anzufordern, die aufgrund der aktuellen Nichtverfügbarkeit einer Compute Engine-Ressource (z. B. GPUs oder CPUs) Ihre Anfrage nicht bearbeiten kann.	IDs der fehlgeschlagenen MIGs.	Folgen Sie der Fehlerbehebung für die Ressourcenverfügbarkeit in der Compute Engine-Dokumentation.
`"scale.up.error.quota.exceeded"`	Das scaleUp-Ereignis ist fehlgeschlagen, da einige MIGs aufgrund eines überschrittenen Compute Engine-Kontingents nicht erhöht werden konnten.	IDs der fehlgeschlagenen MIGs.	Auf dem Tab Fehler der MIG in der Cloud de Confiance Console können Sie sehen, welches Kontingent überschritten wird. Wenn Sie wissen, welches Kontingent überschritten wird, folgen Sie der Anleitung, um eine Kontingenterhöhung anzufordern.
`"scale.up.error.waiting.for.instances.timeout"`	Das Hochskalieren der verwalteten Instanzgruppe ist aufgrund einer Zeitüberschreitung fehlgeschlagen.	IDs der fehlgeschlagenen MIGs.	Diese Meldung sollte nur temporär sein.
`"scale.up.error.ip.space.exhausted"`	Hochskalieren nicht möglich, da Instanzen in einigen der verwalteten Instanzgruppen keine IP-Adressen mehr zur Verfügung hatten. Das bedeutet, dass der Cluster nicht genügend nicht zugewiesenen IP-Adressbereich hat, um neue Knoten oder Pods hinzuzufügen.	IDs der fehlgeschlagenen MIGs.	Folgen Sie der Anleitung unter Zu wenig freier IP-Adressbereich für Pods.
`"scale.up.error.service.account.deleted"`	Hochskalieren nicht möglich, da das Dienstkonto gelöscht wurde.	IDs der fehlgeschlagenen MIGs.	Versuchen Sie, das Dienstkonto wiederherzustellen.

Gründe für ein noScaleUp-Ereignis

Ein noScaleUp-Ereignis wird regelmäßig ausgegeben, wenn der Cluster nicht planbare Pods enthält und von Cluster Autoscaler nicht hochskaliert werden kann, um die Pods zu planen. noScaleUp-Ereignisse sind Best-Effort-Ereignisse und decken nicht alle potenziellen Fälle ab.

Gründe auf oberster Ebene für "NoScaleUp"

Meldungen mit Gründen auf oberster Ebene für noScaleUp-Ereignisse werden im Feld noDecisionStatus.noScaleUp.reason angezeigt. Die Meldung enthält einen Grund auf oberster Ebene, warum Cluster Autoscaler den Cluster nicht hochskalieren kann.

Meldung	Details	Risikominderung
`"no.scale.up.in.backoff"`	Hochskalieren nicht möglich, da der Vorgang in einen Backoff-Zeitraum fällt (vorübergehend blockiert ist). Diese Meldung kann während einer vertikalen Skalierung mit einer großen Anzahl von Pods auftreten.	Diese Meldung sollte nur temporär sein. Prüfen Sie diesen Fehler nach einigen Minuten noch einmal.

Gründe auf oberster Ebene für "noScaleUp" in Bezug auf die automatische Knotenbereitstellung

Meldungen mit Gründen auf oberster Ebene für noScaleUp-Ereignisse in Bezug auf die automatische Knotenbereitstellung werden im Feld noDecisionStatus.noScaleUp.napFailureReason angezeigt. Die Meldung enthält einen Grund auf oberster Ebene, warum Cluster Autoscaler keine neuen Knotenpools bereitstellen kann.

Meldung Details Risikominderung

Meldung	Details	Risikominderung
`"no.scale.up.nap.disabled"`	Die automatische Knotenbereitstellung konnte nicht hochskaliert werden, da sie auf Clusterebene nicht aktiviert ist. Wenn die automatische Knotenbereitstellung deaktiviert ist, werden neue Knoten nicht automatisch bereitgestellt, wenn der ausstehende Pod Anforderungen hat, die von vorhandenen Knotenpools nicht erfüllt werden können.	Prüfen Sie die Clusterkonfiguration und lesen Sie den Abschnitt Automatische Knotenbereitstellung aktivieren.

"no.scale.up.nap.disabled"

Die automatische Knotenbereitstellung konnte nicht hochskaliert werden, da sie auf Clusterebene nicht aktiviert ist.

Wenn die automatische Knotenbereitstellung deaktiviert ist, werden neue Knoten nicht automatisch bereitgestellt, wenn der ausstehende Pod Anforderungen hat, die von vorhandenen Knotenpools nicht erfüllt werden können.

Prüfen Sie die Clusterkonfiguration und lesen Sie den Abschnitt Automatische Knotenbereitstellung aktivieren.

Gründe auf MIG-Ebene für "noScaleUp"

Meldungen mit Gründen auf MIG-Ebene für noScaleUp-Ereignisse werden in den Feldern noDecisionStatus.noScaleUp.skippedMigs[].reason und noDecisionStatus.noScaleUp.unhandledPodGroups[].rejectedMigs[].reason angezeigt. Die Meldung enthält einen Grund, warum Cluster Autoscaler die Größe einer bestimmten MIG nicht erhöhen kann.

Meldung	Details	Parameter	Risikominderung
`"no.scale.up.mig.skipped"`	Eine MIG kann nicht hochskaliert werden, da sie während der Simulation übersprungen wurde.	Gründe, warum die MIG übersprungen wurde (z. B. fehlende Pod-Anforderung).	Prüfen Sie die in der Fehlermeldung enthaltenen Parameter und geben Sie an, warum die MIG übersprungen wurde.
`"no.scale.up.mig.failing.predicate"`	Hochskalieren eines Knotenpools aufgrund eines fehlgeschlagenen Planungsprädikats für die ausstehenden Pods nicht möglich.	Name des fehlgeschlagenen Prädikats und Gründe für den Fehler.	Überprüfen Sie sowohl Pod-Anforderungen wie Affinitätsregeln, Markierungen oder Toleranzen als auch Ressourcenanforderungen.

Gründe auf Pod-Gruppenebene für "noScaleUp" in Bezug auf die automatische Knotenbereitstellung

Meldungen mit Gründen auf Pod-Gruppenebene für noScaleUp-Ereignisse in Bezug auf die automatische Knotenbereitstellung werden im Feld noDecisionStatus.noScaleUp.unhandledPodGroups[].napFailureReasons[] angezeigt. Die Meldung enthält einen Grund, warum Cluster Autoscaler keinen neuen Knotenpool zur Planung einer bestimmten Pod-Gruppe bereitstellen kann.

Meldung	Details	Parameter	Risikominderung
`"no.scale.up.nap.pod.gpu.no.limit.defined"`	Die automatische Knotenbereitstellung konnte keine Knotengruppe bereitstellen, da ein ausstehender Pod eine GPU-Anfrage hat, die GPU-Ressourcenlimits jedoch nicht auf Clusterebene definiert sind.	Angeforderter GPU-Typ.	Prüfen Sie die GPU-Anfrage des ausstehenden Pods und aktualisieren Sie die Konfiguration des Knotens für die automatische Bereitstellung von GPU-Limits auf Clusterebene.
`"no.scale.up.nap.pod.gpu.type.not.supported"`	Die automatische Knotenbereitstellung hat keine Knotengruppe für den Pod bereitgestellt, da sie Anfragen für einen unbekannten GPU-Typ enthält.	Angeforderter GPU-Typ.	Prüfen Sie, ob die Konfiguration des ausstehenden Pods des GPU-Typs mit einem unterstützten GPU-Typ übereinstimmt.
`"no.scale.up.nap.pod.zonal.resources.exceeded"`	Die automatische Knotenbereitstellung hat keine Knotengruppe für den Pod in dieser Zone bereitgestellt, da dies entweder gegen die maximalen Ressourcenlimits von Clustern verstoßen oder die verfügbaren Ressourcen in der Zone überschreiten würde. Oder es gibt keinen Maschinentyp, der in die Anfrage passen könnte.	Name der betreffenden Zone.	Prüfen und aktualisieren Sie clusterweite maximale Ressourcenlimits, die Pod-Ressourcenanfragen oder die verfügbaren Zonen für die automatische Knotenbereitstellung.
`"no.scale.up.nap.pod.zonal.failing.predicates"`	Die automatische Knotenbereitstellung hat aufgrund fehlgeschlagener Prädikate keine Knotengruppe für den Pod in dieser Zone bereitgestellt.	Name der betreffenden Zone und Gründe, warum Prädikate fehlgeschlagen sind.	Prüfen Sie die Anforderungen des ausstehenden Pods, z. B. Affinitätsregeln, Markierungen, Toleranzen oder Ressourcenanforderungen.

Weitere Untersuchungen durchführen

In den folgenden Abschnitten finden Sie Informationen dazu, wie Sie den Log-Explorer und gcpdiag verwenden können, um zusätzliche Informationen zu Ihren Fehlern zu erhalten.

Fehler im Log-Explorer untersuchen

Wenn Sie Ihre Fehlermeldung genauer untersuchen möchten, können Sie sich die Logs ansehen, die sich auf Ihren Fehler beziehen:

Rufen Sie in der Cloud de Confiance Console die Seite Log-Explorer auf:

Zum Log-Explorer
Geben Sie im Bereich „Abfrage“ die folgende Abfrage ein:
```
resource.type="k8s_cluster"
log_id("container.googleapis.com/cluster-autoscaler-visibility")
jsonPayload.resultInfo.results.errorMsg.messageId="ERROR_MESSAGE"
```
Ersetzen Sie ERROR_MESSAGE durch die Nachricht, die Sie untersuchen möchten. Beispiel: scale.up.error.out.of.resources.
Klicken Sie auf Abfrage ausführen.

Einige Fehler mit gcpdiag beheben

gcpdiag ist ein Open-Source-Tool, das mit Unterstützung von technischen Experten von Cloud de Confiance by S3NSentwickelt wurde. Es ist kein offiziell unterstütztes Cloud de Confiance by S3NS -Produkt.

Wenn eine der folgenden Fehlermeldungen angezeigt wird, können Sie gcpdiag verwenden, um das Problem zu beheben:

scale.up.error.out.of.resources
scale.up.error.quota.exceeded
scale.up.error.waiting.for.instances.timeout
scale.up.error.ip.space.exhausted
scale.up.error.service.account.deleted

Eine Liste und Beschreibung aller gcpdiag-Tool-Flags finden Sie in der gcpdiag-Nutzungsanleitung.

Komplexe Fehler bei der Skalierung beheben

In den folgenden Abschnitten finden Sie Anleitungen zum Beheben von Fehlern, bei denen die Maßnahmen mehrere Schritte umfassen, und von Fehlern, denen keine Cluster-Autoscaler-Ereignismeldung zugeordnet ist.

Problem: Pod passt nicht auf den Knoten

Das Cluster-Autoscaling plant einen Pod nur auf einem Knoten ein, wenn ein Knoten mit ausreichenden Ressourcen wie GPUs, Arbeitsspeicher und Speicherplatz vorhanden ist, um die Anforderungen des Pods zu erfüllen. Um festzustellen, ob dies der Grund dafür ist, dass Cluster Autoscaler nicht hochskaliert wurde, vergleichen Sie Ressourcenanfragen mit den bereitgestellten Ressourcen.

Im folgenden Beispiel wird gezeigt, wie Sie CPU-Ressourcen prüfen. Dieselben Schritte gelten aber auch für GPU-, Arbeitsspeicher- und Speicherressourcen. So vergleichen Sie CPU-Anfragen mit bereitgestellten CPUs:

Rufen Sie in der Cloud de Confiance Console die Seite Arbeitslasten auf.

Zu Arbeitslasten
Klicken Sie auf die Fehlermeldung PodUnschedulable.
Klicken Sie im Bereich Details auf den Namen des Pods. Wenn mehrere Pods vorhanden sind, beginne mit dem ersten Pod und wiederhole den folgenden Vorgang für jeden Pod.
Rufen Sie auf der Seite „Pod-Details“ den Tab Events (Ereignisse) auf.
Rufen Sie auf dem Tab Ereignisse den Tab YAML auf.
Sehen Sie sich die Ressourcenanfragen der einzelnen Container im Pod an, um die Gesamtzahl der Ressourcenanfragen zu ermitteln. Im folgenden Beispiel benötigt der Pod 2 vCPUs:
```
resources:
  limits:
    cpu: "3"
 requests:
    cpu: "2"
```
Rufen Sie die Knotenpooldetails des Clusters mit dem nicht geplanten Pod auf:
1. Rufen Sie in der Cloud de Confiance Console die Seite Kubernetes-Cluster auf.
  
  Zur Seite "Kubernetes-Cluster"
2. Klicken Sie auf den Namen des Clusters, für den die Fehlermeldung Pods unschedulable angezeigt wird.
3. Rufen Sie auf der Seite Clusterdetails den Tab Knoten auf.
Notieren Sie sich im Abschnitt Knotenpools den Wert in der Spalte Maschinentyp. Beispiel: n1-standard-1
Vergleichen Sie die Ressourcenanfrage mit den vom Maschinentyp bereitgestellten vCPUs. Wenn ein Pod beispielsweise 2 vCPUs anfordert, die verfügbaren Knoten jedoch den Maschinentyp n1-standard-1 haben, haben die Knoten nur 1 vCPU. Bei einer solchen Konfiguration würde Cluster Autoscaler keine Aufskalierung auslösen, da dieser Pod auch dann nicht auf einen neuen Knoten passen würde. Weitere Informationen zu verfügbaren Maschinentypen finden Sie in der Compute Engine-Dokumentation unter Ressourcen- und Vergleichsanleitung für Maschinenfamilien.

Beachten Sie außerdem, dass die zuweisbaren Ressourcen eines Knotens geringer sind als die Gesamtresourcen, da ein Teil für die Ausführung von Systemkomponenten benötigt wird. Weitere Informationen zur Berechnung finden Sie unter Zuweisbare Ressourcen von Knoten.

Um dieses Problem zu beheben, prüfen Sie, ob die für die Arbeitslast definierten Ressourcenanforderungen Ihren Anforderungen entsprechen. Wenn der Maschinentyp nicht geändert werden soll, erstellen Sie einen Knotenpool mit einem Maschinentyp, der die Anfrage des Pods unterstützen kann. Wenn die Ressourcenanforderungen des Pods nicht korrekt sind, aktualisieren Sie die Definition des Pods, damit die Pods auf die Knoten passen.

Problem: Fehlerhafte Cluster verhindern das Hochskalieren

Der Cluster Autoscaler führt möglicherweise kein Hochskalieren durch, wenn er einen Cluster als fehlerhaft betrachtet. Die Unregelmäßigkeiten im Cluster basieren nicht darauf, dass die Steuerungsebene fehlerfrei ist, sondern auf dem Verhältnis von fehlerfreien und einsatzbereiten Knoten. Wenn 45% der Knoten in einem Cluster fehlerhaft oder nicht bereit sind, werden alle Vorgänge von Cluster Autoscaler angehalten.

Wenn dies der Grund dafür ist, dass Ihr Cluster Autoscaler nicht hochskaliert wird, gibt es ein Ereignis in der ConfigMap von Cluster Autoscaler mit dem Typ Warning und ClusterUnhealthy als Grund.

Führen Sie den folgenden Befehl aus, um die ConfigMap aufzurufen:

kubectl describe configmap cluster-autoscaler-status -n kube-system

Reduzieren Sie die Anzahl der fehlerhaften Knoten, um dieses Problem zu beheben.

Es ist auch möglich, dass einige der Knoten bereit sind, aber nicht als bereit von Cluster Autoscaler betrachtet werden. Dies geschieht, wenn auf einem Knoten eine Markierung mit dem Präfix ignore-taint.cluster-autoscaler.kubernetes.io/ vorhanden ist. Cluster Autoscaler betrachtet einen Knoten als NotReady, solange dieser Taint vorhanden ist.

Wenn das Verhalten durch das Vorhandensein des ignore-taint.cluster-autoscaler.kubernetes.io/.*-Taints verursacht wird, entfernen Sie es.

Nächste Schritte

Häufig gestellte Fragen zum Kubernetes Cluster Autoscaler
In diesem YouTube-Video erfahren Sie, wie Sie Fehler und Skalierungsprobleme beheben.
Wenn Sie in der Dokumentation keine Lösung für Ihr Problem finden, lesen Sie den Abschnitt Support erhalten. Dort finden Sie weitere Hilfe, z. B. zu den folgenden Themen:
- Sie können eine Supportanfrage erstellen, indem Sie sich an den Cloud Customer Care wenden.
- Support von der Community erhalten, indem Sie Fragen auf Stack Overflow stellen und mit dem Tag google-kubernetes-engine nach ähnlichen Problemen suchen. Sie können auch dem #kubernetes-engine-Slack-Kanal beitreten, um weiteren Community-Support zu erhalten.
- Sie können Fehler melden oder Funktionsanfragen stellen, indem Sie die öffentliche Problemverfolgung verwenden.