Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Diese Seite wurde von der Cloud Translation API übersetzt.

Fehlerbehebung beim Abrufen von Images

Autopilot Standard

Wenn Container in Google Kubernetes Engine (GKE) nicht gestartet werden können, sehen Sie möglicherweise Pod-Status wie ErrImagePull oder ImagePullBackOff. Die Ursache für diese Status ist häufig ein Problem beim Abrufen des Images, wenn Kubernetes versucht, das Container-Image aus einer Registry abzurufen. Ein Fehler in diesem Prozess kann verhindern, dass Ihre Apps gestartet werden, oder zu Bereitstellungsverzögerungen führen.

Auf dieser Seite können Sie die häufigsten Ursachen für Fehler beim Abrufen von Images diagnostizieren und beheben:

Authentifizierungseinstellungen: Ihrem Cluster fehlen die erforderlichen Berechtigungen für den Zugriff auf die Container-Image-Registry.
Netzwerkverbindung: Ihr Cluster kann aufgrund von DNS-Problemen, Firewallregeln oder fehlendem Internetzugriff in Clustern, die Netzwerkisolation verwenden, keine Verbindung zur Registry herstellen.
Image not found in registry (Image nicht in der Registry gefunden): Der angegebene Imagename oder das Tag ist falsch, das Image wurde gelöscht oder die Registry ist nicht verfügbar.
Leistungseinschränkungen: Eine große Bildgröße, langsame Laufwerks-E/A oder Netzwerküberlastung können zu langsamen Pulls oder Zeitüberschreitungen führen.
Inkompatible Image-Architektur: Das Image wurde für eine andere CPU-Architektur als Ihr GKE-Knotenpool erstellt.
Inkompatible Schemaversionen: Möglicherweise verwenden Sie containerd 2.0 oder höher mit einem Docker-Schema der Version 1, was nicht unterstützt wird.

Diese Informationen sind wichtig für Anwendungsentwickler, die Bereitstellungsfehler beheben müssen, indem sie Bildnamen, Tags und Architekturen in ihren Manifesten überprüfen. Außerdem können Plattformadministratoren und ‑operatoren damit Probleme auf Clusterebene beheben, z. B. das Konfigurieren von Anmeldedaten für das Abrufen von Images für private Registries oder das Korrigieren von Netzwerkrichtlinien, die den Zugriff auf eine Image-Registry blockieren. Weitere Informationen zu den gängigen Rollen und Beispielaufgaben, auf die wir inCloud de Confiance by S3NS -Inhalten verweisen, finden Sie unter Häufig verwendete GKE-Nutzerrollen und -Aufgaben.

Wenn Sie eine bestimmte Ereignisnachricht bereits gesehen haben, suchen Sie auf dieser Seite nach der Nachricht und folgen Sie den aufgeführten Schritten zur Fehlerbehebung. Wenn Sie keine Nachricht erhalten haben, arbeiten Sie die folgenden Abschnitte der Reihe nach durch. Wenn das Problem weiterhin besteht, wenden Sie sich an Cloud Customer Care.

Image-Pulls verstehen

Bevor Sie mit der Fehlerbehebung beginnen, sollten Sie sich mit dem Lebenszyklus eines Bildes und den Hosting-Optionen vertraut machen.

Image-Lebenszyklus

Wenn Sie einen Pod erstellen, empfängt das Kubelet die Pod-Definition, die die Spezifikation für das Image enthält. Das Kubelet benötigt dieses Image, um einen Container basierend auf dem Image ausführen zu können. Bevor das Image abgerufen wird, prüft das Kubelet in der Container-Laufzeit, ob das Image vorhanden ist. Das Kubelet prüft auch die Image-Pull-Richtlinie des Pods. Wenn sich das Image nicht im Cache der Containerlaufzeit befindet oder die Image-Pull-Richtlinie dies erfordert, weist das Kubelet die Containerlaufzeit (containerd) an, das angegebene Image aus der Registry abzurufen. Wenn das Abrufen eines Images fehlschlägt, kann der Container im Pod nicht gestartet werden.

Nach einem erfolgreichen Image-Pull-Vorgang entpackt die Container-Laufzeit das Image, um ein schreibgeschütztes Basisdateisystem für den Container zu erstellen. Die Containerlaufzeit speichert dieses Image und es bleibt so lange vorhanden, wie laufende Container darauf verweisen. Wenn keine laufenden Container auf ein Image verweisen, kommt das Image für die Garbage Collection infrage und das Kubelet entfernt es schließlich.

Optionen für das Bild-Hosting

Wir empfehlen, Ihre Bilder mit einer der folgenden Optionen zu hosten:

Artifact Registry: Artifact Registry ist der vollständig verwaltete Paketmanager von Google. Artifact Registry ist eng in andere Cloud de Confiance by S3NS-Dienste eingebunden und bietet eine detaillierte Zugriffssteuerung. Weitere Informationen finden Sie in der Artifact Registry-Dokumentation unter Mit Container-Images arbeiten.

Hinweis :Beim Abrufen von Images aus Artifact Registry durch das Kubelet wird nicht die Identitätsföderation von Arbeitslasten für GKE verwendet. Stattdessen wird für diese Image-Pulls das mit der VM verknüpfte Dienstkonto verwendet.
Selbst gehostete Registry: Eine selbst gehostete Registry bietet Ihnen mehr Kontrolle, erfordert aber auch, dass Sie die Registry verwalten. Diese Option ist sinnvoll, wenn Sie bestimmte Compliance- oder Sicherheitsanforderungen haben, die Artifact Registry nicht erfüllen kann.

Fehler beim Abrufen des Images diagnostizieren

Führen Sie die in den folgenden Abschnitten beschriebenen Untersuchungen durch, um Fehler beim Abrufen von Images zu diagnostizieren:

Pod-Status und ‑Ereignisse ansehen
Bedeutung der Statusanzeigen
Mithilfe von Ereignismeldungen können Sie die Ursache für das Fehlschlagen des Image-Pulls ermitteln.
Logs im Log-Explorer ansehen

Pod-Status und ‑Ereignisse ansehen

Damit Sie leichter feststellen können, ob ein Image-Pull fehlgeschlagen ist, zeichnet GKE die folgenden Status für Pods auf:

ImagePullBackOff
ErrImagePull
ImageInspectError
InvalidImageName
RegistryUnavailable
SignatureValidationFailed

ImagePullBackOff und ErrImagePull sind die häufigsten dieser Status.

Zusätzlich zu diesen Status können Sie mit Kubernetes-Ereignissen die Ursache von Fehlern beim Abrufen von Images ermitteln.

Wenn Sie prüfen möchten, ob Ihr Image-Pull-Vorgang fehlschlägt, suchen Sie nach Statusmeldungen und lesen Sie dann Ereignismeldungen, indem Sie eine der folgenden Optionen auswählen:

Console

Gehen Sie folgendermaßen vor:

Rufen Sie in der Cloud de Confiance Console die Seite Arbeitslasten auf.

Zu Arbeitslasten
Wählen Sie die Arbeitslast aus, die Sie prüfen möchten. Wenn Sie nicht sicher sind, welche Arbeitslast Sie untersuchen müssen, sehen Sie in der Spalte Status nach. In dieser Spalte sehen Sie, bei welchen Arbeitslasten Probleme auftreten.
Suchen Sie auf der Seite Details der Arbeitslast nach dem Abschnitt Verwaltete Pods und klicken Sie auf den Namen des Pods mit einem Status, der auf einen Fehler beim Abrufen des Images hinweist.
Klicken Sie auf der Seite Details für den Pod auf den Tab Ereignisse.
Sehen Sie sich die Informationen in der Tabelle an. In der Spalte Message (Nachricht) sind Kubernetes-Ereignisse aufgeführt, die weitere Informationen zu fehlgeschlagenen Image-Pulls enthalten. In der Spalte Grund wird der Pod-Status aufgeführt.

kubectl

Gehen Sie folgendermaßen vor:

Rufen Sie den Status Ihrer Pods auf:
```
kubectl get pods -n NAMESPACE
```
Ersetzen Sie NAMESPACE durch den Namespace, in dem Ihre Pods ausgeführt werden.

Die Ausgabe sieht etwa so aus:
```
NAME         READY   STATUS       RESTARTS      AGE
POD_NAME_1   2/2     Running      0             7d5h
POD_NAME_2   0/1     ErrImagePull 0             7d5h
```
In der Spalte Status wird angegeben, bei welchen Pods ein Fehler beim Abrufen von Images aufgetreten ist.

Ereignisse für Pods mit Fehlern beim Abrufen von Images ansehen:

kubectl describe POD_NAME -n NAMESPACE

Ersetzen Sie POD_NAME durch den Namen des Pods, den Sie im vorherigen Schritt ermittelt haben.

Im Bereich Events finden Sie weitere Informationen dazu, was bei fehlgeschlagenen Image-Pulls passiert ist.

Die Ausgabe sieht etwa so aus:

...
Events:
  Type    Reason    Age               From           Message
  ----    ------    ----              ----           -------
  Warning  Failed   5m (x4 over 7m)   kubelet, NODE  Failed to pull image "IMAGE_ADDRESS": rpc error: code = Unknown desc = Error response from daemon: repository IMAGE_ADDRESS not found
  Warning  Failed   5m (x4 over 7m)   kubelet, NODE  Error: ErrImagePull
  Normal   BackOff  5m (x6 over 7m)   kubelet, NODE  Back-off pulling image "IMAGE_ADDRESS"
  Warning  Failed   2m (x20 over 7m)  kubelet, NODE  Error: ImagePullBackOff

In dieser Ausgabe ist IMAGE_ADDRESS die vollständige Adresse des Bildes. Beispiel: us-west1-docker.pkg.dev/my-project/my-repo/test:staging

Bedeutung der Status

Die verschiedenen Status werden im Folgenden beschrieben:

ImagePullBackOff: Das Kubelet konnte das Image nicht abrufen, versucht es aber weiterhin mit einer zunehmenden Verzögerung (oder Backoff) von bis zu fünf Minuten.
ErrImagePull: Ein allgemeiner, nicht behebbarer Fehler während des Image-Pull-Vorgangs.
ImageInspectError: Bei der Container-Laufzeit ist ein Problem aufgetreten, als versucht wurde, das Container-Image zu prüfen.
InvalidImageName: Der Name des in Ihrer Pod-Definition angegebenen Container-Images ist ungültig.
RegistryUnavailable: Die Registrierung ist nicht zugänglich. Das ist in der Regel ein Problem mit der Netzwerkverbindung.
SignatureValidationFailed: Die digitale Signatur des Container-Images konnte nicht überprüft werden.

Mithilfe von Ereignismeldungen die Ursache für das Fehlschlagen des Image-Pulls ermitteln

In der folgenden Tabelle sind Ereignismeldungen aufgeführt, die sich auf Fehler beim Abrufen von Images beziehen, sowie die Schritte zur Fehlerbehebung, die Sie ausführen sollten, wenn eine dieser Meldungen angezeigt wird.

Nachrichten, die sich auf Fehler beim Pullen von Images beziehen, haben oft das folgende Präfix:

Failed to pull image "IMAGE_ADDRESS": rpc error: code = CODE = failed to pull and unpack image "IMAGE_ADDRESS": failed to resolve reference "IMAGE_ADDRESS":

Diese Nachricht enthält die folgenden Werte:

IMAGE_ADDRESS: die vollständige Adresse des Bildes. Beispiel: us-west1-docker.pkg.dev/my-project/my-repo/test:staging
CODE: Ein Fehlercode, der mit der Log-Nachricht verknüpft ist. Beispiel: NotFound oder Unknown.

Für einige Ursachen von Image-Pull-Fehlern gibt es keine zugehörige Ereignismeldung. Wenn Sie keine der Ereignismeldungen in der folgenden Tabelle sehen, aber weiterhin Probleme beim Abrufen von Images haben, empfehlen wir Ihnen, den Rest der Seite zu lesen.

Ereignisnachricht	Detaillierte Fehlerbehebung
Authentifizierung
`Failed to authorize: failed to fetch oauth token: unexpected status: 403 Forbidden` `Pulling from host HOST_NAME failed with status code: 403 Forbidden`	Zugriff auf das Bild bestätigen VPC Service Controls-Einstellungen prüfen, um auf Artifact Registry zuzugreifen
`Failed to authorize: failed to fetch oauth token: unexpected status: 401 Unauthorized` `Unexpected status code [manifests 1.0]: 401 Unauthorized`	Aktivstatus des Knotendienstkontos prüfen Zugriffsbereich des Knotens für das private Artifact Registry-Repository prüfen
Netzwerkverbindung
`Failed to do request: Head "IMAGE_ADDRESS": dial tcp: lookup gcr.io on REGISTRY_IP_ADDRESS: server misbehaving`	DNS-Auflösung untersuchen
`Failed to start Download and install k8s binaries and configurations`	Firewallkonfiguration untersuchen
`Failed to do request: Head "IMAGE_ADDRESS": dial tcp REGISTRY_IP_ADDRESS: i/o timeout`	Internetverbindung von externen Registry-Endpunkten untersuchen Prüfen, ob die Verbindung zu Google APIs eine Zeitüberschreitung auslöst
Image nicht gefunden
`"IMAGE_ADDRESS": not found` `Failed to copy: httpReadSeeker: failed open: could not fetch content descriptor sha256:SHA_HASH (application/vnd.docker.container.image.v1+json) from remote: not found`	Untersuchen, warum das Kubelet Ihr Image nicht finden kann
Bild-Timeout
`Unknown desc = context canceled`	Ursachen für Image-Pull-Timeouts oder langsame Image-Pulls untersuchen
Inkompatibles Schema
Failed to get converter for "IMAGE_ADDRESS": Pulling Schema 1 images have been deprecated and disabled by default since containerd v2.0. As a workaround you may set an environment variable `CONTAINERD_ENABLE_DEPRECATED_PULL_SCHEMA_1_IMAGE=1`, but this will be completely removed in containerd v2.1.	Kompatibilität der Bildschemaversion prüfen

Logs im Log-Explorer ansehen

Wenn Sie frühere Ereignisse zum Abrufen von Images untersuchen oder Fehler beim Abrufen von Images mit anderen Komponentenaktivitäten korrelieren möchten, können Sie Logs mit dem Log-Explorer ansehen:

Rufen Sie in der Cloud de Confiance Console die Seite Log-Explorer auf:

Zum Log-Explorer
Geben Sie im Bereich „Abfrage“ die folgende Abfrage ein:
```
log_id("events")
resource.type="k8s_pod"
resource.labels.cluster_name="CLUSTER_NAME"
jsonPayload.message=~"Failed to pull image"
```
Ersetzen Sie CLUSTER_NAME durch den Namen des Clusters, auf dem der Pod mit Image-Pull-Fehlern ausgeführt wird.
Klicken Sie auf Abfrage ausführen und sehen Sie sich die Ergebnisse an.

Authentifizierungseinstellungen untersuchen

In den folgenden Abschnitten erfahren Sie, wie Sie überprüfen, ob Ihre GKE-Umgebung die richtigen Authentifizierungseinstellungen hat, um Images aus dem Repository abzurufen.

So prüfen Sie, ob Authentifizierungsprobleme das Problem beim Abrufen von Images verursachen:

Prüfen Sie, ob Sie Zugriff auf das Bild haben.
Prüfen Sie die imagePullSecret-Konfiguration und die Deployment-Spezifikation.
Prüfen Sie, ob das Dienstkonto des Knotens aktiv ist.
Zugriffsbereich des Knotens für das private Artifact Registry-Repository prüfen
Überprüfen Sie die VPC Service Controls-Einstellungen, um auf Artifact Registry zuzugreifen.

Zugriff auf das Bild überprüfen

Wenn ein 403 Forbidden-Fehler beim Abrufen des Images auftritt, prüfen Sie, ob die erforderlichen Komponenten auf das Container-Image zugreifen können.

Die Methode zum Überprüfen und Anwenden der erforderlichen Rollen, um den erforderlichen Zugriff zu gewähren, hängt davon ab, in welchem Repository Ihre Bilder gespeichert sind. Wählen Sie eine der folgenden Optionen aus, um den Zugriff zu bestätigen und zu gewähren:

Artifact Registry

Wenn Sie ein imagePullSecret verwenden, benötigt das mit dem Secret verknüpfte Dienstkonto die Leseberechtigung für das Repository. Andernfalls benötigt das Dienstkonto des Knotenpools eine Berechtigung.

Folgen Sie der Anleitung in der IAM-Dokumentation, um die Rollen aufzurufen, die Ihrem Dienstkonto zugewiesen sind.
Wenn Ihr Dienstkonto nicht die IAM-Rolle Artifact Registry-Leser (roles/artifactregistry.reader) hat, weisen Sie sie zu:
```
gcloud artifacts repositories add-iam-policy-binding REPOSITORY_NAME \
    --location=REPOSITORY_LOCATION \
    --member=serviceAccount:SERVICE_ACCOUNT_EMAIL \
    --role="roles/artifactregistry.reader"
```
Ersetzen Sie Folgendes:
- REPOSITORY_NAME: der Name Ihres Artifact Registry-Repositorys
- REPOSITORY_LOCATION: die Region Ihres Artifact Registry-Repositorys
- SERVICE_ACCOUNT_EMAIL: die E-Mail-Adresse des erforderlichen Dienstkontos. Wenn Sie die Adresse nicht kennen, können Sie mit dem Befehl gcloud iam service-accounts list alle E-Mail-Adressen von Dienstkonten in Ihrem Projekt auflisten.

Container Registry

Folgen Sie der Anleitung in der IAM-Dokumentation, um die Rollen aufzurufen, die Ihrem Dienstkonto zugewiesen sind.
Wenn Ihr Dienstkonto nicht die IAM-Rolle Storage-Objekt-Betrachter (roles/storage.objectViewer) hat, weisen Sie sie zu, damit das Dienstkonto aus dem Bucket lesen kann:
```
gcloud storage buckets add-iam-policy-binding gs://BUCKET_NAME \
    --member=serviceAccount:SERVICE_ACCOUNT_EMAIL \
    --role=roles/storage.objectViewer
```
Ersetzen Sie Folgendes:
- SERVICE_ACCOUNT_EMAIL: die E-Mail-Adresse des erforderlichen Dienstkontos. Mit dem Befehl gcloud iam service-accounts list können Sie alle Dienstkonten in Ihrem Projekt auflisten.
- BUCKET_NAME: Der Name des Cloud Storage-Buckets, der Ihre Images enthält. Mit dem Befehl gcloud storage ls können Sie alle Buckets in Ihrem Projekt auflisten.

Wenn Ihr Registry-Administrator gcr.io-Repositories in Artifact Registry eingerichtet hat, um Images für die Domain gcr.io anstelle von Container Registry zu speichern, müssen Sie Artifact Registry anstelle von Container Registry Lesezugriff gewähren.

Selbst gehostete Registry

Je nachdem, wie Sie Ihre selbst gehostete Registry konfiguriert haben, benötigen Sie möglicherweise Schlüssel, Zertifikate oder beides, um auf das Image zuzugreifen.

Wenn Sie Schlüssel verwenden, sollten Sie ein imagePullSecret verwenden. imagePullSecrets sind eine sichere Methode, um Ihrem Cluster die Anmeldedaten zur Verfügung zu stellen, die für den Zugriff auf eine selbst gehostete Registry erforderlich sind. Ein Beispiel für die Konfiguration eines imagePullSecrets finden Sie in der Kubernetes-Dokumentation unter Image aus einer privaten Registry abrufen.

Um die HTTPS-Verbindung zu Ihrer Registry zu sichern, benötigen Sie möglicherweise auch Zertifikate, die die Integrität der Verbindung zum Remoteserver bestätigen. Wir empfehlen, Secret Manager zum Verwalten Ihrer eigenen selbst signierten Zertifizierungsstelle zu verwenden. Weitere Informationen finden Sie unter Auf private Registrys mit privaten CA-Zertifikaten zugreifen.

Konfiguration von imagePullSecret und Deployment-Spezifikation prüfen

Wenn Sie ein imagePullSecret verwenden, müssen Sie ein Secret mit den Authentifizierungsanmeldedaten zum Abrufen von Images erstellen und in allen Deployments das von Ihnen definierte Secret angeben. Weitere Informationen finden Sie in der Kubernetes-Dokumentation unter imagePullSecrets für einen Pod angeben.

Aktiven Status des Knotendienstkontos prüfen

Wenn der Fehler 401 Unauthorized beim Abrufen des Images auftritt, prüfen Sie, ob das Dienstkonto des Knotens aktiv ist. Auch wenn die Berechtigungen richtig konfiguriert sind, wird dieser Fehler angezeigt, wenn das Konto deaktiviert ist. Wählen Sie eine der folgenden Optionen aus, um den aktiven Status des Dienstkontos des Knotens zu prüfen:

Console

So finden Sie den Namen des Dienstkontos, das von Ihren Knoten verwendet wird:
1. Rufen Sie in der Cloud de Confiance Console die Seite Cluster auf.
  
  Zu den Clustern
2. Klicken Sie in der Clusterliste auf den Namen des Clusters, den Sie prüfen möchten.
3. Suchen Sie nach dem Namen des Knotendienstkontos.
  - Suchen Sie bei Clustern im Autopilot-Modus im Abschnitt Sicherheit nach dem Feld Dienstkonto.
  - Führen Sie für Cluster im Standardmodus die folgenden Schritte aus:
  1. Klicken Sie auf den Tab Knoten.
  2. Klicken Sie in der Tabelle Knotenpools auf einen Knotenpoolnamen. Die Seite Knotenpooldetails wird geöffnet.
  3. Suchen Sie im Abschnitt Sicherheit nach dem Feld Dienstkonto.
  Wenn der Wert im Feld Dienstkonto default ist, verwenden Ihre Knoten das Compute Engine-Standarddienstkonto. Wenn der Wert in diesem Feld nicht default ist, verwenden Ihre Knoten ein benutzerdefiniertes Dienstkonto.
Prüfen Sie, ob das Knotendienstkonto deaktiviert ist:
1. Rufen Sie in der Cloud de Confiance Console die Seite Dienstkonten auf.
  
  Zur Seite „Dienstkonten“
2. Wählen Sie ein Projekt aus.
3. Suchen Sie nach dem Namen des Dienstkontos, das Sie im vorherigen Schritt identifiziert haben.
4. Prüfen Sie die Spalte Status für dieses Konto. Wenn das Dienstkonto deaktiviert ist, hat es den Status Disabled.

gcloud

So finden Sie den Namen des Dienstkontos, das von Ihren Knoten verwendet wird:
- Führen Sie für Cluster im Autopilot-Modus den folgenden Befehl aus:
```
gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --flatten=autoscaling.autoprovisioningNodePoolDefaults.serviceAccount
```
- Führen Sie für Cluster im Standardmodus den folgenden Befehl aus:
```
gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --format="table(nodePools.name,nodePools.config.serviceAccount)"
```
Wenn die Ausgabe default ist, verwenden Ihre Knoten das Compute Engine-Standarddienstkonto. Wenn die Ausgabe nicht default ist, verwenden Ihre Knoten ein benutzerdefiniertes Dienstkonto.
Prüfen Sie, ob das Knotendienstkonto deaktiviert ist:
```
gcloud iam service-accounts list --filter="email:SERVICE_ACCOUNT_NAME AND disabled:true" \
--project=PROJECT_ID
```
Wenn der Befehl eine Ausgabe zurückgibt, ist das Dienstkonto deaktiviert.

Wenn das Dienstkonto deaktiviert ist, aktivieren Sie das Knotendienstkonto.

Zugriffsbereich des Knotens für das private Artifact Registry-Repository prüfen

Wenn Sie Ihr Container-Image in einem privaten Artifact Registry-Repository speichern, hat Ihr Knoten möglicherweise nicht den richtigen Zugriffsbereich. In diesem Fall wird möglicherweise ein 401 Unauthorized-Fehler beim Abrufen des Images angezeigt.

So prüfen Sie den Zugriffsbereich und gewähren ihn bei Bedarf:

Ermitteln Sie den Knoten, auf dem der Pod ausgeführt wird:
```
kubectl describe pod POD_NAME | grep "Node:"
```
Ersetzen Sie POD_NAME durch den Namen des Pods, bei dem ein Fehler beim Abrufen des Images aufgetreten ist.
Prüfen Sie, ob der im vorherigen Schritt identifizierte Knoten den richtigen Speicherkontext hat:
```
gcloud compute instances describe NODE_NAME \
    --zone="COMPUTE_ZONE" \
    --format="flattened(serviceAccounts[].scopes)"
```
Ersetzen Sie Folgendes:
- NODE_NAME: der Name des Knotens, den Sie im vorherigen Schritt identifiziert haben.
- COMPUTE_ZONE: die Compute Engine-Zone, zu der der Knoten gehört.
Die Ausgabe sollte mindestens einen der folgenden Zugriffsbereiche enthalten:
- serviceAccounts[0].scopes[0]: https://www.googleapis.com/auth/devstorage.read_only
- serviceAccounts[0].scopes[0]: https://www.googleapis.com/auth/cloud-platform
Wenn der Knoten keinen dieser Bereiche enthält, schlägt das Abrufen des Images fehl.
Erstellen Sie den Knotenpool, zu dem der Knoten gehört, mit ausreichendem Umfang neu. Da Sie vorhandene Knoten nicht ändern können, müssen Sie den Knoten mit dem richtigen Bereich neu erstellen.

Wir empfehlen, den Knotenpool mit dem Bereich gke-default zu erstellen. Dieser Bereich bietet Zugriff auf die folgenden Bereiche:
- https://www.googleapis.com/auth/devstorage.read_only
- https://www.googleapis.com/auth/logging.write
- https://www.googleapis.com/auth/monitoring
- https://www.googleapis.com/auth/service.management.readonly
- https://www.googleapis.com/auth/servicecontrol
- https://www.googleapis.com/auth/trace.append
Wenn der Bereich gke-default nicht geeignet ist, gewähren Sie dem Knotenpool den Bereich devstorage.read_only, der nur Lesezugriff auf Daten ermöglicht.
gke-default
Erstellen Sie einen Knotenpool mit dem Bereich gke-default:
```
gcloud container node-pools create NODE_POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location=CONTROL_PLANE_LOCATION \
    --scopes="gke-default"
```
Ersetzen Sie Folgendes:
- NODE_POOL_NAME: der Name des neuen Knotenpools.
- CLUSTER_NAME ist der Name Ihres vorhandenen Clusters.
- CONTROL_PLANE_LOCATION: Der Compute Engine-Standort der Steuerungsebene des Clusters. Geben Sie für regionale Cluster eine Region und für zonale Cluster eine Zone an.
devstorage.read_only
Erstellen Sie einen Knotenpool mit dem Bereich devstorage.read_only:
```
gcloud container node-pools create NODE_POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location=CONTROL_PLANE_LOCATION \
    --scopes="https://www.googleapis.com/auth/devstorage.read_only"
```
Ersetzen Sie Folgendes:
- NODE_POOL_NAME: der Name des neuen Knotenpools.
- CLUSTER_NAME ist der Name Ihres vorhandenen Clusters.
- CONTROL_PLANE_LOCATION: Der Compute Engine-Standort der Steuerungsebene des Clusters. Geben Sie für regionale Cluster eine Region und für zonale Cluster eine Zone an.

VPC Service Controls-Einstellungen prüfen, um auf Artifact Registry zuzugreifen

Wenn Sie VPC Service Controls verwenden, achten Sie darauf, dass Dienstperimeter den Zugriff auf Artifact Registry zulassen. Weitere Informationen finden Sie in der Artifact Registry-Dokumentation unter Repositories in einem Dienstperimeter schützen.

Netzwerkverbindung untersuchen

Während des Abrufens eines Images kann die Netzwerkverbindung verhindern, dass der Vorgang abgeschlossen wird.

So prüfen Sie, ob Netzwerkverbindungsprobleme die Ursache für ein Problem beim Abrufen von Images sind:

DNS-Auflösung untersuchen
Überprüfen Sie die Firewallkonfiguration.
Untersuchen Sie die Internetverbindung von externen Registry-Endpunkten.
Prüfen Sie, ob die Verbindung zu Google APIs eine Zeitüberschreitung auslöst.

DNS-Auflösung untersuchen

Wenn Sie einen server misbehaving-Fehler beim Abrufen des Images sehen, kann die DNS-Auflösung die Ursache für den Fehler beim Abrufen des Images sein.

Wenn Sie Probleme mit der DNS-Auflösung untersuchen möchten, versuchen Sie Folgendes:

Fehlerbehebung bei Metadatenserver Der Metadatenserver des Knotens löst alle DNS-Abfragen auf. Alle Probleme, die diesen Server betreffen, können die Namensauflösung stören, die Verbindung zum Repository verhindern und dazu führen, dass das Pullen des Images fehlschlägt.
Wenn Sie Cloud DNS für die DNS-Auflösung verwenden, müssen Sie darauf achten, dass Ihre von Cloud DNS verwalteten privaten Zonen, Weiterleitungszonen, Peering-Zonen und Antwortrichtlinien richtig konfiguriert sind. Fehlkonfigurationen in diesen Bereichen können die DNS-Auflösung stören. Weitere Informationen zu Cloud DNS finden Sie unter Cloud DNS für GKE verwenden. Informationen zur Fehlerbehebung bei Cloud DNS in GKE finden Sie unter Fehlerbehebung bei Cloud DNS in GKE.
Wenn Sie kube-dns für die DNS-Auflösung verwenden, prüfen Sie, ob es richtig funktioniert. Hinweise zur Fehlerbehebung bei kube-dns finden Sie unter Fehlerbehebung bei kube-dns in GKE.
Wenn die Knoten des Clusters keine externen IP-Adressen haben (was häufig der Fall ist, wenn Sie Netzwerkisolation verwenden), aktivieren Sie privaten Google-Zugriff im vom Cluster verwendeten Subnetzwerk und achten Sie darauf, dass Sie die Netzwerkanforderungen erfüllen. Wenn Sie Cloud NAT verwenden, wird der privater Google-Zugriff automatisch aktiviert.Cloud de Confiance by S3NS

Firewallkonfiguration untersuchen

Wenn ein Problem mit Ihrer Firewall dazu führt, dass der Image-Pull fehlschlägt, wird möglicherweise die folgende Fehlermeldung angezeigt:

Failed to start Download and install k8s binaries and configurations

Probleme mit der Firewall diagnostizieren

Wenn Sie einen Standardcluster verwenden und prüfen möchten, ob ein Problem mit Ihrer Firewall Probleme beim Abrufen von Images verursacht, gehen Sie so vor:

Stellen Sie über SSH eine Verbindung zum Knoten her, bei dem Probleme auftreten:
```
gcloud compute ssh NODE_NAME --zone=ZONE_NAME
```
Ersetzen Sie Folgendes:
- NODE_NAME ist der Name des Knotens.
- ZONE_NAME: die Compute Engine-Zone, in der der Knoten erstellt wurde.

Senden Sie die neuesten Logs für die Dienste kube-node-installation.service und kube-node-configuration.service an Textdateien mit den Namen kube-node-installation_status.txt und kube-node-configuration_status.txt:

systemctl status kube-node-installation.service > kube-node-installation_status.txt
systemctl status kube-node-configuration.service > kube-node-configuration_status.txt

Wenn diese Logs keine Informationen dazu enthalten, wann der Image-Pull fehlgeschlagen ist, erstellen Sie eine vollständige Kopie der Logs:

sudo journalctl -u kube-node-installation.service > kube-node-installation_logs.txt
sudo journalctl -u kube-node-configuration.service > kube-node-configuration_logs.txt

Sehen Sie sich den Inhalt der Dateien kube-node-installation_status.txt und kube-node-configuration_status.txt an. Wenn in der Ausgabe i/o timeout angezeigt wird, liegt das Problem wahrscheinlich an Ihrer Firewall.

Probleme mit der Firewallkonfiguration beheben

So beheben Sie Probleme mit Ihrer Firewall:

Ermitteln und beheben Sie alle Firewallregeln, die den Netzwerkverkehr blockieren. Möglicherweise haben Sie beispielsweise eine Regel, die den Traffic zur Registry blockiert, in der Ihr Image gespeichert ist.
1. VPC-Flusslogs aufrufen:
  1. Rufen Sie in der Cloud de Confiance Console die Seite Log-Explorer auf:
    
    Zum Log-Explorer
  2. Geben Sie im Bereich „Abfrage“ die folgende Abfrage ein:
```
resource.type="gce_subnetwork"
logName="projects/PROJECT_ID/logs/[compute.googleapis.com%2Fvpc_flows](http://compute.googleapis.com%2Fvpc_flows)"
resource.labels.subnetwork_name="SUBNET_NAME",
```
    Ersetzen Sie Folgendes:
    - PROJECT_ID: die ID Ihres Cloud de Confiance Projekts.
    - SUBNET_NAME: Der Name Ihres Subnetzwerks.
    Weitere Informationen finden Sie in der VPC-Dokumentation unter Mit Abfragen auf Flusslogs zugreifen.
2. Wenn Sie Firewallregeln finden, die erforderlichen Traffic blockieren, aktualisieren Sie sie.
Wenn die Knoten des Clusters keine externen IP-Adressen haben (was häufig der Fall ist, wenn Sie Netzwerkisolation verwenden), aktivieren Sie privaten Google-Zugriff im vom Cluster verwendeten Subnetzwerk und achten Sie darauf, dass Sie die Netzwerkanforderungen erfüllen. Wenn Sie Cloud NAT verwenden, wird der privater Google-Zugriff automatisch aktiviert.Cloud de Confiance by S3NS

Internetverbindung von externen Registry-Endpunkten untersuchen

Wenn Ihre Netzwerkkonfiguration den Traffic über einen externen Registry-Endpunkt leitet, hat dieser Endpunkt möglicherweise keine Internetverbindung. Wenn der Endpunkt keinen Zugriff hat, kann der Image-Pull-Vorgang fehlschlagen und Sie sehen einen i/o timeout-Image-Pull-Fehler.

Verwenden Sie ping oder traceroute, um die Netzwerkverbindung vom externen Registry-Endpunkt zur Registry zu prüfen:

ping REGISTRY_ENDPOINT

Oder

traceroute REGISTRY_ENDPOINT

Ersetzen Sie REGISTRY_ENDPOINT durch den Registry-Endpunkt. Dieser Wert kann ein Hostname oder eine IP-Adresse sein.

Wenn Sie einen Fehler bei der Verbindung feststellen, prüfen Sie die VPC-Routen:

Rufen Sie in der Cloud de Confiance Console Routen auf.

Zur Seite „Routes“
Sehen Sie sich die Spalte Priorität an und prüfen Sie, ob die Route mit der höchsten Priorität zu einer Quelle führt, die Zugriff auf die Registry hat. Routen mit niedrigeren Werten haben Vorrang.

Prüfen, ob die Verbindung zu Google APIs eine Zeitüberschreitung auslöst

Wenn Sie Netzwerkisolation verwenden, kann es zu einem Fehler kommen, bei dem die Verbindung zu Google APIs und Google-Diensten Zeitüberschreitungen verursacht, was zu einem i/o timeout-Fehler beim Abrufen von Images führt.

Dieser Fehler tritt auf, weil Ihre Knoten beim Versuch, Images aus der Registry abzurufen, keine Verbindung zu einer der folgenden APIs herstellen konnten:

containerregistry.googleapis.com
artifactregistry.googleapis.com

Versuchen Sie Folgendes, um sicherzustellen, dass Sie eine Verbindung zu den erforderlichen APIs herstellen können:

Aktivieren Sie den privaten Google-Zugriff. Knoten ohne externe IP-Adressen benötigen den privater Google-Zugriff, um die externen IP-Adressen von Google APIs und Diensten zu erreichen.
Verwenden Sie eine unterstützte Domain.
Firewallrichtlinien prüfen:
1. Rufen Sie in der Cloud de Confiance Console die Firewallrichtlinien auf.
  
  Zu den Firewall-Richtlinien
2. Prüfen Sie, ob Sie Regeln haben, die ausgehenden TCP-Traffic an Port 443 zu 199.36.153.4/30, 199.36.153.8/30 oder einem IP-Adressbereich, der von Ihrer ausgewählten Domain für Google APIs und Dienste verwendet wird, blockieren. Die IP-Adressbereiche 199.36.153.4/30 und 199.36.153.8/30 werden für den privater Google-Zugriff bzw. den eingeschränkten Google-Zugriff verwendet. TCP-Traffic auf Port 443 zu diesen Bereichen dient dem Zugriff auf Google APIs und Google-Dienste.
  
  Wenn Sie eine dieser Regeln finden, erstellen Sie eine Firewallregel für ausgehenden Traffic, um diesen Traffic zuzulassen.
Wenn Sie Artifact Registry verwenden, muss Ihre Umgebung die Anforderungen für die Verwendung von Artifact Registry mit Netzwerkisolation erfüllen.
Prüfen Sie, ob für virtuelle IP-Adressen (VIPs) (199.36.153.4/30 oder 199.36.153.8/30) VPC-Routen konfiguriert sind:
1. Rufen Sie in der Cloud de Confiance Console VPC-Netzwerke auf.
  
  Zur Seite VPC-Netzwerke
2. Klicken Sie in der Spalte Name auf default.
3. Klicken Sie auf der Seite mit den VPC-Netzwerkdetails auf den Tab Routen.
4. Sehen Sie sich die Tabelle mit den Routen an.
  
  Wenn Ihr VPC-Netzwerk eine Standardroute (Ziel 0.0.0.0/0 oder ::0/0) enthält und der nächste Hop für diese Route das Standard-Internetgateway (Standardnetzwerk) ist, verwenden Sie diese Route für die VIPs, um auf Google APIs und Google-Dienste zuzugreifen.
  
  Wenn Sie eine Standardroute durch eine benutzerdefinierte Route ersetzt haben, deren nächster Hop nicht das Standard-Internetgateway ist, können Sie die Routinganforderungen für Google APIs und -Dienste erfüllen, indem Sie benutzerdefiniertes Routing verwenden.

Untersuchen, warum das Kubelet Ihr Image nicht finden kann

Wenn das Kubelet Ihr Image nicht finden kann, wird möglicherweise ein image not found-Fehler angezeigt und das Abrufen des Images schlägt fehl.

Damit das Kubelet Ihr Image finden kann, versuchen Sie Folgendes:

Prüfen Sie das Manifest Ihres Pods und achten Sie darauf, dass der Name Ihres Images und das Image-Tag richtig geschrieben sind. Rechtschreib- oder Formatierungsfehler führen dazu, dass das Pullen des Images fehlschlägt.
Prüfen Sie, ob das Image noch in der Registry vorhanden ist, in der Sie es gespeichert haben. Wenn das Image einen vollständigen Registry-Pfad hat, prüfen Sie, ob es in der von Ihnen verwendeten Docker-Registry vorhanden ist. Falls Sie nur den Image-Namen angegeben haben, prüfen Sie die Docker Hub-Registry.
Wenn in Ihrem Cluster Netzwerkisolation verwendet wird, versuchen Sie Folgendes:
1. Privaten Google-Zugriff aktivieren.
2. Prüfen Sie, ob Ihr Service-Perimeter richtig konfiguriert ist.

Untersuchen, warum es zu Image-Pull-Timeouts oder langsamen Image-Pulls kommt

Wenn Sie ein sehr großes Image für Ihre GKE-Arbeitslast verwenden, kann beim Abrufen des Images ein Zeitüberschreitungsfehler auftreten und ein context cancelled-Fehler verursacht werden. Bilder haben zwar kein definiertes Größenlimit, der Fehler context cancelled deutet jedoch häufig darauf hin, dass die Größe des Bildes die Ursache ist.

Es kann auch vorkommen, dass das Herunterladen von Bildern nicht fehlschlägt, aber viel länger als gewöhnlich dauert. Wenn Sie eine Baseline für Ihre regulären Image-Pull-Zeiten erstellen möchten, sehen Sie sich den Successfully pulled image-Logeintrag an. Die folgende Logmeldung zeigt beispielsweise, dass das Pullen des Images 30,313387996 Sekunden gedauert hat:

Successfully pulled image "IMAGE_ADDRESS" in 30.313387996s.

Timeouts und langsames Abrufen von Images haben viele gemeinsame Ursachen. Versuchen Sie Folgendes, um diese Probleme zu beheben:

Auf Probleme mit der Netzabdeckung prüfen Wenn Sie dieses Problem nur in einem bestimmten Zeitraum bemerkt haben, prüfen Sie, ob es Cloud de Confiance by S3NS Ausfälle gab.
Laufwerksleistung prüfen Langsame Laufwerk-E/A kann die Pull-Zeiten von Images verlängern. Erwägen Sie ein Upgrade auf nichtflüchtige Speicher mit SSDs (pd-ssd) oder die Verwendung größerer Festplatten, um die Leistung zu verbessern. Weitere Informationen finden Sie unter Fehlerbehebung bei Problemen mit der Laufwerksleistung.
Verringern Sie die Bildgröße. Sie können beispielsweise einige Daten aus den Container-Images in Persistent Volumes verschieben.
Nutzen Sie das Image-Caching, um die Startzeiten von Pods zu verkürzen. GKE speichert Images auf Knoten im Cache. Beim Abrufen eines Images lädt die Containerlaufzeit nur Ebenen herunter, die noch nicht im Cache vorhanden sind. Um die Effektivität dieses Caching-Mechanismus zu maximieren und die Image-Pull-Zeiten zu minimieren, sollten Sie Ihr Dockerfile so strukturieren, dass häufig geänderte Teile des Images (z. B. Ihr Anwendungscode) am Ende der Datei stehen und kleinere Basis-Images verwendet werden.
Aktivieren Sie das Image-Streaming. Diese Funktion kann den Pod-Start und das Herunterladen von Images beschleunigen. Weitere Informationen finden Sie unter Container-Images mithilfe von Image-Streaming abrufen.
Prüfen Sie, ob das Standarddienstkonto die erforderlichen Berechtigungen hat. Wenn Sie Rollen ändern, die dem Standarddienstkonto zugewiesen sind, kann dies zu Störungen bei Arbeitslasten führen, einschließlich des Abrufens von Images. Weitere Informationen finden Sie unter Cluster mit Knotendienstkonten identifizieren, denen wichtige Berechtigungen fehlen.
Proxykonfigurationen prüfen Wenn ein Proxy zwischen Ihrem GKE-Cluster und einem nicht von Google verwalteten Repository vorhanden ist, kann dies zu Latenz führen.
Drittanbietersoftware prüfen Einige Drittanbieter-Software kann das Herunterladen von Bildern beeinträchtigen. Prüfen Sie, ob kürzlich installierte Tools Konflikte verursachen.

Prüfen Sie, ob im Image-Manifest die richtige Architektur verwendet wird.

Wenn das Image, das Sie abrufen möchten, für eine andere Computerarchitektur als die Ihrer Knotenpools erstellt wurde, schlägt der Image-Pull fehl.

So prüfen Sie, ob in Ihrem Image-Manifest die richtige Architektur verwendet wird:

Wenn Sie prüfen möchten, welche Architektur Ihr Image verwendet, sehen Sie sich das Manifest für Ihr Image an. Wenn Sie sich beispielsweise ein Docker-Image ansehen möchten, führen Sie den folgenden Befehl aus:
```
docker manifest inspect --verbose IMAGE_NAME
```
Ersetzen Sie IMAGE_NAME durch den Namen des Bildes, das Sie sich ansehen möchten.

Die Ausgabe sieht etwa so aus:
```
...
"Platform": {
          "architecture": "amd64",
          "os": "linux"
  }
...
```
In diesem Beispiel ist die unterstützte Architektur amd64.
Prüfen Sie den Maschinentyp, der von Ihren Knotenpools verwendet wird:
```
gcloud container node-pools list --cluster CLUSTER_NAME --location CONTROL_PLANE_LOCATION
```
Ersetzen Sie Folgendes:
- CLUSTER_NAME: Der Name des Clusters, auf dem der Pod mit Image-Pull-Fehlern ausgeführt wird.
- CONTROL_PLANE_LOCATION: Der Compute Engine-Standort der Steuerungsebene des Clusters. Geben Sie für regionale Cluster eine Region und für zonale Cluster eine Zone an.
Die Ausgabe sieht etwa so aus:
```
NAME: example-node-pool
MACHINE_TYPE: e2-standard-2
DISK_SIZE_GB: 100
NODE_VERSION: 1.30.8-gke.1162000
```
In diesem Beispiel ist der Maschinentyp e2-standard-2.
Vergleichen Sie die Werte in den Feldern architecture und MACHINE_TYPE und achten Sie darauf, dass beide Werte kompatibel sind. Wenn das Image beispielsweise die Architektur amd64 hat, ist es mit einem Knotenpool kompatibel, der e2-standard-2 als Maschinentyp verwendet. Wenn im Knotenpool jedoch t2a-standard-1 (ein ARM-basierter Maschinentyp) verwendet wird, führt dieser Maschinentyp zu einem Fehler.
Wenn die Architektur des Images nicht mit dem Maschinentyp des Knotenpools kompatibel ist, erstellen Sie das Image neu, um die erforderliche Architektur zu verwenden.

Kompatibilität der Bildschemaversion prüfen

Wenn Sie containerd 2.0 mit einem Docker-Schema-Image der Version 1 verwenden, schlagen Image-Pulls fehl, da in containerd 2.0 die Unterstützung für das Pullen von Docker-Schema 1-Images in GKE 1.33 entfernt wurde. Wenn dieses Problem die Ursache für den Fehler beim Pullen des Images ist, wird möglicherweise die folgende Fehlermeldung angezeigt:

Failed to get converter for "IMAGE_ADDRESS": Pulling Schema 1 images have been deprecated and disabled by default since containerd v2.0. As a workaround you may set an environment variable `CONTAINERD_ENABLE_DEPRECATED_PULL_SCHEMA_1_IMAGE=1`, but this will be completely removed in containerd v2.1.

Um dieses Problem zu beheben, müssen Sie diese Images identifizieren und migrieren. Folgen Sie dazu der Anleitung unter Von Docker-Schema 1-Images migrieren.

Nächste Schritte

Wenn Sie in der Dokumentation keine Lösung für Ihr Problem finden, lesen Sie den Abschnitt Support erhalten. Dort finden Sie weitere Hilfe, z. B. zu den folgenden Themen:
- Sie können eine Supportanfrage erstellen, indem Sie sich an den Cloud Customer Care wenden.
- Support von der Community erhalten, indem Sie Fragen auf Stack Overflow stellen und mit dem Tag google-kubernetes-engine nach ähnlichen Problemen suchen. Sie können auch dem #kubernetes-engine-Slack-Kanal beitreten, um weiteren Community-Support zu erhalten.
- Sie können Fehler melden oder Funktionsanfragen stellen, indem Sie die öffentliche Problemverfolgung verwenden.

Fehlerbehebung beim Abrufen von Images

Image-Pulls verstehen

Image-Lebenszyklus

Optionen für das Bild-Hosting

Fehler beim Abrufen des Images diagnostizieren

Pod-Status und ‑Ereignisse ansehen

Console

kubectl

Bedeutung der Status

Mithilfe von Ereignismeldungen die Ursache für das Fehlschlagen des Image-Pulls ermitteln

Logs im Log-Explorer ansehen

Authentifizierungseinstellungen untersuchen

Zugriff auf das Bild überprüfen

Artifact Registry

Container Registry

Selbst gehostete Registry

Konfiguration von imagePullSecret und Deployment-Spezifikation prüfen

Aktiven Status des Knotendienstkontos prüfen

Console

gcloud

Zugriffsbereich des Knotens für das private Artifact Registry-Repository prüfen

`gke-default`

`devstorage.read_only`

VPC Service Controls-Einstellungen prüfen, um auf Artifact Registry zuzugreifen

Netzwerkverbindung untersuchen

DNS-Auflösung untersuchen

Firewallkonfiguration untersuchen

Probleme mit der Firewall diagnostizieren

Probleme mit der Firewallkonfiguration beheben

Internetverbindung von externen Registry-Endpunkten untersuchen

Prüfen, ob die Verbindung zu Google APIs eine Zeitüberschreitung auslöst

Untersuchen, warum das Kubelet Ihr Image nicht finden kann

Untersuchen, warum es zu Image-Pull-Timeouts oder langsamen Image-Pulls kommt

Prüfen Sie, ob im Image-Manifest die richtige Architektur verwendet wird.

Kompatibilität der Bildschemaversion prüfen

Nächste Schritte