Alcune o tutte le informazioni in questa pagina potrebbero non essere applicabili a Cloud de Confiance by S3NS. Per maggiori dettagli, consulta Differenze rispetto a Google Cloud.

Questa pagina è stata tradotta dall'API Cloud Translation.

Risolvere i problemi relativi ai pull delle immagini

Autopilot Standard

Quando i container non vengono avviati in Google Kubernetes Engine (GKE), potresti visualizzare stati dei pod come ErrImagePull o ImagePullBackOff. La causa di questi stati è spesso un problema con il processo di pull dell'immagine, in cui Kubernetes tenta di recuperare l'immagine container da un registry. Un errore in questo processo può impedire l'avvio delle app o causare ritardi nel deployment.

Utilizza questa pagina per diagnosticare e risolvere le cause più comuni di errori di pull delle immagini:

Impostazioni di autenticazione: il cluster non dispone delle autorizzazioni necessarie per accedere al registro delle immagini container.
Connettività di rete: il cluster non può connettersi al registro a causa di problemi DNS, regole firewall o mancanza di accesso a internet nei cluster che utilizzano l'isolamento di rete.
Immagine non trovata nel registro: il nome o il tag dell'immagine specificato non è corretto, l'immagine è stata eliminata o il registro non è disponibile.
Limitazioni delle prestazioni: le dimensioni delle immagini grandi, l'I/O del disco lento o la congestione della rete possono causare pull lenti o timeout.
Architettura dell'immagine incompatibile: l'immagine è stata creata per un'architettura della CPU diversa da quella del tuo pool di nodi GKE.
Versioni dello schema incompatibili: potresti utilizzare containerd 2.0 o versioni successive con uno schema Docker v1, che non è supportato.

Queste informazioni sono importanti per gli sviluppatori di applicazioni che devono risolvere gli errori di deployment verificando i nomi, i tag e le architetture delle immagini nei manifest. Aiuta inoltre gli amministratori e gli operatori della piattaforma a eseguire il debug dei problemi a livello di cluster, ad esempio la configurazione delle credenziali di pull delle immagini per i registri privati o la correzione delle norme di rete che bloccano l'accesso a un registro di immagini. Per ulteriori informazioni sui ruoli comuni e sulle attività di esempio a cui facciamo riferimento nei contenuti diCloud de Confiance by S3NS , consulta Ruoli e attività comuni degli utenti GKE.

Se hai già visualizzato un messaggio di evento specifico, cerca il messaggio in questa pagina e segui i passaggi per la risoluzione dei problemi elencati. Se non hai ricevuto un messaggio, segui le sezioni riportate di seguito in ordine. Se il problema persiste, contatta l'assistenza clienti Google Cloud.

Informazioni sui pull delle immagini

Prima di iniziare la risoluzione dei problemi, è utile capire un po' di più sul ciclo di vita di un'immagine e su dove puoi ospitarle.

Ciclo di vita delle immagini

Quando crei un pod, kubelet riceve la definizione del pod, che include la specifica dell'immagine. kubelet ha bisogno di questa immagine per poter eseguire un container basato sull'immagine. Prima di eseguire il pull dell'immagine, kubelet controlla il runtime del container per verificare se l'immagine è presente. kubelet controlla anche la policy di pull delle immagini del pod. Se l'immagine non è nella cache del runtime del container o se i criteri di pull dell'immagine lo richiedono, kubelet indica al runtime del container (containerd) di eseguire il pull dell'immagine specificata dal registro. Un pull dell'immagine non riuscito impedisce l'avvio del container nel pod.

Dopo un pull riuscito dell'immagine, il runtime del container decomprime l'immagine per creare un file system di base di sola lettura per il container. Il runtime del container archivia questa immagine e l'immagine rimane presente finché i container in esecuzione fanno riferimento a essa. Se nessun container in esecuzione fa riferimento a un'immagine, questa diventa idonea per la garbage collection e kubelet la rimuove definitivamente.

Opzioni di hosting delle immagini

Ti consigliamo di utilizzare una delle seguenti opzioni per ospitare le immagini:

Artifact Registry: Artifact Registry è il gestore di pacchetti completamente gestito di Google. Artifact Registry si integra strettamente con altri Cloud de Confiance by S3NS servizi e offre controllo dell'accesso granulare. Per saperne di più, consulta Utilizzare le immagini container nella documentazione di Artifact Registry.

Nota: i pull di immagini da Artifact Registry da parte di kubelet non utilizzano Workload Identity Federation for GKE. Questi pull di immagini utilizzano invece il account di servizio associato alla VM.
Registry self-hosted: un registry self-hosted ti offre un maggiore controllo, ma richiede anche la gestione del registry. Prendi in considerazione questa opzione se hai esigenze specifiche di conformità o sicurezza che Artifact Registry non può soddisfare.

Diagnosticare l'errore di pull dell'immagine

Per diagnosticare gli errori di pull delle immagini, esegui le indagini descritte nelle sezioni seguenti:

Visualizza lo stato e gli eventi del pod.
Comprendere il significato dello stato.
Utilizza i messaggi di evento per trovare la causa dell'errore di pull dell'immagine.
Visualizza i log di Esplora log.

Visualizzare lo stato e gli eventi del pod

Per aiutarti a verificare che il pull di un'immagine non sia riuscito, GKE registra i seguenti stati per i pod:

ImagePullBackOff
ErrImagePull
ImageInspectError
InvalidImageName
RegistryUnavailable
SignatureValidationFailed

ImagePullBackOff e ErrImagePull sono gli stati più comuni.

Oltre a questi stati, gli eventi Kubernetes ti aiutano a trovare la causa degli errori di pull delle immagini.

Per verificare se il pull dell'immagine non va a buon fine, controlla i messaggi di stato e poi leggi i messaggi di evento selezionando una delle seguenti opzioni:

Console

Completa i seguenti passaggi:

Nella console Cloud de Confiance , vai alla pagina Workload.

Vai a Carichi di lavoro
Seleziona il workload che vuoi esaminare. Se non sai quale carico di lavoro devi esaminare, controlla la colonna Stato. Questa colonna indica i carichi di lavoro che presentano problemi.
Nella pagina Dettagli del workload, individua la sezione Pod gestiti e fai clic sul nome del pod con uno stato che indica un errore di pull dell'immagine.
Nella pagina Dettagli del pod, fai clic sulla scheda Eventi.
Esamina le informazioni nella tabella. La colonna Messaggio elenca gli eventi Kubernetes, che mostrano maggiori informazioni sui pull delle immagini non riusciti. La colonna Motivo elenca lo stato del pod.

kubectl

Completa i seguenti passaggi:

Visualizzare lo stato dei pod:
```
kubectl get pods -n NAMESPACE
```
Sostituisci NAMESPACE con lo spazio dei nomi in cui vengono eseguiti i tuoi pod.

L'output è simile al seguente:
```
NAME         READY   STATUS       RESTARTS      AGE
POD_NAME_1   2/2     Running      0             7d5h
POD_NAME_2   0/1     ErrImagePull 0             7d5h
```
La colonna Status indica i pod che hanno riscontrato un errore di pull dell'immagine.

Visualizza gli eventi per i pod con errori di pull delle immagini:

kubectl describe POD_NAME -n NAMESPACE

Sostituisci POD_NAME con il nome del pod che hai identificato nel passaggio precedente.

La sezione Events mostra ulteriori informazioni su cosa è successo durante gli eventuali pull di immagini non riusciti.

L'output è simile al seguente:

...
Events:
  Type    Reason    Age               From           Message
  ----    ------    ----              ----           -------
  Warning  Failed   5m (x4 over 7m)   kubelet, NODE  Failed to pull image "IMAGE_ADDRESS": rpc error: code = Unknown desc = Error response from daemon: repository IMAGE_ADDRESS not found
  Warning  Failed   5m (x4 over 7m)   kubelet, NODE  Error: ErrImagePull
  Normal   BackOff  5m (x6 over 7m)   kubelet, NODE  Back-off pulling image "IMAGE_ADDRESS"
  Warning  Failed   2m (x20 over 7m)  kubelet, NODE  Error: ImagePullBackOff

In questo output, IMAGE_ADDRESS è l'indirizzo completo dell'immagine. Ad esempio, us-west1-docker.pkg.dev/my-project/my-repo/test:staging.

Informazioni sul significato dello stato

Per comprendere meglio il significato dei diversi stati, consulta le seguenti descrizioni:

ImagePullBackOff: kubelet non è riuscito a estrarre l'immagine, ma continuerà a riprovare con un ritardo crescente (o backoff) fino a cinque minuti.
ErrImagePull: un errore generale e non recuperabile durante il processo di pull dell'immagine.
ImageInspectError: il runtime del container ha riscontrato un problema durante il tentativo di ispezionare l'immagine del container.
InvalidImageName: il nome dell'immagine container specificato nella definizione del pod non è valido.
RegistryUnavailable: il registro non è accessibile. In genere si tratta di un problema di connettività di rete.
SignatureValidationFailed: non è stato possibile verificare la firma digitale dell'immagine del container.

Utilizzare i messaggi di evento per trovare la causa dell'errore di pull dell'immagine

La tabella che segue elenca i messaggi di evento relativi agli errori di pull delle immagini e i passaggi per la risoluzione dei problemi da seguire se trovi uno di questi messaggi.

I messaggi relativi agli errori di pull delle immagini spesso hanno il seguente prefisso:

Failed to pull image "IMAGE_ADDRESS": rpc error: code = CODE = failed to pull and unpack image "IMAGE_ADDRESS": failed to resolve reference "IMAGE_ADDRESS":

Questo messaggio include i seguenti valori:

IMAGE_ADDRESS: l'indirizzo completo dell'immagine. Ad esempio, us-west1-docker.pkg.dev/my-project/my-repo/test:staging.
CODE: un codice di errore associato al messaggio di log. Ad esempio, NotFound o Unknown.

Alcune cause di errori di pull delle immagini non hanno un messaggio di evento correlato. Se non vedi nessuno dei messaggi relativi agli eventi nella tabella seguente, ma continui a riscontrare problemi di pull delle immagini, ti consigliamo di continuare a leggere il resto della pagina.

Messaggio di evento	Risoluzione dei problemi dettagliata
Autenticazione
`Failed to authorize: failed to fetch oauth token: unexpected status: 403 Forbidden` `Pulling from host HOST_NAME failed with status code: 403 Forbidden`	Verificare l'accesso all'immagine Verificare le impostazioni dei Controlli di servizio VPC per accedere ad Artifact Registry
`Failed to authorize: failed to fetch oauth token: unexpected status: 401 Unauthorized` `Unexpected status code [manifests 1.0]: 401 Unauthorized`	Verificare lo stato attivo dell'account di servizio del nodo Verifica l'ambito di accesso del nodo per il repository Artifact Registry privato
Connettività di rete
`Failed to do request: Head "IMAGE_ADDRESS": dial tcp: lookup gcr.io on REGISTRY_IP_ADDRESS: server misbehaving`	Esaminare la risoluzione DNS
`Failed to start Download and install k8s binaries and configurations`	Esamina la configurazione del firewall
`Failed to do request: Head "IMAGE_ADDRESS": dial tcp REGISTRY_IP_ADDRESS: i/o timeout`	Esamina la connettività a internet degli endpoint del registro esterno Verifica se la connessione alle API di Google va in timeout
Immagine non trovata
`"IMAGE_ADDRESS": not found` `Failed to copy: httpReadSeeker: failed open: could not fetch content descriptor sha256:SHA_HASH (application/vnd.docker.container.image.v1+json) from remote: not found`	Indaga sul motivo per cui kubelet non riesce a trovare l'immagine
Timeout dell'immagine
`Unknown desc = context canceled`	Indagare sul motivo per cui si verificano timeout di pull delle immagini o pull lenti delle immagini
Schema non compatibile
Failed to get converter for "IMAGE_ADDRESS": Pulling Schema 1 images have been deprecated and disabled by default since containerd v2.0. As a workaround you may set an environment variable `CONTAINERD_ENABLE_DEPRECATED_PULL_SCHEMA_1_IMAGE=1`, but this will be completely removed in containerd v2.1.	Verificare la compatibilità della versione dello schema delle immagini

Visualizzare i log di Esplora log

Per esaminare gli eventi di pull delle immagini storici o correlare gli errori di pull delle immagini con l'attività di altri componenti, visualizza i log con Esplora log:

Nella console Cloud de Confiance , vai alla pagina Esplora log.

Vai a Esplora log
Nel riquadro della query, inserisci la seguente query:
```
log_id("events")
resource.type="k8s_pod"
resource.labels.cluster_name="CLUSTER_NAME"
jsonPayload.message=~"Failed to pull image"
```
Sostituisci CLUSTER_NAME con il nome del cluster su cui viene eseguito il pod con errori di pull dell'immagine.
Fai clic su Esegui query ed esamina i risultati.

Esaminare le impostazioni di autenticazione

Le sezioni seguenti ti aiutano a verificare che l'ambiente GKE disponga delle impostazioni di autenticazione corrette per estrarre le immagini dal repository.

Per verificare se i problemi di autenticazione causano un problema di pull dell'immagine, esegui le indagini descritte nelle sezioni seguenti:

Verifica l'accesso all'immagine.
Verifica la configurazione di imagePullSecret e la specifica del deployment.
Verifica lo stato attivo dell'account di servizio del nodo.
Verifica l'ambito di accesso del nodo per il repository Artifact Registry privato
Verifica le impostazioni dei Controlli di servizio VPC per accedere ad Artifact Registry.

Verificare l'accesso all'immagine

Se riscontri un errore di pull dell'immagine 403 Forbidden, verifica che i componenti richiesti possano accedere all'immagine container.

Il metodo per verificare e applicare i ruoli necessari per concedere l'accesso richiesto varia a seconda del tipo di repository in cui sono archiviate le immagini. Per verificare e concedere l'accesso, seleziona una delle seguenti opzioni:

Artifact Registry

Se utilizzi un elemento imagePullSecret, il account di servizio collegato al secret deve disporre dell'autorizzazione di lettura per il repository. In caso contrario, il service account del pool di nodi deve disporre dell'autorizzazione.

Segui le istruzioni riportate nella documentazione IAM per visualizzare i ruoli assegnati al tuo service account.
Se il tuo account di servizio non dispone del ruolo IAM Lettore di Artifact Registry (roles/artifactregistry.reader), concedilo:
```
gcloud artifacts repositories add-iam-policy-binding REPOSITORY_NAME \
    --location=REPOSITORY_LOCATION \
    --member=serviceAccount:SERVICE_ACCOUNT_EMAIL \
    --role="roles/artifactregistry.reader"
```
Sostituisci quanto segue:
- REPOSITORY_NAME: il nome del repository Artifact Registry.
- REPOSITORY_LOCATION: la regione del tuo repository Artifact Registry.
- SERVICE_ACCOUNT_EMAIL: l'indirizzo email del account di servizio richiesto. Se non conosci l'indirizzo, elenca tutti gli indirizzi email degli account di servizio nel tuo progetto utilizzando il comando gcloud iam service-accounts list.

Container Registry

Segui le istruzioni riportate nella documentazione IAM per visualizzare i ruoli assegnati al tuo service account.
Se il tuo account di servizio non dispone del ruolo IAM Storage Object Viewer (roles/storage.objectViewer), concedilo in modo che il account di servizio possa leggere dal bucket:
```
gcloud storage buckets add-iam-policy-binding gs://BUCKET_NAME \
    --member=serviceAccount:SERVICE_ACCOUNT_EMAIL \
    --role=roles/storage.objectViewer
```
Sostituisci quanto segue:
- SERVICE_ACCOUNT_EMAIL: l'indirizzo email del account di servizio richiesto. Puoi elencare tutti i service account nel tuo progetto utilizzando il comando gcloud iam service-accounts list.
- BUCKET_NAME: il nome del bucket Cloud Storage che contiene le tue immagini. Puoi elencare tutti i bucket nel tuo progetto utilizzando il comando gcloud storage ls.

Se l'amministratore del registro ha configurato repository gcr.io in Artifact Registry per archiviare le immagini per il dominio gcr.io anziché Container Registry, devi concedere l'accesso in lettura ad Artifact Registry anziché a Container Registry.

Registry self-hosted

A seconda di come hai configurato il tuo registro autogestito, potresti aver bisogno di chiavi, certificati o entrambi per accedere all'immagine.

Se utilizzi le chiavi, utilizza un imagePullSecret. Gli imagePullSecret sono un modo sicuro per fornire al cluster le credenziali necessarie per accedere a un registro self-hosted. Per un esempio che mostra come configurare un imagePullSecret, vedi Pull an Image from a Private Registry nella documentazione di Kubernetes.

Per proteggere la connessione HTTPS al tuo registro, potresti aver bisogno anche di certificati, che verificano l'integrità della connessione al server remoto. Ti consigliamo di utilizzare Secret Manager per gestire la tua autorità di certificazione autofirmata. Per saperne di più, consulta la sezione Accedere ai registri privati con certificati CA privati.

Verifica la configurazione di imagePullSecret e la specifica del deployment

Se utilizzi un imagePullSecret, assicurati di aver creato un secret che contenga le credenziali di autenticazione per il pull delle immagini e che tutti i deployment specificano il secret che hai definito. Per ulteriori informazioni, consulta Specifica di imagePullSecrets in un pod nella documentazione di Kubernetes.

Verificare lo stato attivo del account di servizio del nodo

Se si verifica un errore di pull dell'immagine 401 Unauthorized, verifica che il account di servizio del nodo sia attivo. Anche se le autorizzazioni sono configurate correttamente, un account disattivato mostrerà questo errore. Per verificare lo stato attivo del account di servizio del nodo, seleziona una delle seguenti opzioni:

Console

Trova il nome del account di servizio utilizzato dai tuoi nodi:
1. Nella console Cloud de Confiance , vai alla pagina Cluster.
  
  Vai a Cluster
2. Nell'elenco dei cluster, fai clic sul nome del cluster che vuoi ispezionare.
3. Trova il nome del account di servizio del nodo.
  - Per i cluster in modalità Autopilot, nella sezione Sicurezza, trova il campo Service account.
  - Per i cluster in modalità Standard:
  1. Fai clic sulla scheda Nodi.
  2. Nella tabella Pool di nodi, fai clic sul nome di un pool di nodi. Viene visualizzata la pagina Dettagli node pool.
  3. Nella sezione Sicurezza, trova il campo Service account.
  Se il valore nel campo Service account è default, i nodi utilizzano il account di servizio predefinito di Compute Engine. Se il valore in questo campo non è default, i tuoi nodi utilizzano un account di servizio personalizzato.
Controlla se il account di servizio del nodo è disabilitato:
1. Nella Cloud de Confiance console, vai alla pagina Service account.
  
  Vai ad Account di servizio
2. Seleziona un progetto.
3. Cerca il nome del account di servizio che hai identificato nel passaggio precedente.
4. Controlla la colonna Stato per l'account. Se il account di servizio è disattivato, il suo stato è Disabled.

gcloud

Trova il nome del account di servizio utilizzato dai tuoi nodi:
- Per i cluster in modalità Autopilot, esegui questo comando:
```
gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --flatten=autoscaling.autoprovisioningNodePoolDefaults.serviceAccount
```
- Per i cluster in modalità Standard, esegui questo comando:
```
gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --format="table(nodePools.name,nodePools.config.serviceAccount)"
```
Se l'output è default, i nodi utilizzano il account di servizio Compute Engine predefinito. Se l'output non è default, i nodi utilizzano un account di servizio personalizzato.
Controlla se il account di servizio del nodo è disabilitato:
```
gcloud iam service-accounts list --filter="email:SERVICE_ACCOUNT_NAME AND disabled:true" \
--project=PROJECT_ID
```
Se il comando restituisce un output, il account di servizio è disabilitato.

Se il account di servizio è disabilitato, abilita il service account del nodo.

Verifica l'ambito di accesso del nodo per il repository Artifact Registry privato

Se memorizzi l'immagine container in un repository Artifact Registry privato, il nodo potrebbe non avere l'ambito di accesso corretto. In questi casi, potresti notare un errore di pull dell'immagine 401 Unauthorized.

Per verificare l'ambito di accesso e concederlo, se necessario, segui questi passaggi:

Identifica il nodo che esegue il pod:
```
kubectl describe pod POD_NAME | grep "Node:"
```
Sostituisci POD_NAME con il nome del pod che riscontra un errore di pull dell'immagine.
Verifica che il nodo identificato nel passaggio precedente abbia l'ambito di archiviazione corretto:
```
gcloud compute instances describe NODE_NAME \
    --zone="COMPUTE_ZONE" \
    --format="flattened(serviceAccounts[].scopes)"
```
Sostituisci quanto segue:
- NODE_NAME: il nome del nodo che hai identificato nel passaggio precedente.
- COMPUTE_ZONE: la zona Compute Engine a cui appartiene il nodo.
L'output deve contenere almeno uno dei seguenti ambiti di accesso:
- serviceAccounts[0].scopes[0]: https://www.googleapis.com/auth/devstorage.read_only
- serviceAccounts[0].scopes[0]: https://www.googleapis.com/auth/cloud-platform
Se il nodo non contiene uno di questi ambiti, il pull dell'immagine non va a buon fine.
Ricrea il pool di nodi a cui appartiene il nodo con un ambito sufficiente. Poiché non è possibile modificare i nodi esistenti, devi ricrearli con l'ambito corretto.

Ti consigliamo di creare il pool di nodi con l'ambito gke-default. Questo ambito fornisce l'accesso ai seguenti ambiti:
- https://www.googleapis.com/auth/devstorage.read_only
- https://www.googleapis.com/auth/logging.write
- https://www.googleapis.com/auth/monitoring
- https://www.googleapis.com/auth/service.management.readonly
- https://www.googleapis.com/auth/servicecontrol
- https://www.googleapis.com/auth/trace.append
Se l'ambito gke-default non è adatto, concedi al pool di nodi l'ambito devstorage.read_only, che consente l'accesso solo ai dati di lettura.
gke-default
Crea un pool di nodi con l'ambito gke-default:
```
gcloud container node-pools create NODE_POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location=CONTROL_PLANE_LOCATION \
    --scopes="gke-default"
```
Sostituisci quanto segue:
- NODE_POOL_NAME: il nome del nuovo pool di nodi.
- CLUSTER_NAME: il nome del tuo cluster esistente.
- CONTROL_PLANE_LOCATION: la posizione di Compute Engine del control plane del tuo cluster. Fornisci una regione per i cluster regionali o una zona per i cluster zonali.
devstorage.read_only
Crea un pool di nodi con l'ambito devstorage.read_only:
```
gcloud container node-pools create NODE_POOL_NAME \
    --cluster=CLUSTER_NAME \
    --location=CONTROL_PLANE_LOCATION \
    --scopes="https://www.googleapis.com/auth/devstorage.read_only"
```
Sostituisci quanto segue:
- NODE_POOL_NAME: il nome del nuovo pool di nodi.
- CLUSTER_NAME: il nome del tuo cluster esistente.
- CONTROL_PLANE_LOCATION: la posizione di Compute Engine del control plane del tuo cluster. Fornisci una regione per i cluster regionali o una zona per i cluster zonali.

Verifica le impostazioni dei Controlli di servizio VPC per accedere ad Artifact Registry

Se utilizzi Controlli di servizio VPC, assicurati che i perimetri di servizio consentano l'accesso ad Artifact Registry. Per scoprire di più, consulta Proteggere i repository in un perimetro di servizio nella documentazione di Artifact Registry.

Esaminare la connettività di rete

Durante il pull di un'immagine, la connettività di rete può impedire il completamento del processo.

Per verificare se i problemi di connettività di rete causano un problema di pull delle immagini, esegui le indagini descritte nelle sezioni seguenti:

Esamina la risoluzione DNS.
Esamina la configurazione del firewall.
Esamina la connettività a internet degli endpoint del registro esterno.
Verifica se la connessione alle API di Google è in timeout.

Esaminare la risoluzione DNS

Se viene visualizzato un errore di pull dell'immagine server misbehaving, la risoluzione DNS potrebbe essere la causa del mancato pull dell'immagine.

Per esaminare i problemi relativi alla risoluzione DNS, prova le seguenti soluzioni:

Risolvi i problemi del server di metadati. Il server di metadati del nodo risolve tutte le query DNS. Eventuali problemi che coinvolgono questo server possono interrompere la risoluzione dei nomi, impedendo la connessione al repository e causando l'errore del pull dell'immagine.
Se utilizzi Cloud DNS per la risoluzione DNS, assicurati che le zone private gestite, le zone di forwarding, le zone di peering e i criteri di risposta di Cloud DNS siano configurati correttamente. Errori di configurazione in queste aree possono interrompere la risoluzione DNS. Per scoprire di più su Cloud DNS, consulta Utilizzo di Cloud DNS per GKE. Per suggerimenti su come risolvere i problemi di Cloud DNS in GKE, consulta Risolvere i problemi di Cloud DNS in GKE.
Se utilizzi kube-dns per la risoluzione DNS, assicurati che funzioni correttamente. Per suggerimenti sulla risoluzione dei problemi di kube-dns, consulta Risolvere i problemi di kube-dns in GKE.
Se i nodi del cluster non hanno indirizzi IP esterni (il che è comune se utilizzi l'isolamento di rete), abilita l'accesso privato Google nella subnet utilizzata dal cluster e assicurati di soddisfare i requisiti di rete. Se utilizzi Cloud NAT, Cloud de Confiance by S3NS l'accesso privato Google viene abilitato automaticamente.

Esamina la configurazione del firewall

Quando un problema con il firewall causa l'errore del pull dell'immagine, potresti visualizzare il seguente messaggio di errore:

Failed to start Download and install k8s binaries and configurations

Diagnosticare i problemi relativi al firewall

Se utilizzi un cluster Standard e vuoi verificare se un problema con il firewall sta causando problemi con i pull delle immagini, segui questi passaggi:

Utilizza SSH per connetterti al nodo che presenta problemi:
```
gcloud compute ssh NODE_NAME --zone=ZONE_NAME
```
Sostituisci quanto segue:
- NODE_NAME: il nome del nodo.
- ZONE_NAME: la zona Compute Engine in cui è stato creato il nodo.

Invia i log più recenti per i servizi kube-node-installation.service e kube-node-configuration.service a file di testo denominati kube-node-installation_status.txt e kube-node-configuration_status.txt:

systemctl status kube-node-installation.service > kube-node-installation_status.txt
systemctl status kube-node-configuration.service > kube-node-configuration_status.txt

Se questi log non includono informazioni relative al momento in cui il pull dell'immagine non è riuscito, genera una copia completa dei log:

sudo journalctl -u kube-node-installation.service > kube-node-installation_logs.txt
sudo journalctl -u kube-node-configuration.service > kube-node-configuration_logs.txt

Esamina i contenuti dei file kube-node-installation_status.txt e kube-node-configuration_status.txt. Se nell'output viene visualizzato i/o timeout, il problema riguarda probabilmente il firewall.

Risolvere i problemi relativi alla configurazione del firewall

Per risolvere i problemi relativi al firewall, prova le seguenti soluzioni:

Identifica e risolvi eventuali regole firewall che bloccano il traffico di rete. Ad esempio, potresti avere una regola che blocca il traffico verso il registro che memorizza l'immagine.
1. Accedi ai log di flusso VPC:
  1. Nella console Cloud de Confiance , vai alla pagina Esplora log.
    
    Vai a Esplora log
  2. Nel riquadro della query, inserisci la seguente query:
```
resource.type="gce_subnetwork"
logName="projects/PROJECT_ID/logs/[compute.googleapis.com%2Fvpc_flows](http://compute.googleapis.com%2Fvpc_flows)"
resource.labels.subnetwork_name="SUBNET_NAME",
```
    Sostituisci quanto segue:
    - PROJECT_ID: l'ID del tuo Cloud de Confiance progetto.
    - SUBNET_NAME: il nome della tua subnet.
    Per saperne di più, consulta Accedere ai log di flusso utilizzando le query nella documentazione VPC.
2. Se trovi regole firewall che bloccano il traffico richiesto, aggiornale.
Se i nodi del cluster non hanno indirizzi IP esterni (il che è comune se utilizzi l'isolamento di rete), abilita l'accesso privato Google nella subnet utilizzata dal cluster e assicurati di soddisfare i requisiti di rete. Se utilizzi Cloud NAT, Cloud de Confiance by S3NS l'accesso privato Google viene abilitato automaticamente.

Esamina la connettività a internet degli endpoint del registro esterno

Se la configurazione di rete indirizza il traffico tramite un endpoint del registro esterno, questo endpoint potrebbe non avere connettività a internet. Quando l'endpoint non ha accesso, il pull dell'immagine potrebbe non riuscire e viene visualizzato un errore di pull dell'immagine i/o timeout.

Per verificare la connettività di rete dall'endpoint del registro esterno al registro, utilizza ping o traceroute:

ping REGISTRY_ENDPOINT

Oppure

traceroute REGISTRY_ENDPOINT

Sostituisci REGISTRY_ENDPOINT con l'endpoint del registro. Questo valore può essere un nome host o un indirizzo IP.

Se riscontri un errore di connettività, controlla le route VPC:

Nella console Cloud de Confiance , vai a Route.

Vai a Route
Esamina la colonna Priorità e assicurati che la route con la priorità più alta sia diretta a un'origine che ha accesso al registro. Le route con valori più bassi hanno la precedenza.

Verifica se la connessione alle API di Google va in timeout

Se utilizzi l'isolamento di rete, potresti riscontrare un errore in cui la connessione alle API e ai servizi Google scade, causando un errore di pull dell'immagine i/o timeout.

Questo errore si verifica perché i nodi non sono riusciti a raggiungere una delle seguenti API quando hanno tentato di estrarre le immagini dal registro:

containerregistry.googleapis.com
artifactregistry.googleapis.com

Per assicurarti di poterti connettere alle API richieste, prova le seguenti soluzioni:

Attiva l'accesso privato Google. I nodi senza indirizzi IP esterni richiedono l'accesso privato Google per raggiungere gli indirizzi IP esterni delle API e dei servizi Google.
Utilizza un dominio supportato.
Esamina i criteri firewall:
1. Nella console Cloud de Confiance , vai a Policy firewall.
  
  Vai a Criteri firewall
2. Verifica di avere regole che bloccano il traffico TCP in uscita sulla porta 443 a 199.36.153.4/30, 199.36.153.8/30 o a qualsiasi intervallo di indirizzi IP utilizzato dal dominio scelto per le API e i servizi Google. Gli intervalli di indirizzi IP 199.36.153.4/30 e 199.36.153.8/30 vengono utilizzati rispettivamente per l'accesso privato Google e l'accesso Google limitato. Il traffico TCP sulla porta 443 verso questi intervalli serve per accedere alle API e ai servizi Google.
  
  Se trovi una di queste regole, crea una regola firewall per il traffico in uscita per consentire questo traffico.
Se utilizzi Artifact Registry, assicurati che il tuo ambiente soddisfi i requisiti per l'utilizzo di Artifact Registry con l'isolamento di rete.
Verifica che gli indirizzi IP virtuali (VIP) (199.36.153.4/30 o 199.36.153.8/30) abbiano route VPC configurate:
1. Nella console Cloud de Confiance , vai a Reti VPC.
  
  Vai a Reti VPC
2. Nella colonna Nome, fai clic su default.
3. Nella pagina dei dettagli della rete VPC, fai clic sulla scheda Route.
4. Esamina la tabella delle rotte.
  
  Se la tua rete VPC contiene una route predefinita (destinazione 0.0.0.0/0 o ::0/0) e l'hop successivo per questa route è il gateway internet predefinito (Rete predefinita), utilizza questa route per consentire ai VIP di accedere alle API e ai servizi Google.
  
  Se hai sostituito una route predefinita con una route personalizzata il cui hop successivo non è il gateway internet predefinito, soddisfa i requisiti di routing per le API e i servizi Google utilizzando il routing personalizzato.

Indaga sul motivo per cui kubelet non riesce a trovare l'immagine

Quando kubelet non riesce a trovare l'immagine, potresti visualizzare un errore image not found e riscontrare errori di pull dell'immagine.

Per aiutare kubelet a trovare l'immagine, prova le seguenti soluzioni:

Controlla il manifest del tuo pod e assicurati che il nome dell'immagine e il tag immagine siano scritti correttamente. Eventuali errori di ortografia o formattazione causano l'esito negativo del pull dell'immagine.
Verifica che l'immagine esista ancora nel registro in cui l'hai archiviata. Se l'immagine ha un percorso del registro completo, verifica che esista nel registro Docker che utilizzi. Se fornisci solo il nome dell'immagine, controlla il registro Docker Hub.
Se il cluster utilizza l'isolamento di rete, prova le seguenti soluzioni:
1. Abilita l'accesso privato Google.
2. Verifica che il perimetro di servizio sia configurato correttamente.

Indaga sul motivo per cui si verificano timeout del pull delle immagini o pull lenti

Se utilizzi un'immagine molto grande per il tuo workload GKE, il pull dell'immagine potrebbe scadere e causare un errore context cancelled. Sebbene le immagini non abbiano un limite di dimensioni definito, l'errore context cancelled indica spesso che la causa è la dimensione dell'immagine.

Potresti anche notare estrazioni di immagini che non hanno esito negativo, ma richiedono molto più tempo del solito. Se vuoi avere una base di riferimento per i tempi di pull delle immagini regolari, controlla la voce di log Successfully pulled image. Ad esempio, il seguente messaggio di log mostra che il pull dell'immagine ha richiesto 30,313387996 secondi:

Successfully pulled image "IMAGE_ADDRESS" in 30.313387996s.

I timeout e i pull lenti delle immagini condividono molte delle stesse cause. Per risolvere questi problemi, prova le seguenti soluzioni:

Controlla se si sono verificate interruzioni del servizio. Se hai notato questo problema solo in un determinato periodo di tempo, verifica se si sono verificati Cloud de Confiance by S3NS interruzioni.
Controlla le prestazioni del disco. L'I/O del disco lento può aumentare i tempi di pull delle immagini. Valuta la possibilità di eseguire l'upgrade a dischi permanenti con SSD (pd-ssd) o di utilizzare dischi più grandi per migliorare le prestazioni. Per altri suggerimenti, vedi Risoluzione dei problemi relativi alle prestazioni del disco.
Riduci le dimensioni dell'immagine. Ad esempio, potresti essere in grado di spostare alcuni dati dalle immagini container ai volumi permanenti.
Sfrutta la memorizzazione nella cache delle immagini per ridurre i tempi di avvio dei pod. GKE memorizza nella cache le immagini sui nodi. Durante il pull di un'immagine, il runtime del container scarica solo i livelli non ancora presenti nella cache. Per massimizzare l'efficacia di questo meccanismo di memorizzazione nella cache e ridurre al minimo i tempi di pull delle immagini, struttura il Dockerfile in modo da inserire le parti dell'immagine che cambiano di frequente (come il codice dell'applicazione) verso la fine del file e utilizza immagini di base più piccole.
Abilita flusso immagine. Questa funzionalità può accelerare l'avvio del pod e il download delle immagini. Per saperne di più, consulta Utilizzo del flusso di immagini per eseguire il pull delle immagini container.
Assicurati che il account di servizio predefinito disponga delle autorizzazioni necessarie. La modifica dei ruoli assegnati alaccount di serviziot predefinito può interrompere i carichi di lavoro, incluso il pull delle immagini. Per ulteriori suggerimenti, consulta Identificare i cluster con service account del nodo a cui mancano autorizzazioni critiche.
Esamina le configurazioni proxy. Se esiste un proxy tra il cluster GKE e un repository non gestito da Google, potrebbe verificarsi una latenza.
Controlla il software di terze parti. Alcuni software di terze parti possono interferire con il recupero delle immagini. Verifica se eventuali strumenti installati di recente potrebbero causare conflitti.

Verifica che il manifest dell'immagine utilizzi l'architettura corretta

Se l'immagine che stai tentando di estrarre è stata creata per un'architettura del computer diversa da quella utilizzata dai tuoi pool di nodi, l'estrazione dell'immagine non va a buon fine.

Per verificare se il manifest dell'immagine utilizza l'architettura corretta, segui questi passaggi:

Per verificare quale architettura utilizza la tua immagine, visualizza il manifest dell'immagine. Ad esempio, per visualizzare un'immagine Docker, esegui questo comando:
```
docker manifest inspect --verbose IMAGE_NAME
```
Sostituisci IMAGE_NAME con il nome dell'immagine che vuoi visualizzare.

L'output è simile al seguente:
```
...
"Platform": {
          "architecture": "amd64",
          "os": "linux"
  }
...
```
In questo esempio, l'architettura supportata è amd64.
Esamina il tipo di macchina utilizzato dai tuoi pool di nodi:
```
gcloud container node-pools list --cluster CLUSTER_NAME --location CONTROL_PLANE_LOCATION
```
Sostituisci quanto segue:
- CLUSTER_NAME: il nome del cluster su cui viene eseguito il pod con errori di pull dell'immagine.
- CONTROL_PLANE_LOCATION: la posizione di Compute Engine del control plane del tuo cluster. Fornisci una regione per i cluster regionali o una zona per i cluster zonali.
L'output è simile al seguente:
```
NAME: example-node-pool
MACHINE_TYPE: e2-standard-2
DISK_SIZE_GB: 100
NODE_VERSION: 1.30.8-gke.1162000
```
In questo esempio, il tipo di macchina è e2-standard-2.
Confronta i valori nei campi architecture e MACHINE_TYPE e assicurati che entrambi i valori siano compatibili. Ad esempio, se l'immagine ha un'architettura amd64, sarebbe compatibile con un pool di nodi che utilizza e2-standard-2 come tipo di macchina. Tuttavia, se il pool di nodi utilizzato t2a-standard-1 (un tipo di macchina basato su Arm), questo tipo di macchina causerebbe un errore.
Se l'architettura dell'immagine non è compatibile con il tipo di macchina del pool di nodi, ricompila l'immagine in modo che abbia come target l'architettura richiesta.

Verifica la compatibilità della versione dello schema delle immagini

L'utilizzo di containerd 2.0 con un'immagine Docker schema v1 causa errori di pull delle immagini perché containerd 2.0 ha rimosso il supporto per il pull delle immagini Docker schema 1 in GKE 1.33. Quando questo problema è la causa dell'errore di pull dell'immagine, potresti visualizzare il seguente messaggio di errore:

Failed to get converter for "IMAGE_ADDRESS": Pulling Schema 1 images have been deprecated and disabled by default since containerd v2.0. As a workaround you may set an environment variable `CONTAINERD_ENABLE_DEPRECATED_PULL_SCHEMA_1_IMAGE=1`, but this will be completely removed in containerd v2.1.

Per risolvere il problema, identifica ed esegui la migrazione di queste immagini seguendo le istruzioni riportate in Eseguire la migrazione dalle immagini Docker Schema 1.

Passaggi successivi

Se non riesci a trovare una soluzione al tuo problema nella documentazione, consulta la sezione Richiedere assistenza per ulteriore aiuto, inclusi consigli sui seguenti argomenti:
- Aprire una richiesta di assistenza contattando l'assistenza clienti cloud.
- Ricevere assistenza dalla community ponendo domande su StackOverflow e utilizzando il tag google-kubernetes-engine per cercare problemi simili. Puoi anche unirti al canale Slack #kubernetes-engine per ulteriore assistenza della community.
- Apertura di bug o richieste di funzionalità utilizzando lo strumento di monitoraggio dei problemi pubblico.

Risolvere i problemi relativi ai pull delle immagini

Informazioni sui pull delle immagini

Ciclo di vita delle immagini

Opzioni di hosting delle immagini

Diagnosticare l'errore di pull dell'immagine

Visualizzare lo stato e gli eventi del pod

Console

kubectl

Informazioni sul significato dello stato

Utilizzare i messaggi di evento per trovare la causa dell'errore di pull dell'immagine

Visualizzare i log di Esplora log

Esaminare le impostazioni di autenticazione

Verificare l'accesso all'immagine

Artifact Registry

Container Registry

Registry self-hosted

Verifica la configurazione di imagePullSecret e la specifica del deployment

Verificare lo stato attivo del account di servizio del nodo

Console

gcloud

Verifica l'ambito di accesso del nodo per il repository Artifact Registry privato

`gke-default`

`devstorage.read_only`

Verifica le impostazioni dei Controlli di servizio VPC per accedere ad Artifact Registry

Esaminare la connettività di rete

Esaminare la risoluzione DNS

Esamina la configurazione del firewall

Diagnosticare i problemi relativi al firewall

Risolvere i problemi relativi alla configurazione del firewall

Esamina la connettività a internet degli endpoint del registro esterno

Verifica se la connessione alle API di Google va in timeout

Indaga sul motivo per cui kubelet non riesce a trovare l'immagine

Indaga sul motivo per cui si verificano timeout del pull delle immagini o pull lenti

Verifica che il manifest dell'immagine utilizzi l'architettura corretta

Verifica la compatibilità della versione dello schema delle immagini

Passaggi successivi