Solução de problemas de escalonabilidade no GKE

O uso intenso do banco de dados etcd pode causar instabilidade no cluster e escassez de recursos, impedindo que os clusters do Google Kubernetes Engine (GKE) sejam escalonados de maneira eficaz.

Use este documento para aprender a identificar clusters em que o uso do etcd está se aproximando do limite e encontrar recomendações para liberar espaço, ajudando a garantir que o cluster permaneça estável.

Essas informações são importantes para administradores e operadores de plataforma responsáveis por manter a integridade e a escalonabilidade dos clusters do GKE. Para mais informações sobre as funções comuns e as tarefas de exemplo referenciadas no Cloud de Confiance by S3NS conteúdo, consulte Funções e tarefas de usuário comuns do GKE.

Este documento aborda a solução de problemas de estabilidade do cluster relacionados ao uso intenso do etcd. Se você tiver um problema de escalonabilidade diferente, um dos seguintes documentos poderá ajudar:

Identificar clusters em que o uso do etcd está se aproximando do limite

O GKE fornece insights e recomendações para o cenário em que o uso do etcd está se aproximando do limite. Você pode encontrar esses insights e recomendações das seguintes maneiras:

  • Use o Cloud de Confiance console. Acesse a página Clusters do Kubernetes. Na coluna Notificações de clusters específicos, procure a recomendação Liberar espaço para reduzir o risco de instabilidade do cluster.
  • Use a CLI gcloud ou a API Recommender especificando o subtipo de recomendador ETCD_DB_USAGE_APPROACHING_LIMIT.

    Para consultar essa recomendação, execute o seguinte comando:

    gcloud recommender recommendations list \
        --recommender=google.container.DiagnosisRecommender \
        --location=LOCATION \
        --project=PROJECT_ID \
        --format=yaml \
        --filter="recommenderSubtype:ETCD_DB_USAGE_APPROACHING_LIMIT"
    

Para implementar essa recomendação, remova todos os dados desnecessários do etcd para liberar espaço. Isso pode envolver a exclusão de recursos antigos ou a remoção de objetos grandes do etcd. Para mais informações, consulte Planejar para grandes clusters do GKE.

Identificar clusters em que o uso do armazenamento por tipo de objeto está se aproximando do limite

O GKE fornece insights e recomendações para o cenário em que o tamanho total dos objetos etcd por tipo está se aproximando do limite. Você pode encontrar esses insights e recomendações das seguintes maneiras:

  • Use o Cloud de Confiance console. Acesse a página Clusters do Kubernetes. Na coluna Notificações de clusters específicos, procure a recomendação Reduzir o tamanho dos tipos de recursos.
  • Use a CLI gcloud ou a API Recommender especificando o subtipo de recomendador APISERVER_RESOURCE_TYPE_SIZE_EXCEEDS_LIMIT.

    Para consultar essa recomendação, execute o seguinte comando:

    gcloud recommender recommendations list \
        --recommender=google.container.DiagnosisRecommender \
        --location=LOCATION \
        --project=PROJECT_ID \
        --format=yaml \
        --filter="recommenderSubtype:APISERVER_RESOURCE_TYPE_SIZE_EXCEEDS_LIMIT"
    

    Para decidir quais objetos remover, use o kubectl para listá-los. Por exemplo, se os ConfigMaps estiverem se aproximando do limite de armazenamento, o comando a seguir vai gerar todos os ConfigMaps em todos os namespaces, ajudando você a identificar candidatos para exclusão:

    kubectl get configmaps --all-namespaces > new_file.txt
    

Para implementar essa recomendação e liberar espaço, remova todos os objetos desnecessários dos tipos especificados do armazenamento. Esse processo pode envolver a exclusão de recursos antigos ou a remoção de objetos grandes do armazenamento. Para mais informações, consulte Planejar para grandes clusters do GKE.

A seguir