このページの一部またはすべての情報は、S3NS の Cloud de Confiance に適用されない場合があります。詳細については、Google Cloud との違いをご確認ください。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

GKE でのロードバランシングのトラブルシューティング

Autopilot Standard

Google Kubernetes Engine（GKE）でのロードバランシングの問題により、HTTP 502 エラーなどのサービスの中断が発生したり、アプリケーションへのアクセスが妨げられたりすることがあります。

このドキュメントでは、外部 Ingress からの 502 エラーのトラブルシューティング方法と、ロードバランサログや check-gke-ingress などの診断ツールを使用して問題を特定する方法について説明します。

この情報は、GKE でロードバランシングされたサービスを構成して維持するプラットフォーム管理者、運用担当者、アプリケーションデベロッパーにとって重要です。 Cloud de Confiance by S3NS のコンテンツで使用されている一般的なロールとタスクの例の詳細については、一般的な GKE ユーザーのロールとタスクをご覧ください。

外部 Ingress により HTTP 502 エラーが発生する

外部 Ingress リソースの HTTP 502 エラーのトラブルシューティングを行うには、次のガイダンスに従ってください。

Ingress によって参照される各 GKE Service に関連付けられている各バックエンドサービスのログを有効にします。
ステータスの詳細を使用して、HTTP 502 レスポンスの原因を特定します。バックエンドからの HTTP 502 レスポンスを示すステータスの詳細には、ロードバランサではなく、処理 Pod 内でのトラブルシューティングが必要です。

非マネージドインスタンスグループ

外部 Ingress が非マネージドインスタンスグループバックエンドを使用している場合、外部 Ingress リソースで HTTP 502 エラーが発生することがあります。この問題は、次のすべての条件が満たされている場合に発生します。

クラスターでは、すべてのノードプール内に多数のノードが含まれています。
Ingress によって参照される 1 つ以上の Service の処理 Pod が、少数のノードにのみ配置されています。
Ingress が参照する Service が externalTrafficPolicy: Local を使用します。

外部 Ingress が非マネージドインスタンスグループのバックエンドを使用しているかどうかを判断するには、次の操作を行います。

Cloud de Confiance コンソールの [Ingress] ページに移動します。

[Ingress] に移動
外部 Ingress の名前をクリックします。
ロードバランサの名前をクリックします。ロードバランシングの詳細ページが表示されます。
[バックエンドサービス] セクションの表で、外部 Ingress が NEG またはインスタンスグループのどちらを使用しているかを確認します。

この問題を解決するには、次のいずれかの解決策を使用します。

VPC ネイティブクラスタを使用します。
外部 Ingress が参照する Service ごとに externalTrafficPolicy: Cluster を使用します。この解決策では、パケットの送信元で元のクライアント IP アドレスが失われます。
node.kubernetes.io/exclude-from-external-load-balancers=true アノテーションを使用します。クラスタ内の外部 Ingress または LoadBalancer Service によって参照される Service の処理 Pod を実行していないノードまたはノードプールに、アノテーションを追加します。

L4 ロードバランサのロギング構成

このセクションでは、外部パススルーネットワークロードバランサまたは内部パススルーネットワークロードバランサのロギングを有効にした場合のトラブルシューティング情報を提供します。

ロギング構成のステータスをモニタリングする

GKE L4LB コントローラは、Service の status.conditions タイプを介してロギングの調整ステータスに関するフィードバックを提供します。このステータスは、次のコマンドを実行して確認できます。

kubectl get svc SERVICE_NAME -o yaml

次のように置き換えます。

SERVICE_NAME: クラスタの名前。

出力で LoggingConfigManaged 条件タイプを探します。次の表に、この条件の考えられる理由を示します。

条件のステータス	理由	説明
正しい	調整済み	コントローラは、L4LBConfig CRD で定義されたロギング構成をアクティブに適用しています。
False	管理対象外	`logging` セクションが L4LBConfig CRD にないか、アノテーションが削除されました。コントローラが管理を停止し、バックエンドサービスが最後の既知の状態のままになっています。
False	見つからない	Service アノテーションで参照されている L4LBConfig リソースが見つかりません。
False	無効	L4LBConfig リソースが `optionalFields` パラメータのクロス検証に失敗しました。
False	エラー	バックエンドサービスの調整中にエラーが発生しました。

コーストの動作について

Service マニフェストから networking.gke.io/l4lb-config アノテーションが削除された場合、または参照されている L4LBConfig リソースが削除された場合、構成は Coast 状態になります。

この状態では、GKE コントローラはロギング設定の管理を停止しますが、 Cloud de Confiance by S3NS バックエンドサービスをデフォルト設定にリセットしません。代わりに、バックエンドサービスは最後の既知の正常な状態にとどまります。通常、警告イベントは、Kubernetes が構成を制御しなくなったことを通知するために発行されます。

ロードバランサのログを使用してトラブルシューティングを行う

内部パススルーネットワークロードバランサのログと外部パススルーネットワークロードバランサのログを使用して、ロードバランサに関する問題のトラブルシューティングを行い、ロードバランサから GKE リソースへのトラフィックを関連付けることができます。

ログは接続ごとに集約され、ほぼリアルタイムでエクスポートされます。ログは、LoadBalancer Service のデータパスに関連する GKE ノードごとに、上り（内向き）トラフィックと下り（外向き）トラフィックの両方に対して生成されます。ログエントリには、次のような GKE リソースの追加フィールドが含まれます。

クラスタ名
クラスタのロケーション
サービス名
サービスの Namespace
Pod 名
Pod の Namespace

診断ツールを使用してトラブルシューティングを行う

check-gke-ingress 診断ツールは、一般的な構成の間違いについて Ingress リソースを検査します。check-gke-ingress ツールは次の方法で使用できます。

クラスタで gcpdiag コマンドラインツールを実行します。Ingress の結果がチェックルール gke/ERR/2023_004 セクションに表示されます。
check-gke-ingress ツールを単独で使用するか、または check-gke-ingress の手順に沿って kubectl プラグインとして使用します。

GKE でのロード バランシングのトラブルシューティング