Google Kubernetes Engine(GKE)でサービスのスムーズな実行状態を維持できるよう、問題のトラブルシューティングを効果的に行う方法を学習します。Kubernetes の初心者でも経験豊富なユーザーでも、よくある問題をモニタリング、診断、解決するための体系的なアプローチを学ぶことができます。
次のツールと手法を使用して、GKE のトラブルシューティング スキルを高めます。
クラスタに影響を与える可能性のある、信頼性に関して進行中のインシデントについて、 Cloud de Confiance by S3NS サービスの健全性とインシデントを確認します。
潜在的な問題をすばやく特定するために、 Cloud de Confiance コンソールでクラスタとワークロードの健全性を評価します。
ノードや Pod などのリソースのライブ ステータスを確認するために、
kubectlコマンドライン ツールを使用してクラスタの状態を調査します。障害の根本原因を特定するために、Cloud Logging で履歴分析を実施します。
ユーザーに影響が及ぶ前に問題に対処するために、Cloud Monitoring で予防的モニタリングを行います。
Gemini Cloud Assist で診断を迅速化するために、ステップごとのガイダンスを受け取り、問題を自動的に調査します。
実際のアプリケーションの障害を診断して解決するために、トラブルシューティングのシナリオ例に沿って、これらのツールが連動する仕組みを学習します。
基本的な概念を理解する
Kubernetes と GKE を初めて使用する場合は、トラブルシューティングを開始する前に、クラスタ アーキテクチャや Pod とノードの関係などのコアコンセプトを理解することが不可欠です。詳細については、GKE の学習を開始するをご覧ください。
また、GKE のどの部分のメンテナンスをお客様が担当し、どの部分を Cloud de Confiance by S3NS が担当するのかを理解することも重要です。詳細については、GKE の共有責任をご覧ください。
次のステップ
Cloud de Confiance by S3NS サービスの健全性とインシデントを確認する(このシリーズの次のページ)を読む。
GKE のトラブルシューティング ガイドで特定の問題の解決に関するヒントを確認する。
このドキュメントに問題のソリューションが見当たらない場合は、サポートを受けるで、次のトピックに関するアドバイスなど、詳細なヘルプをご覧ください。
- Cloud カスタマーケアに問い合わせて、サポートケースを登録する。
- StackOverflow で質問する、
google-kubernetes-engineタグを使用して類似の問題を検索するなどして、コミュニティからサポートを受ける。#kubernetes-engineSlack チャネルに参加して、コミュニティ サポートを利用することもできます。 - 公開バグトラッカーを使用して、バグの報告や機能リクエストの登録を行う。