このドキュメントでは、割り当て調整を使用して割り当てを調整する方法について説明します。
割り当て調整は、リソース消費量を監視し、ユーザーに代わって割り当ての調整リクエストをプロアクティブに送信します。リソース使用量をモニタリングし、割り当て調整リクエストを事前に送信することで、割り当て値に達したことによるサービスの停止を防ぐことができます。割り当て調整を使用すると、リソース使用量の予期しない増加を監視する必要がなくなり、割り当ての調整を手動でリクエストする回数を減らすことができます。
割り当て調整の仕組み
割り当て調整を有効にすると、該当するすべての割り当てがモニタリングされ、次のロジックが適用されます。
- 割り当て調整は、指定された期間にピーク使用量が割り当て値に近づいたかどうかを確認します。
- その場合、割り当て調整は割り当て値の引き上げを試みます(通常は 10~20%)。
割り当て値の引き上げが可能な場合は、その引き上げが承認され、割り当て値が調整されます。割り当て調整が有効であるかどうかにかかわらず、いつでも割り当て値の引き上げを手動でリクエストできます。
割り当て調整は、割り当て値を増やすための割り当て調整リクエストのみを送信します。引き下げは試みません。手動割り当て上限が設定されている割り当ての場合、割り当て調整は割り当て調整リクエストを送信しません。
割り当て調整によって行われたリクエストは、Trusted Cloud コンソールの [割り当てとシステム上限] ページで確認できます。割り当て調整によって開始された変更をモニタリングするためにアラートを設定することもできます。
制限事項
割り当て調整には次の制限があります。
- 割り当て調整の設定は、プロジェクト単位でのみ利用できます。
- 割り当て調整の設定には、Trusted Cloud コンソールからのみアクセスできます。
対象
割り当て調整は、追加の割り当てをいつリクエストすべきかを正確に判断するために、十分な量の履歴データを必要とします。このため、割り当て調整を有効にするオプションは、正確な予測をサポートするために十分な履歴アクティビティがあるプロジェクトでのみ使用できます。
割り当て調整による調整の対象となる割り当てのリストは、次の手順で表示できます。
Trusted Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。
[構成] タブをクリックしてリストを表示します。
または、次の表を検索するには、[キーワードで表をフィルタ] フィールドにキーワードを入力します。
サービス 割り当て Artifact Registry API アジアのマルチリージョンにおける 1 プロジェクト、1 分あたりのリクエスト数 Artifact Registry API ヨーロッパのマルチリージョンにおける 1 プロジェクト、1 分あたりのリクエスト数 Artifact Registry API 米国のマルチリージョンにおける 1 プロジェクト、1 分あたりリクエスト数 Artifact Registry API 1 リージョン、1 プロジェクト、1 分あたりのコンテンツ リクエスト数 Cloud Build API 1 分あたりのビルドとオペレーションの GET リクエスト数 Cloud Build API 1 ユーザー、1 分あたりのビルドとオペレーションの GET リクエスト数 Cloud Build API 同時ビルド CPU(リージョン デフォルト プール) Cloud Build API 同時ビルド(非リージョン デフォルト プール) Cloud Key Management Service API 1 分あたりの暗号リクエスト数 Cloud Key Management Service API 1 分あたりの読み取りリクエスト数 Cloud Key Management Service API 1 分あたりの書き込みリクエスト数 Cloud Logging API 1 リージョン、1 分あたりのログ書き込みバイト数 Cloud Resource Manager API 1 分あたりの読み取りリクエスト数 Cloud Run Admin API 1 リージョン、1 分あたりのジョブ実行リクエスト数 Cloud Run Admin API 1 リージョン、1 分あたりの読み取りリクエスト数 Cloud Run Admin API 1 リージョン、1 プロジェクトあたりの CPU の合計割り当て(ミリ vCPU) Cloud Run Admin API 1 リージョン、1 分あたりの書き込みリクエスト数 Cloud Trace API 1 分あたりの書き込みリクエスト数(無料) Compute Engine API アフィニティ グループ Compute Engine API バックエンド バケット Compute Engine API C2 CPU Compute Engine API C2D CPU Compute Engine API C3 CPU Compute Engine API コミットメント Compute Engine API コミット済み A2 CPU Compute Engine API コミット済み CPU Compute Engine API コミット済みライセンス数 Compute Engine API ローカル SSD ディスクの確約予約量(GB) Compute Engine API コミット済み M3 CPU Compute Engine API コミット済みメモリ最適化 CPU Compute Engine API コミット済み N2 CPU Compute Engine API コミット済み N2D CPU Compute Engine API コミット済み T2D CPU Compute Engine API CPU Compute Engine API VM ファミリーあたりの CPU Compute Engine API クロス プロジェクト ネットワーク サービス プロジェクト Compute Engine API VPC ネットワークあたりのカスタム静的ルート Compute Engine API 外部パススルー ネットワーク ロードバランサのバックエンド サービス Compute Engine API 外部パススルー ネットワーク ロードバランサの転送ルール Compute Engine API 外部プロトコルの転送ルール Compute Engine API ファイアウォール ルール Compute Engine API 転送ルール Compute Engine API グローバル外部マネージド バックエンド サービス Compute Engine API グローバル外部マネージド転送ルール Compute Engine API グローバル外部プロキシ LB バックエンド サービス Compute Engine API グローバル内部 Traffic Director バックエンド サービス Compute Engine API GPU ファミリーあたりの GPU 数 Compute Engine API GPU(すべてのリージョン) Compute Engine API ヘルスチェック Compute Engine API Hyperdisk Balanced の容量(GB) Compute Engine API イメージ Compute Engine API 使用中の IP アドレス Compute Engine API 使用中のリージョン外部 IPv4 アドレス Compute Engine API 使用中のスナップショット スケジュール Compute Engine API インスタンス グループ Compute Engine API インスタンス テンプレート Compute Engine API ピアリング グループあたりのインスタンス数 Compute Engine API VPC ネットワークあたりのインスタンス数 Compute Engine API 内部 IP アドレス Compute Engine API 内部パススルー ネットワーク ロードバランサのバックエンド サービス Compute Engine API ピアリング グループあたりの内部パススルー ネットワーク ロードバランサの転送ルール Compute Engine API VPC ネットワークあたりの内部パススルー ネットワーク ロードバランサの転送ルール Compute Engine API ピアリング グループあたりの IP エイリアス数 Compute Engine API VPC ネットワークあたりの IP エイリアス数 Compute Engine API VM ファミリーあたりのローカル SSD ディスク(GB) Compute Engine API M1 CPU Compute Engine API M2 CPU Compute Engine API M3 CPU Compute Engine API マネージド インスタンス グループ Compute Engine API N2 CPU Compute Engine API N2D CPU Compute Engine API ネットワーク エンドポイント グループ Compute Engine API ネットワーク ファイアウォール ポリシー Compute Engine API ネットワーク ロード バランシング セキュリティ ポリシー ルールの属性 Compute Engine API ネットワーク ロード バランシング セキュリティ ポリシー Compute Engine API ネットワーク Compute Engine API NVIDIA A2 CPU Compute Engine API VPC ネットワークあたりのピアリング Compute Engine API Persistent Disk IOPS Compute Engine API Persistent Disk SSD(GB) Compute Engine API Persistent Disk Standard(GB) Compute Engine API プリエンプティブル CPU Compute Engine API プリエンプティブル ローカル SSD(GB) Compute Engine API プリエンプティブル NVIDIA A100 80 GB GPU Compute Engine API プリエンプティブル NVIDIA A100 GPU Compute Engine API プリエンプティブル NVIDIA H100 GPU Compute Engine API プリエンプティブル NVIDIA H100 MEGA GPU Compute Engine API プリエンプティブル NVIDIA K80 GPU Compute Engine API プリエンプティブル NVIDIA L4 GPU Compute Engine API プリエンプティブル NVIDIA L4 仮想ワークステーション GPU Compute Engine API プリエンプティブル NVIDIA P100 GPU Compute Engine API プリエンプティブル NVIDIA P100 仮想ワークステーション GPU Compute Engine API プリエンプティブル NVIDIA P4 GPU Compute Engine API プリエンプティブル NVIDIA P4 仮想ワークステーション GPU Compute Engine API プリエンプティブル NVIDIA T4 GPU Compute Engine API プリエンプティブル NVIDIA T4 仮想ワークステーション GPU Compute Engine API プリエンプティブル NVIDIA V100 GPU Compute Engine API パブリック アドバタイズド プレフィックス Compute Engine API リージョン外部マネージド バックエンド サービス Compute Engine API VPC ネットワークあたりのリージョン外部マネージド転送ルール数 Compute Engine API リージョン インスタンス テンプレート Compute Engine API リージョン内部マネージド バックエンド サービス Compute Engine API リージョン内部 Traffic Director バックエンド サービス Compute Engine API リージョン マネージド インスタンス グループ Compute Engine API リージョン セキュリティ ポリシー Compute Engine API 詳細一致条件を含むリージョン セキュリティ ポリシー ルール Compute Engine API リージョン ターゲット TCP プロキシ Compute Engine API ルーター Compute Engine API ルート Compute Engine API セキュリティ ポリシー Compute Engine API セキュリティ ポリシー ルール Compute Engine API セキュリティ ポリシー ルールの言語ルール Compute Engine API スナップショット Compute Engine API SSL 証明書 Compute Engine API 静的 BYOIP IP アドレス Compute Engine API 静的 IP アドレス Compute Engine API ピアリング グループあたりのサブネット範囲 Compute Engine API VPC ネットワークあたりのサブネットワーク範囲 Compute Engine API T2A CPU Compute Engine API T2D CPU Compute Engine API ターゲット HTTP プロキシ Compute Engine API ターゲット HTTPS プロキシ Compute Engine API ターゲット SSL プロキシ Compute Engine API ターゲット TCP プロキシ Compute Engine API ターゲット VPN ゲートウェイ Compute Engine API ローカル SSD ディスクの合計予約量(GB) Compute Engine API URL マップ Compute Engine API VM インスタンス Compute Engine API VPN ゲートウェイ Compute Engine API VPN トンネル Connect Gateway API 1 分あたりの Gateway 接続リクエスト数 Dialogflow API 1 分あたりのその他のリクエスト数 Filestore API リージョンごとのバックアップ数 Filestore API リージョンあたりの基本 HDD(Standard)容量(GB) Filestore API リージョンあたりの基本 SSD(Premium)容量(GB) Filestore API リージョンあたりのゾーンとリージョンの 1~10 TiB(エンタープライズ)容量(GB) Filestore API リージョンあたりのゾーンとリージョンの 10~100 TiB(高スケール)容量(GB) Trusted Cloud by S3NS Memorystore for Redis API リージョンあたりの合計 Redis 容量(GB) Trusted Cloud Memorystore for Redis API 1 リージョン、1 プロジェクトあたりの Redis クラスタの合計ユニット数 Memorystore API 1 リージョン、1 プロジェクトあたりの Memorystore ユニットの合計数 Vertex AI API リージョンあたりのカスタムモデル提供 CPU Vertex AI API リージョンあたりのカスタムモデル提供 Nvidia T4 GPU Vertex AI API リージョンあたりのカスタムモデル トレーニング Nvidia T4 GPU Vertex AI API 1 プロジェクト、1 ベースモデル、1 分あたりのコンテンツ生成リクエスト数 Vertex AI API 1 プロジェクト、1 ベースモデル、1 分あたりのリージョン オンライン予測リクエスト数
注: 使用可能なディメンションの完全なリストを表示するには、 Trusted Cloud コンソールでこのエントリを開きます。
Vertex AI API 1 リージョン、1 分あたりのリソース管理(CRUD)リクエスト数 Vertex AI API リージョンあたりの制限付きイメージ トレーニング TPU V3 Pod コア
割り当て調整を有効にする
割り当て調整を有効にするには、次の IAM 権限が必要です。
cloudquotas.quotas.update
cloudquotas.quotas.get
Trusted Cloud コンソール プロジェクトで割り当て調整を有効にするには、適切なタブを選択し、手順に沿って操作します。
コンソール
Trusted Cloud コンソールから Trusted Cloud by S3NS プロジェクトでの割り当て調整を有効にするには、次の操作を行います。
- Trusted Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。
- [構成] タブをクリックします。
- [有効にする] トグルをクリックします。
[ステータス] 列に「有効」と表示されている場合、割り当て調整は使用量をモニタリングします。リソース使用量が割り当て値に近づくと、割り当て調整リクエストを発行します。
REST
REST API(プレビュー版)を使用して Trusted Cloud by S3NS プロジェクトでの割り当て調整を有効にするには、HTTP リクエストを送信して割り当て調整の設定を更新します。
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
リクエストの本文で、割り当て調整設定リソースを指定し、
enablement
フィールドをENABLED
に設定します。ETag を指定することもできますが、これは省略可能です。{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
次のように置き換えます。
PROJECT_ID_OR_NUMBER
: 割り当て調整機能を有効にするプロジェクトのプロジェクト ID またはプロジェクト番号。OPTIONAL_ETAG
: 割り当て調整設定のオプションの ETag 文字列(任意)。
これにより、有効化ステータスが
enabled
に更新されます。
gcloud
gcloud CLI(プレビュー)を使用して Trusted Cloud by S3NS プロジェクトでの割り当て調整を有効にするには、次の操作を行います。
gcloud CLI を使用して認証します。
gcloud auth login
割り当て調整の設定を有効にします。
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
PROJECT_ID_OR_NUMBER
は、割り当て調整機能を有効にするプロジェクトのプロジェクト ID またはプロジェクト番号に置き換えます。有効化ステータスを確認します。
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
必要な権限が付与されている限り、ステータスは
enabled
として返されます。
割り当て調整リクエストを表示する
割り当て調整リクエストを表示するには、次の IAM 権限が必要です。
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
割り当て調整によって発行された割り当て調整リクエストを表示するには:
- Trusted Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。
- [リクエストの増加] タブをクリックします。[リクエストの増加] ビューでは、プロジェクトに対するすべての増加リクエストを確認できます。手動でリクエストした増加と割り当て調整によってリクエストされた増加の両方を確認できます。
- [フィルタ] フィールドをクリックします。
- メニューから [タイプ] を選択し、「
Auto
」と入力します。これにより、割り当て調整によって行われたリクエストがフィルタされます。
割り当て調整アラートを設定する
割り当て調整からアラートを受け取るには:
- Trusted Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。
- [構成] タブをクリックします。
- [アラートを作成] をクリックします。
- アラート テンプレートのいずれかまたは両方を選択します。
- [割り当ての調整によるすべての調整] を選択すると、割り当て調整がこのプロジェクトの割り当て調整リクエストを発行するたびにアラートが送信されます。
- [割り当ての調整のエラーと失敗] を選択すると、割り当て調整が割り当て値を引き上げようとしたときにのみ、アラートが送信されます。
- 省略可: [オプションを表示] をクリックして、アラート間隔の最小時間とインシデントの自動クローズ期間のデフォルト値を調整できます。
- アラートを受信する通知チャンネルを選択します。通知チャンネルの設定を調整するか、新しい通知チャンネルを作成する場合は、[通知チャンネルを管理] をクリックします。
- [作成] をクリックします。
割り当て調整アラートを編集または削除する
割り当て調整アラートは、Trusted Cloud コンソールで編集または削除できます。
Cloud Monitoring コンソールの [ポリシー] ページに移動します。
割り当て調整アラート ポリシーを検索します。割り当て調整アラート ポリシーの名前は次のとおりです。
Quota adjuster errors and failures
All adjustments by quota adjuster
割り当て調整アラート ポリシーが表示されている行で、
[詳細を表示] をクリックします。[編集] または [削除] をクリックします。
割り当て調整を無効にする
割り当て調整を無効にするには、次の IAM 権限が必要です。
cloudquotas.quotas.update
cloudquotas.quotas.get
Trusted Cloud コンソールのプロジェクトで割り当て調整を無効にするには、適切なタブを選択し、手順に沿って操作します。
コンソール
- Trusted Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。
- [構成] タブをクリックします。
- [有効にする] トグルをクリックします。 切り替えボタンがグレーに変わります。
切り替えボタンがグレーになり、[ステータス] 列に「無効」と表示されている場合、割り当て調整で使用量のモニタリングや割り当て調整リクエストの送信は行われなくなります。
REST
REST API(プレビュー版)を使用して Trusted Cloud by S3NS プロジェクトでの割り当て調整を無効にするには、HTTP リクエストを送信して割り当て調整の設定を更新します。
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
リクエストの本文で、割り当て調整設定リソースを指定し、
enablement
フィールドをDISABLED
に設定します。ETag を指定することもできますが、これは省略可能です。{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
次のように置き換えます。
PROJECT_ID_OR_NUMBER
: 割り当て調整ツールを無効にするプロジェクトのプロジェクト ID またはプロジェクト番号。OPTIONAL_ETAG
: 割り当て調整設定のオプションの ETag 文字列(任意)。
これにより、有効化ステータスが
disabled
に更新されます。
gcloud
gcloud CLI(プレビュー)を使用して Trusted Cloud by S3NS プロジェクトでの割り当て調整を無効にするには、次の操作を行います。
gcloud CLI を認証します。
gcloud auth login
割り当て調整の設定を無効にします。
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
PROJECT_ID_OR_NUMBER
は、割り当て調整機能を無効にするプロジェクトのプロジェクト ID またはプロジェクト番号に置き換えます。有効化の状態を確認します。
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
必要な権限が付与されている限り、ステータスは
disabled
として返されます。
割り当て増加が拒否された場合のトラブルシューティング
割り当て調整によって開始された割り当ての増加が拒否されることがあります。これは、 Trusted Cloud by S3NS が特定のプロジェクト、リソース、リージョンの割り当てを特定の値を超えて増やすことができない場合に発生します。このような場合でも、手動での割り当ての増加をリクエストできます。
割り当て調整によって行われた割り当て調整リクエストが拒否されたときに通知を受け取るには、割り当て調整アラートを設定します。