MIG 用のワークロード ポリシーを作成する

このドキュメントでは、A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(GPU 数 8)、または H4D Compute Engine インスタンスを含むマネージド インスタンス グループ(MIG)のポリシーを作成する方法について説明します。ワークロード ポリシーを作成するときに適用する要件と制限事項の詳細については、ワークロード ポリシーについてをご覧ください。

ワークロード ポリシーを使用すると、MIG 内の Compute Engine インスタンスの配置またはトポロジを指定できます。たとえば、ワークロード ポリシーを使用して、コンピューティング インスタンスを互いに近い場所に配置し、AI、ML、ハイ パフォーマンス コンピューティング(HPC)ワークロードのネットワーク レイテンシを最小限に抑えることができます。

始める前に

  • まだ設定していない場合は、認証を設定します。認証では、 Cloud de Confiance by S3NS サービスと API にアクセスするための ID が確認されます。ローカル開発環境からコードまたはサンプルを実行するには、次のいずれかのオプションを選択して Compute Engine に対する認証を行います。

    このページのサンプルをどのように使うかに応じて、タブを選択してください。

    gcloud

    1. Google Cloud CLI をインストールし、 フェデレーション ID を使用して gcloud CLI にログインします。ログイン後、次のコマンドを実行して Google Cloud CLI を初期化します。

      gcloud init
  • デフォルトのリージョンとゾーンを設定します。
  • REST

    このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。

      Google Cloud CLI をインストールし、 フェデレーション ID を使用して gcloud CLI にログインします。

    詳細については、 Cloud de Confiance 認証ドキュメントの REST を使用して認証するをご覧ください。

必要なロール

ワークロード ポリシーを作成して MIG に適用するために必要な権限を取得するには、プロジェクトに対する Compute インスタンス管理者(v1) roles/compute.instanceAdmin.v1)IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには、ワークロード ポリシーを作成して MIG に適用するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

ワークロード ポリシーを作成して MIG に適用するには、次の権限が必要です。

  • ワークロード ポリシーを作成する: プロジェクトに対する compute.resourcePolicies.create

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

ワークロード ポリシーの作成

ワークロード ポリシーを作成するには、MIG のコンピューティング インスタンスが使用するマシンシリーズに基づいて、次のいずれかの方法を使用します。

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成する

ワークロード ポリシーを MIG の A4X Max インスタンスまたは A4X インスタンスに適用する場合は、ポリシーの作成時にアクセラレータ トポロジの値を指定する必要があります。このアクションにより、ワークロードは大規模なノンブロッキング ネットワーク パフォーマンスを実現できます。

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、--accelerator-topology=1x72 フラグを指定して gcloud compute resource-policies create workload-policy コマンドを使用します。

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --accelerator-topology=1x72 \
    --type=high-throughput \
    --region=REGION

次のように置き換えます。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max または A4X マシンタイプを使用できるリージョンを確認するには、利用可能なリージョンとゾーンをご覧ください。

REST

A4X Max インスタンスまたは A4X インスタンスのワークロード ポリシーを作成するには、resourcePolicies.insert メソッドPOST リクエストを送信します。リクエストの本文に、1x72 に設定された acceleratorTopology フィールドを含めます。

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "acceleratorTopology": "1x72",
    "type": "HIGH_THROUGHPUT"
  }
}

次のように置き換えます。

  • PROJECT_ID: ワークロード ポリシーを作成するプロジェクトの ID。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。A4X Max または A4X マシンタイプを使用できるリージョンを確認するには、利用可能なリージョンとゾーンをご覧ください。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、または H4D インスタンスのワークロード ポリシーを作成する

ワークロード ポリシーを MIG の A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、H4D インスタンスに適用する場合は、ポリシーの作成時に最大トポロジ距離値を指定することをおすすめします。このアクションにより、コンピューティング インスタンス間の配置をより緊密にできます。ただし、指定するプレースメントがコンパクトであるほど、コンピューティング インスタンスを作成するゾーンで使用可能なリソースが少なくなる可能性があります。

A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)インスタンスのワークロード ポリシーを作成するには、次のいずれかのオプションを選択します。

gcloud

ワークロード ポリシーを作成するには、gcloud compute resource-policies create workload-policy コマンドを使用します。MIG 内のコンピューティング インスタンスをどの程度近くに配置するかに基づいて、コマンドに次のフラグを含めます。

  • コンピューティング インスタンスをベスト エフォートで互いに近接して配置するには、--type=high-throughput フラグを指定します。

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --type=high-throughput \
        --region=REGION
    
  • コンピューティング インスタンスの配置をさらに制御するには、--max-topology-distance フラグと --type=high-throughput フラグを指定します。

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --max-topology-distance=TOPOLOGY_DISTANCE \
        --type=high-throughput \
        --region=REGION
    

次のように置き換えます。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できるリージョンを確認するには、使用可能なリージョンとゾーンをご覧ください。

  • TOPOLOGY_DISTANCE: トポロジの最大距離。最大距離を短くすると、VM の可用性が低下する可能性があります。次のいずれかの値を指定します。

    • A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには: CLUSTER

    • A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、または H4D インスタンスを同じブロックに配置するには: BLOCK

    • A4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには: SUBBLOCK

REST

ワークロード ポリシーを作成するには、resourcePolicies.insert メソッドPOST リクエストを送信します。MIG 内のコンピューティング インスタンスの配置の近接性に基づいて、リクエスト本文に次のフィールドを含めます。

  • コンピューティング インスタンスをベスト エフォートで近い位置に配置するには、リクエスト本文に type フィールドを含めます。

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "type": "HIGH_THROUGHPUT"
      }
    }
    
  • コンピューティング インスタンスの配置をさらに制御するには、リクエストの本文に maxTopologyDistance フィールドと type フィールドを含めます。

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "maxTopologyDistance": "TOPOLOGY_DISTANCE",
        "type": "HIGH_THROUGHPUT"
      }
    }
    

次のように置き換えます。

  • PROJECT_ID: ワークロード ポリシーを作成するプロジェクトの ID。

  • REGION: ワークロード ポリシーを作成するリージョン。使用するマシンタイプが利用可能で、MIG を作成するリージョンを指定します。GPU マシンタイプを使用できるリージョンを確認するには、使用可能なリージョンとゾーンをご覧ください。

  • WORKLOAD_POLICY_NAME: ワークロード ポリシーの名前。

  • TOPOLOGY_DISTANCE: トポロジの最大距離。最大距離を短くすると、VM の可用性が低下する可能性があります。次のいずれかの値を指定します。

    • A4 インスタンスまたは H4D インスタンスを同じクラスタに配置するには: CLUSTER

    • A4、A3 Ultra、A3 Mega、A3 High(8 個の GPU)、または H4D インスタンスを同じブロックに配置するには: BLOCK

    • A4、A3 Ultra、H4D インスタンスを同じサブブロックに配置するには: SUBBLOCK

次のステップ