予約バインドモデルを使用してインスタンスを作成する

このドキュメントでは、予約バインド プロビジョニング モデルを使用してスタンドアロン Compute Engine インスタンスを作成する方法について説明します。このプロビジョニング モデルでは、事前に予約された容量を消費して A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(GPU 数 8)、A3 Edge、H4D インスタンスを作成できます。

予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するその他の方法については、 AI Hypercomputer のドキュメントのデプロイ オプションの概要をご覧ください。

始める前に

必要なロール

予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者(v1) roles/compute.instanceAdmin.v1)の IAM ロールを付与するよう管理者に依頼します。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。

この事前定義ロールには 予約バインド プロビジョニング モデルを使用してコンピューティングインスタンスを作成するために必要な権限が含まれています。必要とされる正確な権限については、必要な権限セクションを開いてご確認ください。

必要な権限

予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、次の権限が必要です。

  • compute.instances.create プロジェクトに対する
  • カスタム イメージを使用して VM を作成する: イメージに対する compute.images.useReadOnly
  • スナップショットを使用して VM を作成する: スナップショットに対する compute.snapshots.useReadOnly
  • インスタンス テンプレートを使用して VM を作成する: インスタンス テンプレートに対する compute.instanceTemplates.useReadOnly
  • VM のサブネットを指定する: プロジェクトまたは選択したサブネットに対する compute.subnetworks.use
  • VM の静的 IP アドレスを指定する: プロジェクトに対する compute.addresses.use
  • VPC ネットワークの使用時に VM に外部 IP アドレスを割り当てる: プロジェクトまたは選択したサブネットに対する compute.subnetworks.useExternalIp
  • VM にレガシー ネットワークを割り当てる: プロジェクトに対する compute.networks.use
  • レガシー ネットワークを使用する際に VM に外部 IP アドレスを割り当てる: プロジェクトに対する compute.networks.useExternalIp
  • VM の VM インスタンス メタデータを設定する: プロジェクトに対する compute.instances.setMetadata
  • VM にタグを設定する: VM に対する compute.instances.setTags
  • VM にラベルを設定する: VM に対する compute.instances.setLabels
  • VM が使用するサービス アカウントを設定する: VM に対する compute.instances.setServiceAccount
  • VM 用の新しいディスクを作成する: プロジェクトに対する compute.disks.create
  • 既存のディスクを読み取り専用モードまたは読み取り / 書き込みモードでアタッチする: ディスクに対する compute.disks.use
  • 既存のディスクを読み取り専用モードでアタッチする: ディスクに対する compute.disks.useReadOnly

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

予約バインド プロビジョニング モデルを使用するインスタンスを作成する

予約バインド プロビジョニング モデルを使用して A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(GPU 数 8)、H4D インスタンスを作成するには、使用する自動作成予約が開始時間に達するまで待つ必要があります。 また、作成するコンピューティング インスタンスは、次のすべての要件を満たしている必要があります。

次の例では、5 つの A3 Ultra インスタンスのカレンダー モードで将来の予約リクエストを作成し、リクエストの自動作成された予約を消費して A3 Ultra インスタンスを作成します。

予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスの例を作成するには、次のいずれかのオプションを選択します。

コンソール

  1. 5 つの A3 Ultra インスタンスのサンプル リクエストを作成し、審査用に送信します。

    1. Cloud de Confiance コンソールで、[予約] ページに移動します。

      [予約] に移動

    2. [将来の予約] タブをクリックします。

    3. [将来の予約を作成] をクリックします。[将来の予約を作成] ページが開きます。

    4. [GPU] タブをクリックしてから、[GPU のタイプ] リストで [NVIDIA H200 141 GB] を選択します。このアクションは、A3 Ultra インスタンスを指定します。

    5. [必要な総容量] フィールドに「5」と入力します。

    6. [予約期間] セクションで、予約期間の開始時間と期間を指定します。

    7. [容量を検索] をクリックし、 [使用可能な容量] セクションで使用可能な マシンを選択します。

    8. [作成] をクリックします。

  2. リクエストの開始日時に、サンプルの自動作成された予約を消費する A3 Ultra インスタンスを作成するには、次のように操作します。

    1. コンソールで [インスタンスの作成] ページに移動します。 Cloud de Confiance

      [インスタンスの作成] に移動

    2. [名前] フィールドに、コンピューティング インスタンスの名前を入力します。この例では、「example-instance」と入力します。

    3. 自動作成予約が存在するリージョンゾーン を指定します。この例では、それぞれ [us-central1] と [us-central1-b] を選択しています。

    4. [GPU] タブをクリックしてから、[GPU のタイプ] リストで [NVIDIA H200 141 GB] を選択します。このアクションは、A3 Ultra インスタンスを指定し、そのプロビジョニング モデルを [予約で制限] に設定します。

    5. ナビゲーション メニューで、[詳細設定] をクリックします。

    6. [予約] セクションで [予約を選択] を選択し、[予約を選択] をクリックします。

    7. [予約を選択] ペインで、次のように操作します。

      1. 自動作成予約の例を選択します。

      2. [選択] をクリックします。

    8. [プロビジョニング モデル] セクションで、[VM プロビジョニング モデルの詳細設定] セクションを開きます。

    9. [VM の終了時] リストで、[停止](デフォルト)または [削除] を選択します。

    10. [作成] をクリックします。

gcloud

  1. 5 つの A3 Ultra インスタンスのサンプル リクエストを作成して審査用に送信するには、 gcloud beta compute future-reservations create コマンドを使用します。

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    がリクエストを承認し、 Compute Engine によって空の予約が自動的に作成されるとします。 Cloud de Confiance リクエスト開始日時の 2026 年 3 月 5 日に、Compute Engine は予約にある予約済み GPU インスタンスの数を増やします。これで、予約を使用できます。

  2. リクエストの開始日時に、 サンプルの自動作成された予約を消費する A3 Ultra インスタンスを作成するには、 gcloud compute instances create コマンド で次のフラグを指定します。

    • --instance-termination-action フラグ。

    • --provisioning-model フラグ。RESERVATION_BOUND に設定します。

    • --reservation フラグ。

    • --reservation-affinity フラグ。specific に設定します。

    このコマンドは次のようになります。A3 Ultra インスタンスを作成するための要件の詳細については、代わりに A3 Ultra インスタンスまたは A4 インスタンスを作成するをご覧ください。

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    このコマンドでは次の値が指定されています。

    • TERMINATION_ACTION: 予約期間の終了時に Compute Engine によってコンピューティング インスタンスを停止(STOP)するか削除(DELETE)するかの指定。

    • RESERVATION_URL: 予約の URL。次の形式で指定します。

      • 自動作成された予約がこのプロジェクトに存在する場合: example-reservation

      • 自動作成された予約が別のプロジェクトに存在する場合: projects/PROJECT_ID/reservations/example-reservation

REST

  1. 5 つの A3 Ultra インスタンスのサンプル リクエストを作成して審査用に送信するには、ベータ版の futureReservations.insert メソッドPOST リクエストを送信します。

    POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    がリクエストを承認し、 Compute Engine によって空の予約が自動的に作成されるとします。 Cloud de Confiance リクエスト開始日時の 2026 年 3 月 5 日に、Compute Engine は予約にある予約済み GPU インスタンスの数を増やします。これで、予約を使用できます。

  2. リクエストの開始日時に、 サンプルの自動作成された予約を消費する A3 Ultra インスタンスを作成するには、POST リクエストを instances.insert メソッドに送信します。 リクエスト本文で、次のフィールドを指定します。

    • SPECIFIC_RESERVATION に設定した reservationAffinity.consumeReservationType フィールド。

    • reservationAffinity.key フィールド。compute.googleapis.com/reservation-name に設定します。

    • reservationAffinity.values フィールド。予約の URL に設定します。

    • scheduling.instanceTerminationAction フィールド。

    • scheduling.provisioningModel フィールド。RESERVATION_BOUND に設定します。

    このリクエストは次のようになります。A3 Ultra インスタンスを作成するための要件の詳細については、代わりに A3 Ultra インスタンスまたは A4 インスタンスを作成するをご覧ください。

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    リクエスト本文では次の値が指定されています。

    • RESERVATION_URL: 予約の URL。次の形式で指定します。

      • 自動作成された予約がこのプロジェクトに存在する場合: example-reservation

      • 自動作成された予約が別のプロジェクトに存在する場合: projects/PROJECT_ID/reservations/example-reservation

    • TERMINATION_ACTION: 予約期間の終了時に Compute Engine によってコンピューティング インスタンスを停止(STOP)するか削除(DELETE)するかの指定。

次のステップ