このドキュメントでは、予約バインド プロビジョニング モデルを使用してスタンドアロン Compute Engine インスタンスを作成する方法について説明します。このプロビジョニング モデルでは、事前に予約された容量を消費して A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(GPU 数 8)、A3 Edge、H4D インスタンスを作成できます。
予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するその他の方法については、 AI Hypercomputer のドキュメントのデプロイ オプションの概要をご覧ください。
始める前に
-
まだ設定していない場合は、認証を設定します。認証では、 Cloud de Confiance by S3NS サービスと API にアクセスするための ID が確認されます。ローカル開発環境からコードまたはサンプルを実行するには、次のいずれかのオプションを選択して Compute Engine に対する認証を行います。
このページのサンプルをどのように使うかに応じて、タブを選択してください。
コンソール
コンソールを使用してサービスと API にアクセスする場合、認証を設定する必要はありません。 Cloud de Confiance Cloud de Confiance by S3NS
gcloud
-
Google Cloud CLI をインストールし、 フェデレーション ID を使用して gcloud CLI にログインします。 ログイン後、 初期化するには、次のコマンドを実行して Google Cloud CLI を初期化します。
gcloud init
-
- デフォルトのリージョンとゾーンを設定します。
REST
このページの REST API サンプルをローカル開発環境で使用するには、 gcloud CLI に指定した認証情報を使用します。
詳細については、 REST を使用して認証する 認証ドキュメントの Cloud de Confiance をご覧ください。
必要なロール
予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するために必要な権限を取得するには、プロジェクトに対するCompute インスタンス管理者(v1) (roles/compute.instanceAdmin.v1)の IAM ロールを付与するよう管理者に依頼します。ロールの付与については、プロジェクト、フォルダ、組織に対するアクセス権の管理をご覧ください。
この事前定義ロールには 予約バインド プロビジョニング モデルを使用してコンピューティングインスタンスを作成するために必要な権限が含まれています。必要とされる正確な権限については、必要な権限セクションを開いてご確認ください。
必要な権限
予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスを作成するには、次の権限が必要です。
-
compute.instances.createプロジェクトに対する -
カスタム イメージを使用して VM を作成する: イメージに対する
compute.images.useReadOnly -
スナップショットを使用して VM を作成する: スナップショットに対する
compute.snapshots.useReadOnly -
インスタンス テンプレートを使用して VM を作成する: インスタンス テンプレートに対する
compute.instanceTemplates.useReadOnly -
VM のサブネットを指定する: プロジェクトまたは選択したサブネットに対する
compute.subnetworks.use -
VM の静的 IP アドレスを指定する: プロジェクトに対する
compute.addresses.use -
VPC ネットワークの使用時に VM に外部 IP アドレスを割り当てる: プロジェクトまたは選択したサブネットに対する
compute.subnetworks.useExternalIp -
VM にレガシー ネットワークを割り当てる: プロジェクトに対する
compute.networks.use -
レガシー ネットワークを使用する際に VM に外部 IP アドレスを割り当てる: プロジェクトに対する
compute.networks.useExternalIp -
VM の VM インスタンス メタデータを設定する: プロジェクトに対する
compute.instances.setMetadata -
VM にタグを設定する: VM に対する
compute.instances.setTags -
VM にラベルを設定する: VM に対する
compute.instances.setLabels -
VM が使用するサービス アカウントを設定する: VM に対する
compute.instances.setServiceAccount -
VM 用の新しいディスクを作成する: プロジェクトに対する
compute.disks.create -
既存のディスクを読み取り専用モードまたは読み取り / 書き込みモードでアタッチする: ディスクに対する
compute.disks.use -
既存のディスクを読み取り専用モードでアタッチする: ディスクに対する
compute.disks.useReadOnly
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
予約バインド プロビジョニング モデルを使用するインスタンスを作成する
予約バインド プロビジョニング モデルを使用して A4X Max、A4X、A4、A3 Ultra、A3 Mega、A3 High(GPU 数 8)、H4D インスタンスを作成するには、使用する自動作成予約が開始時間に達するまで待つ必要があります。 また、作成するコンピューティング インスタンスは、次のすべての要件を満たしている必要があります。
コンピューティング インスタンスと予約のプロパティが 一致していること。
コンピューティング インスタンスが 予約を明示的に消費対象とすること。
コンピューティング インスタンスが予約の終了日時に 停止または削除されること。
次の例では、5 つの A3 Ultra インスタンスのカレンダー モードで将来の予約リクエストを作成し、リクエストの自動作成された予約を消費して A3 Ultra インスタンスを作成します。
予約バインド プロビジョニング モデルを使用してコンピューティング インスタンスの例を作成するには、次のいずれかのオプションを選択します。
コンソール
5 つの A3 Ultra インスタンスのサンプル リクエストを作成し、審査用に送信します。
Cloud de Confiance コンソールで、[予約] ページに移動します。
[将来の予約] タブをクリックします。
[将来の予約を作成] をクリックします。[将来の予約を作成] ページが開きます。
[GPU] タブをクリックしてから、[GPU のタイプ] リストで [NVIDIA H200 141 GB] を選択します。このアクションは、A3 Ultra インスタンスを指定します。
[必要な総容量] フィールドに「
5」と入力します。[予約期間] セクションで、予約期間の開始時間と期間を指定します。
[容量を検索] をクリックし、 [使用可能な容量] セクションで使用可能な マシンを選択します。
[作成] をクリックします。
リクエストの開始日時に、サンプルの自動作成された予約を消費する A3 Ultra インスタンスを作成するには、次のように操作します。
コンソールで [インスタンスの作成] ページに移動します。 Cloud de Confiance
[名前] フィールドに、コンピューティング インスタンスの名前を入力します。この例では、「
example-instance」と入力します。自動作成予約が存在するリージョン とゾーン を指定します。この例では、それぞれ [us-central1] と [us-central1-b] を選択しています。
[GPU] タブをクリックしてから、[GPU のタイプ] リストで [NVIDIA H200 141 GB] を選択します。このアクションは、A3 Ultra インスタンスを指定し、そのプロビジョニング モデルを [予約で制限] に設定します。
ナビゲーション メニューで、[詳細設定] をクリックします。
[予約] セクションで [予約を選択] を選択し、[予約を選択] をクリックします。
[予約を選択] ペインで、次のように操作します。
自動作成予約の例を選択します。
[選択] をクリックします。
[プロビジョニング モデル] セクションで、[VM プロビジョニング モデルの詳細設定] セクションを開きます。
[VM の終了時] リストで、[停止](デフォルト)または [削除] を選択します。
[作成] をクリックします。
gcloud
5 つの A3 Ultra インスタンスのサンプル リクエストを作成して審査用に送信するには、
gcloud beta compute future-reservations createコマンドを使用します。gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-setting=local \ --start-time=2026-03-05T00:00:00Z \ --end-time=2026-03-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-bがリクエストを承認し、 Compute Engine によって空の予約が自動的に作成されるとします。 Cloud de Confiance リクエスト開始日時の 2026 年 3 月 5 日に、Compute Engine は予約にある予約済み GPU インスタンスの数を増やします。これで、予約を使用できます。
リクエストの開始日時に、 サンプルの自動作成された予約を消費する A3 Ultra インスタンスを作成するには、
gcloud compute instances createコマンド で次のフラグを指定します。--instance-termination-actionフラグ。--provisioning-modelフラグ。RESERVATION_BOUNDに設定します。--reservationフラグ。--reservation-affinityフラグ。specificに設定します。
このコマンドは次のようになります。A3 Ultra インスタンスを作成するための要件の詳細については、代わりに A3 Ultra インスタンスまたは A4 インスタンスを作成するをご覧ください。
gcloud compute instance create example-a3ultra-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-b \ ...このコマンドでは次の値が指定されています。
TERMINATION_ACTION: 予約期間の終了時に Compute Engine によってコンピューティング インスタンスを停止(STOP)するか削除(DELETE)するかの指定。RESERVATION_URL: 予約の URL。次の形式で指定します。自動作成された予約がこのプロジェクトに存在する場合:
example-reservation。自動作成された予約が別のプロジェクトに存在する場合:
projects/PROJECT_ID/reservations/example-reservation。
REST
5 つの A3 Ultra インスタンスのサンプル リクエストを作成して審査用に送信するには、ベータ版の
futureReservations.insertメソッドにPOSTリクエストを送信します。POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2026-03-05T00:00:00Z", "endTime": "2026-03-19T00:00:00Z" } }がリクエストを承認し、 Compute Engine によって空の予約が自動的に作成されるとします。 Cloud de Confiance リクエスト開始日時の 2026 年 3 月 5 日に、Compute Engine は予約にある予約済み GPU インスタンスの数を増やします。これで、予約を使用できます。
リクエストの開始日時に、 サンプルの自動作成された予約を消費する A3 Ultra インスタンスを作成するには、
POSTリクエストをinstances.insertメソッドに送信します。 リクエスト本文で、次のフィールドを指定します。SPECIFIC_RESERVATIONに設定したreservationAffinity.consumeReservationTypeフィールド。reservationAffinity.keyフィールド。compute.googleapis.com/reservation-nameに設定します。reservationAffinity.valuesフィールド。予約の URL に設定します。scheduling.instanceTerminationActionフィールド。scheduling.provisioningModelフィールド。RESERVATION_BOUNDに設定します。
このリクエストは次のようになります。A3 Ultra インスタンスを作成するための要件の詳細については、代わりに A3 Ultra インスタンスまたは A4 インスタンスを作成するをご覧ください。
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances { { "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g", "name": "example-a3ultra-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }リクエスト本文では次の値が指定されています。
RESERVATION_URL: 予約の URL。次の形式で指定します。自動作成された予約がこのプロジェクトに存在する場合:
example-reservation。自動作成された予約が別のプロジェクトに存在する場合:
projects/PROJECT_ID/reservations/example-reservation。
TERMINATION_ACTION: 予約期間の終了時に Compute Engine によってコンピューティング インスタンスを停止(STOP)するか削除(DELETE)するかの指定。