カレンダー モードで将来の予約リクエストを作成する

このドキュメントでは、カレンダー モードで将来の予約リクエストを作成する方法について説明します。このタイプの予約の詳細については、カレンダー モードでの将来の予約リクエストの概要をご覧ください。

カレンダー モードで将来の予約リクエストを作成して、次のリソースを最大 90 日間予約します。

  • GPU をアタッチした仮想マシン(VM)インスタンスは最大 80 個。

  • 最大 1,024 個の TPU チップ。

選択した納品日時に、予約した容量を使用して GPU VM または TPU VM を作成できます。カレンダー モードで将来の予約リクエストを使用して、次のワークロード向けに需要の高いリソースを取得します。

  • モデルの事前トレーニング ジョブ

  • モデルのファインチューニング ジョブ

  • ハイ パフォーマンス コンピューティング(HPC)シミュレーション ワークロード

  • 推論ワークロードの短期的な増加

1 つのリクエストで 81 個以上の GPU VM を予約する場合や 91 日以上の期間を予約する場合は、AI Hypercomputer のドキュメントで容量の予約をご覧ください。

制限事項

以降のセクションでは、カレンダー モードでの将来の予約リクエストに対する制限事項について説明します。

すべてのリクエストに対する制限事項

カレンダー モードでの将来の予約リクエストには、次の制限があります。

  • リソースは 1~90 日間の期間で予約できます。

  • 作成して送信したリクエストをキャンセル、削除、変更することはできません。

GPU VM のリクエストに対する制限事項

GPU VM は次の制限の下でのみ予約できます。

  • リクエストごとに予約できる GPU VM は 1~80 個の範囲です。

  • 次のマシンシリーズを予約できます。

  • 特定のゾーンでのみ GPU VM を予約できます。

TPU のリクエストに対する制限事項

次の方法でのみ TPU を予約できます。

  • リクエストごとに予約できる TPU チップの個数は、1、4、8、16、32、64、128、256、512、1,024 です。

  • 予約できる TPU バージョンは次のとおりです。

  • サービング(SERVING)ワークロード タイプで予約できる TPU v5e チップは 1 個、4 個、8 個のみです。

  • TPU を予約できるのは、次のゾーンのみです。

    • TPU v6e の場合:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • TPU v5p の場合:

      • us-east5-a
    • TPU v5e の場合:

      • バッチ(BATCH)ワークロード タイプの場合: us-west4-b

      • サービング(SERVING)ワークロード タイプの場合: us-central1-a

始める前に

  • カレンダー モードで将来の予約リクエストを使用できない場合は、この機能にアクセスして使用できない可能性があります。その場合は、Google のアカウント担当者またはセールスチームにお問い合わせください。
  • 予約済み容量を組織内の他のプロジェクトと共有するには、カレンダー モードで将来の予約リクエストを作成するプロジェクトで、共有予約の作成が許可されていることを確認します。許可されていない場合はエラーが発生します。
  • まだ設定していない場合は、認証を設定します。認証とは、 Trusted Cloud by S3NS サービスと API にアクセスするために ID を確認するプロセスです。ローカル開発環境からコードまたはサンプルを実行するには、次のいずれかのオプションを選択して Compute Engine で認証を行います。

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.

    gcloud

      1. After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:

        gcloud init
      2. Set a default region and zone.
      3. REST

        このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。

          After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:

          gcloud init

        詳細については、 Trusted Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。

必要なロール

カレンダー モードで将来の予約リクエストを作成するために必要な権限を取得するには、プロジェクトに対する Compute 将来の予約管理者 roles/compute.futureReservationAdmin)IAM ロールを付与するよう管理者に依頼してください。ロールの付与について詳しくは、プロジェクト、フォルダ、組織へのアクセス権を管理するをご覧ください。

この事前定義ロールには、カレンダー モードで将来の予約リクエストを作成するために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

カレンダー モードで将来の予約リクエストを作成するには、次の権限が必要です。

  • 将来の予約リクエストを作成する: プロジェクトに対する compute.futureReservations.create 権限
  • Compute Engine で予約を自動作成できるようにする: プロジェクトに対する compute.reservations.create 権限
  • インスタンス テンプレートを指定するには: インスタンス テンプレートに対する compute.instanceTemplates.useReadOnly
  • リソースの将来の可用性を表示する: プロジェクトに対する compute.advice.calendarMode 権限

カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。

概要

カレンダー モードで将来の予約リクエストを作成するには、次の操作を行います。

  1. リソースの将来の可用性を確認する。予約する GPU VM または TPU の将来の可用性を確認します。リクエストを作成するときに、使用可能であることを確認したリソースの数、タイプ、予約期間を指定します。この情報を提供すると、 Trusted Cloud by S3NS がリクエストを承認する可能性が高くなります。

  2. GPU VM または TPU の予約リクエストを作成する。カレンダー モードで GPU VM または TPU に対する将来の予約リクエストを作成して送信します。リクエストを正常に作成できる場合、 Trusted Cloud は 1 分以内にそのリクエストを承認します。

リソースの将来の可用性を確認する

リージョンでの GPU VM または TPU の将来の可用性を確認する手順は次のとおりです。

  • GPU VM の場合: 最大 60 日前

  • TPU の場合: 最大 120 日前

リージョンでの GPU VM または TPU の将来の可用性を表示するには、次のいずれかのオプションを選択します。

コンソール

カレンダー モードで将来の予約リクエストを作成するときに、リージョンでの GPU VM または TPU の将来の可用性を確認できます。詳細については、このドキュメントの GPU VM または TPU の予約リクエストを作成するをご覧ください。

gcloud

リージョンでの GPU VM または TPU の将来の可用性を表示するには、次のいずれかの gcloud beta compute advice calendar-mode コマンドを使用します。確認するリソースに基づいて、次のフラグを指定します。

  • GPU VM の可用性を表示するには --vm-count フラグと --machine-type フラグを指定します。

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • TPU の可用性を表示するには --chip-count フラグと --tpu-version フラグを指定します。

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

次のように置き換えます。

  • NUMBER_OF_VMS: 予約する GPU VM の数。

  • MACHINE_TYPE: 予約する GPU マシンタイプ。

  • NUMBER_OF_CHIPS: 予約する TPU チップの数。

  • TPU_VERSION: 予約する TPU バージョン。次のいずれかの値を指定します。

    • TPU v6e の場合: V6E

    • TPU v5p の場合: V5P

    • TPU v5e の場合: V5E

    TPU v5e を指定する場合は --workload-type フラグを指定する必要があります。このフラグを、TPU で実行するワークロードのタイプに設定します。

    • 単一または複数のオペレーションで大量のデータを処理するワークロード(機械学習(ML)トレーニング ワークロードなど)の場合は、BATCH を指定します。

    • 同時リクエストを処理し、ネットワーク レイテンシを最小限に抑える必要があるワークロード(ML 推論ワークロードなど)の場合は、SERVING を指定します。

  • REGION: GPU VM または TPU を予約するリージョン。サポートされているリージョンとゾーンを確認するには、このドキュメントの制限事項をご覧ください。

  • FROM_START_TIMETO_START_TIME: 容量を予約する最も早い日付と最も遅い日付。これらの日付を RFC 3339 タイムスタンプの形式で指定します。

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    次のように置き換えます。

    • YYYY-MM-DD: 4 桁の年、2 桁の月、2 桁の日をハイフン(-)で区切った形式の日付。

    • HH:MM:SS: 24 時間制の 2 桁の時間、2 桁の分、2 桁の秒をコロン(:)で区切った形式の時刻。

    • OFFSET: 協定世界時(UTC)のオフセット形式で示されるタイムゾーン。たとえば、太平洋標準時(PST)を使用する場合は -08:00 を指定します。オフセットを使用しない場合は、Z を指定します。

  • FROM_END_TIMETO_END_TIME: 容量の予約を終了する最も早い日付と最も遅い日付。これらの日付を RFC 3339 タイムスタンプの形式で指定します。予約の終了日時ではなく予約期間を指定する場合は、--end-time-range フラグを --duration-range フラグに置き換えます。

出力は次のようになります。

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

リクエストされたリソースが使用可能な場合、出力には startTimeendTimelocation の各フィールドが含まれます。これらのフィールドには、リソースが利用可能な最も早い開始時刻、最も遅い終了時刻、ゾーンを指定します。

REST

リージョンでの GPU VM または TPU の将来の可用性を表示するには、ベータ版の advice.calendarMode メソッドGET リクエストを送信します。表示するリソースに基づいて、リクエスト本文で次のフィールドを指定します。

  • GPU VM の可用性を確認するには instanceCount フィールドと machineType フィールドを指定します。

    POST https://compute.s3nsapis.fr/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • TPU の可用性を表示するには acceleratorCount フィールドと vmFamily フィールドを指定します。

    POST https://compute.s3nsapis.fr/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

次のように置き換えます。

  • PROJECT_ID: リソースを予約するプロジェクトの ID。

  • REGION: GPU VM または TPU を予約するリージョン。サポートされているリージョンとゾーンを確認するには、このドキュメントの制限事項をご覧ください。

  • NUMBER_OF_VMS: 予約する GPU VM の数。

  • MACHINE_TYPE: 予約する GPU マシンタイプ。

  • NUMBER_OF_CHIPS: 予約する TPU チップの数。

  • TPU_VERSION: 予約する TPU バージョン。次のいずれかの値を指定します。

    • TPU v6e の場合: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • TPU v5p の場合: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • TPU v5e の場合: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    TPU v5e を指定する場合は、aggregateResources フィールドで workloadType フィールドを指定する必要があります。このフィールドには、TPU で実行するワークロードのタイプを設定します。

    • 単一または複数のオペレーションで大量のデータを処理するワークロード(機械学習(ML)トレーニング ワークロードなど)の場合は、BATCH を指定します。

    • 同時リクエストを処理し、ネットワーク レイテンシを最小限に抑える必要があるワークロード(ML 推論ワークロードなど)の場合は、SERVING を指定します。

  • FROM_START_TIMETO_START_TIME: 容量を予約する最も早い日付と最も遅い日付。これらの日付を RFC 3339 タイムスタンプの形式で指定します。

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    次のように置き換えます。

    • YYYY-MM-DD: 4 桁の年、2 桁の月、2 桁の日をハイフン(-)で区切った形式の日付。

    • HH:MM:SS: 24 時間制の 2 桁の時間、2 桁の分、2 桁の秒をコロン(:)で区切った形式の時刻。

    • OFFSET: 協定世界時(UTC)のオフセット形式で示されるタイムゾーン。たとえば、太平洋標準時(PST)を使用する場合は -08:00 を指定します。オフセットを使用しない場合は、Z を指定します。

  • FROM_END_TIMETO_END_TIME: 容量の予約を終了する最も早い日付と最も遅い日付。これらの日付を RFC 3339 タイムスタンプの形式で指定します。予約の終了日時ではなく予約期間を指定する場合は、endTimeNotEarlierThan フィールドと endTimeNotLaterThan フィールドを、minDuration フィールドと maxDuration フィールドに置き換えます。

出力は次のようになります。

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

リクエストされたリソースが使用可能な場合、出力には startTimeendTimelocation の各フィールドが含まれます。これらのフィールドには、リソースが利用可能な最も早い開始時刻、最も遅い終了時刻、ゾーンを指定します。

GPU VM または TPU の予約リクエストを作成する

カレンダー モードで将来の予約リクエストを作成する場合は、次の値を指定する方法でのみ予約期間を指定できます。

  • 利用開始日時: 予約するリソースに基づいて、リクエストを作成して送信した時点から利用開始日時までの期間を、次の 1 つ以上の値で指定する必要があります。

    • GPU VM の場合: 87 時間(3 日間と 15 時間)

    • TPU の場合: 24 時間

  • 利用終了日時: リソースの予約期間は最長 90 日間です。

既存の GPU VM を参考にリクエストを作成するにはTrusted Cloud コンソールを使用します。または、次のオプションのいずれかを選択します。

コンソール

  1. Trusted Cloud コンソールで、[予約] ページに移動します。

    [予約] に移動

  2. [将来の予約] タブをクリックします。

  3. [将来の予約を作成] をクリックします。[将来の予約を作成] ページが開き、[ハードウェア構成] ペインが選択されています。

  4. [構成] セクションで、次のいずれかの方法で、予約する GPU VM または TPU のプロパティを指定します。

    • GPU VM または TPU のプロパティを直接指定する手順は次のとおりです。

      1. [マシンタイプを指定] を選択します。

      2. [GPU] タブまたは [TPU] タブをクリックし、予約する GPU マシンタイプまたは TPU バージョンを選択します。

    • 既存のインスタンス テンプレートを使用して GPU VM のプロパティを指定するには、[インスタンス テンプレート] を選択し、そこでテンプレートを選択します。

    • 既存の VM を参考にして GPU VM のプロパティを指定するには、[既存の VM を使用] を選択し、そこで VM を選択します。

  5. 前の手順で TPU v5e(CT5LP)を指定した場合は、[TPU v5 ワークロード タイプ] リストで次のいずれかのオプションを選択します。

    • 単一または複数のオペレーションで大量のデータを処理するワークロード(ML トレーニング ワークロードなど)を TPU で実行するには、[バッチ] を選択します。

    • 同時リクエストを処理し、ネットワーク レイテンシを最小限に抑える必要があるワークロード(ML 推論ワークロードなど)を TPU で実行するには、[サービス提供中] を選択します。

  6. [容量を検索] セクションで、次の操作を行います。

    1. [リージョン] リストと [ゾーン] リストで、リソースを予約するリージョンとゾーンを指定します。サポートされているリージョンとゾーンを確認するには、このドキュメントの制限事項をご覧ください。

    2. GPU VM を予約する場合は [必要な総容量] フィールドで、予約する GPU VM の数を指定します。TPU を予約する場合は [チップの数] リストで、予約する TPU チップの数を指定します。

    3. [開始時間] リストで、リクエストでの利用開始日時を選択します。

    4. 省略可: [開始日の柔軟性を選択] リストで、開始日時の正確さを指定します。

    5. [予約期間] フィールドで、リソースを予約する期間を指定します。

    6. [容量を検索] をクリックします。次に、[使用可能な容量] テーブルで、予約する GPU VM または TPU のタイプ、数、予約期間など、用意されているオプションのいずれかを選択します。

  7. [次へ] をクリックします。

  8. [共有タイプ] セクションで、リクエストした容量を共有するプロジェクトを選択します。

    • 予約済み容量をプロジェクト内でのみ使用するには、[ローカル] を選択します。

    • 予約済み容量を他のプロジェクトと共有するには、[共有] を選択し、 [プロジェクトを追加] をクリックして、プロンプトに沿ってプロジェクトを選択します。

  9. [次へ] をクリックします。

  10. [将来の予約の名前] フィールドに、リクエストの名前を入力します。

  11. [予約名] フィールドに、リクエストした容量をプロビジョニングするために Compute Engine が自動的に作成する予約の名前を入力します。

  12. [作成] をクリックします。

gcloud

カレンダー モードで将来の予約リクエストを作成して審査のために送信するには、次のいずれかの gcloud beta compute future-reservations create コマンドを使用します。予約するリソースに基づいて次のフラグを指定します。

  • GPU VM を予約するには --total-count フラグと --machine-type フラグを指定します。

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • TPU を予約するには --chip-count フラグと --tpu-version フラグを指定します。

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

次のように置き換えます。

  • FUTURE_RESERVATION_NAME: リクエストの名前。

  • NUMBER_OF_VMS: 予約する GPU VM の数。

  • MACHINE_TYPE: 予約する GPU マシンタイプ。

  • NUMBER_OF_CHIPS: 予約する TPU チップの数。

  • TPU_VERSION: 予約する TPU バージョン。次のいずれかの値を指定します。

    • TPU v6e の場合: V6E

    • TPU v5p の場合: V5P

    • TPU v5e の場合: V5E

    TPU v5e を指定する場合は --workload-type フラグを指定する必要があります。フラグを、TPU で実行するワークロードのタイプに設定します。

    • 単一または複数のオペレーションで大量のデータを処理するワークロード(機械学習(ML)トレーニング ワークロードなど)の場合は、BATCH を指定します。

    • 同時リクエストを処理し、ネットワーク レイテンシを最小限に抑える必要があるワークロード(ML 推論ワークロードなど)の場合は、SERVING を指定します。

  • RESERVATION_NAME: リクエストした容量をプロビジョニングするために Compute Engine が自動的に作成する予約の名前。

  • SHARE_TYPE: 組織内の他のプロジェクトが予約済み容量を使用できるかどうか。次のいずれかの値を指定します。

    • プロジェクト内でのみ容量を使用する場合: local

    • 他のプロジェクトと容量を共有する場合: projects

    projects を指定する場合は、プロジェクト ID のカンマ区切りリスト(例: project-1,project-2)に設定された --share-with フラグを含める必要があります。組織内で最大 100 個のプロジェクトを指定できます。このリストにプロジェクト ID は記述しないでください。デフォルトでは、予約済み容量を使用できます。

  • START_TIME: リクエストにある利用開始時間(RFC 3339 タイムスタンプの形式)。

  • END_TIME: 予約期間の終了日時(RFC 3339 タイムスタンプの形式)。終了時間ではなく、予約期間(秒単位)を指定する場合は、--end-time フラグを --duration フラグに置き換えます。

  • ZONE: リソースを予約するゾーン。

REST

カレンダー モードで将来の予約リクエストを作成し、審査を受けるために送信するには、ベータ版の futureReservations.insert メソッドに次の POST リクエストを送信します。予約するリソースに基づいて、リクエスト本文で次の各フィールドを指定します。

  • GPU VM を予約するには totalCount フィールドと machineType フィールドを指定します。

    POST https://compute.s3nsapis.fr/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • TPU を予約するには acceleratorCount フィールドと vmFamily フィールドを指定します。

    POST https://compute.s3nsapis.fr/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

次のように置き換えます。

  • PROJECT_ID: リクエストを作成するプロジェクトの ID。

  • ZONE: リソースを予約するゾーン。

  • FUTURE_RESERVATION_NAME: リクエストの名前。

  • RESERVATION_NAME: リクエストした容量をプロビジョニングするために Compute Engine が自動的に作成する予約の名前。

  • SHARE_TYPE: 組織内の他のプロジェクトが予約済み容量を使用できるかどうか。次のいずれかの値を指定します。

    • プロジェクト内でのみ容量を使用する場合: LOCAL

    • 他のプロジェクトと容量を共有する場合: SPECIFIC_PROJECTS

    SPECIFIC_PROJECTS を指定する場合は、shareSettings フィールドに projectMap フィールドを含めて、容量を共有するプロジェクトを指定する必要があります。組織内で最大 100 個のプロジェクトを指定できます。プロジェクト ID は指定しないでください。デフォルトでは、予約済み容量を使用できます。

    たとえば、リクエストした容量を他の 2 つのプロジェクトと共有するには、次のようにします。

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    CONSUMER_PROJECT_ID_1CONSUMER_PROJECT_ID_2 は、リクエストした容量の使用を許可する 2 つのプロジェクトの ID に置き換えます。

  • NUMBER_OF_VMS: 予約する GPU VM の数。

  • MACHINE_TYPE: 予約する GPU マシンタイプ。

  • NUMBER_OF_CHIPS: 予約する TPU チップの数。

  • TPU_VERSION: 予約する TPU バージョン。次のいずれかの値を指定します。

    • TPU v6e の場合: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • TPU v5p の場合: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • TPU v5e の場合: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    TPU v5e を指定する場合は、aggregateResources フィールドで workloadType フィールドを指定する必要があります。このフィールドには、TPU で実行するワークロードのタイプを設定します。

    • 単一または複数のオペレーションで大量のデータを処理するワークロード(機械学習(ML)トレーニング ワークロードなど)の場合は、BATCH を指定します。

    • 同時リクエストを処理し、ネットワーク レイテンシを最小限に抑える必要があるワークロード(ML 推論ワークロードなど)の場合は、SERVING を指定します。

  • START_TIME: リクエストにある利用開始時間(RFC 3339 タイムスタンプの形式)。

  • END_TIME: 予約期間の終了日時(RFC 3339 タイムスタンプの形式)。終了時間ではなく予約期間(秒単位)を指定する場合は、endTime フィールドを duration フィールドに置き換えます。

次のステップ