Compute Engine インスタンスのプロビジョニング モデル

このドキュメントでは、Compute Engine インスタンスのプロビジョニング モデルについて説明します。デプロイ オプションの詳細については、ワークロードに対する Compute Engine のデプロイ戦略を選択するをご覧ください。

プロビジョニング モデルにより、インスタンスの可用性、ライフサイクル、料金が決まります。これらのモデルを理解していれば、ワークロードに最適なオプションを選択できます。

利用可能なプロビジョニング モデル

コンピューティング インスタンスを作成するときに、次のいずれかのプロビジョニング モデルを指定できます。プロビジョニング モデルを指定しない場合、Compute Engine はデフォルトで標準プロビジョニング モデルを使用します。

次の表は、各プロビジョニング モデルのユースケースと料金を比較するのに役立ちます。

標準 Spot Flex Start(プレビュー 予約で制限
概要
  • リソースの可用性に基づいて、インスタンスをすぐに作成できます。
  • インスタンスの停止または削除のタイミングを制御できます。
  • リソースの可用性に基づいて、インスタンスをすぐに作成できます。
  • インスタンスの停止または削除のタイミングを制御できます。ただし、容量を再利用するために Compute Engine がインスタンスを任意のタイミングで停止または削除できるようにします。
  • ゾーン マネージド インスタンス グループ(MIG)を作成したら、Compute Engine にリクエストして、GPU が割り当てられたインスタンスを MIG に追加します。Compute Engine は、リソースの可用性に基づいてインスタンスのプロビジョニングをスケジュールします。
  • インスタンスを削除するタイミングを制御できます。ただし、停止、一時停止、再作成はできません。インスタンスは最大 7 日間実行されます。その後、Compute Engine はそれらを削除します。
  • GPU が割り当てられたインスタンスを作成するために、将来の日付で容量を予約できます。 Trusted Cloud by S3NS がリクエストを承認すると、Compute Engine は予約を作成します。予約期間の開始時に、予約と一致する GPU インスタンスを作成して予約を消費できます。
  • 承認された予約期間中は、必要に応じてインスタンスを停止、再起動、削除、再作成して予約を使用できます。予約期間が終了すると、Compute Engine は予約を削除し、予約を消費するインスタンスを停止または削除します。
ユースケース 安定性と継続的な運用が必要なワークロードに適しています。たとえば、次のようなワークロードに最適です。
  • ウェブサーバー
  • データベース
  • エンタープライズ アプリケーション
  • 開発とテスト
中断を許容できるワークロードに適しています。たとえば、次のようなワークロードに最適です。
  • バッチ処理
  • ハイ パフォーマンス コンピューティング(HPC)
  • 継続的インテグレーションと継続的デプロイ(CI / CD)
  • データ分析
  • メディアのエンコード
  • オンライン推論
安定性が求められ、7 日間以内に実行する必要があるワークロード。たとえば、次のようなワークロードに適しています。
  • 小規模モデルの事前トレーニング
  • モデルのファインチューニング
  • HPC シミュレーション
  • バッチ推論
安定性と特定の実行時間を必要とするワークロードに適しています。たとえば、次のようなワークロードに最適です。
  • 最大 90 日間続くワークロード:
    • モデルの事前トレーニング ジョブ
    • モデルのファインチューニング ジョブ
    • HPC シミュレーション ワークロード
    • 推論ワークロードの短期的な増加の見込み
  • 90 日を超えるワークロード:
    • トレーニング ワークロード
    • 推論ワークロード
料金 インスタンスに対して標準料金が請求されます。詳しくは、VM インスタンスの料金をご覧ください。 ほとんどの vCPU、GPU、ローカル SSD は 60~91% の割引で利用できます。詳細については、Spot VM の料金をご覧ください。 インスタンスで使用するマシン ファミリーに応じて、vCPU と GPU の割引率が最大 53% になります。Dynamic Workload Scheduler(DWS)の料金をご覧ください。 インスタンスで使用するマシン ファミリーに応じて、vCPU と GPU の割引率が最大 53% になります。また、インスタンスの作成用に容量を予約する方法に応じて、次のように料金が発生します。
割り当て インスタンスを作成すると、標準の割り当てが消費されます。 インスタンスを作成すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。Trusted Cloud の無料枠クレジットは Spot VM に適用されません。 MIG がグループにインスタンスを追加すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。 割り当ては、予約で制限されたプロビジョニング モデルには適用されません。

インスタンスの可用性とライフサイクル

次の表に、各プロビジョニング モデルのコンピューティング インスタンスの可用性と存続期間を示します。

標準 Spot Flex Start(プレビュー 予約で制限
作成の前提条件 作成の前提条件はありません。 作成の前提条件はありません。 作成の前提条件はありません。

インスタンスを作成するには、まず次のいずれかの方法で容量を予約する必要があります。

選択した配信日時に、Compute Engine はリクエストされた容量をプロビジョニングします。その後、インスタンスを作成して容量を消費できます。
サポートされているマシンシリーズ A4X、A4 と A3 Ultra を除く任意のマシンシリーズを使用できます。 次のマシンシリーズを除く任意のマシンシリーズを使用できます。
  • M2 と M3
  • ベアメタル インスタンス
使用できるマシンシリーズは次のとおりです。
VM を作成するための容量を予約する方法に応じて、次のマシンシリーズのみを使用できます。
インスタンスの可用性 リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。 リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。 インスタンスを作成できるのは、MIG でサイズ変更リクエストを作成する場合のみです。Compute Engine は、DWS を使用して、リソースの可用性に基づいてリクエストされた容量のプロビジョニングをスケジュールします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。 インスタンスを作成できるのは、将来の日付の容量を予約した後です。リクエストされた日になると、Compute Engine はリクエストされた容量を配信します。この容量を使用してインスタンスを作成できます。カレンダー モードで将来の予約を使用してリソースを予約すると、Compute Engine は DWS を使用してリクエストされた容量をプロビジョニングします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。
インスタンスの存続期間 インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。
  • インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。
  • まれに、ホストエラーによりインスタンスが停止することがあります。
インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。
  • Compute Engine は、容量を再利用するために、インスタンスを任意のタイミングで停止または削除します。このプロセスはプリエンプションと呼ばれます。
  • インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。
  • まれに、ホストエラーによりインスタンスが停止することがあります。
プロビジョニングされたインスタンスは、選択した実行時間(最大 7 日)の間実行されます。インスタンスの停止、一時停止、再作成はできません。

Compute Engine は、次のいずれかの条件が満たされた場合にインスタンスを削除します。
  • インスタンスの削除をリクエストする。
  • インスタンスの実行時間が終了する。
インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。
  • Compute Engine は、ホスト メンテナンス イベント中にインスタンスを停止します。
  • リクエストされた容量をプロビジョニングするために自動的に作成された予約に対して、確約された予約期間が終了します。その時点で、Compute Engine は予約を削除し、予約を消費するインスタンスを停止または削除します。
  • まれに、ホストエラーによりインスタンスが停止することがあります。

次のステップ