Membuat instance dengan model terikat pemesanan

Dokumen ini menjelaskan cara membuat instance Compute Engine mandiri dengan menggunakan model penyediaan terikat pemesanan. Model penyediaan ini memungkinkan Anda membuat instance A4X Max, A4X, A4, atau A3 Ultra dengan menggunakan kapasitas yang telah dipesan sebelumnya.

Untuk metode lain dalam membuat instance menggunakan model penyediaan yang terikat dengan reservasi, lihat Ringkasan opsi deployment dalam dokumentasi AI Hypercomputer.

Sebelum memulai

  • Siapkan autentikasi jika Anda belum melakukannya. Autentikasi memverifikasi identitas Anda untuk mengakses layanan Cloud de Confiance by S3NS dan API. Untuk menjalankan kode atau contoh dari lingkungan pengembangan lokal, Anda dapat mengautentikasi ke Compute Engine dengan memilih salah satu opsi berikut:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Cloud de Confiance console to access Cloud de Confiance by S3NS services and APIs, you don't need to set up authentication.

    gcloud

    1. Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas gabungan Anda. Setelah login, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

      gcloud init
    2. Set a default region and zone.

    REST

    Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

      Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas gabungan Anda. Setelah login, inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:

      gcloud init

    Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Cloud de Confiance .

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna membuat instance komputasi menggunakan model penyediaan terikat reservasi, minta administrator untuk memberi Anda peran IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat instance komputasi menggunakan model penyediaan yang terikat dengan reservasi. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat instance komputasi menggunakan model penyediaan terikat pemesanan:

  • compute.instances.create di project
  • Untuk menggunakan image kustom guna membuat VM: compute.images.useReadOnly pada image
  • Untuk menggunakan snapshot guna membuat VM: compute.snapshots.useReadOnly pada snapshot
  • Untuk menggunakan template instance guna membuat VM: compute.instanceTemplates.useReadOnly pada template instance
  • Untuk menentukan subnet bagi VM Anda: compute.subnetworks.use di project atau di subnet yang dipilih
  • Untuk menentukan alamat IP statis untuk VM: compute.addresses.use pada project
  • Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan VPC: compute.subnetworks.useExternalIp di project atau di subnet yang dipilih
  • Untuk menetapkan jaringan lama ke VM: compute.networks.use pada project
  • Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan lama: compute.networks.useExternalIp di project
  • Untuk menetapkan metadata instance VM bagi VM: compute.instances.setMetadata di project
  • Untuk menyetel tag untuk VM: compute.instances.setTags di VM
  • Untuk menetapkan label bagi VM: compute.instances.setLabels di VM
  • Untuk menyetel akun layanan yang akan digunakan VM: compute.instances.setServiceAccount di VM
  • Untuk membuat disk baru bagi VM: compute.disks.create pada project
  • Untuk memasang disk yang ada dalam mode hanya baca atau baca-tulis: compute.disks.use pada disk
  • Untuk memasang disk yang ada dalam mode hanya baca: compute.disks.useReadOnly pada disk

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Buat instance yang menggunakan model penyediaan terikat reservasi

Untuk membuat instance komputasi A4X Max, A4X, A4, atau A3 Ultra menggunakan model penyediaan terikat reservasi, Anda harus menunggu hingga reservasi yang dibuat otomatis yang ingin Anda gunakan mencapai waktu mulainya. Selain itu, instance yang ingin Anda buat harus memenuhi semua persyaratan berikut:

Contoh berikut membuat permintaan pemesanan untuk masa mendatang dalam mode kalender untuk lima instance A3 Ultra, lalu membuat instance A3 Ultra dengan menggunakan pemesanan yang dibuat otomatis untuk permintaan tersebut.

Untuk membuat instance contoh menggunakan model penyediaan terikat pemesanan, pilih salah satu opsi berikut:

Konsol

  1. Buat contoh permintaan untuk lima instance A3 Ultra dan kirimkan untuk ditinjau:

    1. Di konsol Cloud de Confiance , buka halaman Reservations.

      Buka Reservations

    2. Klik tab Future reservations.

    3. Klik Create future reservation. Halaman Create a future reservation akan muncul.

    4. Klik tab GPU, lalu di daftar GPU type, pilih NVIDIA H200 141 GB. Tindakan ini menentukan instance A3 Ultra.

    5. Di kolom Total kapasitas yang diperlukan, masukkan 5.

    6. Di bagian Periode pemesanan, tentukan waktu mulai dan durasi untuk periode pemesanan Anda.

    7. Klik Search for capacity, lalu di bagian Available capacity, pilih salah satu mesin yang tersedia.

    8. Klik Create.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra yang akan menggunakan contoh pemesanan yang dibuat otomatis, lakukan hal berikut:

    1. Di konsol Cloud de Confiance , buka halaman Create an instance.

      Buka halaman Buat instance

    2. Di kolom Name, masukkan nama untuk instance. Untuk contoh ini, masukkan example-instance.

    3. Tentukan Region dan Zone tempat reservasi yang dibuat otomatis berada. Untuk contoh ini, pilih us-central1 dan us-central1-b.

    4. Klik tab GPU, lalu di daftar GPU type, pilih NVIDIA H200 141 GB. Tindakan ini menentukan instance A3 Ultra dan menetapkan model penyediaan ke Reservation-bound.

    5. Di menu navigasi, klik Lanjutan.

    6. Di bagian Reservations, pilih Choose a reservation, lalu klik Choose a reservation.

    7. Di panel Pilih reservasi, lakukan hal berikut:

      1. Pilih contoh pemesanan yang dibuat otomatis.

      2. Klik Pilih.

    8. Di bagian Model penyediaan, luaskan bagian Setelan lanjutan model penyediaan VM.

    9. Dalam daftar On VM termination, pilih Stop (default) atau Delete.

    10. Klik Create.

gcloud

  1. Untuk membuat contoh permintaan lima instance A3 Ultra dan mengirimkannya untuk ditinjau, gunakan perintah gcloud beta compute future-reservations create:

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-setting=local \
        --start-time=2026-03-05T00:00:00Z \
        --end-time=2026-03-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-b
    

    Anggap saja Cloud de Confiance menyetujui permintaan dan Compute Engine otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, 5 Maret 2026, Compute Engine menambah jumlah instance GPU yang dicadangkan dalam pemesanan. Kemudian, Anda dapat menggunakan pemesanan.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra yang akan menggunakan contoh pemesanan yang dibuat otomatis, gunakan perintah gcloud compute instances create dengan flag berikut:

    • Flag --instance-termination-action.

    • Flag --provisioning-model ditetapkan ke RESERVATION_BOUND.

    • Flag --reservation.

    • Flag --reservation-affinity ditetapkan ke specific.

    Perintahnya mirip dengan berikut ini. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.

    gcloud compute instance create example-a3ultra-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-b \
        ...
    

    Perintah ini mencakup nilai berikut:

    • TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance di akhir periode pemesanan.

    • RESERVATION_URL: URL pemesanan, yang diformat sebagai berikut:

      • Jika pemesanan yang dibuat otomatis ada di project Anda: example-reservation.

      • Jika pemesanan yang dibuat otomatis ada di project lain: projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Untuk membuat contoh permintaan lima instance A3 Ultra dan mengirimkannya untuk ditinjau, buat permintaan POST ke metode beta futureReservations.insert:

    POST https://compute.s3nsapis.fr/compute/beta/projects/example-project/zones/us-central1-b/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2026-03-05T00:00:00Z",
        "endTime": "2026-03-19T00:00:00Z"
      }
    }
    

    Anggap saja Cloud de Confiance menyetujui permintaan dan Compute Engine otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, 5 Maret 2026, Compute Engine menambah jumlah instance GPU yang dicadangkan dalam pemesanan. Kemudian, Anda dapat menggunakan pemesanan.

  2. Pada waktu mulai permintaan, untuk membuat instance A3 Ultra guna menggunakan contoh pemesanan yang dibuat otomatis, buat permintaan POST ke metode instances.insert. Dalam isi permintaan, sertakan kolom berikut:

    • Kolom reservationAffinity.consumeReservationType ditetapkan ke SPECIFIC_RESERVATION.

    • Kolom reservationAffinity.key ditetapkan ke compute.googleapis.com/reservation-name.

    • Kolom reservationAffinity.values ditetapkan ke URL reservasi.

    • Kolom scheduling.instanceTerminationAction.

    • Kolom scheduling.provisioningModel ditetapkan ke RESERVATION_BOUND.

    Permintaannya mirip dengan berikut ini. Untuk mengetahui persyaratan lengkap guna membuat instance A3 Ultra, lihat Membuat instance A3 Ultra atau A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-b/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-b/machineTypes/a3-ultragpu-8g",
        "name": "example-a3ultra-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Isi permintaan mencakup nilai berikut:

    • RESERVATION_URL: URL pemesanan, yang diformat sebagai berikut:

      • Jika pemesanan yang dibuat otomatis ada di project Anda: example-reservation.

      • Jika pemesanan yang dibuat otomatis ada di project lain: projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION: apakah Compute Engine menghentikan (STOP) atau menghapus (DELETE) instance di akhir periode pemesanan.

Langkah berikutnya