Dokumen ini menjelaskan cara membuat instance dengan GPU terpasang dari rangkaian mesin A3 Ultra atau A4. Untuk mempelajari lebih lanjut cara membuat instance dengan GPU terpasang, lihat Ringkasan pembuatan instance dengan GPU terpasang.
Sebelum memulai
- Untuk meninjau batasan dan langkah-langkah prasyarat tambahan untuk membuat instance dengan GPU terpasang, seperti cara memilih image OS atau memeriksa kuota GPU, lihat Ringkasan pembuatan instance dengan GPU terpasang.
-
Jika Anda belum melakukannya, siapkan autentikasi.
Autentikasi adalah
proses yang digunakan untuk memverifikasi identitas Anda untuk mengakses Trusted Cloud by S3NS layanan dan API.
Untuk menjalankan kode atau sampel dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke
Compute Engine dengan memilih salah satu opsi berikut:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas gabungan Anda. Setelah login, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud init
- Set a default region and zone.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, Anda menggunakan kredensial yang Anda berikan ke gcloud CLI.
Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas gabungan Anda. Setelah login, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud init
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Trusted Cloud .
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk membuat instance, minta administrator untuk memberi Anda peran IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.Peran bawaan ini berisi izin yang diperlukan untuk membuat instance. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
Izin berikut diperlukan untuk membuat instance:
-
compute.instances.create
di project -
Untuk menggunakan image kustom guna membuat VM:
compute.images.useReadOnly
pada image -
Untuk menggunakan snapshot guna membuat VM:
compute.snapshots.useReadOnly
pada snapshot -
Untuk menggunakan template instance guna membuat VM:
compute.instanceTemplates.useReadOnly
pada template instance -
Untuk menetapkan jaringan lama ke VM:
compute.networks.use
pada project -
Untuk menentukan alamat IP statis untuk VM:
compute.addresses.use
pada project -
Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan lama:
compute.networks.useExternalIp
di project -
Untuk menentukan subnet bagi VM Anda:
compute.subnetworks.use
di project atau di subnet yang dipilih -
Untuk menetapkan alamat IP eksternal ke VM saat menggunakan jaringan VPC:
compute.subnetworks.useExternalIp
di project atau di subnet yang dipilih -
Untuk menetapkan metadata instance VM bagi VM:
compute.instances.setMetadata
di project -
Untuk menyetel tag untuk VM:
compute.instances.setTags
di VM -
Untuk menetapkan label bagi VM:
compute.instances.setLabels
di VM -
Untuk menyetel akun layanan yang akan digunakan VM:
compute.instances.setServiceAccount
di VM -
Untuk membuat disk baru untuk VM:
compute.disks.create
pada project -
Untuk memasang disk yang ada dalam mode hanya baca atau baca-tulis:
compute.disks.use
pada disk -
Untuk memasang disk yang ada dalam mode hanya baca:
compute.disks.useReadOnly
pada disk
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Menentukan cara membuat instance A3 Ultra atau A4
Instance A3 Ultra atau A4 tersedia melalui opsi pembuatan berikut, yang masing-masing memiliki prosedur pembuatan, ketersediaan resource, dan harga yang berbeda. Identifikasi opsi yang ingin Anda gunakan berdasarkan workload Anda.
Jika Anda perlu menjalankan workload AI dan ML yang berjalan lama, seperti pelatihan dan inferensi model besar yang memerlukan latensi terendah, buat VM atau cluster yang menggunakan fitur dan layanan yang tersedia dari Cluster Director. Dengan Cluster Director, Anda dapat memesan mesin yang dialokasikan secara padat yang menyediakan penjadwalan yang mengetahui topologi, serta pemantauan dan pemeliharaan yang ditingkatkan. Untuk mempelajari Cluster Director lebih lanjut, lihat Cluster Director di dokumentasi AI Hypercomputer.
Untuk mengetahui petunjuk cara membuat instance A3 Ultra atau A4, lihat Ringkasan pembuatan VM dan cluster dalam dokumentasi AI Hypercomputer.
Jika Anda memerlukan beban kerja AI dan ML dengan durasi jangka pendek, pilih salah satu opsi berikut:
Jika workload Anda perlu berjalan hingga 90 hari dengan latensi jaringan minimal, pesan mesin yang dialokasikan secara padat untuk tanggal mendatang dengan menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender. Di awal periode reservasi, Anda dapat membuat instance A3 Ultra atau A4 dengan menggunakan kapasitas yang dipesan. Di akhir periode pemesanan, Compute Engine akan menghapus pemesanan dan semua VM yang menggunakannya.
Untuk mengetahui petunjuk cara membuat instance A3 Ultra atau A4 yang menggunakan reservasi, lihat Membuat instance A3 Ultra atau A4 dalam dokumen ini.
Jika workload Anda dapat dimulai kapan saja dan memerlukan jumlah VM yang tepat untuk dimulai, gunakan permintaan pengubahan ukuran dalam grup instance terkelola (MIG). Dengan permintaan pengubahan ukuran MIG, Anda meminta Compute Engine untuk menambahkan semua VM sekaligus ke MIG Anda setiap kali resource tersedia. VM ini dapat berjalan hingga tujuh hari. Karena resource dikirim dari kumpulan yang aman, Anda memiliki peluang yang lebih tinggi untuk mendapatkan GPU dibandingkan jika Anda membuat permintaan on-demand.
Untuk mengetahui informasi selengkapnya tentang permintaan perubahan ukuran MIG, lihat Tentang permintaan perubahan ukuran di MIG.
Jika workload Anda dapat menoleransi gangguan ketersediaan, Anda bisa mendapatkan diskon yang signifikan dengan menggunakan Spot VM. Anda dapat membuat dan menghapus Spot VM sesuai kebutuhan. Namun, Spot VM adalah resource terbatas dan Compute Engine dapat melakukan preempt (menghentikan atau menghapus secara otomatis) Spot VM kapan saja untuk mendapatkan kembali kapasitas. Untuk mempelajari Spot VM lebih lanjut, lihat Spot VM.
Untuk mengetahui petunjuk cara membuat instance A3 Ultra atau A4 menggunakan VM Spot, lihat Membuat instance A3 Ultra atau A4 dalam dokumen ini.
Membuat instance A3 Ultra atau A4
Untuk membuat instance A3 Ultra atau A4 menggunakan reservasi atau Spot VM, selesaikan langkah-langkah berikut:
Membuat jaringan VPC
Untuk jenis mesin Ultra A4 atau A3, Anda harus membuat tiga jaringan VPC untuk antarmuka jaringan berikut:
- 2 jaringan VPC untuk antarmuka jaringan (NIC) gVNIC. Ini digunakan untuk komunikasi host ke host.
- 1 jaringan VPC dengan profil jaringan RDMA diperlukan untuk NIC CX7. Jaringan ini harus memiliki 8 subnet, satu subnet untuk setiap NIC CX7, dan digunakan untuk komunikasi GPU ke GPU.
Untuk mengetahui informasi selengkapnya tentang pengaturan NIC, lihat Meninjau bandwidth jaringan dan pengaturan NIC.
Siapkan jaringan secara manual dengan mengikuti panduan petunjuk atau secara otomatis menggunakan skrip yang disediakan.
Panduan petunjuk
Untuk membuat jaringan, Anda dapat menggunakan petunjuk berikut:
- Untuk membuat jaringan VPC bagi gVNIC, lihat Membuat dan mengelola jaringan Virtual Private Cloud.
- Untuk membuat jaringan VPC dengan profil jaringan RDMA, lihat Membuat jaringan Virtual Private Cloud untuk NIC RDMA.
Untuk jaringan VPC ini, sebaiknya tetapkan unit transmisi maksimum (MTU) ke nilai yang lebih besar. Untuk jenis mesin A4 atau A3 Ultra, MTU yang direkomendasikan adalah
8896
byte. Untuk meninjau setelan MTU yang direkomendasikan untuk jenis mesin GPU lainnya, lihat Setelan MTU untuk jenis mesin GPU.Skrip
Untuk membuat jaringan, ikuti langkah-langkah berikut:
- Gunakan skrip ini untuk membuat jaringan.
Untuk jaringan VPC ini, sebaiknya tetapkan unit transmisi maksimum (MTU) ke nilai yang lebih besar. Untuk jenis mesin A4 atau A3 Ultra, MTU yang direkomendasikan adalah
8896
byte. Untuk meninjau setelan MTU yang direkomendasikan untuk jenis mesin GPU lainnya, lihat Setelan MTU untuk jenis mesin GPU.#!/bin/bash # Create standard VPCs (network and subnets) for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs done
Ganti kode berikut:
GVNIC_NAME_PREFIX
: awalan nama kustom yang akan digunakan untuk jaringan dan subnet VPC standar untuk gVNIC.RDMA_NAME_PREFIX
: awalan nama kustom yang akan digunakan untuk jaringan VPC dan subnet dengan profil jaringan RDMA untuk NIC CX7.ZONE
: tentukan zona tempat jenis mesin yang ingin Anda gunakan tersedia, sepertius-central1-a
. Untuk mengetahui informasi tentang region, lihat Ketersediaan GPU menurut region dan zona.REGION
: region tempat Anda ingin membuat subnet. Wilayah ini harus sesuai dengan zona yang ditentukan. Misalnya, jika zona Anda adalahus-central1-a
, maka region Anda adalahus-central1
.IP_RANGE
: rentang IP yang akan digunakan untuk aturan firewall SSH.
-
Opsional: Untuk memverifikasi bahwa resource jaringan VPC berhasil dibuat, periksa setelan jaringan di konsol Trusted Cloud :
- Di Trusted Cloud konsol, buka halaman VPC networks.
- Telusuri daftar untuk menemukan jaringan yang Anda buat pada langkah sebelumnya.
- Untuk melihat subnet, aturan firewall, dan setelan jaringan lainnya, klik nama jaringan.
Buat instance
Untuk membuat instance A3 Ultra atau A4, pilih salah satu metode berikut:
Membuat instance yang menggunakan reservasi
Untuk membuat instance yang menggunakan reservasi, gunakan salah satu opsi berikut:
Konsol
Di konsol Trusted Cloud , buka halaman Create an instance.
Layar Create an instance akan muncul dan menampilkan panel Machine configuration.
Di panel Machine configuration, selesaikan langkah-langkah berikut:
Tentukan Nama untuk instance Anda. Lihat Konvensi penamaan resource.
Pilih Region dan Zona tempat Anda telah memesan kapasitas.
Klik tab GPU, lalu selesaikan langkah-langkah berikut:
Pada daftar GPU type, pilih jenis GPU Anda.
Untuk instance A4, pilih NVIDIA B200.
Untuk instance A3 Ultra, pilih NVIDIA H200 141 GB.
Dalam daftar Number of GPUs, pilih 8.
Di menu navigasi, klik OS dan penyimpanan. Di panel OS and storage yang muncul, selesaikan langkah-langkah berikut:
Klik Ubah. Panel Boot disk configuration akan muncul.
Pada tab Public images, pilih image yang direkomendasikan. Untuk mengetahui daftar image yang direkomendasikan, lihat Sistem operasi.
Untuk mengonfirmasi opsi boot disk, klik Select.
Untuk membuat instance multi-NIC, selesaikan langkah-langkah berikut. Jika tidak, untuk membuat instance NIC tunggal, lewati langkah-langkah ini.
Di menu navigasi, klik Networking. Di panel Networking yang muncul, selesaikan langkah-langkah berikut:
Di bagian Network interfaces, selesaikan langkah-langkah berikut:
Hapus antarmuka jaringan default. Untuk menghapus antarmuka, klik
Hapus.Klik Add a network interface. Gunakan opsi ini untuk menambahkan jaringan gVNIC dan RDMA yang Anda buat di bagian sebelumnya. Saat Anda menambahkan jaringan, ingatlah hal berikut:
Tentukan jaringan host Anda dalam daftar Network dan Subnetwork, lalu tetapkan daftar Network interface card ke gVNIC.
Tentukan jaringan GPU Anda dalam daftar Jaringan dan Sub-jaringan, lalu tetapkan daftar Kartu antarmuka jaringan ke MRDMA untuk jaringan ini.
Di menu navigasi, klik Lanjutan. Di panel Advanced yang muncul, selesaikan langkah-langkah berikut:
Di bagian Reservations, pilih Choose a reservation, lalu klik Choose reservation. Tindakan ini akan membuka panel dengan daftar reservasi yang tersedia dalam zona yang Anda pilih. Dari daftar reservasi, selesaikan langkah-langkah berikut:
Pilih reservasi yang ingin Anda gunakan untuk VM. Anda juga dapat memilih blok tertentu dalam reservasi.
Klik Pilih.
Di bagian Model penyediaan, luaskan bagian Setelan lanjutan model penyediaan VM.
Dalam daftar On VM termination, pilih Stop (default) atau Delete.
Untuk membuat dan memulai instance, klik Create.
gcloud
Untuk membuat VM, gunakan perintah
gcloud compute instances create
.gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=specific \ --reservation=RESERVATION \ --provisioning-model=RESERVATION_BOUND \ --instance-termination-action=TERMINATION_ACTION \ --maintenance-policy=TERMINATE
Ganti kode berikut:
VM_NAME
: nama VM.MACHINE_TYPE
: jenis mesin yang akan digunakan untuk VM. Tentukan jenis mesin A4 atau A3 Ultra. Untuk mengetahui informasi selengkapnya, lihat Jenis mesin GPU.IMAGE_FAMILY
: kelompok image dari image OS yang ingin Anda gunakan. Untuk mengetahui daftar sistem operasi yang didukung, lihat Detail sistem operasi.IMAGE_PROJECT
: project ID image OS.ZONE
: zona tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk mengetahui informasi tentang region, lihat Region dan zona GPU.DISK_SIZE
: ukuran boot disk dalam GB.GVNIC_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC standar yang menggunakan gVNIC.RDMA_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC yang menggunakan NIC RDMA.-
RESERVATION
: nama reservasi atau blok tertentu dalam reservasi. Untuk mendapatkan nama reservasi atau blok yang tersedia, lihat Melihat kapasitas yang dicadangkan. Berdasarkan persyaratan penempatan instance, pilih salah satu opsi berikut:Untuk membuat instance di blok mana pun:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Selain itu, untuk membuat beberapa instance dalam blok yang sama, terapkan kebijakan penempatan rapat yang sama yang menentukan kolokasi blok (
maxDistance=2
) saat membuat setiap instance. Kemudian, Compute Engine akan menerapkan kebijakan ke reservasi dan membuat instance di blok yang sama.Untuk membuat instance di blok tertentu:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: apakah Compute Engine menghentikan (STOP
) atau menghapus (DELETE
) VM di akhir periode reservasi.
REST
Untuk membuat VM, buat permintaan
POST
ke metodeinstances.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name":"VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb":"DISK_SIZE", "diskType":"hyperdisk-balanced", "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode":"READ_WRITE", "type":"PERSISTENT" } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType":"SPECIFIC_RESERVATION", "key":"compute.googleapis.com/reservation-name", "values":[ "RESERVATION" ] }, "scheduling":{ "provisioningModel":"RESERVATION_BOUND", "instanceTerminationAction":"TERMINATION_ACTION", "onHostMaintenance": "TERMINATE", "automaticRestart":true } }
Ganti kode berikut:
PROJECT_ID
: project ID project tempat Anda ingin membuat VM.ZONE
: zona tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk mengetahui informasi tentang region, lihat Region dan zona GPU.MACHINE_TYPE
: jenis mesin yang akan digunakan untuk VM. Tentukan jenis mesin A4 atau A3 Ultra. Untuk mengetahui informasi selengkapnya, lihat Jenis mesin GPU.VM_NAME
: nama VM.DISK_SIZE
: ukuran boot disk dalam GB.IMAGE_PROJECT
: project ID image OS.IMAGE_FAMILY
: kelompok image dari image OS yang ingin Anda gunakan. Untuk mengetahui daftar sistem operasi yang didukung, lihat Detail sistem operasi.NETWORK_PROJECT_ID
: project ID jaringan.GVNIC_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC standar yang menggunakan gVNIC.REGION
: region subnetwork.RDMA_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC yang menggunakan NIC RDMA.-
RESERVATION
: nama reservasi atau blok tertentu dalam reservasi. Untuk mendapatkan nama reservasi atau blok yang tersedia, lihat Melihat kapasitas yang dicadangkan. Berdasarkan persyaratan penempatan instance, pilih salah satu opsi berikut:Untuk membuat instance di blok mana pun:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Selain itu, untuk membuat beberapa instance dalam blok yang sama, terapkan kebijakan penempatan rapat yang sama yang menentukan kolokasi blok (
maxDistance=2
) saat membuat setiap instance. Kemudian, Compute Engine akan menerapkan kebijakan ke reservasi dan membuat instance di blok yang sama.Untuk membuat instance di blok tertentu:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: apakah Compute Engine menghentikan (STOP
) atau menghapus (DELETE
) VM di akhir periode reservasi.
Membuat Spot VM
Untuk membuat Spot VM, gunakan salah satu opsi berikut:
Konsol
Di konsol Trusted Cloud , buka halaman Create an instance.
Layar Create an instance akan muncul dan menampilkan panel Machine configuration.
Di panel Machine configuration, selesaikan langkah-langkah berikut:
Tentukan Nama untuk instance Anda. Lihat Konvensi penamaan resource.
Pilih Region dan Zona tempat Anda ingin membuat VM. Untuk memeriksa region dan zona tempat GPU tersedia, lihat Region dan zona GPU.
Klik tab GPU, lalu selesaikan langkah-langkah berikut:
Pada daftar GPU type, pilih jenis GPU Anda.
Untuk instance A4, pilih NVIDIA B200.
Untuk instance A3 Ultra, pilih NVIDIA H200 141 GB.
Dalam daftar Number of GPUs, pilih 8.
Di menu navigasi, klik OS dan penyimpanan. Di panel OS and storage yang muncul, selesaikan langkah-langkah berikut:
Klik Ubah. Panel Boot disk configuration akan muncul.
Pada tab Public images, pilih image yang direkomendasikan. Untuk mengetahui daftar image yang direkomendasikan, lihat Sistem operasi.
Untuk mengonfirmasi opsi boot disk, klik Select.
Untuk membuat instance multi-NIC, selesaikan langkah-langkah berikut. Jika tidak, untuk membuat instance NIC tunggal, lewati langkah-langkah ini.
Di menu navigasi, klik Networking. Di panel Networking yang muncul, selesaikan langkah-langkah berikut:
Di bagian Network interfaces, selesaikan langkah-langkah berikut:
Hapus antarmuka jaringan default. Untuk menghapus antarmuka, klik
Hapus.Klik Add a network interface. Gunakan opsi ini untuk menambahkan jaringan gVNIC dan RDMA yang Anda buat di bagian sebelumnya. Saat menambahkan jaringan, Anda harus melakukan hal berikut:
Tentukan jaringan host Anda dalam daftar Network dan Subnetwork, lalu tetapkan daftar Network interface card ke gVNIC.
Tentukan jaringan GPU Anda dalam daftar Jaringan dan Sub-jaringan, lalu tetapkan daftar Kartu antarmuka jaringan ke MRDMA untuk jaringan ini.
Di menu navigasi, klik Lanjutan. Di panel Advanced yang muncul, selesaikan langkah-langkah berikut:
Di bagian Provisioning model, pilih Spot di daftar VM provisioning model.
Opsional: Untuk menentukan tindakan yang akan diambil saat Compute Engine melakukan preempt terhadap instance, selesaikan langkah-langkah berikut:
Luaskan bagian Setelan lanjutan model penyediaan VM.
Dalam daftar Pada penghentian VM, pilih Hentikan atau Hapus.
Untuk membuat dan memulai instance, klik Create.
gcloud
Untuk membuat VM, gunakan perintah
gcloud compute instances create
.gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --provisioning-model=SPOT \ --instance-termination-action=TERMINATION_ACTION
Ganti kode berikut:
VM_NAME
: nama VM.MACHINE_TYPE
: jenis mesin yang akan digunakan untuk VM. Tentukan jenis mesin A4 atau A3 Ultra. Untuk mengetahui informasi selengkapnya, lihat Jenis mesin GPU.IMAGE_FAMILY
: kelompok image dari image OS yang ingin Anda gunakan. Untuk mengetahui daftar sistem operasi yang didukung, lihat Detail sistem operasi.IMAGE_PROJECT
: project ID image OS.ZONE
: zona tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk mengetahui informasi tentang region, lihat Region dan zona GPU.DISK_SIZE
: ukuran boot disk dalam GB.GVNIC_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC standar yang menggunakan gVNIC.RDMA_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC yang menggunakan NIC RDMA.TERMINATION_ACTION
: tindakan yang akan diambil saat Compute Engine melakukan preempt terhadap instance, baikSTOP
(default) atauDELETE
.
REST
Untuk membuat VM, buat permintaan
POST
ke metodeinstances.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name":"VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb":"DISK_SIZE", "diskType":"hyperdisk-balanced", "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode":"READ_WRITE", "type":"PERSISTENT" } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "scheduling": { "provisioningModel": "SPOT", "instanceTerminationAction": "TERMINATION_ACTION" } }
Ganti kode berikut:
PROJECT_ID
: project ID project tempat Anda ingin membuat VM.ZONE
: zona tempat jenis mesin yang ingin Anda gunakan tersedia. Untuk mengetahui informasi tentang region, lihat Region dan zona GPU.MACHINE_TYPE
: jenis mesin yang akan digunakan untuk VM. Tentukan jenis mesin A4 atau A3 Ultra. Untuk mengetahui informasi selengkapnya, lihat Jenis mesin GPU.VM_NAME
: nama VM.DISK_SIZE
: ukuran boot disk dalam GB.IMAGE_PROJECT
: project ID image OS.IMAGE_FAMILY
: kelompok image dari image OS yang ingin Anda gunakan. Untuk mengetahui daftar sistem operasi yang didukung, lihat Detail sistem operasi.NETWORK_PROJECT_ID
: project ID jaringan.GVNIC_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC standar yang menggunakan gVNIC.REGION
: region subnetwork.RDMA_NAME_PREFIX
: awalan nama yang Anda tentukan saat membuat jaringan dan subnet VPC yang menggunakan NIC RDMA.TERMINATION_ACTION
: tindakan yang akan diambil saat Compute Engine melakukan preempt terhadap instance, baikSTOP
(default) atauDELETE
.
Menyiapkan instance untuk digunakan
Untuk menyiapkan instance yang telah dipasangi GPU agar dapat digunakan, selesaikan langkah-langkah berikut:
Agar instance A4 atau A3 Ultra dapat menggunakan GPU yang terpasang, driver GPU harus diinstal pada instance tersebut. Kecuali jika image di instance sudah menyertakan driver GPU yang diperlukan, instal driver GPU.
Jika Anda membuat Spot VM di bagian sebelumnya, selesaikan langkah-langkah berikut:
Untuk menyiapkan Spot VM Anda agar siap menghadapi kemungkinan preemption, lihat artikel Mengelola preemption Spot VM.
Opsional: Pelajari praktik terbaik untuk Spot VM.
Langkah berikutnya
Untuk memantau performa GPU, lihat Memantau performa GPU.
Untuk memecahkan masalah instance GPU, lihat Memecahkan masalah VM GPU.
Pelajari platform GPU lebih lanjut.
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-08-08 UTC.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-08 UTC."],[[["This document guides you through creating instances with attached GPUs using the A3 Ultra or A4 machine series."],["Before creating instances, you must review the limitations, prerequisite steps, OS image selection, and GPU quota."],["Authentication setup is required for accessing Google Cloud services and APIs if you are not using the Google Cloud Console."],["To create A3 Ultra or A4 instances, you can use Hypercompute Cluster for low-latency workloads or Spot VMs for lower-priority workloads that can tolerate availability disruptions."],["Creating a multi-NIC A3 Ultra or A4 instance requires setting up Virtual Private Cloud (VPC) networks and subnets for gVNICs and RDMA NICs, which you can manually create or using the provided script."]]],[]] -