Dokumen ini memberikan ringkasan permintaan pemesanan untuk masa mendatang dalam mode kalender.
Gunakan permintaan pemesanan untuk masa mendatang dalam mode kalender untuk mendapatkan resource yang sangat diminati, seperti untuk membuat instance virtual machine (VM) yang memiliki GPU atau TPU terpasang. Saat Cloud de Confiance by S3NS menyetujui permintaan reservasi, Compute Engine akan menyediakan resource yang dipesan pada tanggal dan waktu yang Anda tentukan, dan untuk durasi hingga 90 hari. Kemudian, Anda dapat menggunakan resource yang dicadangkan untuk membuat VM GPU, VM H4D, atau VM TPU untuk menjalankan beban kerja berikut:
Tugas pra-pelatihan model
Tugas penyesuaian model
Workload simulasi komputasi berperforma tinggi (HPC)
Peningkatan beban kerja inferensi jangka pendek yang diperkirakan
Untuk mengetahui informasi selengkapnya tentang cara lain untuk memesan resource di Compute Engine, lihat Memilih jenis reservasi.
Membuat permintaan dalam mode kalender
Bagian berikut menjelaskan cara melihat ketersediaan resource, serta detail yang harus ditentukan saat Anda membuat permintaan pemesanan untuk masa mendatang dalam mode kalender.
Melihat ketersediaan resource pada masa mendatang
Sebelum membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda dapat melihat ketersediaan di masa mendatang di suatu region untuk resource berikut:
Untuk VM GPU atau H4D, hingga 60 hari sebelumnya
Untuk TPU, hingga 120 hari sebelumnya
Compute Engine menggunakan Dynamic Workload Scheduler (DWS) untuk melihat kapan resource yang Anda minta tersedia. Saat membuat permintaan, tentukan jumlah, jenis, dan periode reservasi untuk resource yang telah Anda konfirmasi ketersediaannya. Cloud de Confiance lebih cenderung menyetujui permintaan Anda jika Anda memberikan informasi ini.
Menentukan properti permintaan
Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda harus menentukan properti berikut:
Hapus otomatis. Properti ini menentukan apakah Compute Engine menghapus pemesanan yang dibuat secara otomatis (auto-created) untuk permintaan Anda pada waktu berakhir, meskipun pemesanan belum digunakan sepenuhnya. Untuk membuat permintaan dalam mode kalender, Anda harus mengaktifkan opsi hapus otomatis.
Jenis konsumsi. Properti ini menentukan cara VM menggunakan pemesanan yang dibuat secara otomatis. Saat membuat permintaan dalam mode kalender, Anda harus menentukan bahwa Anda ingin membuat pemesanan yang ditargetkan secara khusus. Setelan ini berarti hanya VM yang menargetkan reservasi yang dapat menggunakannya.
Jenis deployment. Properti ini menentukan kolokasi resource yang dipesan. Compute Engine mencadangkan resource berdasarkan jenis resource:
Untuk VM GPU atau H4D, Anda harus menentukan jenis deployment padat (
DENSE) saat membuat permintaan. Konfigurasi ini menentukan untuk mencadangkan resource secara padat untuk latensi jaringan minimal.Untuk TPU, Compute Engine menggunakan jenis deployment fleksibel (
FLEXIBLE) secara default. Konfigurasi ini menentukan untuk mencadangkan resource sedekat mungkin berdasarkan upaya terbaik.
Name. Nama permintaan Anda, yang harus unik dalam project Anda.
Jumlah resource. Jumlah VM GPU, VM H4D, atau TPU yang akan dipesan pada waktu mulai yang Anda minta.
Status perencanaan. Properti ini menentukan apakah Anda langsung mengirimkan permintaan ke Cloud de Confiance untuk ditinjau, atau menyimpannya sebagai draf dan mengirimkannya nanti. Saat membuat permintaan dalam mode kalender, Anda harus menentukan untuk segera mengirimkan permintaan untuk ditinjau.
Mode reservasi. Properti ini menentukan metode untuk mencadangkan resource, yang harus Anda tetapkan ke
CALENDARuntuk permintaan dalam mode kalender.Nama reservasi. Nama untuk pemesanan yang dibuat secara otomatis oleh Compute Engine jika Cloud de Confiance menyetujui permintaan Anda.
Jenis berbagi. Properti ini menentukan apakah project lain di organisasi Anda dapat menggunakan pemesanan yang dibuat otomatis untuk permintaan yang disetujui. Anda dapat menentukan salah satu opsi berikut:
Project tunggal. Hanya project Anda yang dapat menggunakan kapasitas yang dipesan.
Dibagikan. Anda dapat membagikan kapasitas yang dicadangkan kepada hingga 100 project lain di organisasi Anda. Jika Anda menentukan opsi ini, Anda harus menentukan project yang akan diajak berbagi pemesanan yang dibuat otomatis. Untuk informasi selengkapnya, lihat praktik terbaik untuk pemesanan bersama.
Periode reservasi. Tanggal dan waktu saat Compute Engine menyediakan kapasitas yang Anda minta, dan Anda dapat menggunakannya. Periode reservasi mencakup hal berikut:
Waktu mulai. Saat Anda ingin mulai menggunakan kapasitas yang dipesan. Berdasarkan resource yang Anda pesan, waktu mulai harus setidaknya salah satu nilai berikut dari saat Anda membuat dan mengirimkan permintaan:
Untuk VM GPU dan H4D, 87 jam (tiga hari dan 15 jam)
Untuk TPU, enam jam
Waktu berakhir. Saat kapasitas yang Anda minta tidak lagi dicadangkan untuk Anda. Pada saat ini, Compute Engine menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus VM apa pun yang menggunakan pemesanan berdasarkan tindakan penghentian yang Anda tentukan untuk VM.
Properti resource. Persyaratan hardware VM GPU, VM H4D, atau TPU yang ingin Anda cadangkan. VM hanya dapat menggunakan reservasi jika propertinya cocok dengan properti reservasi. Untuk mengetahui informasi selengkapnya, lihat persyaratan untuk menggunakan reservasi.
Zona. Zona tempat Anda ingin memesan kapasitas.
Proses permintaan peninjauan
Untuk memesan kapasitas menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda harus membuat dan mengirimkan permintaan ke Cloud de Confiance untuk ditinjau. Setelah Anda membuat dan mengirimkan permintaan, Cloud de Confiance akan meninjaunya dalam waktu satu menit, dan kemudian salah satu hal berikut akan terjadi:
Cloud de Confiance menyetujui permintaan Anda: Compute Engine akan mencadangkan resource yang Anda minta dan, dalam waktu satu menit setelah persetujuan, akan otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, Compute Engine akan menyediakan kapasitas yang Anda minta dengan menambah jumlah VM GPU, VM H4D, atau TPU dalam reservasi.
Anda mengalami error. Permintaan gagal karena zona permintaan tidak memiliki resource yang memadai. Sebaiknya Anda melihat kembali ketersediaan sumber daya di masa mendatang, lalu buat dan kirimkan permintaan peninjauan baru.
Siklus proses permintaan
Diagram berikut menunjukkan berbagai status yang dapat ditetapkan Compute Engine untuk permintaan pemesanan untuk masa mendatang dalam mode kalender:
Status dan alur peristiwa yang ditampilkan dalam diagram sebelumnya adalah sebagai berikut:
PENDING_APPROVAL: Anda membuat dan mengirimkan permintaan peninjauan. Dalam satu menit, Cloud de Confiance menyetujui permintaan.APPROVED: Cloud de Confiance telah menyetujui permintaan Anda. Kemudian, dalam waktu satu menit, Compute Engine akan membuat pemesanan kosong dan mengubah status permintaan menjadiPROCURING.PROCURING: Compute Engine menjadwalkan penyediaan resource yang dipesan. Untuk mencegah penyediaan ini, Anda dapat membatalkan permintaan Anda jika memenuhi salah satu kondisi berikut:Waktu mulai lebih dari 30 hari lagi.
Anda membatalkan permintaan dalam waktu 24 jam setelah persetujuan, dan waktu mulai setidaknya empat hari lagi.
Sebelum permintaan mencapai waktu mulainya, status permintaan akan berubah menjadi
PROVISIONING.CANCELLED: Anda membatalkan permintaan saat permintaan berada dalam statusPROCURING. Tindakan ini akan melepaskan kapasitas yang Anda pesan dan Anda tidak akan dikenai biaya untuk kapasitas tersebut. Anda dapat menyimpan permintaan untuk referensi di masa mendatang, atau menghapusnya jika tidak lagi diperlukan.PROVISIONING: Compute Engine menyediakan resource yang dipesan dengan meningkatkan jumlah VM GPU, VM H4D, atau TPU yang dipesan dalam pemesanan yang dibuat secara otomatis. Saat permintaan mencapai waktu mulainya, status permintaan akan berubah menjadiFULFILLED.FULFILLED: Compute Engine telah menyediakan resource yang dipesan, dan Anda akan ditagih untuk resource tersebut. Anda dapat menggunakan pemesanan yang dibuat secara otomatis dengan membuat VM hingga waktu berakhir permintaan.
Saat permintaan mencapai waktu berakhirnya, Compute Engine akan menghapus pemesanan yang dibuat otomatis, dan menghentikan atau menghapus VM apa pun yang menggunakan pemesanan tersebut berdasarkan tindakan penghentian yang dikonfigurasi di VM. Anda dapat menyimpan permintaan dalam mode kalender untuk catatan, atau menghapus permintaan jika Anda tidak memerlukannya lagi.
Menggunakan kapasitas yang disediakan
Setelah Cloud de Confiance menyetujui permintaan pemesanan untuk masa mendatang dalam mode kalender, Compute Engine akan otomatis membuat pemesanan dengan karakteristik berikut:
Reservasi yang dibuat otomatis tidak memiliki VM GPU, VM H4D, atau TPU yang dipesan; Anda belum dapat menggunakannya.
Pemesanan yang dibuat secara otomatis mewarisi properti VM atau TPU yang ditentukan dalam permintaan Anda.
Pada waktu mulai permintaan, Compute Engine akan menyediakan kapasitas yang Anda minta dengan meningkatkan jumlah VM GPU, VM H4D, atau TPU dalam pemesanan yang dibuat secara otomatis. Selanjutnya, Anda dapat menggunakan reservasi dengan membuat VM GPU, VM H4D, atau VM TPU yang memenuhi semua kondisi berikut:
VM dan reservasi memiliki properti yang cocok.
VM menggunakan model penyediaan terikat reservasi.
VM harus dihentikan atau dihapus pada waktu berakhirnya pemesanan.
Anda dapat membuat VM hingga pemesanan digunakan sepenuhnya atau hingga waktu berakhir permintaan. Pada waktu berakhir permintaan, Compute Engine akan menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus VM apa pun yang menggunakan pemesanan tersebut.
Kuota
Persyaratan kuota untuk permintaan pemesanan untuk masa mendatang dalam mode kalender bergantung pada jenis mesin sebagai berikut:
Jenis mesin GPU dan TPU: tidak ada kuota yang diperlukan untuk mencadangkan kapasitas.
Jenis mesin H4D: Kuota CPU digunakan.
Saat membuat VM dengan menggunakan kapasitas yang dipesan, Anda harus memiliki kuota yang cukup untuk resource apa pun yang bukan bagian dari pemesanan Anda, seperti disk atau alamat IP. Jika tidak, pembuatan VM akan gagal.
Harga
Saat Anda membuat dan mengirimkan permintaan pemesanan untuk masa mendatang dalam mode kalender, dan Cloud de Confiance menyetujui permintaan Anda, Anda tidak akan langsung dikenai biaya. Sebagai gantinya, Anda akan dikenai biaya saat hal berikut terjadi:
Compute Engine menyediakan kapasitas yang Anda minta. Saat permintaan Anda mencapai status
FULFILLEDpada waktu mulai permintaan, Anda akan dikenai biaya untuk resource yang disediakan sesuai dengan harga DWS. Model penetapan harga ini menawarkan vCPU, memori, GPU, dan TPU dengan harga diskon dibandingkan dengan harga standar.Anda menggunakan resource di luar reservasi. Saat membuat VM yang menggunakan pemesanan yang dibuat secara otomatis, Anda tidak dikenai biaya tambahan untuk resource yang digunakan. Anda hanya dikenai biaya untuk resource yang bukan bagian dari reservasi, seperti disk atau alamat IP.
Anda berhenti dikenai biaya untuk resource yang dipesan pada waktu berakhirnya permintaan. Pada saat ini, Compute Engine akan menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus VM apa pun yang menggunakan pemesanan berdasarkan tindakan penghentiannya.
Batasan
Bagian berikut menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang dalam mode kalender.
Batasan untuk semua permintaan
Semua permintaan pemesanan untuk masa mendatang dalam mode kalender memiliki batasan berikut:
Anda dapat memesan resource untuk jangka waktu antara 1 dan 90 hari.
Setelah Anda mengirimkan permintaan dan Cloud de Confiance menyetujuinya, batasan berikut akan berlaku:
Anda dapat membatalkan permintaan jika memenuhi salah satu kondisi berikut:
Waktu mulai lebih dari 30 hari lagi.
Anda membatalkan permintaan dalam waktu 24 jam setelah persetujuan, dan waktu mulai setidaknya empat hari lagi.
Anda dapat menghapus permintaan setelah membatalkannya atau setelah permintaan mencapai waktu berakhirnya.
Anda tidak dapat mengubah permintaan.
Batasan untuk permintaan VM GPU atau H4D
Anda hanya dapat memesan VM GPU atau VM H4D sebagai berikut:
Anda dapat memesan jumlah VM berikut per permintaan:
Untuk VM GPU, antara 1 dan 80 VM
Untuk VM H4D, antara 1 dan 256 VM
Anda dapat memesan seri mesin berikut:
Anda hanya dapat memesan VM GPU atau H4D di zona tertentu. Untuk mengetahui informasi selengkapnya, lihat referensi berikut:
Untuk VM GPU, lihat Lokasi GPU.
Untuk VM H4D, lihat Region dan zona yang tersedia.
Anda tidak dapat menggunakan template instance untuk membuat permintaan VM GPU atau H4D.
Batasan untuk permintaan VM TPU
Anda hanya dapat memesan VM TPU sebagai berikut:
Anda dapat memesan 1, 4, 8, 16, 32, 64, 128, 256, 512, atau 1.024 chip TPU per permintaan.
Anda dapat memesan versi TPU berikut:
Anda hanya dapat memesan TPU di zona berikut:
TPU7x:
us-central1-c
TPU v6e:
asia-northeast1-beurope-west4-aus-east5-aus-east5-bus-south1-ai1b
TPU v5p:
us-east5-a
Batasan untuk semua pemesanan yang dibuat otomatis
Pemesanan yang dibuat secara otomatis untuk permintaan memiliki batasan berikut:
Anda hanya dapat mengubah pemesanan sebagai berikut:
Untuk mengizinkan atau melarang tugas Vertex AI menggunakannya.
Setelah waktu mulai pemesanan.
Anda tidak dapat menerapkan diskon abonemen (CUD) atau diskon untuk penggunaan berkelanjutan (SUD) ke reservasi.
Anda tidak dapat menghapus pemesanan; Compute Engine akan menghapusnya pada waktu berakhir pemesanan.