Halaman ini menunjukkan cara men-deploy dan menskalakan workload dengan lebih cepat di cluster Google Kubernetes Engine (GKE) menggunakan node yang dimulai dengan cepat. Node yang dimulai dengan cepat digunakan di GKE dengan mode Autopilot berdasarkan upaya terbaik saat workload menggunakan konfigurasi yang kompatibel.
Node GKE yang dimulai dengan cepat memiliki waktu startup yang jauh lebih rendah untuk seri mesin yang kompatibel. Waktu startup yang dipercepat memberi Anda manfaat berikut:
- Cold start yang lebih cepat
- Penskalaan otomatis yang lebih cepat
- Latensi ekor panjang penjadwalan Pod yang ditingkatkan
- Efisiensi biaya infrastruktur yang ditingkatkan
Dengan node yang dimulai dengan cepat, GKE melakukan pra-inisialisasi resource hardware untuk mempercepat waktu startup. Resource yang telah diinisialisasi sebelumnya tersedia berdasarkan upaya terbaik. Permintaan lonjakan mungkin hanya dilayani sebagian. Tanpa node yang dimulai dengan cepat, resource akan diinisialisasi sesuai permintaan, dan node akan dilayani pada waktu startup normal.
Persyaratan
Node yang dimulai dengan cepat tidak memerlukan konfigurasi tambahan. GKE secara otomatis menggunakan node yang dimulai dengan cepat jika workload Anda menggunakan konfigurasi yang kompatibel. Anda harus memenuhi semua persyaratan berikut untuk menggunakan node yang dimulai dengan cepat:
- Gunakan cluster Autopilot, atau jalankan workload dalam mode Autopilot di cluster Standar Anda.
- Jangan gunakan fitur apa pun yang tidak kompatibel dengan node yang dimulai dengan cepat. Untuk mengetahui informasi selengkapnya, lihat Batasan.
Gunakan salah satu resource komputasi berikut yang dijelaskan dalam tabel masing-masing di bagian Persyaratan konfigurasi untuk resource komputasi yang memenuhi syarat:
Batasan
Fitur berikut tidak kompatibel dengan node GKE yang dimulai dengan cepat. Jika Anda menggunakan salah satu fitur ini, GKE akan menyediakan node dengan waktu startup yang umum:
- G2 dengan versi driver GPU
DEFAULTpada GKE versi sebelum 1.33.0-gke.1304000. Untuk 1.33.0-gke.1304000 atau yang lebih baru,LATESTdanDEFAULTberfungsi dengan node yang dimulai dengan cepat. - Boot disk sekunder pada versi sebelum 1.33.2-gke.1015000.
- Kunci enkripsi yang dikelola pelanggan (CMEK)
- Spot VM
- Kebijakan penempatan
- Dukungan multi-jaringan
Workload GPU Autopilot
Meminta GPU yang kompatibel dalam mode Autopilot menghasilkan waktu startup node hingga empat kali lebih cepat dan waktu penjadwalan Pod hingga dua kali lebih cepat daripada permintaan serupa dalam mode GKE Standar, karena workload GPU Autopilot dapat menggunakan node yang dimulai dengan cepat.
Berikut adalah beberapa contoh kasus penggunaan. Namun, Pod apa pun yang memenuhi kondisi dari bagian Persyaratan kompatibel dengan node yang dimulai dengan cepat.
ComputeClass
Minta jenis dan jumlah akselerator yang kompatibel di ComputeClass, seperti dalam contoh berikut:
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
priorities:
- gpu:
type: ACCELERATOR_TYPE
count: ACCELERATOR_COUNT
nodePoolAutoCreation:
enabled: true
Saat Anda memilih ComputeClass ini di Pod, seperti dalam contoh berikut, GKE akan menggunakan node yang dimulai dengan cepat:
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
# Select a ComputeClass that requests compatible GPUs
cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
containers:
- name: my-container
image: registry.k8s.io/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
Ganti nilai berikut:
ACCELERATOR_COMPUTE_CLASS_NAME: nama ComputeClass yang meminta akselerator.ACCELERATOR_TYPE: jenis akselerator.ACCELERATOR_COUNT: jumlah akselerator yang diperlukan oleh Pod. Nilai ini harus kurang dari atau sama dengan nilai di kolomspec.priorities.gpu.countdi ComputeClass.POD_NAME: nama Pod Anda.
Untuk mengetahui informasi selengkapnya tentang ComputeClass, lihat Tentang class komputasi kustom.
Spesifikasi pod
Pilih jenis dan jumlah akselerator yang kompatibel dalam spesifikasi Pod Anda, seperti dalam contoh berikut:
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
cloud.google.com/gke-accelerator: ACCELERATOR_NAME
containers:
- name: my-container
image: registry.k8s.io/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
Ganti nilai berikut:
POD_NAME: nama Pod Anda.ACCELERATOR_NAME: nama akselerator yang diperlukan oleh Pod.ACCELERATOR_COUNT: jumlah akselerator yang diperlukan oleh Pod.
Persyaratan konfigurasi untuk resource komputasi yang memenuhi syarat
Tabel di bagian berikut menjelaskan persyaratan khusus agar GKE menyediakan resource komputasi yang relevan sebagai node yang dimulai dengan cepat.
Platform komputasi yang dioptimalkan container Autopilot
Lihat persyaratan berikut agar GKE menyediakan node yang dimulai dengan cepat dengan platform komputasi yang dioptimalkan container Autopilot.
| Resource komputasi | Dukungan versi dan saluran rilis | Disk yang didukung |
|---|---|---|
| Platform komputasi yang dioptimalkan container Autopilot |
|
|
Seri mesin G2
Lihat persyaratan berikut agar GKE menyediakan mesin G2 sebagai node yang dimulai dengan cepat.
| Resource komputasi | Dukungan versi dan saluran rilis | Disk yang didukung |
|---|---|---|
| Seri mesin G2 |
|
|
Seri mesin A2
Lihat persyaratan berikut agar GKE menyediakan mesin A2 sebagai node yang dimulai dengan cepat.
| Resource komputasi | Dukungan versi dan saluran rilis | Disk yang didukung |
|---|---|---|
| Jenis mesin A2 Standar |
|
|
| Jenis mesin A2 Ultra |
|
|
Jenis mesin A3 Mega
Lihat persyaratan berikut agar GKE menyediakan mesin A3 Mega sebagai node yang dimulai dengan cepat.
| Resource komputasi | Dukungan versi dan saluran rilis | Disk yang didukung |
|---|---|---|
| Jenis mesin A3 Mega |
|
|
Seri mesin G4
Lihat persyaratan berikut agar GKE menyediakan mesin G4 sebagai node yang dimulai dengan cepat.
| Resource komputasi | Dukungan versi dan saluran rilis | Disk yang didukung |
|---|---|---|
| Seri mesin G4 |
|
|
Harga
Node yang dimulai dengan cepat tersedia di GKE Autopilot tanpa biaya tambahan. Untuk mengetahui informasi selengkapnya tentang harga GKE Autopilot, lihat bagian Mode Autopilot di Harga Google Kubernetes Engine.
Langkah berikutnya
- Tentang platform komputasi yang dioptimalkan container Autopilot
- Tentang class komputasi kustom
- Ringkasan performa Persistent Disk