Sebagian atau seluruh informasi di halaman ini mungkin tidak berlaku untuk Cloud de Confiance dari S3NS. Lihat Perbedaan dengan Google Cloud untuk mengetahui detail selengkapnya.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Tentang peristiwa host

Selama masa aktif instance virtual machine (VM) atau instance bare metal, mesin host tempat instance Anda berjalan dapat mengalami beberapa peristiwa host. Peristiwa host dapat mencakup pemeliharaan rutin infrastruktur Compute Engine, atau, dalam kasus yang jarang terjadi, error host. Anda dapat memilih cara instance komputasi merespons selama atau setelah peristiwa host dengan mengonfigurasi kebijakan pemeliharaan host.

Secara default, sebagian besar instance disetel ke migrasi langsung selama peristiwa host. Untuk semua seri mesin kecuali Z3, Anda dapat mengganti perilaku ini dan secara eksplisit menetapkan instance untuk dihentikan dan secara opsional dimulai ulang.

Beberapa instance komputasi tidak mendukung migrasi langsung, seperti berikut:

Instance H4D
Instance bare metal
Instance dengan GPU terpasang
Instance Z3 dengan Titanium SSD terpasang lebih dari 18 TiB.

Instance ini akan dihentikan selama peristiwa host. Untuk mengetahui informasi selengkapnya, lihat Perilaku pemeliharaan dan mulai ulang.

Jenis peristiwa host

Ada dua jenis peristiwa host, yang dijelaskan secara lebih mendetail di bagian berikut:

Peristiwa pemeliharaan
Error host

Jika instance Anda menjadi tidak responsif, hal ini juga dapat memicu mulai ulang atau penghentian instance.

Peristiwa pemeliharaan

Peristiwa pemeliharaan terjadi saat Compute Engine harus melakukan aktivitas pemeliharaan atau perbaikan yang mengharuskan VM dipindahkan dari server host. Jika Anda mengaktifkan kebijakan pemeliharaan host migrasi langsung untuk jenis instance yang didukung, Compute Engine akan memindahkan instance ke host baru, dan gangguan pada aplikasi Anda akan minimal.

Compute Engine juga menerapkan beberapa upgrade hypervisor dan jaringan ringan di latar belakang tanpa mengganggu dengan mempertahankan instance di host yang sama.

Perilaku instance selama peristiwa pemeliharaan dapat bervariasi bergantung pada masa sewa instance dan jenis mesin.

Untuk VM sole-tenant, perkiraan frekuensi peristiwa pemeliharaan host terencana adalah setiap 4 hingga 6 minggu. Dukungan migrasi langsung bergantung pada kebijakan pemeliharaan host untuk VM sole-tenant.

Anda dapat menemukan informasi tentang perilaku pemeliharaan untuk setiap jenis mesin di halaman kelompok mesin masing-masing, sebagai berikut:

Seri C:
- C2 dan C2D: Kelompok mesin yang dioptimalkan untuk komputasi
- C4N: Kelompok mesin yang dioptimalkan untuk jaringan
- Semua seri C lainnya: Kelompok mesin tujuan umum
Seri E, N, dan T: Kelompok mesin tujuan umum
Seri H: Kelompok mesin yang dioptimalkan untuk komputasi
Seri M dan X: Kelompok mesin yang dioptimalkan untuk memori
Seri Z: Kelompok mesin yang dioptimalkan untuk penyimpanan

Untuk kelompok mesin yang dioptimalkan untuk akselerator, lihat halaman berikut:

GPU: Menangani peristiwa pemeliharaan host GPU.
TPU: Bersiap untuk peristiwa pemeliharaan dalam dokumentasi Cloud TPU.

Error host

Error host (compute.instances.hostError) berarti terjadi masalah hardware atau software pada mesin fisik atau infrastruktur pusat data yang menghosting instance komputasi Anda yang menyebabkan instance Anda error. Error host yang melibatkan kegagalan hardware total atau masalah hardware lainnya dapat mencegah migrasi langsung instance Anda. Jika instance Anda disetel untuk otomatis memulai ulang, yang merupakan setelan default, Compute Engine akan memulai ulang instance Anda, biasanya dalam waktu tiga menit sejak error terdeteksi. Bergantung pada masalahnya, proses mulai ulang mungkin memerlukan waktu hingga 5,5 menit.

Terkadang, instance komputasi mungkin menjadi tidak responsif sebelum error host diberi sinyal. Anda dapat mengurangi jumlah waktu yang ditunggu Compute Engine untuk memulai ulang atau menghentikan instance dengan menetapkan waktu tunggu pemulihan error host. Untuk mengetahui informasi selengkapnya, lihat Menetapkan kebijakan ketersediaan.

Kegagalan fisik dan software terkadang dapat terjadi, tetapi jarang terjadi. Untuk melindungi aplikasi dan layanan Anda dari peristiwa sistem yang berpotensi mengganggu ini, tinjau referensi berikut:

Ringkasan kebijakan pemeliharaan host

Kebijakan pemeliharaan host instance menentukan perilakunya selama peristiwa host berikut:

Peristiwa pemeliharaan
Peristiwa error host atau instance tidak merespons

Anda dapat mengonfigurasi instance agar terus berjalan selama pemeliharaan host, sementara Compute Engine memigrasikannya secara langsung ke host lain atau Anda dapat memilih untuk menghentikan instance.

Anda dapat mengubah kebijakan pemeliharaan host instance dengan mengonfigurasi setelan berikut:

Perilaku pemeliharaan: apakah instance dimigrasikan secara langsung atau dihentikan saat ada peristiwa pemeliharaan.
Perilaku mulai ulang: apakah Compute Engine memulai ulang atau menghentikan instance jika instance error, mengalami error host, atau menjadi tidak responsif.
Waktu pendeteksian error host: jumlah waktu maksimum yang ditunggu Compute Engine untuk memulai ulang atau menghentikan instance setelah mendeteksi bahwa instance tidak responsif.

Anda dapat memperbarui kebijakan pemeliharaan host instance kapan saja untuk mengontrol perilaku instance yang Anda inginkan.

Perilaku pemeliharaan dan mulai ulang

Saat peristiwa host terjadi, instance komputasi dapat menggunakan migrasi langsung, atau instance dapat dihentikan. Jika instance dihentikan, Anda dapat memilih untuk memulai ulang instance sendiri atau meminta Compute Engine untuk otomatis memulainya ulang.

Seri mesin berikut mungkin tidak mendukung migrasi langsung, dan sebagai gantinya memerlukan penghentian selama peristiwa host:

Instance bare metal dihentikan dan dimulai ulang, yang berarti instance tersebut mungkin dimulai ulang di host lain. Untuk mengetahui detail selengkapnya, lihat dokumentasi "Pengalaman pemeliharaan" untuk seri mesin. Misalnya, untuk jenis mesin bare metal C3, lihat Pengalaman pemeliharaan untuk instance C3.
Instance Confidential VM kecuali untuk jenis mesin N2D dengan platform CPU AMD EPYC Milan yang menjalankan AMD SEV.
Instance dengan GPU
Instance dengan TPU

Migrasi langsung

Secara default, sebagian besar jenis instance disetel ke migrasi langsung, kecuali jenis instance yang disebutkan di bagian sebelumnya.

Selama migrasi langsung, Compute Engine akan otomatis memigrasikan instance Anda dari peristiwa pemeliharaan infrastruktur, dan instance Anda akan tetap berjalan selama migrasi. Instance Anda mungkin mengalami penurunan performa yang singkat, tetapi secara umum, performa sebagian besar instance tidak akan terlalu berbeda. Hal ini ideal untuk instance yang memerlukan waktu aktif yang konstan dan dapat mentoleransi penurunan performa yang singkat.

Saat Compute Engine memigrasikan instance Anda, Compute Engine akan melaporkan peristiwa sistem yang dipublikasikan ke daftar operasi zona dan ke log Peristiwa Sistem. Anda dapat meninjau peristiwa ini dengan melihat operasi Compute Engine untuk zona tertentu. Peristiwa migrasi langsung memiliki jenis operasi berikut:

compute.instances.migrateOnHostMaintenance

Menghentikan dan memulai ulang

Jika Anda tidak ingin instance melakukan migrasi langsung, atau jika jenis instance Anda tidak mendukung migrasi langsung, Anda dapat memilih untuk mengizinkan Cloud de Confiance by S3NS penghentian instance saat peristiwa host terjadi. Dengan konfigurasi ini, jika peristiwa host terjadi, Compute Engine akan mengirimkan sinyal soft power-off untuk menghentikan instance. Kemudian, Compute Engine akan menunggu 60 detik hingga instance berhenti secara bersih, dan menetapkan status instance ke TERMINATED. Jika instance tidak berhenti secara bersih dalam 60 detik, instance akan dihentikan secara paksa.

Opsi ini ideal jika instance Anda memerlukan performa maksimum yang konstan, dan jika aplikasi Anda secara keseluruhan dibuat untuk menangani kegagalan atau mulai ulang instance.

Saat Compute Engine menghentikan instance karena peristiwa host, Compute Engine akan melaporkan peristiwa sistem yang dipublikasikan ke daftar operasi zona dan ke log Peristiwa Sistem. Anda dapat meninjau peristiwa ini dengan melihat operasi Compute Engine untuk zona tertentu. Peristiwa penghentian instance memiliki jenis operasi berikut:

compute.instances.terminateOnHostMaintenance

Mulai ulang otomatis

Jika instance Anda dikonfigurasi untuk berhenti saat ada peristiwa pemeliharaan, atau jika instance Anda error karena masalah hardware yang mendasar, Compute Engine dapat otomatis memulai ulang instance. Instance akan dimulai ulang di server host yang sama, atau dipindahkan ke server lain di zona yang sama yang tidak berpartisipasi dalam peristiwa pemeliharaan.

Secara default, Compute Engine mencoba memulihkan instance dengan disk SSD Lokal terpasang selama satu jam. Jika batas waktu tercapai, Compute Engine akan mencoba memulai ulang instance di server host lain di zona yang sama.

Untuk mengonfigurasi mulai ulang otomatis, tetapkan kolom kebijakan pemeliharaan host automaticRestart ke true. Setelan ini tidak berlaku jika instance dibuat offline karena pemadaman layanan zona atau melalui operasi manual, seperti memanggil sudo shutdown dalam OS tamu.

Saat Compute Engine otomatis memulai ulang instance Anda, Compute Engine akan melaporkan peristiwa sistem yang dipublikasikan ke daftar operasi zona. Anda dapat meninjau peristiwa ini dengan melihat operasi Compute Engine untuk zona tertentu. Peristiwa mulai ulang otomatis memiliki jenis operasi berikut:

compute.instances.automaticRestart

Persistensi disk setelah penghentian instance

Karena Hyperdisk adalah penyimpanan yang terhubung ke jaringan, saat instance Anda dimulai ulang, Compute Engine akan memasang kembali disk boot dan disk sekunder ke instance. Data pada disk tersebut tetap ada melalui migrasi langsung dan mulai ulang instance.

Penjadwalan pemeliharaan

Cloud de Confiance by S3NS menyediakan fitur yang memungkinkan kontrol yang lebih ketat terkait pemeliharaan. Dengan menggunakan kelompok mesin tertentu, Anda dapat menentukan preferensi pemeliharaan dan mendapatkan notifikasi peristiwa pemeliharaan mendatang pemeliharaan melalui Cloud Logging, server metadata instance, perintah gcloud CLI compute instances describe atau metode REST instances.describe. Setelah menerima notifikasi, Anda memiliki jangka waktu untuk memulai pemeliharaan terjadwal pada waktu yang Anda pilih. Jika Anda tidak memicu pemeliharaan terjadwal, peristiwa pemeliharaan akan terjadi pada akhir periode waktu notifikasi, yang merupakan waktu terjadwal yang tercantum dalam notifikasi.

Anda dapat menggunakan fitur ini bersama dengan kebijakan pemeliharaan host untuk menyesuaikan jadwal pemeliharaan yang sesuai dengan workload Anda.

Langkah berikutnya

Pelajari migrasi langsung lebih lanjut.
Pelajari cara menetapkan kebijakan pemeliharaan host instance lebih lanjut.
Pelajari cara mendapatkan pemberitahuan migrasi langsung lebih lanjut.
Pelajari cara menyimulasikan pemeliharaan host lebih lanjut.
Pelajari lebih lanjut VM sole-tenant yang dimigrasikan secara manual.