Menyesuaikan layanan GKE dengan bantuan Gemini

Halaman ini menjelaskan cara menyesuaikan deployment Google Kubernetes Engine (GKE) untuk mengoptimalkan performa dan keandalan menggunakan Gemini Cloud Assist, kolaborator yang didukung AI untuk Cloud de Confiance by S3NS. Bantuan Gemini dapat mencakup rekomendasi, pembuatan kode, dan pemecahan masalah.

Di antara banyak manfaat lainnya, Gemini Cloud Assist dapat membantu Anda mencapai hal berikut:

  • Mengurangi biaya: mengidentifikasi resource nonaktif, menyesuaikan ukuran deployment, dan mengoptimalkan konfigurasi penskalaan otomatis untuk meminimalkan pengeluaran yang tidak perlu.
  • Meningkatkan keandalan dan stabilitas: secara proaktif mengidentifikasi potensi masalah, seperti perbedaan versi atau Anggaran Gangguan Pod yang tidak ada, untuk mencegah periode nonaktif dan memastikan ketahanan aplikasi.
  • Mengoptimalkan Workload AI/ML: mendapatkan bantuan untuk men-deploy, mengelola, dan mengoptimalkan workload AI/ML di GKE.
  • Menyederhanakan pemecahan masalah: menganalisis log dengan cepat dan menemukan akar penyebab error, sehingga menghemat waktu dan tenaga.

Halaman ini ditujukan untuk pengguna GKE yang sudah ada, serta Operator dan Developer yang menyediakan dan mengonfigurasi resource cloud serta men-deploy aplikasi dan layanan. Untuk mempelajari lebih lanjut peran umum dan contoh tugas yang dirujuk dalam Cloud de Confiance by S3NS konten, lihat Peran dan tugas pengguna GKE umum.

Pelajari cara dan waktu Gemini untuk Cloud de Confiance menggunakan data Anda.

Biaya

  • Gemini: Selama dalam Pratinjau, tidak ada biaya untuk menggunakan Gemini Cloud Assist.

  • GKE: Tidak ada biaya tambahan untuk menggunakan Gemini Cloud Assist di GKE.

Sebelum memulai

Untuk mulai menggunakan Gemini dengan GKE, selesaikan prasyarat berikut.

Panduan ini mengasumsikan bahwa Anda memiliki cluster GKE dan, sebaiknya, beberapa deployment yang berjalan.

Meminta Gemini Cloud Assist

Anda dapat memanggil Gemini Cloud Assist dari konsol. Cloud de Confiance Gemini Cloud Assist memungkinkan Anda menggunakan perintah natural language untuk mendapatkan bantuan terkait tugas dengan cepat dan efisien.

Untuk membuka Cloud Assist dari halaman GKE, ikuti langkah-langkah berikut:

  1. Di Cloud de Confiance konsol, di halaman pemilih project, pilih Cloud de Confiance project tempat Anda mengaktifkan Gemini Cloud Assist.

    Buka pemilih project

  2. Di Cloud de Confiance konsol, buka halaman tertentu di konsol Kubernetes Engine.

    Misalnya, buka halaman Ringkasan Kubernetes Engine.

    Buka Ringkasan Kubernetes Engine

    Jika Anda memiliki pertanyaan tentang resource tertentu, buka halaman yang relevan terlebih dahulu. Misalnya, di halaman Clusters, Gemini Cloud Assist dapat memberi saran tentang cara mengelola cluster, memantau kondisi cluster, dan memecahkan masalah cluster. Menggunakan Gemini di halaman konsol tertentu akan membantu memberikan konteks untuk pertanyaan Anda. Cloud de Confiance Gemini kemudian dapat menggunakan konteks ini, beserta project keseluruhan yang Anda gunakan, untuk menghasilkan bantuan yang lebih disesuaikan dan akurat.

  3. Untuk membuka panel Gemini Cloud Assist, klik ikon kilat spark Open or close Gemini AI chat di toolbar.

  4. Jika diminta, dan Anda menyetujui persyaratan, klik Accept.

  5. Masukkan perintah di panel Gemini. Lihat contoh alur kerja penggunaan Gemini untuk memecahkan masalah di bagian berikut.

Untuk mengetahui informasi selengkapnya tentang cara menggunakan Gemini di Cloud de Confiance konsol, lihat Menggunakan Gemini Cloud Assist.

Contoh penggunaan Gemini untuk memecahkan masalah

Gemini dapat membantu Anda memecahkan masalah di layanan GKE.

  1. Buka halaman Workloads di Cloud de Confiance konsol.

    Buka Workloads

  2. Pilih workload yang ingin Anda selesaikan masalahnya.

  3. Klik tab Logs.

  4. Klik ikon kilat spark Open or close Gemini AI chat di toolbar.

  5. Masukkan perintah untuk menjelaskan masalah yang Anda alami. Misalnya, "Aplikasi database accounts-db saya mengalami latensi tinggi". Gemini mungkin meminta lebih banyak konteks, seperti jenis database, cakupan dampak, seperti operasi dan pengguna yang terpengaruh oleh latensi.

  6. Gemini kemudian dapat memberikan panduan untuk menganalisis log sendiri, dan memberikan saran pemecahan masalah.

  7. Tinjau dan ikuti saran untuk menyelesaikan masalah.

Contoh perintah untuk Gemini Cloud Assist

Bagian ini menampilkan beberapa kasus penggunaan nyata dan menyarankan perintah yang dapat Anda coba tanyakan kepada Gemini. Respons sebenarnya yang Anda terima mungkin bersifat umum, atau mungkin dipersonalisasi dan dapat ditindaklanjuti berdasarkan status unik lingkungan Anda. Cloud de Confiance by S3NS Respons dapat mencakup Cloud de Confiance link konsol untuk meninjau dan mengelola resource Cloud Anda, serta link ke dokumentasi yang relevan untuk informasi lebih lanjut.

Mengurangi biaya

Tabel berikut menjelaskan perintah yang dapat Anda gunakan untuk membantu mengurangi biaya.

Perintah Jenis respons
"Bagaimana cara menghemat biaya di cluster GKE tanpa mengorbankan performa?"
  • Rekomendasi yang mengidentifikasi dan menyarankan penghapusan resource yang kurang dimanfaatkan, seperti cluster nonaktif.
  • Saran tentang cara mengaktifkan atau menyesuaikan mekanisme penskalaan otomatis.
  • Saran yang menyoroti potensi penghematan melalui peninjauan konfigurasi, seperti kebijakan retensi logging.
"Saya ingin mengupgrade cluster GKE my-docker-cluster. Ada rekomendasi?" Saran untuk menerapkan konfigurasi dan praktik terbaik Kubernetes tertentu, misalnya:
  • Menentukan permintaan dan batas resource untuk Pod guna membantu memastikan alokasi resource yang dapat diprediksi.
  • Menggunakan namespace khusus untuk mengisolasi workload.
  • Menerapkan Anggaran Gangguan Pod untuk membantu memastikan bahwa jumlah minimum replika Pod tersedia selama gangguan sukarela, seperti pemeliharaan atau upgrade node.
  • Menjadwalkan masa pemeliharaan untuk mengelola gangguan yang direncanakan dan meminimalkan periode nonaktif yang tidak terduga.
  • Mendaftarkan cluster di saluran rilis untuk mengelola upgrade versi GKE.
"Saya akan mengalami lonjakan traffic besar dalam beberapa minggu ke depan di cluster my-docker-cluster. Ada rekomendasi?"
  • Strategi untuk menskalakan jumlah Pod aplikasi menggunakan penskala otomatis Pod horizontal.
  • Strategi untuk meningkatkan resource (CPU, memori) per Pod menggunakan penskala otomatis Pod vertikal.
"Workload GKE mana yang tidak mengaktifkan HPA?" Daftar workload yang tidak mengaktifkan penskala otomatis Pod horizontal.

Meningkatkan keandalan dan stabilitas

Tabel berikut menjelaskan perintah yang dapat Anda gunakan untuk membantu meningkatkan keandalan dan stabilitas workload GKE.

Perintah Jenis respons
"Bagaimana cara membuat cluster GKE saya lebih andal dan mencegah periode nonaktif?"
  • Mengidentifikasi perbedaan versi di cluster dan menyarankan tindakan untuk mempertahankan kompatibilitas versi Kubernetes.
  • Memberikan rekomendasi untuk menerapkan isolasi resource.
  • Memberikan rekomendasi untuk mengonfigurasi Anggaran Gangguan Pod guna mempertahankan jumlah minimum replika Pod yang berjalan selama pemeliharaan atau upgrade yang direncanakan.
"Tunjukkan cara memindahkan workload dari namespace Default di my-cluster." Langkah-langkah untuk melakukan hal berikut:
  • Menyiapkan cluster target.
  • Memigrasikan aplikasi dan data ke cluster target.
  • Mengalihkan layanan dengan periode nonaktif minimal.
"Bagaimana cara memastikan ketersediaan tinggi untuk pod yang berjalan?"
  • Prosedur mendetail yang menentukan Deployment yang menggunakan podAntiAffinity, dan beberapa replika untuk redundansi.
  • Saran untuk menetapkan permintaan dan batas resource, serta menggunakan penskala otomatis Pod horizontal.

Mengoptimalkan GKE untuk workload AI/ML

Tabel berikut menjelaskan perintah yang dapat Anda gunakan untuk mendapatkan bantuan terkait deployment, pengelolaan, dan pengoptimalan workload AI/ML di GKE.

Perintah Jenis respons
"Apa konfigurasi node pool yang direkomendasikan untuk menjalankan pelatihan TensorFlow terdistribusi skala besar di GKE dengan GPU?" Rekomendasi untuk mengoptimalkan pelatihan ML TensorFlow terdistribusi di GKE dapat mencakup hal berikut:
  • Memilih jenis GPU dan mesin yang tepat.
  • Mengaktifkan penskalaan otomatis.
  • Mengoptimalkan konektivitas jaringan.
  • Memanfaatkan framework pelatihan terdistribusi.
  • Menerapkan langkah-langkah penghematan biaya.
"Bagaimana cara menggunakan GPU di GKE untuk pelatihan?" Ringkasan langkah-langkah dan pertimbangan untuk mengonfigurasi cluster dan workload agar menggunakan GPU.
"Berikan contoh deployment container penyajian model di GKE." Contoh dengan kode contoh untuk men-deploy container penyajian model di GKE. Contoh ini mungkin menggabungkan praktik terbaik dan membantu memastikan skalabilitas.
"Metrik apa yang harus saya lacak untuk menilai efektivitas penyiapan load balancing untuk inferensi?" Daftar metrik—seperti distribusi traffic, latensi, rasio error, CPU, dan penggunaan memori—untuk mendapatkan insight tentang performa dan kondisi penyiapan load balancing.

Menyederhanakan pemecahan masalah

Tabel berikut menjelaskan perintah yang dapat Anda gunakan untuk membantu menganalisis log dengan cepat dan mengidentifikasi akar penyebab error, sehingga menghemat waktu dan tenaga.

Perintah Jenis respons
"Apa maksud error ini?
Readiness probe failed: Get "https://10…./abcd": context deadline exceeded (Client.Timeout exceeded while awaiting headers)"
Menjelaskan bahwa kubelet gagal menjalankan pemeriksaan kesiapan untuk container dalam periode waktu tunggu yang ditentukan, dan menyarankan kemungkinan penyebab dan tindakan pemecahan masalah.
"Mengapa deployment nettools saya mengalami error ping: socket: Operation not permitted?" Menjelaskan bahwa perintah ping memerlukan kemampuan Konteks Keamanan CAP_NET_RAW, dan bahwa, secara default, container di Kubernetes berjalan dengan kumpulan kemampuan terbatas karena alasan keamanan.
"Apa artinya jika pod saya tidak dapat dijadwalkan karena error Cannot schedule pods: No preemption victims found for incoming pod." Menjelaskan cara kerja penjadwalan dan preemption Pod di Kubernetes. Mencantumkan langkah-langkah untuk memecahkan masalah terkait alasan tidak ditemukannya korban preemption.

Langkah berikutnya