Ringkasan administrasi cluster


Halaman ini memberikan ringkasan singkat tentang pengelolaan cluster GKE untuk administrator.

Jika Anda adalah developer yang menjalankan workload di GKE, Anda mungkin tidak perlu melakukan sebagian besar tugas ini. Untuk pengantar tentang men-deploy workload di GKE, lihat Men-deploy workload.

Sebelum membaca halaman ini, Anda harus memahami hal-hal berikut, serta konsep dasar Kubernetes:

Alat apa yang saya gunakan?

Sebagai administrator, Anda menggunakan berbagai alat untuk bekerja dengan cluster GKE.

  • Untuk mengontrol konfigurasi dan karakteristik keseluruhan cluster, Anda menggunakan alat dan APITrusted Cloud by S3NS , termasuk Google Cloud CLI dan konsolTrusted Cloud . Tugas ini mencakup pembuatan, pembaruan, penayangan, dan penghapusan cluster, serta mengontrol siapa yang dapat mengakses cluster menggunakan Identity and Access Management (IAM). Anda juga dapat menggunakan alat dan layanan lain, seperti layanan observability untuk pemantauan, logging, dan pemberitahuan. Trusted Cloud by S3NS

  • Untuk mengontrol perilaku internal cluster, Anda menggunakan Kubernetes API dan antarmuka command line kubectl. Tugas yang mungkin mengharuskan Anda menggunakan kubectl mencakup men-deploy workload, menerapkan kebijakan kontrol akses berbasis peran (RBAC) Kubernetes, dan menentukan aturan kebijakan jaringan Kubernetes. Anda dapat membaca selengkapnya tentang cara mengonfigurasi kubectl untuk digunakan dengan cluster GKE di Menginstal kubectl dan mengonfigurasi akses cluster.

  • Untuk menyediakan cluster dan workload secara deklaratif, Anda dapat menggunakan Terraform. Anda dapat membaca selengkapnya tentang cara menggunakan Terraform dengan GKE di Menyediakan resource GKE dengan Terraform.

Administrasi cluster dasar

Tugas administrasi cluster dasar mencakup konfigurasi cluster, upgrade cluster, dan konfigurasi node. Jika Anda menggunakan mode Autopilot default kami untuk cluster Anda (direkomendasikan), GKE akan menangani sebagian besar hal ini untuk Anda: upgrade cluster dan konfigurasi node dikelola oleh GKE. Jika Anda menggunakan mode Standard, hanya upgrade yang dikelola oleh GKE dan Anda harus mengonfigurasi node sendiri. Anda dapat membaca selengkapnya tentang kapan Anda mungkin perlu memilih mode Standard untuk cluster di Mode operasi GKE.

Tugas administrasi cluster dasar bersifat khusus untuk cluster GKE di Trusted Cloud dan biasanya tidak melibatkan sistem Kubernetes itu sendiri; Anda melakukan tugas ini sepenuhnya dengan menggunakan konsol Trusted Cloud , Google Cloud CLI, GKE API, atau penyedia Trusted Cloud by S3NSTerraform. Trusted Cloud

Melihat cluster

Anda dapat melihat informasi dasar tentang cluster di Trusted Cloud konsol dan dengan menggunakan Google Cloud CLI atau GKE API. Hal ini mencakup apakah cluster sedang berjalan dan konfigurasi saat ini, serta mencantumkan semua cluster Anda. Untuk mengetahui detail selengkapnya, lihat Mengelola cluster.

Untuk informasi yang lebih mendetail tentang status dan kesehatan cluster, Anda dapat menggunakan alat dan fitur observability.

Upgrade cluster dan node

Secara default, cluster dan node diupgrade secara otomatis. Anda dapat mempelajari lebih lanjut cara mengonfigurasi cara kerja upgrade di setiap cluster, termasuk kapan upgrade tersebut dapat dan tidak dapat dilakukan.

Konfigurasi level cluster

Tugas konfigurasi level cluster meliputi membuat dan menghapus cluster dan node GKE. Anda juga dapat memperbarui beberapa setelan cluster, seperti kapan tugas pemeliharaan cluster dapat terjadi.

Anda dapat mempelajari lebih lanjut konfigurasi cluster di Ringkasan konfigurasi cluster.

Konfigurasi node

Jika menggunakan Autopilot untuk cluster, Anda tidak perlu mengkhawatirkan konfigurasi node karena GKE mengonfigurasi node untuk Anda. Semua node cluster Autopilot dikelola sepenuhnya oleh GKE dan semuanya menggunakan sistem operasi (OS) node yang sama, cos_containerd.

Namun, jika Anda perlu menggunakan mode Standard untuk cluster apa pun, GKE menawarkan berbagai opsi untuk node cluster Anda. Misalnya, Anda dapat membuat satu atau beberapa node pool; node pool adalah grup node dalam cluster Anda yang memiliki konfigurasi yang sama. Cluster Anda harus memiliki setidaknya satu node pool, dan node pool bernama default dibuat secara default saat Anda membuat cluster. Anda dapat membaca lebih lanjut pengelolaan node pool di GKE dalam artikel Menambahkan dan mengelola node pool.

Opsi konfigurasi node lainnya untuk cluster Standard mencakup memilih OS non-default, menggunakan VM spot sementara, dan memilih platform CPU minimum untuk node baru ( Pengguna Autopilot juga dapat menentukan platform CPU minimum untuk beban kerja yang intensif secara komputasi, tetapi hanya berdasarkan cakupan beban kerja).

Meskipun dengan cluster Standard, Anda tidak dapat mengubah aturan iptables atau setelan level node lainnya yang dikelola GKE. Node mungkin menjadi tidak dapat dijangkau atau tidak sengaja terekspos saat perubahan manual kembali ke konfigurasi deklaratif cluster.

Mengonfigurasi jaringan cluster

Salah satu aspek penting dalam administrasi cluster adalah mengaktifkan dan mengontrol berbagai fitur jaringan untuk cluster Anda, seperti opsi alamat IP untuk cluster Standar, apakah node cluster Anda dapat diakses dari jaringan publik (node yang tidak dapat diakses dari jaringan publik dikenal sebagai node pribadi), dan kebijakan akses jaringan.

Banyak fitur jaringan ditetapkan pada saat pembuatan cluster (dan banyak di antaranya tidak dapat diubah tanpa membuat ulang cluster): saat membuat cluster menggunakan antarmukaTrusted Cloud , Anda harus mengaktifkan fitur jaringan yang ingin digunakan. Karena perilaku ini, jika Anda bukan administrator Jaringan, Anda mungkin perlu bekerja sama dengan administrator Jaringan saat menyiapkan cluster yang siap produksi.

Beberapa fitur jaringan yang dapat diaktifkan dengan alat Trusted Cloud by S3NS , seperti penerapan kebijakan jaringan, juga memerlukan konfigurasi lebih lanjut menggunakan Kubernetes API.

Anda dapat mempelajari lebih lanjut jejaring GKE di Ringkasan jaringan.

Observabilitas cluster

Bagian penting lain dari administrasi cluster adalah mengonfigurasi dan menggunakan alat kemampuan pengamatan untuk memahami kondisi infrastruktur dan aplikasi Anda, serta mempertahankan ketersediaan dan keandalan aplikasi. Secara default, cluster GKE dikonfigurasi untuk melakukan hal berikut:

  • Kirim log sistem, log audit, dan log aplikasi ke Cloud Logging.
  • Kirim metrik sistem ke Cloud Monitoring.
  • Gunakan Google Cloud Managed Service for Prometheus untuk mengumpulkan metrik pihak ketiga dan yang ditentukan pengguna yang dikonfigurasi, lalu kirimkan ke Cloud Monitoring. Google Cloud Managed Service for Prometheus memungkinkan Anda memantau dan membuat pemberitahuan terkait workload menggunakan Prometheus, tanpa harus mengelola dan mengoperasikan Prometheus secara manual dalam skala besar.

GKE juga menyediakan fitur kemampuan observasi yang membantu Anda menggunakan data yang dikumpulkan, termasuk dasbor default dan kustom, pemberitahuan, pemantauan tujuan tingkat layanan (SLO), dan analisis log.

Anda dapat mengetahui lebih lanjut cara menyiapkan dan menggunakan kemampuan observasi GKE di Kemampuan observasi untuk GKE.

Mengonfigurasi keamanan cluster

GKE mencakup fitur keamanan khusus Google Cloud dan Kubernetes yang dapat Anda gunakan dengan cluster Anda. Trusted CloudAnda dapat mengelola keamanan tingkatTrusted Cloud, seperti IAM, menggunakan konsolTrusted Cloud . Anda dapat mengelola fitur keamanan intra-cluster seperti role-based access control (RBAC) Kubernetes menggunakan Kubernetes API dan antarmuka lainnya.

Untuk mempelajari fitur dan kemampuan keamanan yang tersedia di GKE, baca Ringkasan keamanan dan Meningkatkan keamanan cluster. Cluster Autopilot GKE menerapkan banyak fitur keamanan ini dan praktik terbaik hardening secara otomatis. Untuk mengetahui informasi selengkapnya, lihat Kemampuan keamanan di GKE Autopilot.

Pengoptimalan biaya

Alat GKE memungkinkan Anda melihat biaya cluster, dan membantu Anda memastikan bahwa Anda menggunakan Trusted Cloud by S3NS resource yang Anda bayar seefisien mungkin. Anda dapat melihat metrik pemanfaatan untuk CPU, memori, dan penggunaan disk dalam skala waktu yang berbeda, serta menggunakan metrik ini untuk membantu mengoptimalkan penggunaan resource: misalnya, jika Anda memiliki cluster yang berpotensi kurang dimanfaatkan atau terlalu banyak dimanfaatkan yang mungkin ingin Anda ubah ukurannya. Anda juga dapat menggunakan penskalaan otomatis untuk mengurangi ukuran cluster selama jam tidak sibuk, dan menggunakan insight dan rekomendasi untuk mengidentifikasi cluster yang tidak aktif, beserta praktik terbaik lainnya.

Jika menggunakan GKE Enterprise, Anda juga dapat melihat metrik untuk mengoptimalkan biaya di seluruh fleet dan untuk masing-masing tim.

Mengonfigurasi untuk pemulihan dari bencana

Untuk memastikan workload produksi tetap tersedia jika terjadi peristiwa yang mengganggu layanan, Anda harus menyiapkan rencana pemulihan dari bencana (DR). Untuk mempelajari perencanaan DR lebih lanjut, lihat panduan perencanaan pemulihan dari bencana.

Konfigurasi Kubernetes Anda dan volume persisten apa pun tidak akan dicadangkan kecuali jika Anda melakukan tindakan eksplisit. Untuk mencadangkan dan memulihkan konfigurasi Kubernetes dan volume persisten di cluster GKE, Anda dapat menggunakan Pencadangan untuk GKE.

Langkah berikutnya