Dokumen ini menjelaskan cara menskalakan grup instance terkelola (MIG) berdasarkan kapasitas penyajian Load Balancer Aplikasi eksternal atau Load Balancer Aplikasi internal. Artinya, penskalaan otomatis akan menambahkan atau menghapus instance VM dalam grup saat load balancer menunjukkan bahwa grup telah mencapai fraksi yang dapat dikonfigurasi dari tingkat kepenuhannya, di mana tingkat kepenuhannya ditentukan oleh kapasitas target dari mode balancing yang dipilih dari grup backend instance.
Anda juga dapat menskalakan MIG berdasarkan penggunaan CPU atau berdasarkan Metrik pemantauan.
Batasan
Anda dapat menskalakan grup instance terkelola secara otomatis berdasarkan kapasitas penyajian Load Balancer Aplikasi eksternal dan Load Balancer Aplikasi internal. Jenis load balancing lainnya tidak didukung.
Sebelum memulai
- Tinjau batasan autoscaler.
- Baca dasar-dasar autoscaler.
-
Jika Anda belum melakukannya, siapkan autentikasi.
Autentikasi adalah
proses yang digunakan untuk memverifikasi identitas Anda untuk mengakses Trusted Cloud by S3NS layanan dan API.
Untuk menjalankan kode atau sampel dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke
Compute Engine dengan memilih salah satu opsi berikut:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas gabungan Anda. Setelah login, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud init
- Set a default region and zone.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, Anda menggunakan kredensial yang Anda berikan ke gcloud CLI.
Instal Google Cloud CLI, lalu login ke gcloud CLI dengan identitas gabungan Anda. Setelah login, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud init
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Trusted Cloud .
Penskalaan berdasarkan kapasitas penyajian load balancing HTTP(S)
Compute Engine memberikan dukungan untuk load balancing dalam grup instance Anda. Anda dapat menggunakan penskalaan otomatis bersama dengan load balancing dengan menyiapkan autoscaler yang melakukan penskalaan berdasarkan beban instance Anda.
Load balancer HTTP(S) eksternal atau internal mendistribusikan permintaan ke layanan backend sesuai dengan peta URL-nya. Load balancer dapat memiliki satu atau beberapa layanan backend, yang masing-masing mendukung backend grup instance atau grup endpoint jaringan (NEG). Jika backend adalah grup instance, load balancer HTTP(S) akan menawarkan dua mode balancing:
UTILIZATION
danRATE
. DenganUTILIZATION
, Anda dapat menentukan target maksimum untuk penggunaan backend rata-rata atas instance dalam grup instance. DenganRATE
, Anda harus menentukan jumlah target permintaan per detik per instance atau per grup. (Hanya grup instance zona yang mendukung penentuan tingkat maksimum untuk seluruh grup. Grup instance terkelola regional tidak mendukung penentuan tingkat maksimum per grup.)Mode balancing dan kapasitas target yang Anda tetapkan menentukan kondisi yang digunakan Trusted Cloud untuk menentukan kapan VM backend berada pada kapasitas penuh. Trusted Cloud akan mencoba mengirimkan traffic ke VM yang responsif dan memiliki kapasitas yang tersisa. Jika semua VM sudah mencapai kapasitasnya, target penggunaan atau kecepatan akan terlampaui.
Saat Anda memasang autoscaler ke backend grup instance pada load balancer HTTP(S), autoscaler akan menskalakan grup instance terkelola untuk mempertahankan sebagian kecil dari kapasitas penyajian load balancing.
Misalnya, anggaplah kapasitas penyajian load balancing dari grup instance terkelola ditetapkan sebagai 100 RPS per instance. Jika Anda membuat autoscaler dengan kebijakan load balancing HTTP(S) dan menetapkannya untuk mempertahankan tingkat penggunaan target sebesar 0,8 atau 80%, autoscaler akan menambahkan atau menghapus instance dari grup instance terkelola untuk mempertahankan 80% kapasitas penyajian, atau 80 RPS per instance.
Diagram berikut menunjukkan cara autoscaler berinteraksi dengan grup instance terkelola dan layanan backend:
Autoscaler mengamati kapasitas penyajian grup instance terkelola, yang ditentukan dalam layanan backend, dan melakukan penskalaan berdasarkan target penggunaan. Dalam contoh ini, kapasitas penyajian diukur dalam nilai maxRatePerInstance
.Konfigurasi load balancing yang berlaku
Anda dapat menetapkan salah satu dari tiga opsi untuk kapasitas penyajian load balancing. Saat pertama kali membuat backend, Anda dapat memilih antara pemanfaatan backend maksimum, permintaan maksimum per detik per instance, atau permintaan maksimum per detik dari seluruh grup. Penskalaan otomatis hanya berfungsi dengan penggunaan backend maksimum dan permintaan maksimum per detik/instance karena nilai setelan ini dapat dikontrol dengan menambahkan atau menghapus instance. Misalnya, jika Anda menetapkan backend untuk menangani 10 permintaan per detik per instance, dan autoscaler dikonfigurasi untuk mempertahankan 80% dari rasio tersebut, autoscaler dapat menambahkan atau menghapus instance saat permintaan per detik per instance berubah.
Penskalaan otomatis tidak berfungsi dengan permintaan maksimum per grup karena setelan ini terpisah dari jumlah instance dalam grup instance. Load balancing terus mengirimkan jumlah maksimum permintaan per grup ke grup instance, berapa pun jumlah instance dalam grup.
Misalnya, jika Anda menetapkan backend untuk menangani 100 permintaan maksimum per grup per detik, load balancer akan mengirimkan 100 permintaan per detik ke grup, terlepas dari apakah grup memiliki dua instance atau 100 instance. Karena nilai ini tidak dapat disesuaikan, penskalaan otomatis tidak akan berfungsi dengan konfigurasi load balancing yang menggunakan jumlah maksimum permintaan per detik per grup.
Mengaktifkan penskalaan otomatis berdasarkan kapasitas penayangan load balancing
Konsol
- Buka halaman Instance groups di konsol Trusted Cloud .
- Jika Anda memiliki grup instance, pilih grup tersebut, lalu klik Edit. Jika Anda tidak memiliki grup instance, klik Buat grup instance.
- Klik Group size & autoscaling untuk meluaskan bagian tersebut.
- Dalam daftar Autoscaling mode, pastikan On: add and remove instances to the group dipilih.
- Tentukan jumlah minimum dan maksimum instance yang Anda inginkan untuk dibuat oleh autoscaler dalam grup ini.
- Di bagian Autoscaling signals, klik Add a signal.
- Tetapkan Signal type ke HTTP load balancing utilization.
Masukkan nilai Target HTTP load balancing utilization dalam persentase. Misalnya, untuk pemakaian load balancing HTTP sebesar 60%, masukkan
60
.Anda dapat menggunakan kolom Periode inisialisasi untuk menetapkan periode inisialisasi, yang akan memberi tahu autoscaler berapa lama waktu yang diperlukan aplikasi untuk diinisialisasi. Menentukan periode inisialisasi yang akurat akan meningkatkan keputusan autoscaler. Misalnya, saat penskalaan otomatis, autoscaler mengabaikan data dari VM yang masih melakukan inisialisasi karena VM tersebut mungkin belum mewakili penggunaan normal aplikasi Anda. Periode inisialisasi default adalah 60 detik.
Simpan perubahan Anda.
gcloud
Untuk mengaktifkan autoscaler yang melakukan penskalaan sesuai kapasitas penyajian, gunakan sub-perintah
set-autoscaling
. Misalnya, perintah berikut akan membuat autoscaler yang menskalakan grup instance terkelola target untuk mempertahankan 60% kapasitas penyajian. Bersama dengan parameter--target-load-balancing-utilization
, parameter--max-num-replicas
juga diperlukan saat membuat autoscaler:gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \ --max-num-replicas 20 \ --target-load-balancing-utilization 0.6 \ --cool-down-period 90
Anda dapat menggunakan flag
--cool-down-period
untuk menetapkan periode inisialisasi, yang akan memberi tahu autoscaler waktu yang diperlukan aplikasi untuk diinisialisasi. Menentukan periode inisialisasi yang akurat akan meningkatkan keputusan autoscaler. Misalnya, saat penskalaan otomatis, autoscaler mengabaikan data dari VM yang masih melakukan inisialisasi karena VM tersebut mungkin belum mewakili penggunaan normal aplikasi Anda. Periode inisialisasi default adalah 60 detik.Anda dapat memverifikasi bahwa autoscaler telah berhasil dibuat menggunakan sub-perintah
instance-groups managed describe
:gcloud compute instance-groups managed describe example-managed-instance-group
Untuk mengetahui daftar perintah dan flag
gcloud
yang tersedia, baca referensigcloud
.REST
Untuk membuat autoscaler, gunakan metode
autoscalers.insert
untuk MIG zona atau metoderegionAutoscalers.insert
untuk MIG regional.Contoh berikut akan membuat autoscaler untuk MIG zona:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/
Isi permintaan Anda harus berisi kolom
name
,target
, danautoscalingPolicy
.autoscalingPolicy
harus menentukanloadBalancingUtilization
.Anda dapat menggunakan kolom
coolDownPeriodSec
untuk menetapkan periode inisialisasi, yang akan memberi tahu autoscaler waktu yang diperlukan aplikasi untuk diinisialisasi. Menentukan periode inisialisasi yang akurat akan meningkatkan keputusan autoscaler. Misalnya, saat penskalaan otomatis, autoscaler mengabaikan data dari VM yang masih melakukan inisialisasi karena VM tersebut mungkin belum mewakili penggunaan normal aplikasi Anda. Periode inisialisasi default adalah 60 detik.{ "name": "example-autoscaler", "target": "zones/us-central1-f/instanceGroupManagers/example-managed-instance-group", "autoscalingPolicy": { "maxNumReplicas": 20, "loadBalancingUtilization": { "utilizationTarget": 0.8 }, "coolDownPeriodSec": 90 } }
Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan penskalaan otomatis berdasarkan kapasitas penyajian load balancing, selesaikan tutorial, Melakukan penskalaan otomatis layanan web secara global di Compute Engine.
Langkah berikutnya
- Pelajari cara mengelola autoscaler.
- Pelajari cara autoscaler membuat keputusan.
- Pelajari cara menggunakan beberapa sinyal penskalaan otomatis untuk menskalakan grup Anda.
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-08-19 UTC.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-19 UTC."],[[["This document explains how to configure autoscaling for a managed instance group (MIG) based on the serving capacity of an external or internal Application Load Balancer, which adjusts the number of VM instances based on load balancer metrics."],["Autoscaling with load balancing serving capacity works with two balancing modes: maximum backend utilization and maximum requests per second per instance, but it does not support scaling based on maximum requests per second for the entire group."],["To enable autoscaling based on HTTP load balancing utilization, you must specify the minimum and maximum number of instances for the group and define the target HTTP load balancing utilization as a percentage, along with the cool down period."],["You can configure the autoscaler through the Google Cloud console, using the `gcloud` command-line tool, or by making direct API calls via REST, each requiring specific permissions and settings, such as `target-load-balancing-utilization`."],["The cool down period, which is the time it takes for the application to initialize, is configurable and necessary for proper autoscaling operations, as it ensures that the autoscaler only considers data from fully initialized instances."]]],[]] -