A forma mais simples de criar uma escala automática é dimensionar um grupo de instâncias geridas (GIG) com base na utilização da CPU das respetivas instâncias.
Também pode criar uma escala automática de um GIG com base na capacidade de fornecimento do balanceamento de carga, métricas de monitorização ou horários.
Antes de começar
- Reveja as limitações do ajuste automático.
- Leia acerca dos princípios básicos do escalamento automático.
-
Se ainda não o tiver feito, configure a autenticação.
A autenticação valida a sua identidade para aceder a Trusted Cloud by S3NS serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Trusted Cloud console to access Trusted Cloud by S3NS services and APIs, you don't need to set up authentication.
gcloud
-
Instale a CLI Google Cloud e, em seguida, inicie sessão na CLI gcloud com a sua identidade federada. Depois de iniciar sessão, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
- Set a default region and zone.
REST
Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.
Instale a CLI Google Cloud e, em seguida, inicie sessão na CLI gcloud com a sua identidade federada. Depois de iniciar sessão, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Para mais informações, consulte o artigo Autenticar para usar REST na Trusted Cloud documentação de autenticação.
Dimensionamento com base na utilização da CPU
Pode criar uma escala automática com base na utilização média da CPU de um grupo de instâncias gerido (GIG). A utilização desta política indica ao redimensionador automático que recolha a utilização da CPU das instâncias no grupo e determine se precisa de ser dimensionado. Define a utilização da CPU alvo que o escalador automático deve manter e o escalador automático trabalha para manter esse nível.
O escalador automático trata o nível de utilização da CPU alvo como uma fração da utilização média de todas as CPUs virtuais ao longo do tempo no grupo de instâncias. Se a utilização média do total de vCPUs exceder a utilização alvo, o escalador automático adiciona mais instâncias de VM. Se a utilização média do total de vCPUs for inferior à utilização alvo, o escalador automático remove instâncias. Por exemplo, se definir uma utilização alvo de 0,75, indica ao escalador automático que deve manter uma utilização média de 75% entre todas as CPUs virtuais no grupo de instâncias.
Também pode ajustar a escala com base na utilização prevista da CPU. Para mais informações, e para ver se esta opção é adequada para a sua carga de trabalho, consulte o artigo Escalamento com base em previsões.
Ative a escalabilidade automática com base na utilização da CPU
Consola
Na consola, aceda à página Grupos de instâncias.
Se tiver um grupo de instâncias, clique no nome do grupo de instâncias e, de seguida, clique em Editar. Na página de edição do grupo de instâncias, faça o seguinte:
- Clique em Tamanho do grupo e ajuste automático para expandir a secção.
- Clique em Configurar escalamento automático.
Se não tiver um grupo de instâncias, clique em Criar grupo de instâncias e faça o seguinte:
- No campo Nome, especifique um nome para o grupo.
- Na lista Modelo de instância, selecione um modelo.
Na secção Localização, consoante esteja a criar um GIG zonal ou regional, escolha uma opção da seguinte forma:
- Para um MIG zonal, selecione Zona única e, de seguida, selecione uma região e uma zona.
- Para um MIG regional, selecione Várias zonas e, de seguida, selecione uma região e zonas.
Na secção Ajuste de escala automático, é adicionado um sinal de ajuste de escala automático da utilização da CPU por predefinição. Pode usar os valores predefinidos para o sinal ou fazer o seguinte:
- Especifique os números mínimo e máximo de instâncias que quer que o escalador automático crie neste grupo.
Para editar a utilização da CPU alvo, clique no sinal de utilização da CPU para expandir a secção e especificar a percentagem.
- Em Ajuste de escala preditivo, selecione Desativado. Para saber mais sobre o ajuste de escala preditivo e se é adequado para a sua carga de trabalho, consulte o artigo Ajuste de escala com base em previsões.
Clique em Concluído.
Pode usar o período de inicialização para indicar ao autoscaler quanto tempo a sua aplicação demora a inicializar. A especificação de um período de inicialização preciso melhora as decisões do escalador automático. Por exemplo, ao aumentar a escala, o escalador automático ignora os dados das VMs que ainda estão a ser inicializadas, porque essas VMs podem ainda não representar a utilização normal da sua aplicação. O período de inicialização predefinido é de 60 segundos.
Clique em Guardar.
gcloud
Use o subcomando
set-autoscaling
para ativar o dimensionamento automático para um grupo de instâncias gerido. Por exemplo, o seguinte comando cria um escalador automático com uma utilização de CPU alvo de 60%. Juntamente com o parâmetro--target-cpu-utilization
, o parâmetro--max-num-replicas
também é obrigatório quando cria um ajuste automático:gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \ --max-num-replicas 20 \ --target-cpu-utilization 0.60 \ --cool-down-period 90
Pode usar a flag
--cool-down-period
para definir o período de inicialização, que indica ao escalador automático quanto tempo a sua aplicação demora a inicializar. A especificação de um período de inicialização preciso melhora as decisões do escalador automático. Por exemplo, ao aumentar a escala, o escalador automático ignora os dados das VMs que ainda estão a ser inicializadas, porque essas VMs podem ainda não representar a utilização normal da sua aplicação. O período de inicialização predefinido é de 60 segundos.Opcionalmente, pode ativar a escala automática preditiva para aumentar a escala antes da carga prevista. Para saber se a escala automática preditiva é adequada para a sua carga de trabalho, consulte o artigo Escalar com base em previsões.
Pode verificar se o dimensionamento automático está ativado com êxito através do subcomando
instance-groups managed describe
, que descreve o grupo de instâncias gerido correspondente e fornece informações sobre quaisquer funcionalidades de dimensionamento automático para esse grupo de instâncias:gcloud compute instance-groups managed describe example-managed-instance-group
Para ver uma lista dos
gcloud
comandos e flags disponíveis, consulte agcloud
referência.REST
Para criar um escalador automático, use o método
autoscalers.insert
para um GIG zonal ou o métodoregionAutoscalers.insert
para um GIG regional.O exemplo seguinte cria um redimensionador automático para um MIG zonal:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/
O corpo do pedido tem de conter os campos
name
,target
eautoscalingPolicy
.autoscalingPolicy
tem de definircpuUtilization
emaxNumReplicas
.Pode usar o campo
coolDownPeriodSec
para definir o período de inicialização, que indica ao escalador automático quanto tempo a sua aplicação demora a inicializar. A especificação de um período de inicialização preciso melhora as decisões do escalador automático. Por exemplo, ao aumentar a escala, o escalador automático ignora os dados das VMs que ainda estão a ser inicializadas, porque essas VMs podem ainda não representar a utilização normal da sua aplicação. O período de inicialização predefinido é de 60 segundos.Opcionalmente, pode ativar a escala automática preditiva para aumentar a escala antes da carga prevista. Para saber se a escala automática preditiva é adequada para a sua carga de trabalho, consulte o artigo Escalar com base em previsões.
{ "name": "example-autoscaler", "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group", "autoscalingPolicy": { "maxNumReplicas": 10, "cpuUtilization": { "utilizationTarget": 0.6 }, "coolDownPeriodSec": 90 } }
Para mais informações sobre a ativação da escala automática com base na utilização da CPU, conclua o tutorial, Usar a escala automática para apps altamente escaláveis.
Como o escalador automático processa a utilização elevada da CPU
Durante períodos de utilização intensa da CPU, se a utilização estiver perto de 100%, o escalador automático estima que o grupo já pode estar muito sobrecarregado. Nestes casos, o escalamento automático aumenta o número de máquinas virtuais, no máximo, em 50%.
O que se segue?
- Saiba como ativar o ajuste de escala preditivo.
- Saiba como gerir os escaladores automáticos.
- Saiba como os escaladores automáticos tomam decisões.
- Saiba como usar vários sinais de ajuste automático da escala para ajustar a escala do seu grupo.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-10-02 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-02 UTC."],[],[],null,[]] -