Algumas ou todas as informações nesta página podem não se aplicar ao Cloud de Confiance by S3NS. Consulte o artigo Diferenças em relação ao Google Cloud para mais detalhes.

Esta página foi traduzida pela API Cloud Translation.

Dimensionamento com base na utilização da CPU

A forma mais simples de criar uma escala automática é dimensionar um grupo de instâncias geridas (GIG) com base na utilização da CPU das respetivas instâncias.

Também pode criar uma escala automática de um GIG com base na capacidade de fornecimento do balanceamento de carga, métricas de monitorização ou horários.

Antes de começar

Reveja as limitações do ajuste automático.
Leia acerca dos princípios básicos do escalamento automático.
Se ainda não o tiver feito, configure a autenticação. A autenticação valida a sua identidade para aceder a Cloud de Confiance by S3NS serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Cloud de Confiance console to access Cloud de Confiance by S3NS services and APIs, you don't need to set up authentication.
gcloud
1. Instale a CLI Google Cloud e, em seguida, inicie sessão na CLI gcloud com a sua identidade federada. Depois de iniciar sessão, inicialize a CLI gcloud executando o seguinte comando:
  gcloud init
  Nota: se instalou a CLI gcloud anteriormente, certifique-se de que tem a versão mais recente executando gcloud components update.
2. Set a default region and zone.
REST

Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.
Para mais informações, consulte o artigo Autenticar para usar REST na Cloud de Confiance documentação de autenticação.

Dimensionamento com base na utilização da CPU

Pode criar uma escala automática com base na utilização média da CPU de um grupo de instâncias gerido (GIG). A utilização desta política indica ao redimensionador automático que recolha a utilização da CPU das instâncias no grupo e determine se precisa de ser dimensionado. Define a utilização da CPU alvo que o escalador automático deve manter e o escalador automático trabalha para manter esse nível.

O escalador automático trata o nível de utilização da CPU alvo como uma fração da utilização média de todas as CPUs virtuais ao longo do tempo no grupo de instâncias. Se a utilização média do total de vCPUs exceder a utilização alvo, o escalador automático adiciona mais instâncias de VM. Se a utilização média do total de vCPUs for inferior à utilização alvo, o escalador automático remove instâncias. Por exemplo, se definir uma utilização alvo de 0,75, indica ao escalador automático que deve manter uma utilização média de 75% entre todas as CPUs virtuais no grupo de instâncias.

Também pode ajustar a escala com base na utilização prevista da CPU. Para mais informações, e para ver se esta opção é adequada para a sua carga de trabalho, consulte o artigo Escalamento com base em previsões.

Ative a escalabilidade automática com base na utilização da CPU

Autorizações necessárias para esta tarefa

Para realizar esta tarefa, tem de ter as seguintes autorizações:

compute.autoscalers.create no projeto
compute.instanceGroupManagers.use no projeto

Consola

Na consola, aceda à página Grupos de instâncias.

Aceda a Grupos de instâncias
Se tiver um grupo de instâncias, clique no nome do grupo de instâncias e, de seguida, clique em Editar. Na página de edição do grupo de instâncias, faça o seguinte:
1. Clique em Tamanho do grupo e ajuste automático para expandir a secção.
2. Clique em Configurar escalamento automático.
Se não tiver um grupo de instâncias, clique em Criar grupo de instâncias e faça o seguinte:
1. No campo Nome, especifique um nome para o grupo.
2. Na lista Modelo de instância, selecione um modelo.
3. Na secção Localização, consoante esteja a criar um GIG zonal ou regional, escolha uma opção da seguinte forma:
  - Para um MIG zonal, selecione Zona única e, de seguida, selecione uma região e uma zona.
  - Para um MIG regional, selecione Várias zonas e, de seguida, selecione uma região e zonas.
Na secção Ajuste de escala automático, é adicionado um sinal de ajuste de escala automático da utilização da CPU por predefinição. Pode usar os valores predefinidos para o sinal ou fazer o seguinte:
1. Especifique os números mínimo e máximo de instâncias que quer que o escalador automático crie neste grupo.
2. Para editar a utilização da CPU alvo, clique no sinal de utilização da CPU para expandir a secção e especificar a percentagem.
  1. Em Ajuste de escala preditivo, selecione Desativado. Para saber mais sobre o ajuste de escala preditivo e se é adequado para a sua carga de trabalho, consulte o artigo Ajuste de escala com base em previsões.
3. Clique em Concluído.
Pode usar o período de inicialização para indicar ao autoscaler quanto tempo a sua aplicação demora a inicializar. A especificação de um período de inicialização preciso melhora as decisões do escalador automático. Por exemplo, ao aumentar a escala, o escalador automático ignora os dados das VMs que ainda estão a ser inicializadas, porque essas VMs podem ainda não representar a utilização normal da sua aplicação. O período de inicialização predefinido é de 60 segundos.
Clique em Guardar.

gcloud

Use o subcomando set-autoscaling para ativar o dimensionamento automático para um grupo de instâncias gerido. Por exemplo, o seguinte comando cria um escalador automático com uma utilização de CPU alvo de 60%. Juntamente com o parâmetro --target-cpu-utilization, o parâmetro --max-num-replicas também é obrigatório quando cria um ajuste automático:

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \
    --max-num-replicas 20 \
    --target-cpu-utilization 0.60 \
    --cool-down-period 90

Pode usar a flag --cool-down-period para definir o período de inicialização, que indica ao escalador automático quanto tempo a sua aplicação demora a inicializar. A especificação de um período de inicialização preciso melhora as decisões do escalador automático. Por exemplo, ao aumentar a escala, o escalador automático ignora os dados das VMs que ainda estão a ser inicializadas, porque essas VMs podem ainda não representar a utilização normal da sua aplicação. O período de inicialização predefinido é de 60 segundos.

Opcionalmente, pode ativar a escala automática preditiva para aumentar a escala antes da carga prevista. Para saber se a escala automática preditiva é adequada para a sua carga de trabalho, consulte o artigo Escalar com base em previsões.

Pode verificar se o dimensionamento automático está ativado com êxito através do subcomando instance-groups managed describe, que descreve o grupo de instâncias gerido correspondente e fornece informações sobre quaisquer funcionalidades de dimensionamento automático para esse grupo de instâncias:

gcloud compute instance-groups managed describe example-managed-instance-group

Para ver uma lista dos gcloud comandos e flags disponíveis, consulte a gcloud referência.

REST

Para criar um escalador automático, use o método autoscalers.insert para um GIG zonal ou o método regionAutoscalers.insert para um GIG regional.

O exemplo seguinte cria um redimensionador automático para um MIG zonal:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/

O corpo do pedido tem de conter os campos name, target e autoscalingPolicy. autoscalingPolicy tem de definir cpuUtilization e maxNumReplicas.

Pode usar o campo coolDownPeriodSec para definir o período de inicialização, que indica ao escalador automático quanto tempo a sua aplicação demora a inicializar. A especificação de um período de inicialização preciso melhora as decisões do escalador automático. Por exemplo, ao aumentar a escala, o escalador automático ignora os dados das VMs que ainda estão a ser inicializadas, porque essas VMs podem ainda não representar a utilização normal da sua aplicação. O período de inicialização predefinido é de 60 segundos.

{
  "name": "example-autoscaler",
  "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group",
  "autoscalingPolicy": {
    "maxNumReplicas": 10,
    "cpuUtilization": {
      "utilizationTarget": 0.6
    },
    "coolDownPeriodSec": 90
  }
}

Para mais informações sobre a ativação da escala automática com base na utilização da CPU, conclua o tutorial, Usar a escala automática para apps altamente escaláveis.

Como o escalador automático processa a utilização elevada da CPU

Durante períodos de utilização intensa da CPU, se a utilização estiver perto de 100%, o escalador automático estima que o grupo já pode estar muito sobrecarregado. Nestes casos, o escalamento automático aumenta o número de máquinas virtuais, no máximo, em 50%.

O que se segue?

Saiba como ativar o ajuste de escala preditivo.
Saiba como gerir os escaladores automáticos.
Saiba como os escaladores automáticos tomam decisões.
Saiba como usar vários sinais de ajuste automático da escala para ajustar a escala do seu grupo.

Dimensionamento com base na utilização da CPU

Antes de começar

Console

gcloud

REST

Dimensionamento com base na utilização da CPU

Ative a escalabilidade automática com base na utilização da CPU

Autorizações necessárias para esta tarefa

Consola

gcloud

REST

Como o escalador automático processa a utilização elevada da CPU

O que se segue?