Es posible que parte de la información de esta página (o toda) no se aplique a Cloud de Confiance de S3NS. Consulta Diferencias con Google Cloud para obtener más información.

Google utiliza tecnología de IA para traducir contenido a tu idioma preferido. Las traducciones realizadas con IA pueden contener errores.

Escalamiento según el uso de CPU

La forma más simple de realizar el ajuste de escala automático consiste en escalar un grupo de instancias administrado (MIG) en función del uso de CPU de sus instancias.

También puedes escalar automáticamente un MIG en función de la capacidad de entrega del balanceo de cargas, las métricas de Monitoring o los programas.

Antes de comenzar

Revisa las limitaciones del escalador automático.
Lee acerca de los aspectos básicos del escalador automático.
Si aún no lo hiciste, configura la autenticación. La autenticación verifica tu identidad para acceder a los servicios y las APIs de Cloud de Confiance by S3NS . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Selecciona la pestaña que corresponda a la forma en que planeas usar las muestras de esta página:
Console

Cuando usas la consola de Cloud de Confiance para acceder a los servicios y las APIs de Cloud de Confiance by S3NS , no necesitas configurar la autenticación.
gcloud
1. Instala Google Cloud CLI y, luego, accede a gcloud CLI con tu identidad federada. Después de acceder, inicializa Google Cloud CLI con el siguiente comando:
  gcloud init
  Nota: Si ya instalaste gcloud CLI, asegúrate de tener la versión más reciente. Para esto, ejecuta gcloud components update.
Configura una región y una zona predeterminadas.

REST

Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.

Instala Google Cloud CLI y, luego, accede a gcloud CLI con tu identidad federada.

Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Cloud de Confiance .

Escalamiento según el uso de CPU

Puedes ajustar la escala de forma automática en función del uso de CPU promedio de un grupo de instancias administrado (MIG). El uso de esta política le indica al escalador automático que recopile el uso de CPU de las instancias en el grupo y determine si necesita escalar. Estableces el uso objetivo de CPU que debe mantener el escalador automático y este funciona para mantenerlo.

El escalador automático considera el nivel de uso objetivo de CPU como una fracción del uso promedio de todas las CPU virtuales a lo largo del tiempo en el grupo de instancias. Si el uso promedio del total de las CPU virtuales supera el uso objetivo, el escalador automático agregará más instancias de VM. Si el uso promedio del total de las CPU virtuales es menor que el objetivo de uso, el escalador automático quitará instancias. Por ejemplo, si se establece el objetivo de uso en 0.75, se le indica al escalador automático que mantenga un uso promedio del 75% entre todas las CPU virtuales del grupo de instancias.

También puedes escalar en función del uso de CPU previsto. Si deseas obtener más información y ver si esto es adecuado para tu carga de trabajo, consulta Escala en función de las predicciones.

Habilita el ajuste de escala automático según el uso de CPU

Para habilitar el ajuste de escala automático según el uso de CPU, usa una de las siguientes opciones. Si deseas configurar un período de estabilización para controlar el ritmo del ajuste de escala, debes usar Google Cloud CLI o REST.

Permisos necesarios para esta tarea

Para realizar esta tarea, debes tener los siguientes permisos:

compute.autoscalers.create en el proyecto
compute.instanceGroupManagers.use en el proyecto

Console

En la consola de Cloud, ve a la página Grupos de instancias.

Ir a Grupos de instancias
Si tienes un grupo de instancias, haz clic en su nombre y, luego, en Editar. En la página de edición del grupo de instancias, haz lo siguiente:
1. Haz clic en Tamaño del grupo y ajuste de escala automático para expandir la sección.
2. Haz clic en Configurar ajuste de escala automático.
Si no tienes un grupo de instancias, haz clic en Crear grupo de instancias y sigue estos pasos:
1. En el campo Nombre, especifica un nombre para el grupo.
2. En la lista Plantilla de instancias, selecciona una plantilla.
3. En la sección Ubicación, según si crearás un MIG zonal o regional, elige una opción de la siguiente manera:
  - Para un MIG zonal, selecciona Zona única y, luego, una región y una zona.
  - Para un MIG regional, selecciona Varias zonas y, luego, una región y zonas.
En la sección Ajuste de escala automático, se agrega de forma predeterminada un indicador de ajuste de escala automático de uso de CPU. Puedes usar los valores predeterminados para el indicador o hacer lo siguiente:
1. Especifica la cantidad mínima y máxima de instancias que deseas que el escalador automático cree en este grupo.
2. Para editar el uso de CPU objetivo, haz clic en el indicador de uso de CPU para expandir la sección y especificar el porcentaje.
  1. En Ajuste de escala automático predictivo, selecciona Desactivado. Si deseas obtener más información sobre el ajuste de escala automático predictivo y si es adecuado para tu carga de trabajo, consulta Escala en función de las predicciones.
3. Haz clic en Listo.
Puedes usar el período de inactividad para indicarle al escalador automático cuánto tiempo tarda la aplicación en inicializarse. Especificar un período de inicialización preciso mejora las decisiones de escalador automático. Por ejemplo, cuando se escala horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que estas aún no representen el uso normal de tu aplicación. El período de inicialización predeterminado es de 60 segundos.
Haz clic en Guardar.

gcloud

Usa el subcomando set-autoscaling a fin de habilitar el ajuste de escala automático para un grupo de instancias administrado. Por ejemplo, mediante el siguiente comando, se crea un escalador automático que tiene un uso objetivo de CPU del 60%. Además del parámetro --target-cpu-utilization, también se requiere el parámetro --max-num-replicas cuando se crea un escalador automático:

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \
    --max-num-replicas 20 \
    --target-cpu-utilization 0.60 \
    --cool-down-period 90 \
    --stabilization-period 240

De manera opcional, establece las siguientes marcas para controlar el ajuste de escala automático:

Puedes usar la marca --cool-down-period para establecer el período de inicialización, que le indica al escalador automático cuánto tarda tu aplicación en inicializarse. Especificar un período de inicialización preciso mejora las decisiones de escalador automático. Por ejemplo, cuando se escala horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que estas aún no representen el uso normal de tu aplicación. El período de inicialización predeterminado es de 60 segundos.
Puedes usar la marca --stabilization-period para establecer el período de estabilización, que determina la duración del ajuste de escala reducido de tu MIG. Un período de estabilización más corto indica una eliminación más rápida de la VM para reducir la escala. El valor debe estar entre "0" y "3600" segundos. El valor predeterminado es "600" segundos. Para obtener más información, consulta las prácticas recomendadas para el período de estabilización.

De manera opcional, puedes habilitar el ajuste de escala automático predictivo para escalar horizontalmente antes de la carga prevista. A fin de saber si el ajuste de escala automático predictivo es adecuado para tu carga de trabajo, consulta Escala en función de las predicciones.

Puedes verificar que el ajuste de escala automático se habilitó de manera correcta mediante el subcomando instance-groups managed describe, que describe el grupo de instancias administrado correspondiente y proporciona información sobre las funciones de ajuste de escala automático para ese grupo de instancias:

gcloud compute instance-groups managed describe example-managed-instance-group

Para obtener una lista de los comandos y las marcas gcloud disponibles, consulta la referencia de gcloud.

REST

A fin de crear un escalador automático, usa el método autoscalers.insert para un MIG zonal o el método regionAutoscalers.insert para un MIG regional.

En el siguiente ejemplo, se crea un escalador automático para un MIG zonal:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers

El cuerpo de tu solicitud debe contener los campos name, target y autoscalingPolicy. autoscalingPolicy debe definir cpuUtilization y maxNumReplicas.

De manera opcional, configura los siguientes campos para controlar el ajuste de escala automático:

Puedes usar el campo coolDownPeriodSec para establecer el período de inicialización, que le indica al escalador automático cuánto tarda tu aplicación en inicializarse. Especificar un período de inicialización preciso mejora las decisiones de escalador automático. Por ejemplo, cuando se escala horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que estas aún no representen el uso normal de tu aplicación. El período de inicialización predeterminado es de 60 segundos.
Puedes usar el campo stabilizationPeriodSec para establecer el período de estabilización, que determina la duración del ajuste de reducción de escala de tu MIG. Un período de estabilización más corto indica una eliminación más rápida de la VM para reducir la escala. El valor debe estar entre "0" y "3600" segundos. El valor predeterminado es "600" segundos. Para obtener más información, consulta las prácticas recomendadas para el período de estabilización.

{
  "name": "example-autoscaler",
  "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group",
  "autoscalingPolicy": {
    "maxNumReplicas": 10,
    "cpuUtilization": {
      "utilizationTarget": 0.6
    },
    "coolDownPeriodSec": 90,
    "stabilizationPeriodSec": 240
  }
}

A fin de obtener más información sobre cómo habilitar el ajuste de escala automático según el uso de CPU, completa el instructivo sobre cómo usar el ajuste de escala automático para aplicaciones altamente escalables .

Cómo el escalador automático maneja el uso intensivo de CPU

Durante los períodos de uso intensivo de CPU, si el uso está cerca del 100%, el escalador automático estima que el grupo puede estar muy sobrecargado. En estos casos, el escalador automático aumenta la cantidad de máquinas virtuales en un 50% como máximo.

¿Qué sigue?

Obtén más información para habilitar el ajuste de escala automático predictivo.
Obtén más información sobre cómo administrar los escaladores automáticos.
Descubre cómo los escaladores automáticos toman decisiones.
Obtén información sobre cómo usar varios indicadores de ajuste de escala automático para escalar tu grupo.