Crea políticas de cargas de trabajo para MIG

En este documento, se explica cómo crear políticas para grupos de instancias administrados (MIG) que tienen instancias de Compute Engine A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D. Para obtener más información sobre los requisitos y las limitaciones que se aplican cuando creas políticas de cargas de trabajo, consulta Acerca de las políticas de cargas de trabajo.

Una política de carga de trabajo te permite especificar la ubicación o la topología de las instancias de Compute Engine en tu MIG. Por ejemplo, puedes usar políticas de carga de trabajo para colocar instancias de procesamiento más cerca unas de otras, lo que minimiza la latencia de red para las cargas de trabajo de inteligencia artificial (IA), aprendizaje automático (AA) o computación de alto rendimiento (HPC).

Antes de comenzar

  • Si aún no lo hiciste, configura la autenticación. La autenticación verifica tu identidad para acceder a los servicios y las APIs de Cloud de Confiance by S3NS . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Selecciona la pestaña que corresponda a la forma en que planeas usar las muestras de esta página:

    gcloud

    1. Instala Google Cloud CLI y, luego, accede a gcloud CLI con tu identidad federada. Después de acceder, inicializa Google Cloud CLI con el siguiente comando:

      gcloud init
  • Configura una región y una zona predeterminadas.
  • REST

    Para usar las muestras de la API de REST incluidas en esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la gcloud CLI.

      Instala Google Cloud CLI y, luego, accede a gcloud CLI con tu identidad federada.

    Para obtener más información, consulta Autentícate para usar REST en la documentación de autenticación de Cloud de Confiance .

Roles obligatorios

Para obtener los permisos que necesitas para crear y aplicar políticas de cargas de trabajo a los MIG, pídele a tu administrador que te otorgue el rol de IAM Administrador de instancias de Compute (v1) (roles/compute.instanceAdmin.v1) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear y aplicar políticas de cargas de trabajo a los MIGs. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para crear y aplicar políticas de cargas de trabajo a los MIGs:

  • Para crear una política de cargas de trabajo, haz lo siguiente: compute.resourcePolicies.create en el proyecto

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Crear una política de cargas de trabajo

Para crear una política de carga de trabajo, usa uno de los siguientes métodos según la serie de máquinas que usen las instancias de procesamiento de tu MIG:

Crea una política de cargas de trabajo para instancias de A4X Max o A4X

Si aplicas una política de carga de trabajo a instancias A4X Max o A4X en un MIG, debes especificar un valor de topología del acelerador cuando crees la política. Esta acción ayuda a tus cargas de trabajo a lograr un rendimiento de red a gran escala y sin bloqueos.

Para crear una política de carga de trabajo para instancias A4X Max o A4X, selecciona una de las siguientes opciones:

gcloud

Para crear una política de cargas de trabajo para instancias A4X Max o A4X, usa el comando gcloud compute resource-policies create workload-policy con la marca --accelerator-topology=1x72:

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
    --accelerator-topology=1x72 \
    --type=high-throughput \
    --region=REGION

Reemplaza lo siguiente:

  • WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.

  • REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas A4X Max o A4X, consulta Regiones y zonas disponibles.

REST

Para crear una política de cargas de trabajo para instancias A4X Max o A4X, realiza una solicitud POST al método resourcePolicies.insert. En el cuerpo de la solicitud, incluye el campo acceleratorTopology configurado como 1x72:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies

{
  "name": "WORKLOAD_POLICY_NAME",
  "workloadPolicy": {
    "acceleratorTopology": "1x72",
    "type": "HIGH_THROUGHPUT"
  }
}

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID del proyecto en el que se creará la política de cargas de trabajo.

  • REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas A4X Max o A4X, consulta Regiones y zonas disponibles.

  • WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.

Crea una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D

Si deseas aplicar una política de carga de trabajo a instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en un MIG, te recomendamos que especifiques un valor de distancia máxima de la topología cuando crees tu política. Esta acción ayuda a garantizar una colocación más cercana entre tus instancias de procesamiento. Sin embargo, cuanto más compacta sea la posición que especifiques, menos recursos podrían estar disponibles en la zona en la que deseas crear tus instancias de procesamiento.

Para crear una política de cargas de trabajo para instancias A4, A3 Ultra, A3 Mega o A3 High (8 GPUs), selecciona una de las siguientes opciones:

gcloud

Para crear una política de cargas de trabajo, usa el comando gcloud compute resource-policies create workload-policy. Según qué tan cerca quieras colocar las instancias de procesamiento en un MIG, incluye las siguientes marcas en el comando:

  • Para colocar tus instancias de procesamiento cerca unas de otras de la mejor manera posible, incluye la marca --type=high-throughput:

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --type=high-throughput \
        --region=REGION
    
  • Para controlar aún más la ubicación de tus instancias de procesamiento, incluye las marcas --max-topology-distance y --type=high-throughput:

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --max-topology-distance=TOPOLOGY_DISTANCE \
        --type=high-throughput \
        --region=REGION
    

Reemplaza lo siguiente:

  • WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.

  • REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas con GPU, consulta Regiones y zonas disponibles.

  • TOPOLOGY_DISTANCE: Es la distancia máxima de la topología. Una distancia máxima más corta puede reducir la probabilidad de disponibilidad de la VM. Especifica uno de los siguientes valores:

    • Para colocar instancias de A4 o H4D en el mismo clúster, haz lo siguiente: CLUSTER

    • Para colocar instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en el mismo bloque, haz lo siguiente: BLOCK

    • Para colocar instancias de A4, A3 Ultra o H4D en el mismo subbloque, haz lo siguiente: SUBBLOCK

REST

Para crear una política de cargas de trabajo, realiza una solicitud POST al método resourcePolicies.insert. Según qué tan cerca quieras colocar las instancias de procesamiento en un MIG, incluye los siguientes campos en el cuerpo de la solicitud:

  • Para colocar tus instancias de procesamiento cerca unas de otras de la mejor manera posible, incluye el campo type en el cuerpo de la solicitud:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "type": "HIGH_THROUGHPUT"
      }
    }
    
  • Para controlar aún más la colocación de tus instancias de procesamiento, incluye los campos maxTopologyDistance y type en el cuerpo de la solicitud:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
    
    {
      "name": "WORKLOAD_POLICY_NAME",
      "workloadPolicy": {
        "maxTopologyDistance": "TOPOLOGY_DISTANCE",
        "type": "HIGH_THROUGHPUT"
      }
    }
    

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID del proyecto en el que se creará la política de cargas de trabajo.

  • REGION: Es la región en la que se creará tu política de carga de trabajo. Especifica una región en la que deseas crear el MIG y en la que esté disponible el tipo de máquina que deseas usar. Para revisar las regiones en las que están disponibles los tipos de máquinas con GPU, consulta Regiones y zonas disponibles.

  • WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.

  • TOPOLOGY_DISTANCE: Es la distancia máxima de la topología. Una distancia máxima más corta puede reducir la probabilidad de disponibilidad de la VM. Especifica uno de los siguientes valores:

    • Para colocar instancias de A4 o H4D en el mismo clúster, haz lo siguiente: CLUSTER

    • Para colocar instancias A4, A3 Ultra, A3 Mega, A3 High (8 GPUs) o H4D en el mismo bloque, haz lo siguiente: BLOCK

    • Para colocar instancias de A4, A3 Ultra o H4D en el mismo subbloque, haz lo siguiente: SUBBLOCK

¿Qué sigue?