Registra y llama a modelos de IA remotos con la administración de extremos de modelos

En esta página, se describe cómo invocar predicciones o generar incorporaciones con un modelo y, luego, registrar el extremo del modelo con la administración de extremos del modelo.

Para obtener más información sobre la función mysql.ml_create_model_registration(), consulta la referencia de administración de extremos de modelos.

Antes de comenzar

  • Según el proveedor del modelo, configura la autenticación.

Configura la autenticación

En las siguientes secciones, se muestra cómo configurar la autenticación antes de agregar un extremo del modelo de Vertex AI o extremos del modelo alojados en Trusted Cloud by S3NS.

Configura la autenticación para Vertex AI

Para usar los extremos del modelo de Google Vertex AI, debes agregar permisos de Vertex AI a la cuenta de servicio de Cloud SQL basada en IAM que usas para conectarte a la base de datos. Para obtener más información sobre la integración en Vertex AI, consulta Integra Cloud SQL en Vertex AI.

Configura la autenticación para los modelos alojados de forma personalizada

En esta sección, se explica cómo configurar la autenticación si usas Secret Manager. En el caso de todos los modelos, excepto los extremos de modelos de Vertex AI, puedes almacenar tus claves de API o tokens de portador en Secret Manager.

Si el extremo de tu modelo no controla la autenticación a través de Secret Manager, esta sección es opcional. Por ejemplo, si el extremo de tu modelo usa encabezados HTTP para pasar información de autenticación o no usa autenticación en absoluto, no completes los pasos de esta sección.

Para crear y usar una clave de API o un token de portador, completa los siguientes pasos:

  1. Crea un secreto en Secret Manager. Para obtener más información, consulta Crea un secreto y accede a su versión.

    El nombre y la ruta del secreto se usan en la función SQL mysql.ml_create_sm_secret_registration().

  2. Otorga permisos a la instancia de Cloud SQL para acceder al secreto.

      gcloud secrets add-iam-policy-binding SECRET_ID \
          --member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
          --role="roles/secretmanager.secretAccessor"
    

    Reemplaza lo siguiente:

    • SECRET_ID: Es el ID del secreto en Secret Manager.
    • SERVICE_ACCOUNT_EMAIL: La dirección de correo electrónico de la cuenta de servicio de Cloud SQL basada en IAM. Para encontrar esta dirección de correo electrónico, usa el comando gcloud sql instances describe INSTANCE_NAME y reemplaza INSTANCE_NAME por el nombre de la instancia. El valor que aparece junto al parámetro serviceAccountEmailAddress es la dirección de correo electrónico.

Modelos de incorporación de texto con compatibilidad integrada

En esta sección, se muestra cómo registrar extremos de modelos para la administración de extremos de modelos.

Modelos de embeddings de Vertex AI

La administración de extremos de modelos proporciona compatibilidad integrada para todas las versiones de los modelos text-embedding-gecko, text-embedding y gemini-embedding de Vertex AI. Usa el nombre calificado para establecer la versión del modelo en textembedding-gecko@001 o textembedding-gecko@002.

Dado que los IDs de los extremos de los modelos de embeddings de Vertex AI son compatibles de forma predeterminada con la administración de extremos de modelos, puedes usar cualquiera de ellos directamente como ID del modelo. En el caso de estos modelos, la función de incorporación realiza automáticamente la transformación de entrada y salida.

Asegúrate de que la instancia de Cloud SQL y el modelo de Vertex AI que consultas estén en la misma región.

Para registrar el extremo del modelo gemini-embedding-001, llama a la función ml_create_model_registration:

  CALL
    mysql.ml_create_model_registration(
      'gemini-embedding-001',
      'publishers/google/models/gemini-embedding-001',
      'google','text_embedding', 'gemini-embedding-001',
      'AUTH_TYPE_CLOUDSQL_SERVICE_AGENT_IAM',
       NULL,
      'mysql.cloudsql_ml_text_embedding_input_transform',
      'mysql.cloudsql_ml_text_embedding_output_transform', NULL);

Modelos de incorporación de texto alojados de forma personalizada

En esta sección, se muestra cómo registrar extremos de modelos personalizados alojados en redes dentro de Trusted Cloud by S3NS.

Agregar extremos de modelos de incorporación de texto alojados de forma personalizada implica crear funciones de transformación y, de manera opcional, encabezados HTTP personalizados. Por otro lado, agregar extremos de modelos genéricos alojados de forma personalizada implica generar de forma opcional encabezados HTTP personalizados y establecer la URL de solicitud del modelo.

En el siguiente ejemplo, se agrega el extremo del modelo de incorporación de texto custom-embedding-model alojado por Cymbal, que se aloja dentro de Trusted Cloud by S3NS. Las funciones de transformación cymbal_text_input_transform y cymbal_text_output_transform se usan para transformar el formato de entrada y salida del modelo al formato de entrada y salida de la función de predicción.

Para registrar extremos de modelos de embeddings de texto alojados de forma personalizada, completa los siguientes pasos:

  1. Llama al secreto almacenado en Secret Manager:

    CALL
      mysql.ml_create_sm_secret_registration(
        'SECRET_ID',
        'projects/project-id/secrets/SECRET_MANAGER_SECRET_ID/versions/VERSION_NUMBER');
    

    Reemplaza lo siguiente:

    • SECRET_ID: Es el ID del secreto que estableciste y que se usa posteriormente cuando se registra un extremo del modelo, por ejemplo, key1.
    • SECRET_MANAGER_SECRET_ID: Es el ID del secreto que se configuró en Secret Manager cuando creaste el secreto.
    • PROJECT_ID: Es el ID de tu proyecto de Trusted Cloud by S3NS .
    • VERSION_NUMBER: Es el número de versión del ID del secreto.
  2. Crea las funciones de transformación de entrada y salida según la siguiente firma para la función de predicción de los extremos del modelo de incorporación de texto. Para obtener más información sobre cómo crear funciones de transformación, consulta Ejemplo de funciones de transformación.

    A continuación, se incluyen ejemplos de funciones de transformación específicas del extremo del modelo de incorporación de texto custom-embedding-model:

    -- Input Transform Function corresponding to the custom model endpoint
    DELIMITER $$
    CREATE FUNCTION IF NOT EXISTS cymbal_text_input_transform(model_id VARCHAR(100), input_text TEXT)
    RETURNS JSON
    DETERMINISTIC
    
    BEGIN
      RETURN JSON_OBJECT('prompt', JSON_ARRAY(input_text));
    END $$
    
    -- Output Transform Function corresponding to the custom model endpoint
    CREATE FUNCTION IF NOT EXISTS cymbal_text_output_transform(model_id VARCHAR(100), response_json JSON)
    RETURNS BLOB
    DETERMINISTIC
    
    BEGIN
      RETURN STRING_TO_VECTOR(
             JSON_EXTRACT(
                  content,
                  '$.predictions[0].embeddings.values'
                )
         );
    
    END $$
    DELIMITER ;
    
  3. Llama a la función de creación de modelos para registrar el extremo del modelo de incorporación personalizado:

   CALL
      mysql.ml_create_model_registration(
        'MODEL_ID',
        'REQUEST_URL',
        'custom',
        'text_embedding',
        'MODEL_QUALIFIED_NAME',
        'auth_type_secret_manager',
        'SECRET_ID'
        'database_name.cymbal_text_input_transform',
        'database_name.cymbal_text_output_transform', NULL);

Reemplaza lo siguiente:

  • MODEL_ID: Obligatorio. Es un ID único para el extremo del modelo que defines (por ejemplo, custom-embedding-model). Se hace referencia a este ID del modelo para los metadatos que el extremo del modelo necesita para generar incorporaciones o invocar predicciones.
  • REQUEST_URL: Obligatorio. Es el extremo específico del modelo cuando se agregan extremos de modelos genéricos y de incorporación de texto personalizados, por ejemplo, https://cymbal.com/models/text/embeddings/v1. Asegúrate de que se pueda acceder al extremo del modelo a través de una dirección IP interna. La administración de extremos de modelos no admite direcciones IP externas.
  • MODEL_QUALIFIED_NAME: Se requiere si el extremo del modelo usa un nombre calificado. Es el nombre completamente calificado en caso de que el extremo del modelo tenga varias versiones.
  • SECRET_ID: Es el ID del secreto que usaste antes en el procedimiento mysql.ml_create_sm_secret_registration().

Modelos genéricos

En esta sección, se muestra cómo registrar un extremo de modelo gemini-flash genérico de Vertex AI Model Garden, que está pre registrado en el catálogo de forma predeterminada. Puedes registrar cualquier extremo de modelo genérico alojado en Trusted Cloud by S3NS.

Cloud SQL solo admite extremos de modelos disponibles a través de Vertex AI Model Garden y extremos de modelos alojados en redes dentro de Trusted Cloud by S3NS.

Modelo de Gemini

En el siguiente ejemplo, se usa el extremo del modelo gemini-2.5-flash de Vertex AI Model Garden.

Para registrar el extremo del modelo gemini-2.5-flash, llama a la función mysql.ml_create_model_registration:

    CALL
      mysql.ml_create_model_registration(
        'MODEL_ID',
        'https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-2.5-flash:streamGenerateContent',
        'google',
        'auth_type_cloudsql_service_agent_iam',
        NULL, NULL, NULL, NULL);

Reemplaza lo siguiente:

  • MODEL_ID: Es un ID único para el extremo del modelo que defines (por ejemplo,
    gemini-1). Se hace referencia a este ID del modelo para los metadatos que el extremo del modelo necesita para generar incorporaciones o invocar predicciones.
  • PROJECT_ID: Es el ID de tu proyecto de Trusted Cloud by S3NS .

Para obtener más información, consulta cómo invocar predicciones para extremos de modelos genéricos.

¿Qué sigue?