En esta página, se describe la administración de extremos de modelos. La administración de extremos de modelos te permite experimentar con el registro de un extremo de modelo de IA y la invocación de predicciones. Para usar modelos de IA en entornos de producción, consulta Invoca predicciones en línea desde instancias de Cloud SQL.
Después de agregar y registrar los extremos del modelo en la administración de extremos del modelo, puedes hacer referencia a ellos con el ID del modelo para invocar predicciones.
Antes de comenzar
Asegúrate de completar las siguientes acciones:
- Registra el extremo de tu modelo con la administración de extremos de modelos. Para obtener más información, consulta Cómo registrar y llamar a modelos de IA remotos con la administración de extremos de modelos.
- Crea o actualiza tu instancia de Cloud SQL para que se pueda integrar en Vertex AI. Para obtener más información, consulta Habilita la integración de la base de datos con Vertex AI.
Invoca predicciones para modelos genéricos
Usa la función de SQL mysql.ml_predict_row()
para llamar a un extremo del modelo genérico registrado y, así, invocar predicciones. Puedes usar la función mysql.ml_predict_row()
con cualquier tipo de modelo.
SELECT
mysql.ml_predict_row(
'MODEL_ID',
'REQUEST_BODY');
Reemplaza lo siguiente:
MODEL_ID
: Es el ID del modelo que definiste cuando registraste el extremo del modelo.REQUEST_BODY
: los parámetros de la función de predicción, en formato JSON
Ejemplos
Para generar predicciones para un extremo del modelo gemini-flash
registrado, ejecuta la siguiente instrucción:
SELECT JSON_EXTRACT(
mysql.ml_predict_row(
'gemini-2.5-flash',
'{
"contents": [
{
"role": "user",
"parts": [
{
"text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find allsupplier names which are located in the India nation."
} ]}]
}'
),
'$.candidates[0].content.parts[0].text'
);