Questa pagina descrive la gestione degli endpoint del modello. La gestione degli endpoint dei modelli ti consente di sperimentare la registrazione di un endpoint di modello di AI e l'invocazione delle previsioni. Per utilizzare i modelli di AI negli ambienti di produzione, consulta Richiamare le previsioni online dalle istanze Cloud SQL.
Dopo aver aggiunto e registrato gli endpoint del modello nella gestione degli endpoint del modello, puoi farvi riferimento utilizzando l'ID modello per richiamare le previsioni.
Prima di iniziare
Assicurati di completare le seguenti azioni:
- Registra l'endpoint del modello con la gestione degli endpoint del modello. Per maggiori informazioni, consulta Registrare e chiamare modelli di AI remoti utilizzando la gestione degli endpoint dei modelli.
- Crea o aggiorna l'istanza Cloud SQL in modo che possa integrarsi con Vertex AI. Per ulteriori informazioni, vedi Abilitare l'integrazione del database con Vertex AI.
Richiamare le previsioni per i modelli generici
Utilizza la funzione SQL mysql.ml_predict_row()
per chiamare un endpoint del modello generico registrato per richiamare
le previsioni. Puoi utilizzare la funzione mysql.ml_predict_row()
con qualsiasi tipo di modello.
SELECT
mysql.ml_predict_row(
'MODEL_ID',
'REQUEST_BODY');
Sostituisci quanto segue:
MODEL_ID
: l'ID modello che hai definito durante la registrazione dell'endpoint del modelloREQUEST_BODY
: i parametri della funzione di previsione, in formato JSON
Esempi
Per generare previsioni per un endpoint del modello gemini-flash
registrato, esegui la seguente istruzione:
SELECT JSON_EXTRACT(
mysql.ml_predict_row(
'gemini-2.5-flash',
'{
"contents": [
{
"role": "user",
"parts": [
{
"text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find allsupplier names which are located in the India nation."
} ]}]
}'
),
'$.candidates[0].content.parts[0].text'
);