Nesta página, descrevemos como registrar um endpoint de modelo de IA e gerar incorporações de vetores com o gerenciamento de endpoints de modelo. Para usar modelos de IA em ambientes de produção, consulte Criar aplicativos de IA generativa usando o Cloud SQL e Trabalhar com embeddings de vetor.
Depois que os endpoints de modelo forem adicionados e registrados no gerenciamento de endpoints de modelo, você poderá referenciá-los usando o ID do modelo para gerar embeddings.
Antes de começar
Faça o seguinte:
- Registre o endpoint de modelo com o gerenciamento de endpoints de modelo. Para mais informações, consulte Registrar e chamar modelos de IA remotos usando o gerenciamento de endpoints de modelo.
- Crie ou atualize sua instância do Cloud SQL para que ela possa se integrar à Vertex AI. Para mais informações, consulte Ativar a integração de bancos de dados com a Vertex AI.
Gerar embeddings
Use a função SQL google_ml.embedding()
para chamar o endpoint do modelo registrado com
o tipo de modelo de embedding de texto e gerar embeddings.
Para chamar o modelo e gerar embeddings, use a seguinte consulta SQL:
SELECT
google_ml.embedding(
model_id => 'MODEL_ID',
content => 'CONTENT');
Substitua:
MODEL_ID
: o ID do modelo definido ao registrar o endpoint de modelo.CONTENT
: o texto a ser traduzido em um embedding de vetor.
Exemplos
Alguns exemplos de como gerar embeddings usando endpoints de modelo registrados são listados nesta seção.
Modelos de embedding de texto com suporte integrado
Para gerar embeddings para um endpoint de modelo textembedding-gecko@002
registrado,
execute a seguinte instrução:
SELECT
google_ml.embedding(
model_id => 'textembedding-gecko@002',
content => 'Cloud SQL is a managed, cloud-hosted SQL database service');