Vista geral da IA generativa
Este documento descreve as funcionalidades de inteligência artificial (IA) generativa que o BigQuery ML suporta. Estas funcionalidades permitem-lhe realizar tarefas de IA no BigQuery ML através de modelos do Vertex AI pré-preparados e modelos do BigQuery ML incorporados.
As tarefas suportadas incluem o seguinte:
- Gere texto
- Gere dados estruturados
- Gerar valores de um tipo específico por linha
- Gere incorporações
- Intervalos temporais de previsão
Aceda a um modelo do Vertex AI para realizar uma destas funções através da criação de um modelo remoto no BigQuery ML que representa o ponto final do modelo do Vertex AI. Depois de criar um modelo remoto sobre o modelo do Vertex AI que quer usar, acede às capacidades desse modelo executando uma função do BigQuery ML no modelo remoto.
Esta abordagem permite-lhe usar as capacidades destes modelos do Vertex AI em consultas SQL para analisar dados do BigQuery.
Fluxo de trabalho
Pode usar modelos remotos sobre modelos do Vertex AI e modelos remotos sobre os serviços de IA da nuvem juntamente com as funções do BigQuery ML para realizar análises de dados complexas e tarefas de IA generativa.
O diagrama seguinte mostra alguns fluxos de trabalho típicos em que pode usar estas capacidades em conjunto:
Gerar texto
A geração de texto é uma forma de IA generativa em que o texto é gerado com base num comando ou na análise de dados. Pode realizar a geração de texto usando dados de texto e multimodais.
Seguem-se alguns exemplos de utilização comuns para a geração de texto:
- Gerar conteúdo criativo.
- A gerar código.
- Gerar respostas de chat ou email.
- Brainstorming, como sugerir caminhos para produtos ou serviços futuros.
- Personalização de conteúdo, como sugestões de produtos.
- Classificar dados aplicando uma ou mais etiquetas ao conteúdo para o ordenar em categorias.
- Identificar os principais sentimentos expressos no conteúdo.
- Resumir as ideias ou as impressões principais transmitidas pelo conteúdo.
- Identificar uma ou mais entidades proeminentes em texto ou dados visuais.
- Traduzir o conteúdo de dados de texto ou áudio para um idioma diferente.
- Gerar texto que corresponda ao conteúdo verbal nos dados de áudio.
- Legendar ou fazer perguntas e respostas sobre dados visuais.
O enriquecimento de dados é um passo seguinte comum após a geração de texto, no qual enriquece as estatísticas da análise inicial combinando-as com dados adicionais. Por exemplo, pode analisar imagens de mobiliário doméstico para gerar texto para uma coluna design_type
, de modo que o SKU do mobiliário tenha uma descrição associada, como mid-century modern
ou farmhouse
.
Modelos suportados
Para realizar tarefas de IA generativa, pode usar modelos remotos no BigQuery ML para fazer referência a modelos implementados ou alojados no Vertex AI. Pode criar os seguintes tipos de modelos remotos:
- Modelos remotos sobre qualquer um dos modelos Gemini geralmente disponíveis ou em pré-visualização.
Modelos remotos sobre os seguintes modelos de parceiros:
Usar modelos de geração de texto
Depois de criar um modelo remoto, pode usar a função ML.GENERATE_TEXT
para interagir com esse modelo:
Para modelos remotos baseados em modelos Gemini, pode fazer o seguinte:
Use a função
ML.GENERATE_TEXT
para gerar texto a partir de um comando que especifica numa consulta ou extrai de uma coluna numa tabela padrão. Quando especifica o comando numa consulta, pode fazer referência aos seguintes tipos de colunas de tabelas no comando:STRING
colunas para fornecer dados de texto.STRUCT
colunas que usam oObjectRef
formato para fornecer dados não estruturados. Tem de usar aOBJ.GET_ACCESS_URL
função no comando para converter os valoresObjectRef
em valoresObjectRefRuntime
.
Use a função
ML.GENERATE_TEXT
para analisar conteúdo de texto, imagem, áudio, vídeo ou PDF de uma tabela de objetos com um comando que fornece como argumento de função.
Para todos os outros tipos de modelos remotos, pode usar a função
ML.GENERATE_TEXT
com um comando que fornece numa consulta ou a partir de uma coluna numa tabela padrão.
Use os seguintes tópicos para experimentar a geração de texto no BigQuery ML:
- Gere texto através de um modelo do Gemini e da função
ML.GENERATE_TEXT
. - Gere texto através de um modelo Gemma e da função
ML.GENERATE_TEXT
. - Analise imagens com um modelo Gemini.
- Gere texto com a função
ML.GENERATE_TEXT
com os seus dados. - Ajuste um modelo com os seus dados.
Atributos de segurança e fundamentação
Pode usar a
fundamentação
e os
atributos de segurança
quando usa modelos do Gemini com a função ML.GENERATE_TEXT
,
desde que esteja a usar uma tabela padrão para a entrada. A fundamentação permite que o modelo Gemini use informações adicionais da Internet para gerar respostas mais específicas e factuais. Os atributos de segurança permitem que o modelo Gemini filtre as respostas que devolve com base nos atributos que especificar.
Sintonização supervisionada
Quando cria um modelo remoto que faz referência a qualquer um dos seguintes modelos, pode optar por configurar ajustes supervisionados ao mesmo tempo:
gemini-2.5-pro
gemini-2.5-flash-lite
gemini-2.0-flash-001
gemini-2.0-flash-lite-001
gemini-1.5-pro-002
gemini-1.5-flash-002
Toda a inferência ocorre no Vertex AI. Os resultados são armazenados no BigQuery.
Vertex AI Provisioned Throughput
Para os
modelos Gemini suportados,
pode usar o
Vertex AI Provisioned Throughput
com a função ML.GENERATE_TEXT
para fornecer um débito elevado consistente para
pedidos. Para mais informações, consulte o artigo
Use o débito aprovisionado da Vertex AI.
Gere dados estruturados
A geração de dados estruturados é muito semelhante à geração de texto, exceto que também pode formatar a resposta do modelo especificando um esquema SQL.
Para gerar dados estruturados, crie um modelo remoto sobre qualquer um dos modelos Gemini
geralmente disponíveis
ou
em pré-visualização. Em seguida, pode usar a função
AI.GENERATE_TABLE
para interagir com esse modelo. Para experimentar a criação de dados estruturados, consulte o artigo
Gere dados estruturados através da função AI.GENERATE_TABLE
.
Pode especificar
atributos de segurança
quando usa modelos Gemini com a função AI.GENERATE_TABLE
para filtrar as respostas do modelo.
Gere valores de um tipo específico por linha
Pode usar funções de IA generativa escalares com modelos Gemini para
analisar dados em tabelas padrão do BigQuery. Os dados incluem dados de texto e dados não estruturados de colunas que contêm valores ObjectRef
.
Para cada linha na tabela, estas funções geram resultados que contêm um tipo específico.
Estão disponíveis as seguintes funções de IA:
AI.GENERATE
, que gera um valor deSTRING
AI.GENERATE_BOOL
AI.GENERATE_DOUBLE
AI.GENERATE_INT
Quando usa a função AI.GENERATE
com os modelos Gemini suportados, pode usar o débito processado do Vertex AI para fornecer um débito elevado consistente para pedidos. Para mais informações, consulte o artigo
Use o débito aprovisionado da Vertex AI.
Gere incorporações
Uma incorporação é um vetor numérico de alta dimensão que representa uma determinada entidade, como um fragmento de texto ou um ficheiro de áudio. A geração de incorporações permite-lhe captar a semântica dos seus dados de uma forma que facilita o raciocínio e a comparação dos dados.
Seguem-se alguns exemplos de utilização comuns para a geração de incorporações:
- Usar a geração aumentada de recuperação (RAG) para aumentar as respostas do modelo a consultas dos utilizadores, referenciando dados adicionais de uma fonte fidedigna. A RAG oferece uma melhor precisão factual e consistência das respostas, bem como acesso a dados mais recentes do que os dados de preparação do modelo.
- Realizar uma pesquisa multimodal. Por exemplo, usar a entrada de texto para pesquisar imagens.
- Realizar uma pesquisa semântica para encontrar itens semelhantes para recomendações, substituições e eliminação de duplicados de registos.
- Criar incorporações para usar com um modelo k-means para clustering.
Modelos suportados
Os seguintes modelos são suportados:
Para criar incorporações de texto, pode usar os seguintes modelos do Vertex AI:
gemini-embedding-001
(Pré-visualizar)text-embedding
text-multilingual-embedding
- Modelos abertos suportados (Pré-visualização)
Para criar incorporações multimodais, que podem incorporar texto, imagens e vídeos no mesmo espaço semântico, pode usar o modelo
multimodalembedding
do Vertex AI.Para criar incorporações para dados estruturados de variáveis aleatórias independentes e identicamente distribuídas (IID), pode usar um modelo de análise de componentes principais (PCA) do BigQuery ML ou um modelo de autoencoder.
Para criar incorporações de dados de utilizadores ou itens, pode usar um modelo de fatorização de matrizes do BigQuery ML.
Para uma incorporação de texto mais pequena e leve, experimente usar um modelo do TensorFlow pré-treinado, como o NNLM, o SWIVEL ou o BERT.
Usar modelos de geração de incorporações
Depois de criar o modelo, pode usar a função ML.GENERATE_EMBEDDING
para interagir com ele. Para todos os tipos de modelos suportados, o ML.GENERATE_EMBEDDING
funciona com dados estruturados em
tabelas padrão. Para modelos de incorporação multimodal, ML.GENERATE_EMBEDDING
também funciona com conteúdo visual de colunas de tabelas padrão que contêm valores ObjectRef
ou de tabelas de objetos .
Para modelos remotos, toda a inferência ocorre no Vertex AI. Para outros tipos de modelos, toda a inferência ocorre no BigQuery. Os resultados são armazenados no BigQuery.
Use os seguintes tópicos para experimentar a geração de texto no BigQuery ML:
- Gere incorporações de texto através da função
ML.GENERATE_EMBEDDING
- Gere incorporações de imagens através da
ML.GENERATE_EMBEDDING
função - Gere incorporações de vídeo com a função
ML.GENERATE_EMBEDDING
- Gere e pesquise incorporações multimodais
- Realize pesquisas semânticas e geração aumentada de recuperação
Previsão
A previsão é uma técnica que lhe permite
analisar dados de séries cronológicas do histórico para fazer uma previsão informada
sobre tendências futuras. Pode usar o modelo de séries cronológicas TimesFM
(pré-visualização) integrado do BigQuery ML para fazer previsões sem
ter de criar o seu próprio modelo. O modelo TimesFM integrado funciona com a função AI.FORECAST
para gerar previsões com base nos seus dados.
Localizações
As localizações suportadas para a geração de texto e os modelos de incorporação variam consoante o tipo e a versão do modelo que usa. Para mais informações, consulte o artigo Localizações. Ao contrário de outros modelos de IA generativa, o suporte de localização não se aplica ao modelo de série cronológica TimesFM incorporado. O modelo TimesFM está disponível em todas as regiões suportadas pelo BigQuery.
Preços
São-lhe cobrados os recursos de computação que usa para executar consultas em modelos. Os modelos remotos fazem chamadas aos modelos da Vertex AI, pelo que as consultas em relação a modelos remotos também incorrem em cobranças da Vertex AI.
Para mais informações, consulte os preços do BigQuery ML.
O que se segue?
- Para uma introdução à IA e ao ML no BigQuery, consulte o artigo Introdução à IA e ao ML no BigQuery.
- Para mais informações sobre a realização de inferências sobre modelos de aprendizagem automática, consulte a Vista geral da inferência de modelos.
- Para mais informações sobre as declarações e as funções SQL suportadas para modelos de IA generativa, consulte o artigo Percursos do utilizador completos para modelos de IA generativa.