Vista geral da IA generativa

Este documento descreve as funcionalidades de inteligência artificial (IA) generativa que o BigQuery ML suporta. Estas funcionalidades permitem-lhe realizar tarefas de IA no BigQuery ML através de modelos do Vertex AI pré-preparados e modelos do BigQuery ML incorporados.

As tarefas suportadas incluem o seguinte:

Aceda a um modelo do Vertex AI para realizar uma destas funções através da criação de um modelo remoto no BigQuery ML que representa o ponto final do modelo do Vertex AI. Depois de criar um modelo remoto sobre o modelo do Vertex AI que quer usar, acede às capacidades desse modelo executando uma função do BigQuery ML no modelo remoto.

Esta abordagem permite-lhe usar as capacidades destes modelos do Vertex AI em consultas SQL para analisar dados do BigQuery.

Fluxo de trabalho

Pode usar modelos remotos sobre modelos do Vertex AI e modelos remotos sobre os serviços de IA da nuvem juntamente com as funções do BigQuery ML para realizar análises de dados complexas e tarefas de IA generativa.

O diagrama seguinte mostra alguns fluxos de trabalho típicos em que pode usar estas capacidades em conjunto:

Diagrama que mostra fluxos de trabalho comuns para modelos remotos que usam modelos da Vertex AI ou serviços de IA da nuvem.

Gerar texto

A geração de texto é uma forma de IA generativa em que o texto é gerado com base num comando ou na análise de dados. Pode realizar a geração de texto usando dados de texto e multimodais.

Seguem-se alguns exemplos de utilização comuns para a geração de texto:

  • Gerar conteúdo criativo.
  • A gerar código.
  • Gerar respostas de chat ou email.
  • Brainstorming, como sugerir caminhos para produtos ou serviços futuros.
  • Personalização de conteúdo, como sugestões de produtos.
  • Classificar dados aplicando uma ou mais etiquetas ao conteúdo para o ordenar em categorias.
  • Identificar os principais sentimentos expressos no conteúdo.
  • Resumir as ideias ou as impressões principais transmitidas pelo conteúdo.
  • Identificar uma ou mais entidades proeminentes em texto ou dados visuais.
  • Traduzir o conteúdo de dados de texto ou áudio para um idioma diferente.
  • Gerar texto que corresponda ao conteúdo verbal nos dados de áudio.
  • Legendar ou fazer perguntas e respostas sobre dados visuais.

O enriquecimento de dados é um passo seguinte comum após a geração de texto, no qual enriquece as estatísticas da análise inicial combinando-as com dados adicionais. Por exemplo, pode analisar imagens de mobiliário doméstico para gerar texto para uma coluna design_type, de modo que o SKU do mobiliário tenha uma descrição associada, como mid-century modern ou farmhouse.

Modelos suportados

Para realizar tarefas de IA generativa, pode usar modelos remotos no BigQuery ML para fazer referência a modelos implementados ou alojados no Vertex AI. Pode criar os seguintes tipos de modelos remotos:

Usar modelos de geração de texto

Depois de criar um modelo remoto, pode usar a função ML.GENERATE_TEXT para interagir com esse modelo:

  • Para modelos remotos baseados em modelos Gemini, pode fazer o seguinte:

    • Use a função ML.GENERATE_TEXT para gerar texto a partir de um comando que especifica numa consulta ou extrai de uma coluna numa tabela padrão. Quando especifica o comando numa consulta, pode fazer referência aos seguintes tipos de colunas de tabelas no comando:

    • Use a função ML.GENERATE_TEXT para analisar conteúdo de texto, imagem, áudio, vídeo ou PDF de uma tabela de objetos com um comando que fornece como argumento de função.

  • Para todos os outros tipos de modelos remotos, pode usar a função ML.GENERATE_TEXT com um comando que fornece numa consulta ou a partir de uma coluna numa tabela padrão.

Use os seguintes tópicos para experimentar a geração de texto no BigQuery ML:

Atributos de segurança e fundamentação

Pode usar a fundamentação e os atributos de segurança quando usa modelos do Gemini com a função ML.GENERATE_TEXT, desde que esteja a usar uma tabela padrão para a entrada. A fundamentação permite que o modelo Gemini use informações adicionais da Internet para gerar respostas mais específicas e factuais. Os atributos de segurança permitem que o modelo Gemini filtre as respostas que devolve com base nos atributos que especificar.

Sintonização supervisionada

Quando cria um modelo remoto que faz referência a qualquer um dos seguintes modelos, pode optar por configurar ajustes supervisionados ao mesmo tempo:

  • gemini-2.5-pro
  • gemini-2.5-flash-lite
  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-001
  • gemini-1.5-pro-002
  • gemini-1.5-flash-002

Toda a inferência ocorre no Vertex AI. Os resultados são armazenados no BigQuery.

Vertex AI Provisioned Throughput

Para os modelos Gemini suportados, pode usar o Vertex AI Provisioned Throughput com a função ML.GENERATE_TEXT para fornecer um débito elevado consistente para pedidos. Para mais informações, consulte o artigo Use o débito aprovisionado da Vertex AI.

Gere dados estruturados

A geração de dados estruturados é muito semelhante à geração de texto, exceto que também pode formatar a resposta do modelo especificando um esquema SQL.

Para gerar dados estruturados, crie um modelo remoto sobre qualquer um dos modelos Gemini geralmente disponíveis ou em pré-visualização. Em seguida, pode usar a função AI.GENERATE_TABLE para interagir com esse modelo. Para experimentar a criação de dados estruturados, consulte o artigo Gere dados estruturados através da função AI.GENERATE_TABLE.

Pode especificar atributos de segurança quando usa modelos Gemini com a função AI.GENERATE_TABLE para filtrar as respostas do modelo.

Gere valores de um tipo específico por linha

Pode usar funções de IA generativa escalares com modelos Gemini para analisar dados em tabelas padrão do BigQuery. Os dados incluem dados de texto e dados não estruturados de colunas que contêm valores ObjectRef. Para cada linha na tabela, estas funções geram resultados que contêm um tipo específico.

Estão disponíveis as seguintes funções de IA:

Quando usa a função AI.GENERATE com os modelos Gemini suportados, pode usar o débito processado do Vertex AI para fornecer um débito elevado consistente para pedidos. Para mais informações, consulte o artigo Use o débito aprovisionado da Vertex AI.

Gere incorporações

Uma incorporação é um vetor numérico de alta dimensão que representa uma determinada entidade, como um fragmento de texto ou um ficheiro de áudio. A geração de incorporações permite-lhe captar a semântica dos seus dados de uma forma que facilita o raciocínio e a comparação dos dados.

Seguem-se alguns exemplos de utilização comuns para a geração de incorporações:

  • Usar a geração aumentada de recuperação (RAG) para aumentar as respostas do modelo a consultas dos utilizadores, referenciando dados adicionais de uma fonte fidedigna. A RAG oferece uma melhor precisão factual e consistência das respostas, bem como acesso a dados mais recentes do que os dados de preparação do modelo.
  • Realizar uma pesquisa multimodal. Por exemplo, usar a entrada de texto para pesquisar imagens.
  • Realizar uma pesquisa semântica para encontrar itens semelhantes para recomendações, substituições e eliminação de duplicados de registos.
  • Criar incorporações para usar com um modelo k-means para clustering.

Modelos suportados

Os seguintes modelos são suportados:

Para uma incorporação de texto mais pequena e leve, experimente usar um modelo do TensorFlow pré-treinado, como o NNLM, o SWIVEL ou o BERT.

Usar modelos de geração de incorporações

Depois de criar o modelo, pode usar a função ML.GENERATE_EMBEDDING para interagir com ele. Para todos os tipos de modelos suportados, o ML.GENERATE_EMBEDDING funciona com dados estruturados em tabelas padrão. Para modelos de incorporação multimodal, ML.GENERATE_EMBEDDING também funciona com conteúdo visual de colunas de tabelas padrão que contêm valores ObjectRef ou de tabelas de objetos .

Para modelos remotos, toda a inferência ocorre no Vertex AI. Para outros tipos de modelos, toda a inferência ocorre no BigQuery. Os resultados são armazenados no BigQuery.

Use os seguintes tópicos para experimentar a geração de texto no BigQuery ML:

Previsão

A previsão é uma técnica que lhe permite analisar dados de séries cronológicas do histórico para fazer uma previsão informada sobre tendências futuras. Pode usar o modelo de séries cronológicas TimesFM (pré-visualização) integrado do BigQuery ML para fazer previsões sem ter de criar o seu próprio modelo. O modelo TimesFM integrado funciona com a função AI.FORECAST para gerar previsões com base nos seus dados.

Localizações

As localizações suportadas para a geração de texto e os modelos de incorporação variam consoante o tipo e a versão do modelo que usa. Para mais informações, consulte o artigo Localizações. Ao contrário de outros modelos de IA generativa, o suporte de localização não se aplica ao modelo de série cronológica TimesFM incorporado. O modelo TimesFM está disponível em todas as regiões suportadas pelo BigQuery.

Preços

São-lhe cobrados os recursos de computação que usa para executar consultas em modelos. Os modelos remotos fazem chamadas aos modelos da Vertex AI, pelo que as consultas em relação a modelos remotos também incorrem em cobranças da Vertex AI.

Para mais informações, consulte os preços do BigQuery ML.

O que se segue?