Présentation de Conversational Analytics

L'analyse conversationnelle dans BigQuery vous permet de discuter avec des agents au sujet de vos données en langage naturel. Pour obtenir des réponses sur vos données, vous pouvez effectuer les actions suivantes :

  • Créez des agents de données qui définissent automatiquement le contexte des données et les instructions de traitement des requêtes pour un ensemble de sources de connaissances que vous sélectionnez, telles que des tables, des vues, des graphiques ou des fonctions définies par l'utilisateur (UDF).
  • Si nécessaire, vous pouvez créer du contexte et des instructions pour un agent sous la forme de métadonnées de table et de champ personnalisées, d'instructions à l'agent pour interpréter et interroger les données, ou en créant des requêtes validées (anciennement appelées requêtes de référence) pour configurer l'agent de données afin qu'il puisse répondre efficacement aux questions pour des cas d'utilisation spécifiques.

Avant de personnaliser un agent, nous vous recommandons de commencer par travailler avec le contexte et les instructions qu'il crée.

Voici quelques exemples de contexte et d'instructions que vous pouvez fournir à l'agent :

  • Context. Un agent de données pour l'analyse des ventes peut être configuré pour comprendre que "meilleurs vendeurs" fait référence aux commerciaux ayant généré le plus de revenus, et non à ceux ayant conclu le plus de contrats.
  • Instructions : Vous pouvez demander à un agent de données de toujours filtrer les données sur le trimestre le plus récent lorsqu'il est interrogé sur les "tendances", ou de regrouper les résultats par "catégorie de produit" par défaut.

Une fois que vous avez créé des agents de données, vous pouvez discuter avec eux pour poser des questions sur les données BigQuery en langage naturel. Vous pouvez également créer des conversations directes avec une ou plusieurs sources de données pour répondre à des questions ponctuelles et basiques.

L'analyse conversationnelle est optimisée par Gemini pour Google Cloud et est compatible avec certaines fonctions BigQuery ML. Pour en savoir plus, consultez la page Compatibilité avec BigQuery ML.

Découvrez comment et quand Gemini pour Cloud de Confiance utilise vos données.

Agents de données

Les agents de données se composent d'une ou de plusieurs sources de connaissances, ainsi que d'un ensemble d'instructions spécifiques à un cas d'utilisation pour le traitement de ces données. Lorsque vous créez un agent de données, vous pouvez le configurer à l'aide des options suivantes :

  • Utilisez des sources de connaissances telles que des tables, des vues et des UDF avec un agent de données. Vous pouvez également vous connecter aux tables Lakehouse en tant que sources. Pour en savoir plus, consultez Interroger des données Lakehouse en langage naturel.
  • Fournissez des métadonnées personnalisées pour les tables et les champs afin de décrire les données de la manière la plus appropriée pour le cas d'utilisation donné.
  • Fournissez des instructions pour interpréter et interroger les données, par exemple en définissant les éléments suivants :
    • Synonymes et termes commerciaux pour les noms de champs
    • Champs et valeurs par défaut les plus importants pour le filtrage et le regroupement
  • Créez des requêtes validées que l'agent de données peut utiliser pour structurer la réponse d'un agent et apprendre la logique métier utilisée par votre organisation. Les requêtes validées étaient auparavant appelées requêtes de référence. Elles peuvent utiliser des fonctions BigQuery ML compatibles et sont compatibles avec les paramètres de requête.
  • Créez des termes de glossaire personnalisés BigQuery pour chaque agent ou importez des termes de glossaire d'entreprise depuis Knowledge Catalog. Ces termes aident un agent à interpréter les requêtes des utilisateurs. Pour savoir quand utiliser chaque type, consultez Créer ou examiner des termes de glossaire.

Gérer les agents de données

Vous pouvez créer et gérer les types d'agents de données suivants, et les utiliser dans l'onglet Catalogue d'agents de la console Cloud de Confiance  :

  • Un agent exemple prédéfini pour chaque projet Cloud de Confiance .
  • Liste des agents que vous avez créés, mis en brouillon et publiés.
  • Liste des agents créés et partagés avec vous par d'autres personnes.

Pour en savoir plus, consultez Créer des agents de données.

D'autres services du projet qui acceptent les agents de données, tels que l'API Conversational Analytics et Looker Studio, peuvent accéder aux agents de données que vous créez dans BigQuery. Vous pouvez également accéder à un agent créé dans la console Cloud de Confiance en l'appelant à l'aide de l'API Conversational Analytics.

Conversations

Les conversations sont des discussions persistantes avec un agent de données ou une source de données. Vous pouvez poser aux agents de données des questions en plusieurs parties qui utilisent des termes courants tels que "ventes" ou "le plus populaire", sans avoir à spécifier les noms des champs de table ni à définir de conditions pour filtrer les données. Vous pouvez également poser des questions sur les données contenues dans des objets tels que des PDF.

La réponse du chat qui vous est renvoyée offre les fonctionnalités suivantes :

  • La réponse à votre question sous forme de texte, de code ou d'images (multimodale). La réponse peut inclure les fonctions BigQuery ML compatibles.
  • Graphiques générés, le cas échéant.
  • Visualisations de graphiques pour les chemins de requête GQL.
  • Raisonnement de l'agent pour les résultats.
  • Métadonnées sur la conversation, telles que l'agent et les sources de données utilisées.

Lorsque vous créez une conversation directe avec une source de données, l'API Conversational Analytics interprète votre question sans le contexte ni les instructions de traitement qu'un agent de données propose. Par conséquent, les résultats des conversations directes peuvent être moins précis. Utilisez des agents de données pour les cas qui nécessitent une plus grande précision.

Vous pouvez créer et gérer des conversations dans BigQuery à l'aide de la consoleCloud de Confiance . Pour en savoir plus, consultez Analyser les données avec des conversations.

Assistance BigQuery ML

L'analyse conversationnelle est compatible avec les fonctions BigQuery ML suivantes en réponse aux discussions avec les agents de données et les sources de données, ainsi qu'avec les requêtes SQL validées que vous créez.

Pour utiliser la fonction AI.GENERATE compatible, vous devez disposer des autorisations requises pour exécuter des requêtes d'IA générative.

Cas d'utilisation de BigQuery ML

Pour activer les fonctions BigQuery ML compatibles, utilisez-les de l'une des manières suivantes :

  • Lorsque vous créez un agent et ajoutez une requête validée (par exemple, si vous êtes un data scientist qui prépare un rapport récurrent), vous pouvez utiliser les fonctions BigQuery ML compatibles dans une requête validée pour décrire les valeurs par défaut et automatiser le rapport.
  • Lorsque vous posez des questions générales sur les données à un agent, dans une conversation ou dans une requête validée à l'aide de mots clés, l'agent génère le code SQL BigQuery ML en réponse à vos questions.

Le tableau suivant présente des exemples d'invites one-shot qui activent l'utilisation de BigQuery ML :

Cas d'utilisation Exemple d'utilisation Ensemble de données public
Prévision "Prédire le nombre de trajets pour le mois prochain" bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
Détection d'anomalies "Trouve les valeurs aberrantes dans les trajets par jour pour 2018 en utilisant 2017 comme référence." bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
Génération de texte par LLM "Pour chaque article de la catégorie 'sports', résume la colonne 'body' en une ou deux phrases." bigquery-public-data.bbc_news.fulltext

Prise en charge des graphiques

L'analyse conversationnelle permet d'utiliser un graphique comme source de données. Lorsque vous posez des questions sur votre graphique, l'agent construit des requêtes GQL ou SQL pour y répondre. Les agents peuvent utiliser les descriptions et les synonymes que vous définissez sur les libellés et les propriétés de votre graphique pour améliorer la qualité des résultats. Les agents peuvent également tirer parti des mesures définies dans votre graphique pour effectuer une agrégation à plusieurs niveaux. Si la réponse inclut des chemins de graphique, des visualisations de graphique sont fournies.

Par exemple, vous pouvez utiliser l'agent exemple Look Graph sur la page Agents de BigQuery pour poser des questions semblables à celles ci-dessous sur le graphique bigquery-public-data.thelook_ecommerce.graph :

  • Which product is most popular among 25-year-olds?
  • Show me the connection between bow tie orders and distribution centers

Les limites suivantes s'appliquent lorsque vous utilisez un graphique comme source de données :

  • Vous ne pouvez utiliser qu'un seul graphique comme source de données par agent ou conversation.
  • Vous ne pouvez pas combiner des tableaux et des graphiques en tant que sources de données.

Sécurité

Vous pouvez gérer l'accès à l'analyse conversationnelle dans BigQuery à l'aide des rôles et autorisations IAM de l'API Conversational Analytics. Pour en savoir plus sur les rôles nécessaires pour des opérations spécifiques, consultez les rôles requis pour l'agent de données et les rôles requis pour la conversation.

Emplacements

Comme l'analyse conversationnelle a un mode de fonctionnement mondial, vous ne pouvez pas choisir la région à utiliser.

Tarifs

Les requêtes exécutées lorsque vous créez des agents de données et que vous avez des conversations avec des agents de données ou des sources de données vous sont facturées au tarif de calcul BigQuery. La création et l'utilisation d'agents de données et de conversations ne sont pas facturées pendant la période de prévisualisation.

Bonnes pratiques

Consultez les guides suivants pour découvrir les bonnes pratiques d'utilisation de l'API Conversational Analytics :

Limites

Pour en savoir plus sur les limites concernant les requêtes, les conversations, les données et les visualisations, consultez Limites connues de l'API Conversational Analytics.

Quota partagé dynamique

Le quota partagé dynamique (QPD) de Gemini Enterprise Agent Platform gère la capacité du modèle Gemini. Contrairement aux quotas classiques, DSQ vous permet d'accéder à un grand pool de ressources partagées sans limite fixe par projet pour le débit du modèle.

Les performances, comme la latence, peuvent varier en fonction de la charge globale du système. En cas de forte demande dans le pool partagé, vous pouvez parfois rencontrer des erreurs 429 Resource Exhausted temporaires. Ces erreurs indiquent que la capacité du pool partagé est momentanément limitée, mais pas que vous avez atteint une limite de quota spécifique dans votre projet. Pour vérifier la capacité, relancez la requête après un court délai.

Identifier et analyser les requêtes générées par l'agent

Les jobs BigQuery exécutés par un agent de données incluent des libellés spécifiques. Ces libellés vous permettent d'identifier, de filtrer et d'analyser les jobs de l'agent.

Vous pouvez utiliser ces libellés pour les tâches suivantes :

Identifier les libellés de l'agent de données dans la console Cloud de Confiance

BigQuery applique des libellés aux jobs exécutés par un agent de données. Pour obtenir la clé d'étiquette afin de filtrer les données et effectuer d'autres analyses, consultez la clé d'étiquette dans la consoleCloud de Confiance .

Pour afficher la clé d'étiquette d'un agent de données, procédez comme suit :

  1. Dans la console Cloud de Confiance , affichez les détails du job.

  2. Dans le volet Informations sur la tâche de requête, localisez la section Libellés et recherchez les libellés préfixés par ca, comme ca-bq-job: true.

Analyser les tâches générées par l'agent

Utilisez le libellé pour analyser les tâches générées par l'agent. Par exemple, pour vérifier le nombre de jobs exécutés par un agent de données, exécutez la requête suivante sur la vue INFORMATION_SCHEMA.JOBS :

SELECT
  COUNT(*) AS job_count
FROM
  `PROJECT_ID`.`region-REGION`.INFORMATION_SCHEMA.JOBS
WHERE
  EXISTS (
    SELECT 1
    FROM UNNEST(labels) AS label
    WHERE label.key = 'ca-bq-job' AND label.value = 'true'
  );

Remplacez les éléments suivants :

  • PROJECT_ID : ID de votre projet Cloud de Confiance .
  • REGION : région dans laquelle vos jobs sont exécutés (par exemple, us ou eu).

Étapes suivantes