Analizzare i dati con l'assistenza di Gemini
Questo tutorial descrive come utilizzare l'assistenza basata sull'AI in Gemini in BigQuery per analizzare i dati.
Per l'esempio di questo tutorial, supponiamo che tu sia un analista dei dati che deve analizzare e prevedere le vendite di prodotti da un set di dati.
Questo tutorial presuppone che tu abbia familiarità con SQL e con le attività di analisi dei dati di base. Non è richiesta la conoscenza dei prodotti Trusted Cloud . Se non hai mai utilizzato BigQuery, consulta le guide rapide di BigQuery.
Obiettivi
- Utilizza Gemini in BigQuery per rispondere a domande su come BigQuery gestisce attività specifiche di analisi dei dati.
- Chiedi a Gemini in BigQuery di trovare set di dati e di spiegare e generare query SQL.
- Crea un modello di machine learning (ML) per prevedere i periodi futuri.
Costi
Questo tutorial utilizza i seguenti prodotti Trusted Cloud fatturabili:
Per stimare i costi in base all'utilizzo previsto, utilizza il calcolatore prezzi.
Prima di iniziare
-
In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.
- Assicurati che Gemini in BigQuery sia configurato per il tuo progetto Trusted Cloud .
Nella console Trusted Cloud , vai alla pagina BigQuery.
Crea un set di dati denominato
bqml_tutorial
. Utilizzi il set di dati per archiviare gli oggetti del database, tra cui tabelle e modelli.Per attivare le funzionalità di Gemini in BigQuery necessarie per completare questo tutorial, nella barra degli strumenti di BigQuery, fai clic su pen_spark Gemini, quindi seleziona le seguenti opzioni:
- Completamento automatico
- Generazione automatica
- Spiegazione
Scopri di più sulle funzionalità di BigQuery
Prima di iniziare, tieni presente che vuoi saperne di più su come BigQuery gestisce le query sui dati. Per ricevere assistenza, puoi inviare a Gemini in BigQuery un'istruzione in linguaggio naturale (o prompt) come la seguente:
- "Come faccio a iniziare a utilizzare BigQuery?"
- "Quali sono i vantaggi dell'utilizzo di BigQuery per l'analisi dei dati?"
- "Come gestisce BigQuery la scalabilità automatica per le query?"
Gemini in BigQuery può anche fornire informazioni su come analizzare i dati. Per questo tipo di aiuto, potresti inviare prompt come i seguenti:
- "Come faccio a creare un modello di previsione delle serie temporali in BigQuery?"
- "Come faccio a caricare diversi tipi di dati in BigQuery?"
Accedere ai dati e analizzarli
Gemini in BigQuery può aiutarti a sapere quali dati puoi accedere per l'analisi e come analizzarli.
Per questo esempio, considera di aver bisogno di aiuto per quanto segue:
- Trovare il set di dati e le tabelle sulle vendite da analizzare.
- Sapere come sono correlate le tabelle di dati e le query in un set di dati sulle vendite.
- Comprendere le query complesse e scrivere query che utilizzano il set di dati.
Trovare i dati
Prima di poter eseguire query sui dati, devi sapere a quali dati puoi accedere. Ogni prodotto di dati organizza e archivia i dati in modo diverso.
Per ricevere assistenza, puoi inviare a Gemini in BigQuery un prompt come "Come faccio a sapere quali set di dati e tabelle sono disponibili in BigQuery?"
Nella console Trusted Cloud , vai alla pagina BigQuery.
Nella barra degli strumenti della console Trusted Cloud , fai clic su spark Apri o chiudi la chat di Gemini Cloud Assist.
Nel riquadro Cloud Assist, inserisci il prompt
How do I learn which datasets and tables are available to me in BigQuery?
.Fai clic su send Invia prompt.
Scopri come e quando Gemini per Trusted Cloud utilizza i tuoi dati.
La risposta include diversi modi per elencare progetti, set di dati o tabelle all'interno di un set di dati.
(Facoltativo) Per reimpostare la cronologia della chat, nel riquadro Cloud Assist, fai clic su delete Cancella chat, quindi fai clic su Reimposta chat.
Comprendere e scrivere SQL in BigQuery
Per questo esempio, supponiamo che tu abbia selezionato i dati da analizzare e ora voglia interrogarli. Gemini in BigQuery può aiutarti a lavorare con SQL, ad esempio per comprendere query complesse e difficili da analizzare o per generare nuove query SQL.
Richiedere l'assistenza di Gemini per spiegare le query SQL
Supponiamo che tu voglia comprendere una query complessa scritta da un'altra persona. Gemini in BigQuery può spiegare la query in linguaggio semplice, ad esempio la sintassi della query, lo schema sottostante e il contesto aziendale.
Nella console Trusted Cloud , vai alla pagina BigQuery.
Nell'editor query, apri o incolla la query per cui vuoi ricevere una spiegazione. Ad esempio:
SELECT u.id AS user_id, u.first_name, u.last_name, avg(oi.sale_price) AS avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` AS u JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi ON u.id = oi.user_id GROUP BY 1, 2, 3 ORDER BY avg_sale_price DESC LIMIT 10
Evidenzia la query, quindi fai clic su auto_awesome Spiega questa query selezionata.
Nel riquadro Cloud Assist viene restituita una risposta simile alla seguente:
The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id, first_name, and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
Generare una query SQL che raggruppa le vendite per giorno e prodotto
In questo esempio, vuoi generare una query che elenchi i tuoi prodotti più venduti per
ogni giorno. Quindi, utilizzi le tabelle nel set di dati thelook_ecommerce
e chiedi a Gemini in BigQuery di generare una query per calcolare le vendite per articolo dell'ordine e per nome del prodotto.
Questo tipo di query è spesso complesso, ma utilizzando Gemini in BigQuery, puoi creare automaticamente un'istruzione. Puoi fornire un prompt per generare una query SQL in base allo schema dei dati. Anche se inizi senza codice, con una conoscenza limitata dello schema dei dati o solo una conoscenza di base della sintassi SQL, l'assistenza di Gemini può suggerire una o più istruzioni SQL.
Per chiedere a Gemini in BigQuery di generare una query che elenca i tuoi prodotti più venduti, segui questi passaggi:
Nella console Trusted Cloud , vai alla pagina BigQuery.
Nel menu di navigazione, fai clic su Studio.
Fai clic su
Query SQL. Il riquadro Explorer carica automaticamente il database selezionato.Nell'editor query, inserisci il seguente prompt e poi premi Invio:
# select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
Il carattere cancelletto (
#
) chiede a Gemini in BigQuery di generare SQL. Gemini in BigQuery suggerisce una query SQL simile alla seguente:SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
Per accettare il codice suggerito, fai clic su Tab e poi su Esegui per eseguire l'istruzione SQL. Puoi anche scorrere l'SQL suggerito e accettare parole specifiche suggerite nell'istruzione.
Nel riquadro Risultati query, visualizza i risultati della query.
Crea un modello di previsione e visualizza i risultati
In questo esempio, utilizzi BigQuery ML per:
- Utilizza una query sulle tendenze per creare un modello di previsione.
- Utilizza Gemini in BigQuery per spiegare e aiutarti a scrivere una query per visualizzare i risultati del modello di previsione.
Utilizzi la seguente query di esempio con le vendite effettive, che vengono utilizzate come input per il modello. La query viene utilizzata per creare il modello ML.
Per creare un modello ML di previsione, nell'editor di query, esegui la seguente query SQL:
CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS', time_series_timestamp_col = 'date_col', time_series_data_col = 'total_sales', time_series_id_col = 'product_id') AS SELECT sum(sale_price) AS total_sales, DATE(created_at) AS date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;
Puoi utilizzare Gemini in BigQuery per aiutarti a comprendere questa query.
Quando viene creato il modello, la scheda Risultati del riquadro Risultati query mostra un messaggio simile al seguente:
Successfully created model named sales_forecasting_model.
Nel riquadro Cloud Assist, inserisci un prompt per Gemini in BigQuery per aiutarti a scrivere una query per ottenere una previsione dal modello al termine, ad esempio inserisci
How can I get a forecast in SQL from the model?
In base al contesto del prompt, la risposta include un esempio di modello ML che prevede le vendite:
SELECT * FROM ML.FORECAST( MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`, STRUCT( 7 AS horizon, 0.95 AS confidence_level))
In questa risposta,
PROJECT_ID
è il tuo progettoTrusted Cloud .Nel riquadro Cloud Assist, copia la query SQL.
Nell'editor di query, esegui la query SQL.
Esegui la pulizia
Per evitare che al tuo account Trusted Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi eliminare il progetto Trusted Cloud che hai creato per il tutorial. In alternativa, puoi eliminare le singole risorse.
Elimina progetto
- In the Trusted Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Eliminare il set di dati
L'eliminazione del progetto rimuove tutti i set di dati e tutte le tabelle nel progetto. Se preferisci riutilizzare il progetto, puoi eliminare il set di dati creato in questo tutorial.
Nella console Trusted Cloud , vai alla pagina BigQuery.
Nel menu di navigazione, seleziona il set di dati
bqml_tutorial
che hai creato.Per eliminare il set di dati, la tabella e tutti i dati, fai clic su Elimina set di dati.
Per confermare l'eliminazione, nella finestra di dialogo Elimina set di dati, digita il nome del set di dati (
bqml_tutorial
), quindi fai clic su Elimina.
Passaggi successivi
- Leggi la panoramica di Gemini per Trusted Cloud .
- Scopri di più su quote e limiti di Gemini for Trusted Cloud .
- Scopri di più sulle posizioni per Gemini in Trusted Cloud.
- Scopri come esplorare i dati generando insight.
- Scopri di più su come scrivere query con l'assistenza di Gemini in BigQuery.