Puoi esplorare i risultati delle query BigQuery utilizzando i notebook Colab Enterprise in BigQuery.
In questo tutorial, esegui una query sui dati di un set di dati pubblico BigQuery ed esplori i risultati della query in un blocco note.
Obiettivi
- Crea ed esegui una query in BigQuery.
- Esplora i risultati delle query in un notebook.
Costi
Questo tutorial utilizza un set di dati disponibile tramite il Trusted Cloud by S3NS programma per i set di dati pubblici. Google sostiene le spese per lo spazio in cui sono archiviati questi set di dati e ti consente di accedervi pubblicamente. Ti vengono addebitati i costi per le query eseguite sui dati. Per maggiori informazioni, vedi Prezzi di BigQuery.
Prima di iniziare
-
In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.
-
Verify that billing is enabled for your Trusted Cloud project.
-
Enable the BigQuery API.
Per i nuovi progetti, BigQuery viene abilitato automaticamente.
Impostare la regione predefinita per gli asset di codice
Se è la prima volta che crei un asset di codice, devi impostare la regione predefinita per gli asset di codice. Non puoi modificare la regione di un asset di codice dopo la creazione.
Tutti gli asset di codice in BigQuery Studio utilizzano la stessa regione predefinita. Per impostare la regione predefinita per gli asset di codice:
Vai alla pagina BigQuery.
Nel riquadro Explorer, trova il progetto in cui hai attivato gli asset di codice.
Fai clic su
Visualizza azioni accanto al progetto, quindi fai clic su Modifica la mia regione di codice predefinita.Per Regione, seleziona la regione che vuoi utilizzare per gli asset di codice.
Fai clic su Seleziona.
Per un elenco delle regioni in cui è disponibile, consulta Località di BigQuery Studio.
Autorizzazioni obbligatorie
Per creare ed eseguire blocchi note, devi disporre dei seguenti ruoli IAM (Identity and Access Management):
- Utente BigQuery (
roles/bigquery.user
) - Utente runtime notebook (
roles/aiplatform.notebookRuntimeUser
) - Code Creator (
roles/dataform.codeCreator
)
Aprire i risultati della query in un notebook
Puoi eseguire una query SQL e poi utilizzare un notebook per esplorare i dati. Questo approccio è utile se vuoi modificare i dati in BigQuery prima di utilizzarli o se hai bisogno solo di un sottoinsieme dei campi della tabella.
Nella console Trusted Cloud , vai alla pagina BigQuery.
Nel campo Digita per effettuare la ricerca, inserisci
bigquery-public-data
.Se il progetto non viene visualizzato, inserisci
bigquery
nel campo di ricerca, quindi fai clic su Cerca in tutti i progetti in modo da confrontare la stringa di ricerca con i progetti esistenti.Seleziona bigquery-public-data > ml_datasets > penguins.
Per la tabella penguins, fai clic su
Visualizza azioni, quindi fai clic su Query.Aggiungi un asterisco (
*
) per la selezione dei campi alla query generata, in modo che sia simile al seguente esempio:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Fai clic su
Esegui.Nella sezione Risultati delle query, fai clic su Esplora dati e poi su Esplora con il notebook Python.
Prepara il notebook per l'uso
Prepara il notebook per l'uso connettendoti a un runtime e impostando i valori predefiniti dell'applicazione.
- Nell'intestazione del blocco note, fai clic su Connetti per connetterti al runtime predefinito.
- Nel blocco di codice Setup, fai clic su Esegui cella.
esplora i dati
- Per caricare i dati penguins in un DataFrame BigQuery e mostrare i risultati, fai clic su Esegui cella nel blocco di codice nella sezione Set di risultati caricato dal job BigQuery come DataFrame.
- Per ottenere metriche descrittive per i dati, fai clic su Esegui cella nel blocco di codice nella sezione Mostra statistiche descrittive utilizzando describe().
- (Facoltativo) Utilizza altre funzioni o pacchetti Python per esplorare e analizzare i dati.
Il seguente esempio di codice mostra l'utilizzo di
bigframes.pandas
per analizzare i dati e di bigframes.ml
per creare un modello di regressione lineare dai dati penguins in un
DataFrame BigQuery:
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Il modo più semplice per eliminare la fatturazione è eliminare il progetto Trusted Cloud che hai creato per questo tutorial.
- In the Trusted Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Passaggi successivi
- Scopri di più sulla creazione di notebook in BigQuery.
- Scopri di più sull'esplorazione dei dati con BigQuery DataFrames.