Alcune o tutte le informazioni in questa pagina potrebbero non essere applicabili a Cloud de Confiance di S3NS. Per maggiori dettagli, consulta Differenze rispetto a Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Esplorare i risultati delle query nei notebook

Puoi esplorare i risultati delle query utilizzando le celle SQL o le celle di codice nei notebook BigQuery Colab Enterprise.

In questo tutorial, eseguirai una query sui dati di un set di dati pubblici BigQuery ed esplorerai i risultati della query in un notebook.

Obiettivi

Crea ed esegui una query in BigQuery.
Esplora i risultati della query in un notebook utilizzando le celle SQL e le celle di codice.

Costi

Questo tutorial utilizza un set di dati disponibile tramite il Cloud de Confiance by S3NS programma Set di dati pubblici. Google paga per l'archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati. Ti vengono addebitati costi per le query che esegui sui dati. Per ulteriori informazioni, vedi Prezzi di BigQuery.

Prima di iniziare

Nella Cloud de Confiance console, nella pagina di selezione del progetto, seleziona o crea un Cloud de Confiance progetto.
Ruoli richiesti per selezionare o creare un progetto
- Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto su cui ti è stato concesso un ruolo.
- Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto (roles/resourcemanager.projectCreator), che contiene l' resourcemanager.projects.create autorizzazione. Scopri come concedere i ruoli.
Nota: se non prevedi di conservare le risorse che crei in questa procedura, crea un progetto anziché selezionarne uno esistente. Al termine di questi passaggi, puoi eliminare il progetto, rimuovendo tutte le risorse associate.

Vai al selettore di progetti
Verifica che la fatturazione sia abilitata per il tuo Cloud de Confiance progetto.
Abilita l'API BigQuery.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo servizi (roles/serviceusage.serviceUsageAdmin), che contiene l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.
Abilitare l'API

Per i nuovi progetti, BigQuery è abilitato automaticamente.

Imposta la regione predefinita per gli asset di codice

Tutti i nuovi asset di codice nel tuo Cloud de Confiance progetto utilizzano una regione predefinita. Dopo aver creato l'asset, non puoi modificarne la regione.

Per impostare la regione predefinita per i nuovi asset di codice:

Vai alla pagina BigQuery.

Vai a BigQuery
Nel riquadro a sinistra, fai clic su File per aprire il browser dei file:
Accanto al nome del progetto, fai clic su Visualizza azioni del riquadro File > Cambia regione del codice.
Seleziona la regione del codice che vuoi utilizzare come predefinita.
Fai clic su Salva.

Per un elenco delle regioni supportate, vedi Località di BigQuery Studio.

Autorizzazioni obbligatorie

Per creare ed eseguire notebook, devi disporre dei seguenti ruoli Identity and Access Management (IAM):

Apri i risultati della query in un notebook

Puoi eseguire una query SQL e poi utilizzare un notebook per esplorare i dati. Questo approccio è utile se vuoi modificare i dati in BigQuery prima di utilizzarli o se ti serve solo un sottoinsieme dei campi della tabella.

Nella Cloud de Confiance console, vai alla pagina BigQuery.

Vai a BigQuery
Nel riquadro a sinistra, fai clic su Explorer.
Vai al progetto bigquery-public-data, fai clic Attiva/disattiva nodo per espanderlo, quindi fai clic su Set di dati. Nel riquadro dei dettagli si apre una nuova scheda che mostra un elenco di tutti i set di dati del progetto.
Nella casella Filtra , scegli ID set di dati e inserisci ml_datasets.
Nella pagina Set di dati, fai clic su ml_datasets > penguins.
Fai clic su Query.
Aggiungi un asterisco (*) per la selezione dei campi alla query generata, in modo che sia simile all'esempio seguente:
```
SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
```
Fai clic su Esegui.
Nella sezione Risultati query, fai clic su Apri in, quindi su Notebook.

Prepara il notebook per l'uso

Prepara il notebook per l'uso connettendoti a un runtime e impostando i valori predefiniti dell'applicazione.

Nell'intestazione del notebook, fai clic su Connetti per connetterti al runtime predefinito.
Nel blocco di codice Configurazione, fai clic su Esegui cella.

Esplora i dati

Fai clic su Opzioni per l'inserimento di celle di codice > Aggiungi cella SQL.

Inserisci la seguente query nella cella SQL:

SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;

Fai clic su Esegui cella.

I risultati della query vengono visualizzati in un BigQuery DataFrame.
In alternativa, per caricare i risultati della query in un DataFrame BigQuery utilizzando il job di query eseguito in precedenza nell'editor di query, segui questi passaggi:
1. Vai alla sezione Set di risultati caricato da un job BigQuery come DataFrame.
2. Nel blocco di codice, fai clic su Esegui cella.
  
  I risultati della query vengono visualizzati in un DataFrame BigQuery.
Per ottenere metriche descrittive per i dati:
1. Vai alla sezione Mostra statistiche descrittive utilizzando describe().
2. Nel blocco di codice, fai clic su Esegui cella.
  
  I risultati vengono visualizzati in un DataFrame BigQuery.
(Facoltativo) Utilizza altre funzioni o pacchetti Python per esplorare e analizzare i dati.

Il seguente esempio di codice mostra l'utilizzo di bigframes.pandas per analizzare i dati e di bigframes.ml per creare un modello di regressione lineare dai dati penguins in un DataFrame BigQuery:

import bigframes.pandas as bpd

# Load data from BigQuery
query_or_table = "bigquery-public-data.ml_datasets.penguins"
bq_df = bpd.read_gbq(query_or_table)

# Inspect one of the columns (or series) of the DataFrame:
bq_df["body_mass_g"]

# Compute the mean of this series:
average_body_mass = bq_df["body_mass_g"].mean()
print(f"average_body_mass: {average_body_mass}")

# Find the heaviest species using the groupby operation to calculate the
# mean body_mass_g:
(
    bq_df["body_mass_g"]
    .groupby(by=bq_df["species"])
    .mean()
    .sort_values(ascending=False)
    .head(10)
)

# Create the Linear Regression model
from bigframes.ml.linear_model import LinearRegression

# Filter down to the data we want to analyze
adelie_data = bq_df[bq_df.species == "Adelie Penguin (Pygoscelis adeliae)"]

# Drop the columns we don't care about
adelie_data = adelie_data.drop(columns=["species"])

# Drop rows with nulls to get our training data
training_data = adelie_data.dropna()

# Pick feature columns and label column
X = training_data[
    [
        "island",
        "culmen_length_mm",
        "culmen_depth_mm",
        "flipper_length_mm",
        "sex",
    ]
]
y = training_data[["body_mass_g"]]

model = LinearRegression(fit_intercept=False)
model.fit(X, y)
model.score(X, y)

Libera spazio

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.

Il modo più semplice per eliminare la fatturazione è eliminare il Cloud de Confiance progetto che hai creato per questo tutorial.

Attenzione: l'eliminazione di un progetto ha i seguenti effetti:

L'intero contenuto del progetto viene eliminato. Se hai utilizzato un progetto esistente per, le attività descritte in questo documento, eliminerai anche tutto il lavoro che hai svolto nel progetto.
Gli ID progetto personalizzati non sono più disponibili. Quando hai creato questo progetto, potresti aver creato un ID progetto personalizzato che vuoi utilizzare in futuro. Per conservare gli URL che utilizzano l'ID progetto, ad esempio un URL appspot.com, elimina le risorse selezionate all'interno del progetto anziché eliminare l'intero progetto.

Se intendi esplorare più architetture, tutorial o guide rapide, puoi riutilizzare i progetti ed evitare così di superare i limiti di quota.

Nella Cloud de Confiance console, vai alla pagina Gestisci risorse.
Vai a Gestisci risorse
Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.

Passaggi successivi

Scopri di più su lla creazione di notebook in BigQuery.
Scopri di più sull'esplorazione dei dati con BigQuery DataFrames.