Introduzione ai set di dati

Questa pagina fornisce una panoramica dei set di dati in BigQuery.

Set di dati

Un set di dati è contenuto in un progetto specifico. I set di dati sono contenitori di primo livello utilizzati per organizzare e controllare l'accesso alle tabelle e alle viste. Una tabella o una vista deve appartenere a un set di dati, quindi devi creare almeno un set di dati prima di caricare i dati in BigQuery. Utilizza il formato projectname.datasetname per qualificare completamente un nome di dataset quando utilizzi GoogleSQL o il formato projectname:datasetname per qualificare completamente un nome di dataset quando utilizzi lo strumento a riga di comando bq.

Località

Quando crei un set di dati, puoi specificare una località in cui archiviare i dati BigQuery. Per un elenco delle località dei set di dati BigQuery, vedi Località BigQuery. BigQuery archivia i dati nella località selezionata. Ad esempio, se scegli EU o una regione con sede nell'UE per la posizione del set di dati, i dati dei clienti BigQuery principali risiedono nell'UE.

Dopo aver creato il set di dati, la località non può essere modificata, .

Se non specifichi esplicitamente una località, la località viene determinata in uno dei seguenti modi:

  • La posizione dei set di dati a cui viene fatto riferimento nella richiesta. Ad esempio, se una query fa riferimento a una tabella o a una vista in un dataset archiviato nella regione asia-northeast1, il job di query viene eseguito in asia-northeast1.
  • La regione specificata per una connessione a cui viene fatto riferimento in una richiesta.
  • La posizione di una tabella di destinazione.

Se la posizione non è specificata in modo esplicito e non può essere determinata dalle risorse nella richiesta, viene utilizzata la posizione predefinita. Se la località predefinita non è impostata, il job viene eseguito nella multi-regione US.

Conservazione dei dati

I set di dati utilizzano il time travel in combinazione con il periodo di sicurezza per conservare i dati eliminati e modificati per un breve periodo di tempo, nel caso in cui sia necessario recuperarli. Per saperne di più, vedi Conservazione dei dati con Time Travel e fail-safe.

Set di dati esterni

Oltre ai set di dati BigQuery, puoi creare set di dati esterni, ovvero link a origini dati esterne:

I set di dati esterni sono noti anche come set di dati federati; entrambi i termini vengono utilizzati in modo intercambiabile.

Una volta creati, i set di dati esterni contengono tabelle di un'origine dati esterna a cui viene fatto riferimento. I dati di queste tabelle non vengono copiati in BigQuery, ma vengono sottoposti a query ogni volta che vengono utilizzati. Per saperne di più, consulta Query federate di Spanner.

Limitazioni

I set di dati BigQuery sono soggetti alle seguenti limitazioni:

  • La posizione del set di dati può essere impostata solo al momento della creazione. Una volta creato un set di dati, la sua posizione non può essere modificata.
  • Tutte le tabelle a cui viene fatto riferimento in una query devono essere archiviate in set di dati nella stessa posizione.
  • I set di dati esterni non supportano la scadenza delle tabelle, le repliche, lo spostamento temporale, le regole di confronto predefinite, la modalità di arrotondamento predefinita o l'opzione per attivare o disattivare i nomi delle tabelle senza distinzione tra maiuscole e minuscole.

  • Quando copi una tabella, i set di dati che contengono la tabella di origine e la tabella di destinazione devono trovarsi nella stessa località.

  • I nomi dei set di dati devono essere univoci per ogni progetto.

Quote

Per saperne di più su quote e limiti dei set di dati, consulta Quote e limiti.

Sicurezza

Per controllare l'accesso ai set di dati in BigQuery, vedi Controllo dell'accesso ai set di dati. Per informazioni sulla crittografia dei dati, vedi Crittografia at-rest.

Passaggi successivi