Einführung in Datasets

Diese Seite bietet einen Überblick über Datasets in BigQuery.

Datasets

Datasets sind Bestandteil eines Projekts. Datasets sind Container auf oberster Ebene, mit denen Sie den Zugriff auf Tabellen und Ansichten organisieren und steuern können. Die Tabellen und Ansichten müssen Teil eines Datasets sein. Um Daten in BigQuery laden zu können, ist daher mindestens ein Dataset erforderlich. Verwenden Sie das Format projectname.datasetname, um einen Dataset-Namen bei Verwendung von GoogleSQL vollständig zu qualifizieren, oder das Format projectname:datasetname, um einen Dataset-Namen bei Verwendung des bq-Befehlszeilentools vollständig zu qualifizieren.

Standort

Sie geben einen Standort zum Speichern Ihrer BigQuery-Daten an, wenn Sie ein Dataset erstellen. Eine Liste der BigQuery-Dataset-Standorte finden Sie unter BigQuery-Standorte. BigQuery speichert Ihre Daten am ausgewählten Standort. Wenn Sie als Dataset-Standort beispielsweise EU oder eine Region in der EU auswählen, werden Ihre grundlegenden BigQuery-Kundendaten in der EU gespeichert.

Nachdem Sie das Dataset erstellt haben, kann der Standort nicht mehr geändert werden. .

Wenn Sie keinen Standort explizit angeben, wird der Standort auf eine der folgenden Arten ermittelt:

  • Der Speicherort der Datasets, auf die in der Anfrage verwiesen wird. Wenn eine Abfrage beispielsweise auf eine Tabelle oder Ansicht in einem Dataset verweist, das in der Region asia-northeast1 gespeichert ist, wird der Abfragejob in asia-northeast1 ausgeführt.
  • Die für eine in einer Anfrage referenzierte Verbindung angegebene Region.
  • Der Speicherort einer Zieltabelle.

Wenn der Standort nicht explizit angegeben ist und nicht anhand der Ressourcen in der Anfrage ermittelt werden kann, wird der Standardspeicherort verwendet. Wenn kein Standardspeicherort festgelegt ist, wird der Job in der multiregionalen Region US ausgeführt.

Datenaufbewahrung

Datasets verwenden Zeitreise in Verbindung mit dem Ausfallsicherheitszeitraum, um gelöschte und geänderte Daten für kurze Zeit aufzubewahren, falls Sie sie wiederherstellen müssen. Weitere Informationen finden Sie unter Datenaufbewahrung mit Zeitreisen und Ausfallsicherheit.

Externe Datasets

Neben BigQuery-Datasets können Sie auch externe Datasets erstellen. Das sind Verknüpfungen zu externen Datenquellen:

Externe Datasets werden auch als föderierte Datasets bezeichnet. Beide Begriffe werden synonym verwendet.

Nach der Erstellung enthalten externe Datasets Tabellen aus einer referenzierten externen Datenquelle. Daten aus diesen Tabellen werden nicht in BigQuery kopiert, sondern jedes Mal abgefragt, wenn sie verwendet werden. Weitere Informationen finden Sie unter Föderierte Spanner-Abfragen.

Beschränkungen

BigQuery-Datasets unterliegen den folgenden Einschränkungen:

  • Der Dataset-Speicherort kann nur zum Zeitpunkt der Erstellung festgelegt werden. Nachdem ein Dataset erstellt wurde, kann sein Standort nicht mehr geändert werden.
  • Alle in einer Abfrage referenzierten Tabellen müssen in Datasets an demselben Standort gespeichert werden.
  • Externe Datasets unterstützen keine Tabellenablaufzeiten, Replikate, Zeitreisen, Standardsortierung, Standardrundungsmodus oder die Option, bei Tabellennamen die Groß-/Kleinschreibung zu berücksichtigen.

  • Wenn Sie eine Tabelle kopieren, müssen sich die Datasets mit der Quell- und Zieltabelle am selben Speicherort befinden.

  • Datasetnamen müssen für jedes Projekt eindeutig sein.

Kontingente

Weitere Informationen zu allen Kontingenten und Beschränkungen finden Sie unter Kontingente und Beschränkungen.

Sicherheit

Informationen zum Steuern des Zugriffs auf Datasets in BigQuery finden Sie unter Zugriff auf Datasets steuern. Informationen zur Datenverschlüsselung finden Sie unter Verschlüsselung inaktiver Daten.

Nächste Schritte