Einführung in Datasets

Diese Seite bietet einen Überblick über Datasets in BigQuery.

Datasets

Datasets sind Bestandteil eines Projekts. Datasets sind Container auf oberster Ebene, mit denen Sie den Zugriff auf Tabellen und Ansichten organisieren und steuern können. Die Tabellen und Ansichten müssen Teil eines Datasets sein. Um Daten in BigQuery laden zu können, ist daher mindestens ein Dataset erforderlich. Verwenden Sie das Format projectname.datasetname, um einen Dataset-Namen bei Verwendung von GoogleSQL vollständig zu qualifizieren, oder das Format projectname:datasetname, um einen Dataset-Namen bei Verwendung des bq-Befehlszeilentools vollständig zu qualifizieren.

Standort

Sie geben einen Standort zum Speichern Ihrer BigQuery-Daten an, wenn Sie ein Dataset erstellen. Eine Liste der BigQuery-Dataset-Standorte finden Sie unter BigQuery-Standorte. Nachdem Sie das Dataset erstellt haben, kann der Standort nicht mehr geändert werden..

BigQuery verarbeitet Abfragen am selben Standort wie das Dataset, das die Tabellen enthält, die Sie abfragen. BigQuery speichert Ihre Daten am ausgewählten Standort.

Datenaufbewahrung

Datasets verwenden Zeitreise in Verbindung mit dem Ausfallsicherheitszeitraum, um gelöschte und geänderte Daten für kurze Zeit aufzubewahren, falls Sie sie wiederherstellen müssen. Weitere Informationen finden Sie unter Datenaufbewahrung mit Zeitreisen und Ausfallsicherheit.

Externe Datasets

Neben BigQuery-Datasets können Sie auch externe Datasets erstellen, die Verknüpfungen zu externen Datenquellen sind:

Externe Datensätze werden auch als föderierte Datensätze bezeichnet und beide Begriffe werden synonym verwendet.

Nach dem Erstellen enthalten externe Datasets Tabellen aus einer referenzierten externen Datenquelle. Daten aus diesen Tabellen werden nicht in BigQuery kopiert, sondern bei jeder Verwendung abgefragt. Weitere Informationen finden Sie unter Föderierte Abfragen in Spanner.

Beschränkungen

BigQuery-Datasets unterliegen den folgenden Einschränkungen:

  • Der Dataset-Speicherort kann nur zum Zeitpunkt der Erstellung festgelegt werden. Nachdem ein Dataset erstellt wurde, kann sein Standort nicht mehr geändert werden.
  • Alle in einer Abfrage referenzierten Tabellen müssen in Datasets an demselben Standort gespeichert werden.
  • Externe Datasets unterstützen keine Ablaufzeit für Tabellen, Repliken, Zeitreisen, Standardsortierung, Standardabrundungsmodus oder die Option zum Aktivieren oder Deaktivieren der Unterscheidung zwischen Groß- und Kleinschreibung bei Tabellennamen.

  • Wenn Sie eine Tabelle kopieren, müssen sich die Datasets mit der Quell- und Zieltabelle am selben Speicherort befinden.

  • Datasetnamen müssen für jedes Projekt eindeutig sein.

Kontingente

Weitere Informationen zu allen Kontingenten und Beschränkungen finden Sie unter Kontingente und Beschränkungen.

Sicherheit

Informationen zum Steuern des Zugriffs auf Datasets in BigQuery finden Sie unter Zugriff auf Datasets steuern. Informationen zur Datenverschlüsselung finden Sie unter Verschlüsselung inaktiver Daten.

Nächste Schritte