BigQuery DataFrames-Sitzungen und ‑E/A verwalten
In diesem Dokument wird erläutert, wie Sie Sitzungen verwalten und Eingabe- und Ausgabevorgänge (E/A) ausführen, wenn Sie BigQuery DataFrames verwenden. Sie erfahren, wie Sie Sitzungen erstellen und verwenden, mit In-Memory-Daten arbeiten und aus Dateien und BigQuery-Tabellen lesen und in diese schreiben.
BigQuery-Sitzungen
BigQuery DataFrames verwendet ein lokales Sitzungsobjekt, um Metadaten intern zu verwalten. Jedes DataFrame- und Series-Objekt ist mit einer Sitzung verbunden, jede
Sitzung ist mit einem Standort verbunden und jede Abfrage in einer
Sitzung wird an dem Standort ausgeführt, an dem Sie die Sitzung erstellt haben. Verwenden Sie das folgende Codebeispiel, um manuell eine Sitzung zu erstellen und sie zum Laden von Daten zu verwenden:
Sie können Daten aus mehreren Sitzungsinstanzen nicht kombinieren, auch wenn Sie sie mit denselben Einstellungen initialisieren. Das folgende Codebeispiel zeigt, dass der Versuch, Daten aus verschiedenen Sitzungsinstanzen zu kombinieren, einen Fehler verursacht:
Globale Sitzung
BigQuery DataFrames bietet eine globale Standardsitzung, auf die Sie mit der bigframes.pandas.get_global_session() Methode zugreifen können. In
Colab müssen Sie eine Projekt-ID für das
bigframes.pandas.options.bigquery.project Attribut angeben, bevor Sie es verwenden. Sie
können auch einen Standort mit dem
bigframes.pandas.options.bigquery.location Attribut festlegen, das standardmäßig auf
die US Multi-Region festgelegt ist.
Das folgende Codebeispiel zeigt, wie Sie Optionen für die globale Sitzung festlegen:
Wenn Sie den Standort oder das Projekt der globalen Sitzung zurücksetzen möchten, schließen Sie die aktuelle Sitzung durch
Ausführen der bigframes.pandas.close_session() Methode.
Viele integrierte BigQuery DataFrames-Funktionen verwenden standardmäßig die globale Sitzung. Das folgende Codebeispiel zeigt, wie integrierte Funktionen die globale Sitzung verwenden:
In-Memory-Daten
Sie können DataFrames und Series Objekte mit integrierten Python- oder NumPy
Datenstrukturen erstellen, ähnlich wie Sie Objekte mit pandas erstellen. Verwenden Sie das folgende Codebeispiel, um ein Objekt zu erstellen:
Verwenden Sie das folgende Codebeispiel, um pandas-Objekte mit der read_pandas()
-Methode oder Konstruktoren in DataFrames-Objekte zu konvertieren:
Verwenden Sie das folgende Codebeispiel, um die to_pandas() Methode zu verwenden, um BigQuery DataFrames-Daten in
Ihren Arbeitsspeicher zu laden:
Kostenschätzung mit dem Parameter dry_run
Das Laden großer Datenmengen kann viel Zeit und Ressourcen in Anspruch nehmen. Mit dem
Parameter dry_run=True im
to_pandas() Aufruf können Sie sehen, wie
viele Daten verarbeitet werden. Verwenden Sie das folgende Codebeispiel, um einen Testlauf durchzuführen:
Dateien lesen und schreiben
Sie können Daten aus kompatiblen Dateien in BigQuery DataFrames lesen. Diese Dateien können sich auf Ihrem lokalen Computer oder in Cloud Storage befinden. Verwenden Sie das folgende Codebeispiel, um Daten aus einer CSV-Datei zu lesen:
Verwenden Sie das folgende Codebeispiel, um Ihre BigQuery DataFrames in lokalen Dateien oder Cloud Storage-Dateien zu speichern
mit der to_csv Methode:
BigQuery-Tabellen lesen und schreiben
Verwenden Sie das folgende Code
beispiel, um BigQuery DataFrames mit BigQuery-Tabelle
referenzen und der bigframes.pandas.read_gbq Funktion zu erstellen:
Verwenden Sie das folgende Codebeispiel, um einen SQL-String mit der read_gbq() Funktion zu verwenden, um Daten in
BigQuery DataFrames zu lesen:
Verwenden Sie die
to_gbq() Methode Ihres DataFrame Objekts, um Ihr DataFrame Objekt in einer BigQuery-Tabelle zu speichern. Das folgende Codebeispiel zeigt, wie das geht:
Nächste Schritte
- Informationen zu BigQuery DataFrames.
- Informationen zum Arbeiten mit Datentypen in BigQuery DataFrames
- Informationen zum Visualisieren von Diagrammen mit BigQuery DataFrames
- Referenz zur BigQuery DataFrames API