Datenvorbereitungen planen

In diesem Dokument wird beschrieben, wie Sie Datenvorbereitungsjobs in BigQuery planen und manuell ausführen, um Ihre Datentransformations-Workflows zu automatisieren. Durch die Planung bleiben Ihre Daten ohne manuelle Eingriffe auf dem neuesten Stand und korrekt. Sie können Ihre Datenvorbereitungen aber auch manuell ausführen, um Transformationen vor der Bereitstellung zu testen und zu validieren. Datenvorbereitungen basieren auf Dataform.

Sie können Datenvorbereitungen mit Nutzeranmeldedaten für ein Google Konto oder mit einem benutzerdefinierten Dienstkonto planen.

Hinweis

Erstellen Sie zuerst eine Datenvorbereitung.

Anforderungen von VPC Service Controls

Wenn Sie VPC Service Controls verwenden, um Ihre Datenvorbereitungen zu schützen, sollten Sie wissen, dass geplante Ausführungen auf Dataform basieren. Wenn Sie VPC Service Controls für geplante Ausführungen konfigurieren, müssen die folgenden Anforderungen erfüllt sein:

Eine detaillierte Anleitung zur Konfiguration und Sicherheitsüberlegungen finden Sie unter VPC Service Controls für Dataform konfigurieren.

Erforderliche Rollen

Wenn Sie eine Datenvorbereitung mit einem Dienstkonto autorisieren möchten, wenn Sie die Datenvorbereitung manuell in der Entwicklung ausführen oder die Datenvorbereitung planen, müssen Sie dem Dienstkonto, das Sie für die Ausführung der Datenvorbereitungsjobs verwenden möchten, Rollen zuweisen. Weitere Informationen finden Sie unter Zugriff auf das Dataform-Dienstkonto gewähren.

So planen Sie Datenvorbereitungen:

Informationen zur Verbesserung der Sicherheit bei der Planung finden Sie unter Erweiterte Berechtigungen für die Planung implementieren.

Datenvorbereitung entwickeln

Wenn Sie eine Datenvorbereitung entwickeln, können Sie die Schritte manuell ausführen und die Ausgabe prüfen, bevor Sie die Änderungen in der Produktion bereitstellen. Sie können die aktuelle Version, die Sie entwickeln, mit Ihren Daten testen, während BigQuery die zuletzt bereitgestellte Version gemäß einem Zeitplanausführt. Bevor Sie die Ausführung durchführen können, müssen Sie das Ziel konfigurieren, und alle Validierungsfehler beheben.

Datenvorbereitung manuell in der Entwicklung ausführen

Wenn Sie Ihre Datenvorbereitungsschritte testen und die Ergebnisse in Ihrer Zieltabelle validieren möchten, führen Sie die Datenvorbereitung manuell über den Datenvorbereitungseditor aus:

  1. Rufen Sie in der Cloud de Confiance Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im linken Bereich auf Explorer:

    Hervorgehobener Button für den Explorer-Bereich.

    Wenn der linke Bereich nicht angezeigt wird, klicken Sie auf Linken Bereich maximieren , um ihn zu öffnen.

  3. Maximieren Sie im Bereich Explorer Ihr Projekt und klicken Sie auf Datenvorbereitungen.

  4. Klicken Sie auf den Namen der Datenvorbereitung, die Sie ausführen möchten.

  5. Klicken Sie in der Symbolleiste des Datenvorbereitungseditors auf Mehr > Ausführung jetzt konfigurieren.

  6. Autorisieren Sie im Abschnitt Authentifizierung die Datenvorbereitung mit den Nutzeranmeldedaten Ihres Google-Kontos oder einem Dienstkonto.

    • Wenn Sie die Nutzeranmeldedaten Ihres Google-Kontos verwenden möchten (Vorschau), wählen Sie Mit meinen Nutzeranmeldedaten ausführen aus. Dies ist die Standardoption.

      Optional: Wählen Sie im Abschnitt Erweiterte Zugriffsoptionen die zusätzlichen Dienste aus, die für Ihre Datenvorbereitung erforderlich sind:

      • Google Drive: Gewährt Lesezugriff auf Google Drive-Dateien.
    • Wenn Sie ein Dienstkonto verwenden möchten, wählen Sie Mit ausgewähltem Dienstkonto ausführen aus und wählen Sie dann ein Dienst konto aus. Wenn das Dienstkonto zusätzliche Berechtigungen benötigt, weisen Sie ihm die erforderlichen Rollen zu, indem Sie auf Alle gewähren klicken.

  7. Klicken Sie auf Speichern.

  8. Beheben Sie alle angezeigten Validierungsfehler.

  9. Klicken Sie in der Symbolleiste des Datenvorbereitungseditors auf Ausführen.

  10. Klicken Sie im Dialogfeld Jetzt ausführen auf Bestätigen , um zu bestätigen, dass bei dieser manuellen Ausführung Daten in eine Zieltabelle geschrieben werden, die Sie möglicherweise auch für geplante Ausführungen verwenden.

    Wenn Sie Mit meinen Nutzeranmeldedaten ausführen als Authentifizierungsmethode ausgewählt haben, müssen Sie Ihr Google-Konto autorisieren (Vorschau).

    Die Ausführung führt dann Ihre Schritte aus und lädt die Ausgabe in das Ziel.

  11. Optional: Nach Abschluss der Ausführung können Sie die Details zur Ausführung im Bereich Ausführungen aufrufen.

Datenvorbereitung bereitstellen

Wenn Sie Ausführungen für eine Version Ihrer Datenvorbereitung planen möchten, müssen Sie zuerst Ihre Änderungen speichern und bereitstellen. Zeitpläne führen immer die zuletzt bereitgestellte Version aus und ignorieren alle nicht bereitgestellten Änderungen.

So stellen Sie eine Datenvorbereitung bereit:

  1. Rufen Sie in der Cloud de Confiance Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im linken Bereich auf Explorer:

    Hervorgehobener Button für den Explorer-Bereich.

  3. Maximieren Sie im Bereich Explorer Ihr Projekt und klicken Sie auf Datenvorbereitungen.

  4. Klicken Sie auf den Namen der ausgewählten Datenvorbereitung.

    Der Datenvorbereitungseditor wird geöffnet.

  5. Klicken Sie in der Symbolleiste des Datenvorbereitungseditors auf Bereitstellen.

Zeitplan erstellen

Wenn Sie einen Zeitplan erstellen möchten, der die bereitgestellten Datenvorbereitungsschritte ausführt und die vorbereiteten Daten in die Zieltabelle lädt, müssen Sie zuerst eine Datenvorbereitungsausführung planen. Dazu müssen Sie das Ziel konfigurieren, und alle Validierungsfehler beheben.

So erstellen Sie einen Zeitplan für die Datenvorbereitung:

Bereich Explorer

  1. Rufen Sie in der Cloud de Confiance Console die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie im linken Bereich auf Explorer:

    Hervorgehobener Button für den Explorer-Bereich.

  3. Maximieren Sie im Bereich Explorer Ihr Projekt und klicken Sie auf Datenvorbereitungen.

  4. Klicken Sie auf den Namen der Datenvorbereitung, die Sie planen möchten.

  5. Klicken Sie in der Symbolleiste des Datenvorbereitungseditors auf Zeitplan.

  6. Geben Sie einen Namen für den Zeitplan ein.

  7. Autorisieren Sie im Abschnitt Authentifizierung die Datenvorbereitung mit den Nutzeranmeldedaten Ihres Google-Kontos oder einem Dienstkonto.

    • Wenn Sie die Nutzeranmeldedaten Ihres Google-Kontos verwenden möchten (Vorschau), wählen Sie Mit meinen Nutzeranmeldedaten ausführen aus.

      Optional: Wählen Sie im Abschnitt Erweiterte Zugriffsoptionen die zusätzlichen Dienste aus, die für Ihre Datenvorbereitung erforderlich sind:

      • Google Drive: Gewährt Lesezugriff auf Google Drive-Dateien.
    • Wenn Sie ein Dienstkonto verwenden möchten, wählen Sie Mit ausgewähltem Dienstkonto ausführen aus und wählen Sie dann ein Dienst konto aus.

  8. Planen Sie eine Häufigkeit.

  9. Klicken Sie auf Zeitplan erstellen. Wenn Sie Mit meinen Nutzeranmeldedaten ausführen als Authentifizierungsmethode ausgewählt haben, müssen Sie Ihr Google-Konto autorisieren (Vorschau).

Seite Planung

  1. Rufen Sie in der Cloud de Confiance Console die Seite Planung auf.

    Zur Seite „Planung“

  2. Klicken Sie auf Erstellen und wählen Sie dann im Menü Zeitplan für Datenvorbereitung aus.

  3. Wählen Sie im Bereich Datenvorbereitung planen im Feld Datenvorbereitung die Datenvorbereitung aus, die Sie planen möchten.

  4. Geben Sie im Feld Name des Zeitplans einen Namen für den Zeitplan ein.

  5. Autorisieren Sie im Abschnitt Authentifizierung die Datenvorbereitung mit den Nutzeranmeldedaten Ihres Google-Kontos oder einem Dienstkonto.

    • Wenn Sie die Nutzeranmeldedaten Ihres Google-Kontos verwenden möchten (Vorschau), wählen Sie Mit meinen Nutzeranmeldedaten ausführen aus.

      Optional: Wählen Sie im Abschnitt Erweiterte Zugriffsoptionen die zusätzlichen Dienste aus, die für Ihre Datenvorbereitung erforderlich sind:

      • Google Drive: Gewährt Lesezugriff auf Google Drive-Dateien.
    • Wenn Sie ein Dienstkonto verwenden möchten, wählen Sie Mit ausgewähltem Dienstkonto ausführen aus und wählen Sie dann ein Dienst konto aus.

  6. Führen Sie im Abschnitt Planungshäufigkeit folgende Schritte aus:

    1. Wählen Sie im Menü Wiederholungen die Häufigkeit der Datenvorbereitungsausführungen aus.
    2. Geben Sie im Feld Um die Uhrzeit die Uhrzeit für die geplanten Datenvorbereitungsausführungen ein.
    3. Wählen Sie im Menü Zeitzone die Zeitzone für den Zeitplan aus.
  7. Klicken Sie auf Zeitplan erstellen. Wenn Sie Mit meinen Nutzeranmeldedaten ausführen als Authentifizierungsmethode ausgewählt haben, müssen Sie Ihr Google-Konto autorisieren (Vorschau).

Google-Konto autorisieren

Wenn Sie die Ressource mit den Nutzeranmeldedaten Ihres Google-Kontos authentifizieren möchten, müssen Sie manuell die Berechtigung erteilen, dass BigQuery -Pipelines das Zugriffstoken für Ihr Google-Konto abrufen und in Ihrem Namen auf die Quelldaten zugreifen können. Sie können die manuelle Genehmigung über die OAuth-Dialogoberfläche erteilen. Wenn Sie Erweiterte Zugriffsoptionen auswählen, müssen Sie den Zugriff auf diese Dienste gewähren, z. B. Google Drive oder Knowledge Catalog.

Sie müssen BigQuery-Pipelines nur einmal die Berechtigung erteilen.

So widerrufen Sie die erteilte Berechtigung:

  1. Rufen Sie die Seite Ihres Google-Kontos auf.
  2. Klicken Sie auf BigQuery-Pipelines.
  3. Klicken Sie auf Zugriff entfernen.

Wenn Sie den Inhaber des Zeitplans für die Datenvorbereitung durch Aktualisieren der Anmeldedaten ändern, ist auch eine manuelle Genehmigung erforderlich, falls der neue Inhaber des Google-Kontos noch nie einen Zeitplan erstellt hat.

Geplante Datenvorbereitung manuell ausführen

Wenn Sie eine Datenvorbereitung in einem ausgewählten Zeitplan manuell ausführen, führt BigQuery die Datenvorbereitung einmal aus, unabhängig vom Zeitplan.

So führen Sie eine geplante Datenvorbereitung manuell aus:

  1. Rufen Sie in der Cloud de Confiance Console die Seite Planung auf.

    Zur Seite „Planung“

  2. Klicken Sie auf den Namen des ausgewählten Zeitplans für die Datenvorbereitung.

  3. Klicken Sie auf der Seite Zeitplandetails auf Ausführen.

Terminübersichten ansehen

Sie können Zeitpläne für die Datenvorbereitung im Datenvorbereitungseditor oder auf der Seite Planung aufrufen.

Datenvorbereitungseditor

So rufen Sie den Zeitplan für eine Datenvorbereitung auf:

  1. Klicken Sie in der Symbolleiste des Datenvorbereitungseditors auf „schedule“ Zeitplan ansehen.
  2. Optional: Klicken Sie auf Letzte Ausführungen ansehen, um den Zeitplanverlauf aufzurufen.

Seite Planung

So rufen Sie alle Zeitpläne für die Datenvorbereitung in Ihrem Projekt auf:

  1. Rufen Sie in der Cloud de Confiance Console die Seite Planung auf.

    Zur Seite „Planung“

  2. Optional: Wenn Sie den Ausführungsverlauf und die Details eines ausgewählten Zeitplans aufrufen möchten, klicken Sie auf den Namen des Zeitplans. Der Verlauf manueller Ausführungen wird nicht angezeigt.

Zeitplan bearbeiten

Sie können einen Zeitplan im Datenvorbereitungseditor oder auf der Seite Planung bearbeiten.

Datenvorbereitungseditor

So bearbeiten Sie einen Zeitplan:

  1. Klicken Sie in der Symbolleiste des Datenvorbereitungseditors auf „schedule“ Zeitplan ansehen.
  2. Klicken Sie im Dialogfeld Datenvorbereitung planen auf Bearbeiten und aktualisieren Sie dann den Zeitplan.
  3. Klicken Sie auf Zeitplan aktualisieren.

Seite Planung

So bearbeiten Sie einen Zeitplan:

  1. Rufen Sie in der Cloud de Confiance Console die Seite Planung auf.

    Zur Seite „Planung“

  2. Klicken Sie auf den Namen des ausgewählten Zeitplans für die Datenvorbereitung.

  3. Klicken Sie auf der Seite Zeitplandetails auf Bearbeiten.

  4. Klicken Sie auf Zeitplan ansehen.

  5. Klicken Sie im Dialogfeld Datenvorbereitung planen auf Bearbeiten und aktualisieren Sie dann den Zeitplan.

  6. Klicken Sie auf Zeitplan aktualisieren.

Zeitplan löschen

So löschen Sie einen Zeitplan für eine ausgewählte Datenvorbereitung endgültig:

  1. Rufen Sie in der Cloud de Confiance Console die Seite Planung auf.

    Zur Seite „Planung“

  2. Klicken Sie in der Zeile mit dem Zeitplan auf more_vert Aktionen > Löschen.

Nächste Schritte