Airflow-DAGs planen
In diesem Dokument wird beschrieben, wie Sie gerichtete azyklische Graphen (Directed Acyclic Graphs, DAGs) in Airflow über die Seite Planung in BigQuery aus Managed Airflow 3 planen. Außerdem wird beschrieben, wie Sie DAGs manuell auslösen und den Verlauf und die Logs vergangener DAG-Ausführungen aufrufen.
Airflow-DAGs in BigQuery verwalten
Die Seite Planung in BigQuery bietet Tools zum Planen von Airflow-DAGs, die in Ihren Managed Airflow 3-Umgebungen ausgeführt werden.
Airflow-DAGs, die Sie in BigQuery planen, werden in einer oder mehreren Managed Airflow-Umgebungen in Ihrem Projekt ausgeführt. Auf der Seite Planung in BigQuery werden Informationen für alle Airflow-DAGs in Ihrem Projekt zusammengefasst.
Während einer DAG-Ausführung plant und führt Airflow einzelne Aufgaben aus, aus denen ein DAG besteht, in einer vom DAG definierten Reihenfolge. Auf der Seite Planung in BigQuery können Sie den Status vergangener DAG-Ausführungen ansehen, detaillierte Logs aller DAG-Ausführungen und aller Aufgaben aus diesen DAG-Ausführungen aufrufen und Details zu DAGs ansehen.
Weitere Informationen zu den Airflow-Kernkonzepten wie Airflow-DAGs, DAG-Ausführungen, Aufgaben oder Operatoren finden Sie in der Airflow-Dokumentation auf der Seite Core Concepts (Kernkonzepte).
Weitere Informationen zu Managed Airflow-Umgebungen finden Sie in der Managed Airflow-Dokumentation auf der Seite Managed Airflow 3 – Übersicht.
Hinweis
die Cloud Composer API aktivieren
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (
roles/serviceusage.serviceUsageAdmin), die die Berechtigungserviceusage.services.enableenthält. Weitere Informationen zum Zuweisen von Rollen- Ihr Cloud de Confiance Projekt muss mindestens eine Managed Airflow 3-Umgebung mit mindestens einer bereits hochgeladenen DAG-Datei enthalten:
- Wenn Sie mit Airflow-DAGs beginnen möchten, folgen Sie der Anleitung unter Apache Airflow-DAG in Managed Airflow 3 ausführen. In dieser Anleitung erstellen Sie eine Managed Airflow 3-Umgebung mit der Standardkonfiguration, laden einen DAG hoch und prüfen, ob er von Airflow ausgeführt wird.
- Eine detaillierte Anleitung zum Hochladen eines Airflow-DAG in eine Managed Airflow 3-Umgebung finden Sie unter DAGs hinzufügen und aktualisieren.
- Eine detaillierte Anleitung zum Erstellen einer Managed Airflow 3-Umgebung finden Sie unter Managed Airflow-Umgebungen erstellen.
Erforderliche Berechtigungen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Planen von Airflow-DAGs benötigen:
-
So rufen Sie Airflow-DAGs und ihre Details auf:
Umgebungsnutzer und Betrachter von Storage-Objekten (
roles/composer.environmentAndStorageObjectViewer) -
Airflow-DAGs auslösen und pausieren:
Umgebungsnutzer und Betrachter von Storage-Objekten (
roles/composer.environmentAndStorageObjectUser)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Planen von Airflow-DAGs erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Airflow-DAGs zu planen:
-
So rufen Sie Airflow-DAGs und ihre Details auf:
composers.dags.list, composer.environments.list -
So lösen Sie Airflow-DAGs aus und pausieren sie:
composers.dags.list, composer.environments.list, composer.dags.execute
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Weitere Informationen zu Managed Airflow 3 IAM finden Sie in der Managed Airflow-Dokumentation unter Zugriffssteuerung mit IAM.
Airflow-DAG manuell auslösen
Wenn Sie einen Airflow-DAG manuell auslösen, führt Airflow den DAG einmal aus, unabhängig vom Zeitplan, der für den DAG angegeben wurde.
So lösen Sie einen ausgewählten Airflow-DAG manuell aus:
Rufen Sie in der Cloud de Confiance Console die Seite Scheduling auf.
Führen Sie eine der folgenden Aktionen aus:
Klicken Sie auf den Namen des ausgewählten DAG und dann auf der Seite DAG-Details auf DAG auslösen.
Klicken Sie in der Zeile mit dem ausgewählten DAG in der Spalte Aktionen auf Aktionen ansehen und dann auf DAG auslösen.
Airflow-DAG-Ausführungsprotokolle und -Details ansehen
So rufen Sie Details zu einem ausgewählten Airflow-DAG auf:
Rufen Sie in der Cloud de Confiance Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten DAG.
Wählen Sie auf der Seite DAG-Details den Tab Details aus.
Wenn Sie frühere DAG-Ausführungen aufrufen möchten, wählen Sie den Tab Ausführungen aus.
Optional: Auf dem Tab Ausführungen werden standardmäßig DAG-Ausführungen der letzten 10 Tage angezeigt. Wenn Sie DAG-Ausführungen nach einem anderen Zeitraum filtern möchten, wählen Sie im Drop-down-Menü 10 Tage einen Zeitraum aus und klicken Sie dann auf OK.
Optional: Wenn Sie zusätzliche Spalten mit Details zum DAG-Lauf in der Liste aller DAG-Läufe anzeigen möchten, klicken Sie auf Spaltenanzeigeoptionen, wählen Sie die gewünschten Spalten aus und klicken Sie auf OK.
Wenn Sie Details und Logs für eine ausgewählte DAG-Ausführung aufrufen möchten, wählen Sie eine DAG-Ausführung aus.
Wenn Sie eine Visualisierung des DAG mit Aufgabenabhängigkeiten aufrufen möchten, wählen Sie den Tab Diagramm aus.
- Wenn Sie sich die Details einer Aufgabe ansehen möchten, wählen Sie sie im Diagramm aus.
Wenn Sie den Quellcode des DAG ansehen möchten, wählen Sie den Tab Code aus.
Optional: Klicken Sie auf Aktualisieren, um die angezeigten Daten zu aktualisieren.
Alle Airflow-DAGs ansehen
So rufen Sie Airflow-DAGs aus allen Managed Airflow 3-Umgebungen in IhremCloud de Confiance -Projekt auf:
Rufen Sie in der Cloud de Confiance Console die Seite Scheduling auf.
Optional: Wenn Sie zusätzliche Spalten mit DAG-Details anzeigen möchten, klicken Sie auf Spaltenanzeigeoptionen, wählen Sie die gewünschten Spalten aus und klicken Sie auf OK.
Airflow-DAG pausieren
So pausieren Sie einen ausgewählten Airflow-DAG:
Rufen Sie in der Cloud de Confiance Console die Seite Scheduling auf.
Führen Sie eine der folgenden Aktionen aus:
Klicken Sie auf den Namen des ausgewählten DAG und dann auf der Seite DAG-Details auf DAG pausieren.
Klicken Sie in der Zeile mit dem ausgewählten DAG in der Spalte Aktionen auf Aktionen ansehen und dann auf DAG pausieren.
Fehlerbehebung
Eine Anleitung zur Fehlerbehebung bei Airflow-DAGs finden Sie in der Managed Airflow-Dokumentation unter Fehlerbehebung bei Airflow-DAGs.