Pianificare i DAG di Airflow
Questo documento descrive come pianificare i grafici aciclici diretti (DAG) di Airflow da Managed Airflow 3 nella pagina Pianificazione di BigQuery, incluso come attivare manualmente i DAG e come visualizzare la cronologia e i log delle esecuzioni precedenti dei DAG.
Informazioni sulla gestione dei DAG di Airflow in BigQuery
La pagina Pianificazione in BigQuery fornisce strumenti per pianificare i DAG Airflow eseguiti negli ambienti Managed Airflow 3.
I DAG Airflow che pianifichi in BigQuery vengono eseguiti in uno o più ambienti Managed Airflow nel tuo progetto. La pagina Pianificazione in BigQuery combina le informazioni di tutti i DAG Airflow nel tuo progetto.
Durante l'esecuzione di un DAG, Airflow pianifica ed esegue le singole attività che compongono un DAG in una sequenza definita dal DAG. Nella pagina Pianificazione di BigQuery, puoi visualizzare gli stati delle esecuzioni di DAG passate, esplorare i log dettagliati di tutte le esecuzioni di DAG e di tutte le attività di queste esecuzioni di DAG e visualizzare i dettagli sui DAG.
Per saperne di più sui concetti di base di Airflow, come DAG, esecuzioni di DAG, attività o operatori, consulta la pagina Concetti di base nella documentazione di Airflow.
Per scoprire di più sugli ambienti Managed Airflow, consulta la pagina Panoramica di Managed Airflow 3 nella documentazione di Managed Airflow.
Prima di iniziare
Abilitare l'API Cloud Composer.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (
roles/serviceusage.serviceUsageAdmin), che include l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.- Assicurati che il tuo progetto Cloud de Confiance abbia almeno un ambiente Managed Airflow 3 con almeno un file DAG già caricato:
- Per iniziare a utilizzare i DAG di Airflow, segui le istruzioni riportate nella guida Esegui un DAG di Apache Airflow in Managed Airflow 3. Come parte di questa guida, crei un ambiente Managed Airflow 3 con la configurazione predefinita, carichi un DAG e verifichi che Airflow lo esegua.
- Per istruzioni dettagliate su come caricare un DAG Airflow in un ambiente Managed Airflow 3, vedi Aggiungere e aggiornare i DAG.
- Per istruzioni dettagliate su come creare un ambiente Managed Airflow 3, vedi Creare ambienti Managed Airflow.
Autorizzazioni obbligatorie
Per ottenere le autorizzazioni necessarie per pianificare i DAG di Airflow, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:
-
Per visualizzare i DAG di Airflow e i relativi dettagli:
Environment and Storage Object Viewer (
roles/composer.environmentAndStorageObjectViewer) -
Per attivare e mettere in pausa i DAG Airflow:
Environment and Storage Object User (
roles/composer.environmentAndStorageObjectUser)
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per pianificare i DAG di Airflow. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per pianificare i DAG di Airflow sono necessarie le seguenti autorizzazioni:
-
Per visualizzare i DAG di Airflow e i relativi dettagli:
composers.dags.list, composer.environments.list -
Per attivare e mettere in pausa i DAG Airflow:
composers.dags.list, composer.environments.list, composer.dags.execute
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Per saperne di più su IAM di Managed Airflow 3, consulta Controllo dell'accesso con IAM nella documentazione di Managed Airflow.
Attivare manualmente un DAG Airflow
Quando attivi manualmente un DAG Airflow, Airflow esegue il DAG una sola volta, indipendentemente dalla pianificazione specificata per il DAG.
Per attivare manualmente un DAG Airflow selezionato:
Nella console Cloud de Confiance , vai alla pagina Scheduling.
Esegui una delle operazioni seguenti:
Fai clic sul nome del DAG selezionato, quindi nella pagina Dettagli DAG, fai clic su Attiva DAG.
Nella riga contenente il DAG selezionato, fai clic su Visualizza azioni nella colonna Azioni, quindi fai clic su Attiva DAG.
Visualizzare i log e i dettagli dell'esecuzione di DAG di Airflow
Per visualizzare i dettagli di un DAG Airflow selezionato:
Nella console Cloud de Confiance , vai alla pagina Scheduling.
Fai clic sul nome del DAG selezionato.
Nella pagina Dettagli DAG, seleziona la scheda Dettagli.
Per visualizzare le esecuzioni DAG precedenti, seleziona la scheda Esecuzioni.
(Facoltativo) La scheda Esecuzioni mostra le esecuzioni dei DAG degli ultimi 10 giorni per impostazione predefinita. Per filtrare le esecuzioni DAG in base a un intervallo di tempo diverso, nel menu a discesa 10 giorni, seleziona un intervallo di tempo e poi fai clic su Ok.
(Facoltativo) Per visualizzare colonne aggiuntive con i dettagli dell'esecuzione del DAG nell'elenco di tutte le esecuzioni del DAG, fai clic su Opzioni di visualizzazione delle colonne, seleziona le colonne e fai clic su Ok.
Per visualizzare i dettagli e i log di un'esecuzione DAG selezionata, seleziona un'esecuzione DAG.
Per visualizzare una visualizzazione del DAG con le dipendenze delle attività, seleziona la scheda Diagramma.
- Per visualizzare i dettagli di un'attività, selezionala nel diagramma.
Per visualizzare il codice sorgente del DAG, seleziona la scheda Codice.
(Facoltativo) Per aggiornare i dati visualizzati, fai clic su Aggiorna.
Visualizza tutti i DAG di Airflow
Per visualizzare i DAG Airflow di tutti gli ambienti Managed Airflow 3 nel tuo progettoCloud de Confiance , segui questi passaggi:
Nella console Cloud de Confiance , vai alla pagina Scheduling.
(Facoltativo) Per visualizzare colonne aggiuntive con i dettagli del DAG, fai clic su Opzioni di visualizzazione delle colonne, poi seleziona le colonne e fai clic su Ok.
Mettere in pausa un DAG Airflow
Per mettere in pausa un DAG Airflow selezionato:
Nella console Cloud de Confiance , vai alla pagina Scheduling.
Esegui una delle operazioni seguenti:
Fai clic sul nome del DAG selezionato, quindi nella pagina Dettagli DAG, fai clic su Metti in pausa DAG.
Nella riga contenente il DAG selezionato, fai clic su Visualizza azioni nella colonna Azioni e poi fai clic su Metti in pausa DAG.
Risoluzione dei problemi
Per istruzioni sulla risoluzione dei problemi relativi ai DAG Airflow, vedi Risoluzione dei problemi relativi ai DAG Airflow nella documentazione di Managed Airflow.
Passaggi successivi
- Scopri di più su come scrivere DAG Airflow.
- Scopri di più su Airflow in Managed Airflow 3.