Il est possible qu'une partie ou l'ensemble des informations de cette page ne s'appliquent pas au Cloud de confiance S3NS. Pour en savoir plus, consultez Différences par rapport à Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Créer des pipelines

Ce document explique comment créer des pipelines dans BigQuery. Les pipelines sont alimentés par Dataform.

Avant de commencer

In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
Verify that billing is enabled for your Cloud de Confiance project.
Enable the BigQuery, Dataform, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the APIs

Exigences relatives à VPC Service Controls

Si vous utilisez VPC Service Controls pour protéger vos pipelines, sachez que les exécutions de pipeline sont optimisées par Dataform. Lorsque vous configurez VPC Service Controls pour les exécutions planifiées, assurez-vous que les exigences suivantes sont respectées :

Vous devez définir le service de règles d'administration dataform.restrictGitRemotes.
Dataform et BigQuery doivent être restreints par le même périmètre de service VPC Service Controls.
Pour permettre aux utilisateurs de s'authentifier avec les identifiants de leur compte Google lorsqu'ils planifient ou déclenchent manuellement des exécutions, vous devez ajouter leurs identités utilisateur à vos règles d'entrée. Pour en savoir plus, consultez Mettre à jour les règles d'entrée et de sortie pour un périmètre de service et la Documentation de référence sur les règles d'entrée.

Pour obtenir des instructions de configuration détaillées et des informations sur les considérations de sécurité, consultez Configurer VPC Service Controls pour Dataform.

Rôles requis pour les pipelines

Pour obtenir les autorisations nécessaires pour créer des pipelines, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Pour créer des pipelines : Créateur de code (roles/dataform.codeCreator)
Pour modifier et exécuter des pipelines : Éditeur Dataform (roles/dataform.editor)

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

Pour en savoir plus sur IAM pour Dataform, consultez Contrôler les accès avec IAM.

Rôles requis pour les options de notebook

Pour obtenir les autorisations nécessaires pour sélectionner un modèle d'exécution dans les options du notebook, demandez à votre administrateur de vous accorder le rôle IAM Utilisateur de l'exécution du notebook (roles/aiplatform.notebookRuntimeUser) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

Si vous ne disposez pas de ce rôle, vous pouvez sélectionner la spécification d'exécution du notebook par défaut.

Points à noter concernant la sécurité des pipelines

Étant donné que les composants de code dans BigQuery sont fournis par Dataform, vous devez tenir compte des implications de sécurité suivantes pour les utilisateurs ayant accès à ces composants :

La visibilité des composants de code est régie par les autorisations Dataform au niveau du projet. Les utilisateurs disposant de l'autorisation dataform.repositories.list (incluse dans les rôles BigQuery standards tels que Utilisateur de job BigQuery, Utilisateur BigQuery Studio et Utilisateur BigQuery) peuvent voir tous les composants de code dans le panneau Explorateur du projet Cloud de Confiance , qu'ils les aient créés ou qu'ils aient été partagés avec eux. Pour limiter la visibilité, vous pouvez créer des rôles personnalisés qui excluent l'autorisation dataform.repositories.list.
Les utilisateurs qui peuvent modifier ces éléments peuvent potentiellement accéder aux secrets partagés avec l'agent de service Dataform. Pour sécuriser vos identifiants, limitez la création et la modification des accès aux utilisateurs de confiance, et limitez les secrets accessibles à l'agent de service Dataform. Pour en savoir plus, consultez Accès aux secrets lors de l'installation du package.

Pour en savoir plus, consultez Remarques sur la sécurité pour les autorisations Dataform.

Définir la région par défaut des composants de code

Tous les nouveaux composants de code de votre projet Cloud de Confiance utilisent une région par défaut. Une fois le composant créé, vous ne pouvez plus modifier sa région.

Pour définir la région par défaut des nouveaux composants de code :

Accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Fichiers pour ouvrir l'explorateur de fichiers :
À côté du nom du projet, cliquez sur Afficher les actions du panneau "Fichiers" > Changer de région de code.
Sélectionnez la région de code que vous souhaitez utiliser par défaut.
Cliquez sur Enregistrer.

Pour obtenir la liste des régions compatibles, consultez Emplacements BigQuery Studio.

Créer un pipeline

Vous pouvez également utiliser la page Pipelines et connexions de BigQuery dans la console Cloud de Confiance pour créer un pipeline Dataform qui utilise un workflow simplifié et spécifique à BigQuery. Cette fonctionnalité est disponible en version preview.

Pour créer un pipeline, procédez comme suit :

Accédez à la page BigQuery.

Accéder à BigQuery
Dans la barre d'onglets du volet de l'éditeur, cliquez sur la flèche à côté du signe +, puis sur Pipeline.
Facultatif : Pour renommer le pipeline, cliquez sur son nom, puis saisissez un nouveau nom.
Cliquez sur Commencer, puis accédez à l'onglet Paramètres.
Dans la section Authentification, choisissez d'autoriser le pipeline avec les identifiants utilisateur de votre compte Google ou d'un compte de service.
- Pour utiliser les identifiants utilisateur de votre compte Google (Aperçu), sélectionnez Exécuter avec mes identifiants utilisateur.
  
  (Facultatif) Dans la section Options d'accès étendu, sélectionnez les services supplémentaires dont votre pipeline a besoin :
  - Knowledge Catalog : autorise les mises à jour des métadonnées Knowledge Catalog. Cloud de Confiance
  - Google Drive : permet un accès en lecture seule aux fichiers Google Drive.
  - Bigtable : permet l'accès en lecture seule aux données Google Bigtable.
    
    Remarque : L'authentification des exécutions basées sur l'API avec des identifiants utilisateur n'est pas acceptée. Pour exécuter toutes les tâches d'un pipeline à l'aide de l'API Dataform, vous devez configurer le pipeline pour qu'il utilise un compte de service.
- Pour utiliser un compte de service, sélectionnez Exécuter avec le compte de service sélectionné, puis sélectionnez un compte de service. Si vous devez créer un compte de service, cliquez sur Nouveau compte de service.
Dans la section Emplacement de traitement, sélectionnez un emplacement de traitement pour le pipeline.
- Pour activer la sélection automatique d'un emplacement, sélectionnez Sélection automatique de l'emplacement. Cette option sélectionne un emplacement en fonction des ensembles de données référencés dans la requête. Le processus de sélection est le suivant :
  - Si votre requête fait référence à des ensembles de données provenant du même emplacement, BigQuery utilise cet emplacement.
  - Si votre requête fait référence à des ensembles de données provenant de deux emplacements différents ou plus, une erreur se produit. Pour en savoir plus sur cette limite, consultez Réplication interrégionale d'ensembles de données.
  - Si votre requête ne fait référence à aucun ensemble de données, BigQuery utilise par défaut la zone multirégionale US.
- Pour sélectionner une région spécifique, sélectionnez Région, puis choisissez une région dans le menu Région. Vous pouvez également utiliser la variable système @@location dans votre requête. Pour en savoir plus, consultez Spécifier des zones.
- Pour sélectionner un emplacement multirégional, sélectionnez Multirégional, puis choisissez un emplacement multirégional dans le menu Multirégional.
L'emplacement de traitement du pipeline n'a pas besoin de correspondre à votre emplacement de stockage par défaut pour les composants de code.

Options SQLX

Pour configurer les paramètres SQLX de votre pipeline, procédez comme suit dans la section Options SQLX :

Dans le champ Default project (Projet par défaut), saisissez le nom d'un projetCloud de Confiance existant. Cette valeur est utilisée pour defaultProject dans le fichier workflow_settings.yaml et pour defaultDatabase dans le fichier dataform.json. Le projet par défaut est utilisé par les tâches de pipeline lors de leur exécution.

Remarque : Le nom du projet n'est pas validé. Vous pouvez donc saisir n'importe quelle chaîne non vide. Toutefois, si le projet n'existe pas, l'exécution du pipeline échoue.
Facultatif : Dans le champ Ensemble de données par défaut, recherchez et sélectionnez un ensemble de données existant. La liste des ensembles de données disponibles est filtrée en fonction du projet et de l'emplacement de traitement sélectionnés. Cette valeur est utilisée pour defaultDataset dans le fichier workflow_settings.yaml. L'ensemble de données par défaut est utilisé par les tâches du pipeline lors de leur exécution.

Remarque : Si vous définissez l'ensemble de données par défaut, puis que vous modifiez la région du pipeline, la sélection de l'ensemble de données est invalidée. Changer de projet peut également invalider la sélection de l'ensemble de données. Si un ensemble de données donné n'existe pas dans le projet sélectionné, il est créé.

Options du notebook

Pour ajouter un notebook à votre pipeline, procédez comme suit dans la section Options du notebook :

Dans le champ Modèle d'environnement d'exécution, acceptez l'environnement d'exécution de notebook par défaut, ou recherchez et sélectionnez un environnement d'exécution existant.
- Pour afficher les spécifications du runtime par défaut, cliquez sur la flèche à côté.
- Pour créer un environnement d'exécution, consultez Créer un modèle d'exécution.
Remarque : Un modèle d'environnement d'exécution de notebook doit se trouver dans la même région que le pipeline qui le spécifie.
Remarque : Lorsque vous incluez un notebook dans un pipeline BigQuery, vous ne pouvez pas modifier le réseau de l'instance d'exécution Gemini Enterprise Agent Platform. L'environnement d'exécution est limité au réseau par défaut. La sélection d'un autre réseau n'est pas prise en charge.
Dans le champ Bucket Cloud Storage, cliquez sur Parcourir, puis sélectionnez ou créez un bucket Cloud Storage pour stocker la sortie des notebooks dans votre pipeline.
Suivez la procédure décrite dans Ajouter un compte principal à une stratégie au niveau du bucket pour ajouter votre compte de service Dataform personnalisé en tant que compte principal au bucket Cloud Storage que vous prévoyez d'utiliser pour stocker le résultat des exécutions de pipeline programmées, et attribuer le rôle Administrateur de l'espace de stockage (roles/storage.admin) à ce compte principal.

Le compte de service Dataform personnalisé sélectionné doit disposer du rôle IAM "Administrateur de stockage" sur le bucket sélectionné.

Ajouter une tâche de pipeline

Vous pouvez ajouter plusieurs tâches à un pipeline qui exécute des composants de code dans une séquence spécifique.

Conventions de dénomination des tâches

Lorsque vous nommez une tâche de pipeline, respectez les conventions de nommage suivantes :

Les noms de tâches ne peuvent contenir que des lettres (a-z, A-Z), des chiffres (0-9), des traits de soulignement (_) et des tirets (-).
Les noms de tâches doivent commencer par une lettre, un chiffre ou un trait de soulignement.
Les points (.) ne sont pas autorisés dans les noms de tâches. Lorsque vous nommez ou renommez une tâche, n'incluez pas d'extensions de fichier telles que .sql ou .py. Si le nom d'une tâche contient un point, le bouton Exécuter est désactivé.
Les noms de tâches peuvent contenir des caractères comportant jusqu'à 1 024 octets UTF-8.
Les noms de tâches doivent être uniques dans le conteneur de pipeline.
Les noms de tâches sont sensibles à la casse.

Ajoutez une tâche

Pour ajouter une tâche à un pipeline, procédez comme suit :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Pour ajouter un composant code, sélectionnez l'une des options suivantes :
Requête SQL
1. Cliquez sur Ajouter une tâche, puis sélectionnez Requête. Vous pouvez créer une requête ou en importer une.
2. Facultatif : Dans le volet Détails de la tâche de requête, dans le menu Exécuter après, sélectionnez une tâche qui précèdera votre requête.
Créer une requête
1. Cliquez sur le menu à côté de Modifier la requête, puis sélectionnez Dans le contexte ou Dans un nouvel onglet.
2. Recherchez une requête existante.
3. Sélectionnez un nom de requête, puis appuyez sur Entrée.
4. Cliquez sur Enregistrer.
5. Facultatif : Pour renommer la requête, cliquez sur son nom dans le volet "Pipeline", puis sur Modifier la requête. Cliquez ensuite sur le nom de la requête existante en haut de l'écran, puis saisissez un nouveau nom.
Importer une requête existante
1. Cliquez sur le menu déroulant à côté de Modifier la requête, puis sur Importer une copie.
2. Recherchez une requête existante à importer ou sélectionnez-en une dans le volet de recherche. Lorsque vous importez une requête, l'original reste inchangé, car le fichier source de la requête est copié dans le pipeline.
3. Cliquez sur Modifier pour ouvrir la requête importée.
4. Cliquez sur Enregistrer.
Notebook
1. Cliquez sur Ajouter une tâche, puis sélectionnez Notebook. Vous pouvez créer un notebook ou en importer un existant. Pour modifier les paramètres des modèles d'exécution de notebooks, consultez Options des notebooks.
2. Facultatif : Dans le volet Détails de la tâche de notebook, dans le menu Exécuter après, sélectionnez une tâche qui précèdera votre notebook.
Créer un notebook
1. Cliquez sur le menu à côté de Modifier le notebook, puis sélectionnez Dans le contexte ou Dans un nouvel onglet.
2. Recherchez un notebook existant.
3. Sélectionnez le nom d'un notebook, puis appuyez sur Entrée.
4. Cliquez sur Enregistrer.
5. Facultatif : Pour renommer le notebook, cliquez sur son nom dans le volet "Pipeline", puis sur Modifier le notebook. Cliquez sur le nom du notebook existant en haut de l'écran, puis saisissez un nouveau nom.
Importer un notebook existant
1. Cliquez sur le menu à côté de Modifier le notebook, puis sur Importer une copie.
2. Recherchez un notebook existant à importer ou sélectionnez-en un dans le volet de recherche. Lorsque vous importez un notebook, l'original reste inchangé, car le fichier source du notebook est copié dans le pipeline.
3. Pour ouvrir le notebook importé, cliquez sur Modifier.
4. Cliquez sur Enregistrer.
Préparation des données
1. Cliquez sur Ajouter une tâche, puis sélectionnez Préparation des données. Vous pouvez créer une préparation de données ou en importer une.
2. Facultatif : Dans le volet Détails de la tâche de préparation des données, dans le menu Exécuter après, sélectionnez une tâche qui précèdera la préparation de vos données.
Créer une préparation des données
1. Cliquez sur le menu déroulant à côté de Modifier la préparation des données, puis sélectionnez Dans le contexte ou Dans un nouvel onglet.
2. Recherchez une préparation de données existante.
3. Sélectionnez un nom de préparation des données, puis appuyez sur Entrée.
4. Cliquez sur Enregistrer.
5. Facultatif : Pour renommer la préparation des données, cliquez sur son nom dans le volet "Pipeline", puis sur Modifier la préparation des données. Cliquez ensuite sur le nom en haut de l'écran et saisissez-en un nouveau.
Importer une préparation de données existante
1. Cliquez sur le menu déroulant à côté de Modifier la préparation des données, puis sur Importer une copie.
2. Recherchez une préparation de données existante à importer ou sélectionnez-en une dans le volet de recherche. Lorsque vous importez une préparation de données, l'original reste inchangé, car le fichier source de la préparation de données est copié dans le pipeline.
3. Pour ouvrir la préparation des données importées, cliquez sur Modifier.
4. Cliquez sur Enregistrer.
Table

Aperçu

Ce produit ou cette fonctionnalité sont soumis aux "Conditions des offres de pré-DG" de la section "Conditions générales du service" des Conditions spécifiques du service. Les produits et fonctionnalités pré-DG sont disponibles "en l'état" et peuvent avoir une compatibilité limitée. Pour en savoir plus, consultez les descriptions des étapes de lancement.

Remarque : Pour envoyer des commentaires ou demander de l'aide, contactez dataform-preview-support@google.com.
1. Cliquez sur Ajouter une tâche, puis sélectionnez Table.
2. Dans le volet Créer, sélectionnez Table ou Table incrémentielle.
3. Vérifiez le projet par défaut de la table ou sélectionnez-en un autre.
4. Vérifiez l'ensemble de données par défaut pour la table ou sélectionnez-en un autre.
5. Saisissez un nom pour la table.
6. Dans le volet Détails de la tâche "Table", cliquez sur Ouvrir pour ouvrir la tâche.
7. Configurez la tâche à l'aide des paramètres de Détails > Configuration ou dans le bloc config de l'éditeur de code pour le tableau.
  
  Pour les modifications de métadonnées, utilisez l'onglet Configuration. Cet onglet vous permet de modifier une valeur spécifique dans le bloc config à partir de l'éditeur de code, comme une chaîne ou un tableau, qui est formatée comme un objet JavaScript. Cet onglet vous permet d'éviter les erreurs de syntaxe et de vérifier que vos paramètres sont corrects.
  
  Facultatif : Dans le menu Exécuter après, sélectionnez une tâche qui précédera votre tableau.
  
  Vous pouvez également définir les métadonnées de la tâche de votre pipeline dans le bloc config de l'éditeur. Pour en savoir plus, consultez Créer des tables.
  
  L'éditeur valide votre code et affiche l'état de validation.
  
  Remarque : Lorsque vous utilisez des fonctions JavaScript comme valeurs dans le bloc config, vous ne pouvez pas modifier les fonctions JavaScript dans l'onglet Configuration.
8. Dans Détails > Requêtes compilées, consultez le code SQL compilé à partir du code SQLX.
9. Cliquez sur Exécuter pour exécuter le code SQL dans votre pipeline.
10. Dans Résultats de la requête, examinez l'aperçu des données.
Afficher

Aperçu

Ce produit ou cette fonctionnalité sont soumis aux "Conditions des offres de pré-DG" de la section "Conditions générales du service" des Conditions spécifiques du service. Les produits et fonctionnalités pré-DG sont disponibles "en l'état" et peuvent avoir une compatibilité limitée. Pour en savoir plus, consultez les descriptions des étapes de lancement.

Remarque : Pour envoyer des commentaires ou demander de l'aide, contactez dataform-preview-support@google.com.
1. Cliquez sur Ajouter une tâche, puis sélectionnez Vue.
2. Dans le volet Créer, sélectionnez Vue ou Vue matérialisée.
3. Vérifiez le projet par défaut de la vue ou sélectionnez-en un autre.
4. Vérifiez l'ensemble de données par défaut de la vue ou sélectionnez-en un autre.
5. Saisissez un nom pour la vue.
6. Dans le volet Afficher les détails de la tâche, cliquez sur Ouvrir pour ouvrir la tâche.
7. Configurez la tâche à l'aide des paramètres de Détails > Configuration ou dans le bloc config de l'éditeur de code pour la vue.
  
  Pour les modifications de métadonnées, utilisez l'onglet Configuration. Cet onglet vous permet de modifier une valeur spécifique dans le bloc config à partir de l'éditeur de code, comme une chaîne ou un tableau, qui est formatée comme un objet JavaScript. Cet onglet vous permet d'éviter les erreurs de syntaxe et de vérifier que vos paramètres sont corrects.
  
  Facultatif : Dans le menu Exécuter après, sélectionnez une tâche qui précédera votre vue.
  
  Vous pouvez également définir les métadonnées de la tâche de votre pipeline dans le bloc config de l'éditeur. Pour en savoir plus, consultez Créer une vue avec Dataform Core.
  
  L'éditeur valide votre code et affiche l'état de validation.
  
  Remarque : Lorsque vous utilisez des fonctions JavaScript comme valeurs dans le bloc config, vous ne pouvez pas modifier les fonctions JavaScript dans l'onglet Configuration.
8. Dans Détails > Requêtes compilées, consultez le code SQL compilé à partir du code SQLX.
9. Cliquez sur Exécuter pour exécuter le code SQL dans votre pipeline.
10. Dans Résultats de la requête, examinez l'aperçu des données.

Modifier une tâche de pipeline

Pour modifier une tâche de pipeline, procédez comme suit :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur la tâche sélectionnée.
Pour modifier la tâche précédente, dans le menu Exécuter après, sélectionnez une tâche qui précèdera votre tâche.
Pour modifier le contenu de la tâche sélectionnée, cliquez sur Modifier.
Dans le nouvel onglet qui s'ouvre, modifiez le contenu de la tâche, puis enregistrez les modifications apportées à la tâche.

Supprimer une tâche de pipeline

Pour supprimer une tâche d'un pipeline, procédez comme suit :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur la tâche sélectionnée.
Dans le volet Détails de la tâche, cliquez sur Supprimer Supprimer.

Partager un pipeline

Pour partager un pipeline, procédez comme suit :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur Partager, puis sélectionnez Gérer les autorisations.
Cliquez sur Ajouter un utilisateur/groupe.
Dans le champ Nouveaux comptes principaux, saisissez le nom d'au moins un utilisateur ou groupe.
Pour Attribuer des rôles, sélectionnez un rôle.
Cliquez sur Enregistrer.

Partager un lien vers un pipeline

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur Partager, puis sélectionnez Partager le lien. L'URL de votre pipeline est copiée dans le presse-papiers de votre ordinateur.

Exécuter un pipeline

Lorsque vous exécutez un pipeline, vous pouvez choisir d'exécuter toutes les tâches du pipeline, de sélectionner manuellement des tâches spécifiques à exécuter ou d'exécuter des tâches avec des tags sélectionnés.

Exécuter toutes les tâches d'un pipeline

Pour exécuter manuellement la version actuelle d'un pipeline, sélectionnez l'une des options suivantes :

Console

Pour exécuter toutes les tâches d'un pipeline :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur Run (Exécuter) > Run all tasks (Exécuter toutes les tâches). Si vous avez sélectionné Exécuter avec mes identifiants utilisateur pour votre authentification, vous devez autoriser votre compte Google (aperçu).
Facultatif : Pour inspecter l'exécution, affichez les exécutions manuelles précédentes.

API

Pour exécuter un pipeline manuellement, compilez l'espace de travail par défaut et utilisez le résultat de la compilation pour créer un appel de workflow.

Pour créer un résultat de compilation pour l'espace de travail par défaut, utilisez la méthode projects.locations.repositories.compilationResults.create.

Exécutez la requête API avec les informations suivantes :
```
curl -X POST \
   -H "Authorization: Bearer $(gcloud auth print-access-token)" \
   -H "Content-Type: application/json" \
   -d '{
      "workspace": "projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workspaces/default"
   }' \
   "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/compilationResults"
```
Remplacez les éléments suivants :
- LOCATION : région Cloud de Confiance by S3NS de votre dépôt, par exemple us-central1. Pour trouver l'emplacement du dépôt dans la console Cloud de Confiance , accédez au volet Explorateur, sélectionnez le pipeline, ouvrez l'onglet Paramètres, puis cliquez sur Ouvrir le pipeline dans Dataform. L'emplacement figure dans l'URL au format /locations/LOCATION/.
- PROJECT_ID : identifiant unique de votre projetCloud de Confiance .
- REPOSITORY_ID : identifiant unique de votre dépôt Dataform, par exemple my-secure-repo. Vous trouverez l'ID du dépôt dans la console Cloud de Confiance . Pour ce faire, accédez au volet Explorateur, sélectionnez le pipeline, ouvrez l'onglet Paramètres, puis consultez le champ ID du dépôt Dataform.
Dans le corps de la réponse, recherchez le champ name et copiez sa valeur (par exemple, projects/my-project/locations/us-central1/repositories/my-repo/compilationResults/12345-67890).
Déclenchez l'exécution du pipeline à l'aide de la méthode projects.locations.repositories.workflowInvocations.create.

Exécutez la requête API avec les informations suivantes :
```
curl -X POST \
   -H "Authorization: Bearer $(gcloud auth print-access-token)" \
   -H "Content-Type: application/json" \
   -d '{
      "compilationResult": "COMPILATION_RESULT"
   }' \
   "https://dataform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/repositories/REPOSITORY_ID/workflowInvocations"
```
Remplacez les éléments suivants :
- COMPILATION_RESULT : nom complet de la ressource du résultat de la compilation que vous avez copié à l'étape précédente.
- LOCATION : région Cloud de Confiance by S3NS de votre dépôt, par exemple us-central1.
- PROJECT_ID : identifiant unique de votre projetCloud de Confiance .
- REPOSITORY_ID : identifiant unique de votre dépôt Dataform, par exemple my-secure-repo.

Exécuter des tâches sélectionnées dans un pipeline

Pour exécuter des tâches sélectionnées dans un pipeline :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur Exécuter > Sélectionner les tâches à exécuter.
Dans le volet Exécuter, dans la section Authentification, autorisez l'exécution avec les identifiants utilisateur de votre compte Google ou d'un compte de service.
- Pour utiliser les identifiants utilisateur de votre compte Google (aperçu), sélectionnez Exécuter avec les identifiants utilisateur.
```
Optional: In the **Extended access options** section, select the
additional services that your pipeline requires:

- **Knowledge Catalog**: Allows Cloud de Confiance Knowledge Catalog metadata updates.
- **Google Drive**: Allows read-only access to Google Drive files.
- **Bigtable**: Allows read-only access to Google
  Bigtable data.
```
- Pour utiliser un compte de service personnalisé, sélectionnez Exécuter avec le compte de service sélectionné, puis sélectionnez un compte de service personnalisé.
  
  Remarque : Pour afficher les comptes de service dans le menu, vous devez disposer de l'autorisation iam.serviceAccounts.list au niveau du projet, qui est disponible dans le rôle Afficher les comptes de service (roles/iam.serviceAccountViewer). Si vous ne disposez pas de cette autorisation, vous pouvez sélectionner le compte de service en cliquant sur Saisir manuellement et en saisissant l'ID du compte de service.
  
  Si vous devez créer un compte de service, cliquez sur Nouveau compte de service.
Assurez-vous que l'option Sélection de tâches est sélectionnée.
Dans le menu Sélectionner les tâches à exécuter, recherchez des tâches spécifiques et sélectionnez celles que vous souhaitez exécuter.

Le tableau Tâches liste les tâches que vous avez sélectionnées. Cliquez sur le nom d'une tâche pour l'ouvrir directement dans l'éditeur SQL.
Facultatif : Configurez les options d'exécution suivantes :
- Inclure les dépendances : sélectionnez cette option pour exécuter les tâches sélectionnées et leurs dépendances.
- Inclure les dépendances : sélectionnez cette option pour exécuter les tâches sélectionnées et leurs dépendances transitives en aval.
- Exécuter avec une actualisation complète : sélectionnez cette option pour reconstruire toutes les tables à partir de zéro.
- Exécuter en tant que job interactif avec une priorité élevée (par défaut) : sélectionnez cette option pour définir la priorité du job de requête BigQuery. Par défaut, BigQuery exécute les requêtes en tant que tâches de requête interactives, qui sont censées démarrer le plus rapidement possible. Si vous décochez cette option, les requêtes seront exécutées en tant que jobs de requête par lot, qui ont une priorité inférieure.
Cliquez sur Exécuter. Si vous avez sélectionné Exécuter avec les identifiants utilisateur comme méthode d'authentification, vous devez autoriser votre compte Google (Aperçu).
Facultatif : Pour inspecter l'exécution, affichez les exécutions manuelles précédentes.

Exécuter des tâches avec des tags sélectionnés dans un pipeline

Pour exécuter des tâches avec des tags sélectionnés dans un pipeline :

Dans la console Cloud de Confiance , accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet de gauche, cliquez sur Explorateur :

Si le volet de gauche ne s'affiche pas, cliquez sur Développer le volet de gauche pour l'ouvrir.
Dans le volet Explorateur, développez votre projet, cliquez sur Pipelines, puis sélectionnez un pipeline.
Cliquez sur Exécuter > Exécuter par tag, puis effectuez l'une des opérations suivantes :
- Cliquez sur une balise que vous souhaitez exécuter.
- Cliquez sur Sélectionner les tags à exécuter.
Dans le volet Exécuter, dans la section Authentification, autorisez l'exécution avec les identifiants utilisateur de votre compte Google ou d'un compte de service.
- Pour utiliser les identifiants utilisateur de votre compte Google (aperçu), sélectionnez Exécuter avec les identifiants utilisateur.
```
Optional: In the **Extended access options** section, select the
additional services that your pipeline requires:

- **Knowledge Catalog**: Allows Cloud de Confiance Knowledge Catalog metadata updates.
- **Google Drive**: Allows read-only access to Google Drive files.
- **Bigtable**: Allows read-only access to Google
  Bigtable data.
```
- Pour utiliser un compte de service personnalisé, sélectionnez Exécuter avec le compte de service sélectionné, puis sélectionnez un compte de service personnalisé.
  
  Remarque : Pour afficher les comptes de service dans le menu, vous devez disposer de l'autorisation iam.serviceAccounts.list au niveau du projet, qui est disponible dans le rôle Afficher les comptes de service (roles/iam.serviceAccountViewer). Si vous ne disposez pas de cette autorisation, vous pouvez sélectionner le compte de service en cliquant sur Saisir manuellement et en saisissant l'ID du compte de service.
  
  Si vous devez créer un compte de service, cliquez sur Nouveau compte de service.
Assurez-vous que l'option Sélection de balises est sélectionnée.
Dans le menu Sélectionner les tags à exécuter, recherchez des tags spécifiques et sélectionnez ceux que vous souhaitez exécuter.

Le tableau Tâches liste les tâches que vous avez sélectionnées. Cliquez sur le nom d'une tâche pour l'ouvrir directement dans l'éditeur SQL.
Facultatif : Configurez les options d'exécution suivantes :
- Inclure les dépendances : sélectionnez cette option pour exécuter les tâches sélectionnées et leurs dépendances.
- Inclure les dépendances : sélectionnez cette option pour exécuter les tâches sélectionnées et leurs dépendances transitives en aval.
- Exécuter avec une actualisation complète : sélectionnez cette option pour reconstruire toutes les tables à partir de zéro.
- Exécuter en tant que job interactif avec une priorité élevée (par défaut) : sélectionnez cette option pour définir la priorité du job de requête BigQuery. Par défaut, BigQuery exécute les requêtes en tant que tâches de requête interactives, qui sont censées démarrer le plus rapidement possible. Si vous décochez cette option, les requêtes seront exécutées en tant que jobs de requête par lot, qui ont une priorité inférieure.
Cliquez sur Exécuter. Si vous avez sélectionné Exécuter avec les identifiants utilisateur comme méthode d'authentification, vous devez autoriser votre compte Google (Aperçu).
Facultatif : Pour inspecter l'exécution, affichez les exécutions manuelles précédentes.

Autoriser votre compte Google

Pour authentifier la ressource avec vos identifiants de compte Google, vous devez accorder manuellement l'autorisation aux pipelines BigQuery pour obtenir le jeton d'accès à votre compte Google et accéder aux données sources en votre nom. Vous pouvez accorder une approbation manuelle à l'aide de l'interface de la boîte de dialogue OAuth. Si vous sélectionnez une option d'accès étendu, vous devez accorder l'accès à ces services (par exemple, Google Drive ou le catalogue de connaissances).

Vous n'avez besoin d'accorder l'autorisation aux pipelines BigQuery qu'une seule fois.

Pour révoquer l'autorisation que vous avez accordée, procédez comme suit :

Accédez à la page de votre compte Google.
Cliquez sur Pipelines BigQuery.
Cliquez sur Supprimer l'accès.

Si votre pipeline contient un notebook, vous devez également accorder manuellement l'autorisation à Colab Enterprise d'obtenir le jeton d'accès à votre compte Google et d'accéder aux données sources en votre nom. Vous n'avez besoin d'accorder l'autorisation qu'une seule fois. Vous pouvez révoquer cette autorisation sur la page de votre compte Google.

Étapes suivantes

En savoir plus sur les pipelines BigQuery
Découvrez comment gérer les pipelines.
Découvrez comment planifier des pipelines.