Interroger un ensemble de données public avec la console Trusted Cloud

Découvrez comment localiser et interroger des ensembles de données publics dans BigQuery à l'aide de la console Trusted Cloud .

Avant de commencer

  1. In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.

    Go to project selector

  2. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Trusted Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Trusted Cloud console, go to the IAM page.

      Accéder à IAM
    2. Sélectionnez le projet.
    3. Cliquez sur  Accorder l'accès.
    4. Dans le champ Nouveaux comptes principaux, saisissez votre identifiant utilisateur. Il s'agit généralement de l'identifiant associé à un utilisateur dans un pool d'identités de personnel. Pour en savoir plus, consultez Représenter les utilisateurs de pools de personnel dans les stratégies IAM ou contactez votre administrateur.

    5. Dans la liste Sélectionner un rôle, sélectionnez un rôle.
    6. Pour attribuer des rôles supplémentaires, cliquez sur  Ajouter un autre rôle et ajoutez tous les rôles supplémentaires.
    7. Cliquez sur Enregistrer.
  3. Verify that billing is enabled for your Trusted Cloud project.

  4. Si vous n'activez pas la facturation pour le projet Trusted Cloud que vous utilisez dans ce tutoriel, vous importerez et utiliserez les données du bac à sable BigQuery. Le bac à sable BigQuery vous permet d'apprendre à utiliser BigQuery avec un ensemble limité de fonctionnalités offertes.

  5. Vérifiez que l'API BigQuery est activée.

    Activer l'API

    Si vous avez créé un nouveau projet, l'API BigQuery est automatiquement activée.

  6. Ouvrir un ensemble de données public

    Les ensembles de données publics BigQuery sont disponibles par défaut dans la console Trusted Cloud .

    Dans l'exemple suivant, vous allez accéder aux ensembles de données du projet public bigquery-public-data.

    1. Dans la console Trusted Cloud , accédez à la page BigQuery.

      Accéder à BigQuery

    2. Dans le volet Explorateur, cliquez sur + Ajouter des données.

    3. Dans la boîte de dialogue Ajouter des données, dans le volet Filtrer par, cliquez sur Icône de l'ensemble de données public Ensembles de données publics.

    4. Vous pouvez utiliser le champ Rechercher sur Marketplace ou des filtres pour affiner votre recherche.

    5. Sélectionnez un ensemble de données, puis cliquez sur Afficher l'ensemble de données.

      Dans le volet Explorateur, l'ensemble de données est sélectionné et vous pouvez en afficher les détails.

    6. Facultatif : Cliquez sur  Afficher les actions à côté de votre ensemble de données pour afficher d'autres options.

      Tous les ensembles de données contiennent des tables que vous pouvez afficher en cliquant sur  Développer/réduire le nœud à côté de chaque ensemble de données.

    Interroger un ensemble de données public

    Lors des étapes qui suivent, vous allez interroger l'ensemble de données public "USA Names" pour déterminer les noms les plus couramment utilisés aux États-Unis entre 1910 et 2013 :

    1. Dans la console Trusted Cloud , accédez à la page BigQuery.

      Accéder à BigQuery

    2. Cliquez sur Requête SQL.

    3. Dans l'éditeur de requête, collez la requête suivante :

      SELECT
        name,
        SUM(number) AS total
      FROM
        `bigquery-public-data.usa_names.usa_1910_2013`
      GROUP BY
        name
      ORDER BY
        total DESC
      LIMIT
        10;
      

      Si la requête est valide, une coche apparaît avec la quantité de données traitées par la requête. Si la requête n'est pas valide, un point d'exclamation apparaît avec un message d'erreur.

      Outil de validation des requêtes

    4. Cliquez sur Exécuter.

      Les noms les plus courants sont indiqués dans la section Résultats de la requête. La ligne d'en-tête de la table contient chaque nom de colonne que vous avez sélectionné dans la requête.

      Résultats de la requête dans la console Trusted Cloud .

    5. Facultatif : Pour afficher la durée et la quantité de données traitées par la requête, cliquez sur l'onglet Informations sur le job dans la section Résultats de la requête.

    Effectuer un nettoyage

    Pour éviter que les ressources utilisées dans cette démonstration soient facturées sur votre compte Trusted Cloud , procédez comme suit :

    Supprimer le projet

    Si vous avez utilisé le bac à sable BigQuery pour interroger l'ensemble de données public, la facturation n'est pas activée pour votre projet.

    Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.

    Pour supprimer le projet :

    1. In the Trusted Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Étapes suivantes