データの読み込みとクエリ

BigQuery を使用する手始めとして、データセットを作成し、テーブルにデータを読み込み、テーブルに対してクエリを実行してみましょう。

始める前に

  1. In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. このガイドで既存のプロジェクトを使用する場合は、このガイドを完了するために必要な権限があることを確認します。新しいプロジェクトを作成した場合は、必要な権限がすでに付与されています。

  3. Enable the BigQuery API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

    新しいプロジェクトでは、BigQuery API が自動的に有効になります。

  4. (省略可)プロジェクトに対する課金を有効にします。課金を有効にしない場合や、クレジット カードを指定しない場合でも、このドキュメントの手順は行えます。BigQuery には、この手順を実施するためのサンドボックスが用意されています。詳細については、BigQuery サンドボックスを有効にするをご覧ください。
  5. 必要なロール

    データセットの作成、テーブルの作成、データの読み込み、データのクエリに必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。

    • 読み込みジョブとクエリジョブを実行する: BigQuery ジョブユーザーroles/bigquery.jobUser
    • データセットの作成、テーブルの作成、テーブルへのデータの読み込み、テーブルのクエリ: BigQuery データ編集者roles/bigquery.dataEditor

    ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

    必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

    BigQuery データセットを作成する

    Cloud de Confiance コンソールを使用して、データを保存するデータセットを作成します。データセットを作成する場所は、米国のマルチリージョン ロケーションとします。BigQuery のリージョンとマルチリージョンの詳細については、ロケーションをご覧ください。

    1. Cloud de Confiance コンソールで、[BigQuery] ページを開きます。
    2. BigQuery に移動
    3. 左側のペインで、 [エクスプローラ] をクリックします。
    4. [エクスプローラ] ペインでプロジェクト名をクリックします。
    5. [アクションを表示] をクリックします。
    6. [データセットを作成] を選択します。
    7. [データセットを作成する] ページで、次の操作を行います。
      1. [データセット ID] に「babynames」と入力します。
      2. [ロケーション タイプ] で [マルチリージョン] を選択してから、[US(米国の複数のリージョン)] を選択します。一般公開データセットは us マルチリージョン ロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに保存します。
      3. 残りのデフォルトの設定は変更せず、[データセットを作成] をクリックします。

    ソースデータを含むファイルをダウンロードする

    ダウンロードするファイルには、人気のある新生児の名前に関する約 7 MB のデータが含まれます。これは米国社会保障局から提供されています。

    このデータの詳細については、米国社会保障局の人気の名前の背景情報をご覧ください。

    1. 新しいブラウザタブで次の URL を開き、米国社会保障局のデータをダウンロードします。

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. ファイルを抽出します。

      データセット スキーマの詳細については、zip ファイルの NationalReadMe.pdf ファイルをご覧ください。

    3. データの内容を確認するには、yob2024.txt ファイルを開きます。このファイルには、名前、出生時の性別、その名前の子供の数の値がカンマ区切りで含まれています。このファイルにはヘッダー行がありません。

    4. 後で確認できるように、yob2024.txt ファイルの場所をメモします。

    テーブルにデータを読み込む

    次に、新しいテーブルにデータを読み込みます。

    1. 左側のペインで、 [エクスプローラ] をクリックします。
    2. [エクスプローラ] ペインで、プロジェクト名を開きます。
    3. [データセット] をクリックし、babynames データセットの横にある アクションを表示)をクリックして、[開く] を選択します。
    4. [ テーブルを作成] をクリックします。

      特に指示のない限り、すべての設定にデフォルト値を使用します。

    5. [テーブルの作成] ページで、次の操作を行います。
      1. [ソース] セクションの [テーブルの作成元] で、リストから [アップロード] を選択します。
      2. [ファイルを選択] フィールドで [参照] をクリックします。
      3. ローカルの yob2024.txt ファイルを選択して [開く] をクリックします。
      4. [ファイル形式] リストから [CSV] を選択します。
      5. [宛先] セクションの [テーブル] フィールドに「names_2024」と入力します。
      6. [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をテキスト フィールドに貼り付けます。
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. [テーブルを作成] をクリックします。

        BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。

    テーブルデータのプレビューを確認する

    テーブルデータのプレビューを表示する手順は次のとおりです。

    1. 左側のペインで、 [エクスプローラ] をクリックします。
    2. [エクスプローラ] ペインで、プロジェクトを開き、[データセット] をクリックします。
    3. babynames データセットをクリックし、names_2024 テーブルを選択します。
    4. [プレビュー] タブをクリックします。テーブルの最初の数行が BigQuery に表示されます。
    5. テーブルの [プレビュー] タブ。
    [プレビュー] タブは、すべてのテーブルタイプで使用できるわけではありません。たとえば、[プレビュー] タブは、外部のテーブルやビューには表示されません。

    テーブルデータをクエリする

    次に、テーブルに対してクエリを実行します。

    1. [names_2024] タブの横にある [ SQL クエリ] オプションをクリックします。新しいエディタタブが開きます。
    2. 次のクエリをコピーしてクエリエディタに貼り付けます。このクエリは、2024 年に米国で生まれた男児につけられた名前のうち最も多いもの 5 つを取得します。
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. [実行] をクリックします。結果が [クエリ結果] セクションに表示されます。
      クエリ結果パネル

    これで、 Cloud de Confiance コンソールを使用してサンプルデータを BigQuery に読み込み、一般公開データセット内のテーブルに対してクエリを正常に実行できました。

    クリーンアップする

    このページで使用したリソースについて、 Cloud de Confiance アカウントに課金されないようにするには、次の手順を実施します。

    1. Cloud de Confiance コンソールで、[BigQuery] ページを開きます。
    2. BigQuery に移動
    3. 左側のペインで、 [エクスプローラ] をクリックします。
    4. [エクスプローラ] ペインで、[データセット] をクリックし、作成した babynames データセットをクリックします。
    5. アクションを表示)オプションを開いて、[削除] をクリックします。
    6. [データセットの削除] ダイアログで削除コマンドを確定します。「delete」という単語を入力して、[削除] をクリックします。

    次のステップ