このページの一部またはすべての情報は、S3NS の Cloud de Confiance に適用されない場合があります。詳細については、Google Cloud との違いをご確認ください。

データの読み込みとクエリ

BigQuery を使用する手始めとして、データセットを作成し、テーブルにデータを読み込み、テーブルに対してクエリを実行してみましょう。

始める前に

In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
このガイドで既存のプロジェクトを使用する場合は、このガイドを完了するために必要な権限があることを確認します。新しいプロジェクトを作成した場合は、必要な権限がすでに付与されています。
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the API

新しいプロジェクトでは、BigQuery API が自動的に有効になります。
（省略可）プロジェクトに対する課金を有効にします。課金を有効にしない場合や、クレジットカードを指定しない場合でも、このドキュメントの手順は行えます。BigQuery には、この手順を実施するためのサンドボックスが用意されています。詳細については、BigQuery サンドボックスを有効にするをご覧ください。
注: プロジェクトに請求先アカウントがあり、BigQuery サンドボックスを使用する場合は、プロジェクトの課金を無効にしてください。

必要なロール

データセットの作成、テーブルの作成、データの読み込み、データのクエリに必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。

読み込みジョブとクエリジョブを実行する: BigQuery ジョブユーザー（roles/bigquery.jobUser）
データセットの作成、テーブルの作成、テーブルへのデータの読み込み、テーブルのクエリ: BigQuery データ編集者（roles/bigquery.dataEditor）

ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

BigQuery データセットを作成する

Cloud de Confiance コンソールを使用して、データを保存するデータセットを作成します。データセットを作成する場所は、米国のマルチリージョンロケーションとします。BigQuery のリージョンとマルチリージョンの詳細については、ロケーションをご覧ください。

Cloud de Confiance コンソールで、[BigQuery] ページを開きます。

BigQuery に移動

左側のペインで、 [エクスプローラ] をクリックします。
[エクスプローラ] ペインでプロジェクト名をクリックします。
[アクションを表示] をクリックします。
[データセットを作成] を選択します。
[データセットを作成する] ページで、次の操作を行います。

[データセット ID] に「babynames」と入力します。
[ロケーションタイプ] で [マルチリージョン] を選択してから、[US（米国の複数のリージョン）] を選択します。一般公開データセットは us マルチリージョンロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに保存します。
残りのデフォルトの設定は変更せず、[データセットを作成] をクリックします。

ソースデータを含むファイルをダウンロードする

ダウンロードするファイルには、人気のある新生児の名前に関する約 7 MB のデータが含まれます。これは米国社会保障局から提供されています。

このデータの詳細については、米国社会保障局の人気の名前の背景情報をご覧ください。

新しいブラウザタブで次の URL を開き、米国社会保障局のデータをダウンロードします。
```
https://www.ssa.gov/OACT/babynames/names.zip
```
ファイルを抽出します。

データセットスキーマの詳細については、zip ファイルの NationalReadMe.pdf ファイルをご覧ください。
データの内容を確認するには、yob2024.txt ファイルを開きます。このファイルには、名前、出生時の性別、その名前の子供の数の値がカンマ区切りで含まれています。このファイルにはヘッダー行がありません。
後で確認できるように、yob2024.txt ファイルの場所をメモします。

テーブルにデータを読み込む

次に、新しいテーブルにデータを読み込みます。

左側のペインで、 [エクスプローラ] をクリックします。
[エクスプローラ] ペインで、プロジェクト名を開きます。
[データセット] をクリックし、babynames データセットの横にある（アクションを表示）をクリックして、[開く] を選択します。
[ テーブルを作成] をクリックします。
特に指示のない限り、すべての設定にデフォルト値を使用します。
[テーブルの作成] ページで、次の操作を行います。

[ソース] セクションの [テーブルの作成元] で、リストから [アップロード] を選択します。
[ファイルを選択] フィールドで [参照] をクリックします。
ローカルの yob2024.txt ファイルを選択して [開く] をクリックします。
[ファイル形式] リストから [CSV] を選択します。
[宛先] セクションの [テーブル] フィールドに「names_2024」と入力します。
[スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をテキストフィールドに貼り付けます。

name:string,assigned_sex_at_birth:string,count:integer

[テーブルを作成] をクリックします。
BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。

テーブルデータのプレビューを確認する

テーブルデータのプレビューを表示する手順は次のとおりです。

左側のペインで、 [エクスプローラ] をクリックします。
[エクスプローラ] ペインで、プロジェクトを開き、[データセット] をクリックします。
babynames データセットをクリックし、names_2024 テーブルを選択します。
[プレビュー] タブをクリックします。テーブルの最初の数行が BigQuery に表示されます。

[プレビュー] タブは、すべてのテーブルタイプで使用できるわけではありません。たとえば、[プレビュー] タブは、外部のテーブルやビューには表示されません。

テーブルデータをクエリする

次に、テーブルに対してクエリを実行します。

[names_2024] タブの横にある [ SQL クエリ] オプションをクリックします。新しいエディタタブが開きます。
次のクエリをコピーしてクエリエディタに貼り付けます。このクエリは、2024 年に米国で生まれた男児につけられた名前のうち最も多いもの 5 つを取得します。
```
  SELECT
    name,
    count
  FROM
    `babynames.names_2024`
  WHERE
    assigned_sex_at_birth = 'M'
  ORDER BY
    count DESC
  LIMIT
    5;
  
```
[実行] をクリックします。結果が [クエリ結果] セクションに表示されます。

これで、 Cloud de Confiance コンソールを使用してサンプルデータを BigQuery に読み込み、一般公開データセット内のテーブルに対してクエリを正常に実行できました。

クリーンアップする

このページで使用したリソースについて、 Cloud de Confiance アカウントに課金されないようにするには、次の手順を実施します。

Cloud de Confiance コンソールで、[BigQuery] ページを開きます。

BigQuery に移動

左側のペインで、 [エクスプローラ] をクリックします。
[エクスプローラ] ペインで、[データセット] をクリックし、作成した babynames データセットをクリックします。
アクションを表示（）オプションを開いて、[削除] をクリックします。
[データセットの削除] ダイアログで削除コマンドを確定します。「delete」という単語を入力して、[削除] をクリックします。

次のステップ

BigQuery へのデータの読み込みの詳細については、データの読み込みの概要をご覧ください。
データのクエリの詳細については、BigQuery 分析の概要をご覧ください。
ネストされたデータと繰り返しデータを含む JSON ファイルの読み込みについて学習するには、ネストされた JSON データと繰り返し JSON データを読み込むをご覧ください。
プログラムで BigQuery にアクセスする方法については、REST API リファレンスまたは BigQuery クライアントライブラリのページをご覧ください。