Trusted Cloud コンソールを使用してデータを読み込んでクエリを実行する

Trusted Cloud コンソールを使用してデータセットを作成する方法、BigQuery テーブルにサンプルデータを読み込む方法、テーブルに対してクエリを実行する方法について説明します。

始める前に

BigQuery を使用する前に、Trusted Cloud コンソールにログインしてプロジェクトを作成する必要があります。プロジェクトで課金を有効にしていない場合、アップロードしたデータはすべて BigQuery サンドボックスに保存されます。このサンドボックスでは制限付きの BigQuery 機能を使用しながら、BigQuery について料金なしで学習できます。詳細については、BigQuery サンドボックスを有効にするをご覧ください。

  1. In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.

    Go to project selector

  2. 省略可: 既存のプロジェクトを選択する場合は、必ず BigQuery API を有効にしてください。新しいプロジェクトでは、BigQuery API が自動的に有効になります。
  3. BigQuery データセットを作成する

    Trusted Cloud コンソールを使用して、データを保存するデータセットを作成します。

    1. Trusted Cloud コンソールで、[BigQuery] ページを開きます。
    2. [BigQuery] に移動
    3. [エクスプローラ] ペインでプロジェクト名をクリックします。
    4. [アクションを表示] をクリックします。
    5. [データセットを作成] を選択します。
    6. [データセットを作成する] ページで、次の操作を行います。
      1. [データセット ID] に「babynames」と入力します。
      2. [ロケーション タイプ] で [マルチリージョン] を選択してから、[US(米国の複数のリージョン)] を選択します。一般公開データセットは us マルチリージョン ロケーションに保存されています。わかりやすくするため、データセットを同じロケーションに保存します。
      3. 残りのデフォルトの設定は変更せず、[データセットを作成] をクリックします。

    ソースデータ ファイルをダウンロードする

    ダウンロードするファイルには、人気のある新生児の名前に関する約 7 MB のデータが含まれます。これは米国社会保障局から提供されています。

    データセットの詳細については、社会保障局のデータセットの情報ページをご覧ください。

    1. 新しいブラウザタブで次の URL を開き、米国社会保障局のデータセットをダウンロードします。

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. ファイルを抽出します。

      データセット スキーマの詳細については、zip ファイルの NationalReadMe.pdf ファイルをご覧ください。

    3. データの内容を確認するには、yob2014.txt ファイルを開きます。このファイルには、名前、出生時の性別、その名前の子供の数の値がカンマ区切りで含まれています。このファイルにはヘッダー行がありません。

    4. 後で確認できるように、yob2014.txt ファイルの場所をメモします。

    テーブルにデータを読み込む

    次に、新しいテーブルにデータを読み込みます。

    1. [エクスプローラ] ペインでプロジェクト名をクリックします。
    2. babynames データセットの横にある [アクションを表示] をクリックし、[開く] を選択します。
    3. [テーブルを作成] をクリックします。

      特に指示のない限り、すべての設定にデフォルト値を使用します。

    4. [テーブルの作成] ページで、次の操作を行います。
      1. [ソース] セクションで、[テーブルの作成元] リストから [アップロード] を選択します。
      2. [ファイルを選択] フィールドで [参照] をクリックします。
      3. ローカルの yob2014.txt ファイルを選択して [開く] をクリックします。
      4. [ファイル形式] リストから [CSV] を選択します。
      5. [宛先] セクションの [テーブル] フィールドに「names_2014」と入力します。
      6. [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をテキスト フィールドに貼り付けます。
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. [テーブルを作成] をクリックします。

        BigQuery によってテーブルが作成され、データが読み込まれるのを待ちます。BigQuery によるデータの読み込みが完了したら、[個人履歴] と [プロジェクト履歴] ペインを開いてジョブの詳細を確認します。

    テーブルデータのプレビューを確認する

    テーブルデータのプレビューを表示する手順は次のとおりです。

    1. [エクスプローラ] ペインで、プロジェクトと babynames データセットを開いて、names_2014 テーブルを選択します。
    2. [プレビュー] タブをクリックします。テーブルの最初の数行が BigQuery に表示されます。
    3. テーブルのプレビュー
    [プレビュー] タブは、すべてのテーブルタイプで使用できるわけではありません。たとえば、[プレビュー] タブは、外部のテーブルやビューには表示されません。

    テーブルデータをクエリする

    次に、テーブルにクエリを実行します。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。

    1. 詳細ペインで、[SQL クエリ] をクリックします。新しいエディタタブが開きます。
    2. 次のクエリをコピーしてクエリエディタに貼り付けます。このクエリは、2014 年に生まれた米国の男児に割り当てられた米国の新生児の名前の上位 5 つを取得します。
      
          SELECT
            name,
            count
          FROM
            `babynames.names_2014`
          WHERE
            assigned_sex_at_birth = 'M'
          ORDER BY
            count DESC
          LIMIT
            5;
          
    3. [実行] をクリックします。結果が [クエリ結果] セクションに表示されます。
      名前のクエリ結果

    一般公開データセット内のテーブルに対してクエリを正常に実行し、 Trusted Cloud コンソールを使用してサンプルデータを BigQuery に読み込みました。

    クリーンアップする

    このページで使用したリソースについて、 Trusted Cloud アカウントに課金されないようにするには、次の手順を実施します。

    1. Trusted Cloud コンソールで、[BigQuery] ページを開きます。
    2. [BigQuery] に移動
    3. [エクスプローラ] ペインで、作成した babynames データセットをクリックします。
    4. [アクションを表示] オプションを開いて、[削除] をクリックします。
    5. [データセットの削除] ダイアログで削除コマンドを確定します。「delete」という単語を入力して、[削除] をクリックします。

    次のステップ