Membuat kueri set data publik dengan alat bq

Pelajari cara memeriksa dan membuat kueri set data publik dengan alat command line bq.

Sebelum memulai

  1. In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.

    Go to project selector

  2. Verify that billing is enabled for your Trusted Cloud project.

  3. Jika Anda tidak mengaktifkan penagihan untuk Trusted Cloud project yang digunakan dalam tutorial ini, Anda akan bekerja dengan data di sandbox BigQuery. Sandbox BigQuery memungkinkan Anda mempelajari BigQuery dengan sekumpulan fitur BigQuery terbatas tanpa biaya.

  4. Pastikan BigQuery API diaktifkan.

    Mengaktifkan API

    Jika Anda membuat project baru, BigQuery API akan otomatis diaktifkan.

  5. In the Trusted Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Trusted Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

  6. Memeriksa set data publik

    BigQuery menawarkan beberapa tabel contoh dalam set data bigquery-public-data.samples yang dapat Anda buat kuerinya. Dalam tutorial ini, Anda menjalankan kueri di tabel shakespeare yang berisi entri untuk setiap kata dalam setiap drama Shakespeare.

    Periksa tabel shakespeare dalam set data samples:

    bq show bigquery-public-data:samples.shakespeare
    

    Outputnya mirip dengan berikut ini. Beberapa kolom dihilangkan untuk menyederhanakan output.

      Last modified                  Schema                 Total Rows   Total Bytes
    ----------------- ------------------------------------ ------------ ------------
     14 Mar 17:16:45   |- word: string (required)           164656       6432064
                       |- word_count: integer (required)
                       |- corpus: string (required)
                       |- corpus_date: integer (required)
    

    Membuat kueri set data publik

    Gunakan perintah bq query untuk menjalankan kueri SQL pada data.

    1. Tentukan berapa kali substring raisin muncul dalam karya Shakespeare:

      bq query --use_legacy_sql=false \
          'SELECT
            word,
            SUM(word_count) AS count
          FROM
            `bigquery-public-data.samples.shakespeare`
          WHERE
            word LIKE "%raisin%"
          GROUP BY
            word;'
      

      Outputnya mirip dengan berikut ini:

      +---------------+-------+
      |     word      | count |
      +---------------+-------+
      | praising      |     8 |
      | Praising      |     4 |
      | raising       |     5 |
      | dispraising   |     2 |
      | dispraisingly |     1 |
      | raisins       |     1 |
      +---------------+-------+
      
    2. Telusuri substring huzzah dalam karya Shakespeare:

      bq query --use_legacy_sql=false \
          'SELECT
            word
          FROM
            `bigquery-public-data.samples.shakespeare`
          WHERE
            word = "huzzah";'
      

      Karena substring tidak muncul dalam karya Shakespeare, tidak ada hasil yang ditampilkan.

    Pembersihan

    Agar tidak menimbulkan biaya pada akun Trusted Cloud Anda untuk resource yang digunakan di halaman ini, hapus project Trusted Cloud yang berisi resource tersebut.

    Menghapus project

    Jika Anda menggunakan sandbox BigQuery untuk meng-kueri set data publik, penagihan tidak akan diaktifkan untuk project Anda.

    Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.

    Untuk menghapus project:

    1. In the Trusted Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Langkah berikutnya