Menggunakan alat bq
Dalam tutorial ini, Anda akan mempelajari cara menggunakan bq, alat command-line
interface (CLI) berbasis Python untuk BigQuery guna membuat set data, memuat data
sampel, dan mengkueri tabel. Setelah menyelesaikan tutorial ini, Anda akan memahami
bq dan cara menggunakan BigQuery dengan CLI.
Untuk referensi lengkap tentang semua perintah dan flag bq, lihat
referensi alat command line bq.
Sebelum memulai
- 
    
    
      In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project. Roles required to select or create a project - Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- 
      Create a project: To create a project, you need the Project Creator
      (roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
 
- 
  
    Verify that billing is enabled for your Cloud de Confiance project. 
- Pastikan BigQuery API diaktifkan. - Jika Anda membuat project baru, BigQuery API akan otomatis diaktifkan. 
- Download data Administrasi Jaminan Sosial AS dengan membuka URL berikut di tab browser baru: - https://www.ssa.gov/OACT/babynames/names.zip
- Ekstrak file. - Untuk mengetahui informasi selengkapnya tentang skema set data, lihat file - NationalReadMe.pdfyang Anda ekstrak.
- Untuk melihat tampilan data tersebut, buka file - yob2024.txt. File ini berisi nilai yang dipisahkan koma untuk nama, jenis kelamin yang ditetapkan saat lahir, dan jumlah anak dengan nama tersebut. File tidak memiliki baris header.
- Pindahkan file ke direktori kerja Anda. - Jika Anda menggunakan Cloud Shell, klik - Lainnya Upload, klik Pilih File, pilih file- yob2024.txt, lalu klik Upload.
- Jika Anda bekerja di shell lokal, salin atau pindahkan file - yob2024.txtke direktori tempat Anda menjalankan alat bq.
 
- Masukkan perintah berikut untuk membuat set data bernama - babynames:- bq mk --dataset babynames- Outputnya mirip dengan hal berikut ini: - Dataset 'babynames' successfully created.
- Pastikan set data - babynamessekarang muncul di project Anda:- bq ls --datasets=true- Output akan mirip dengan yang berikut ini: - datasetId ------------- babynames
- Di set data - babynames, muat file sumber- yob2024.txtke tabel baru bernama- names2024:- bq load babynames.names2024 yob2024.txt name:string,assigned_sex_at_birth:string,count:integer- Outputnya mirip dengan hal berikut ini: - Upload complete. Waiting on bqjob_r3c045d7cbe5ca6d2_0000018292f0815f_1 ... (1s) Current status: DONE
- Pastikan tabel - names2024sekarang muncul dalam set data- babynames:- bq ls --format=pretty babynames- Outputnya mirip dengan yang berikut ini. Beberapa kolom dihilangkan untuk menyederhanakan output. - +-----------+-------+ | tableId | Type | +-----------+-------+ | names2024 | TABLE | +-----------+-------+
- Konfirmasi bahwa skema tabel - names2024baru Anda adalah- name: string,- assigned_sex_at_birth: string, dan- count: integer:- bq show babynames.names2024- Outputnya mirip dengan yang berikut ini. Beberapa kolom dihilangkan untuk menyederhanakan output. - Last modified Schema Total Rows Total Bytes ----------------- ------------------------------- ------------ ------------ 14 Mar 17:16:45 |- name: string 31904 607494 |- assigned_sex_at_birth: string |- count: integer
- Tentukan nama anak perempuan paling populer dalam data: - bq query \ 'SELECT name, count FROM babynames.names2024 WHERE assigned_sex_at_birth = "F" ORDER BY count DESC LIMIT 5'- Output akan mirip dengan yang berikut ini: - +-----------+-------+ | name | count | +-----------+-------+ | Olivia | 14718 | | Emma | 13485 | | Amelia | 12740 | | Charlotte | 12552 | | Mia | 12113 | +-----------+-------+
- Tentukan nama anak laki-laki yang paling tidak populer dalam data: - bq query \ 'SELECT name, count FROM babynames.names2024 WHERE assigned_sex_at_birth = "M" ORDER BY count ASC LIMIT 5'- Output akan mirip dengan yang berikut ini: - +---------+-------+ | name | count | +---------+-------+ | Aaran | 5 | | Aadiv | 5 | | Aadarsh | 5 | | Aarash | 5 | | Aadrik | 5 | +---------+-------+- Jumlah minimumnya adalah 5 karena data sumber menghilangkan nama yang memiliki kurang dari 5 kemunculan. 
- In the Cloud de Confiance console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
- Hapus set data - babynames:- bq rm --recursive=true babynames- Flag - --recursiveakan menghapus semua tabel dalam set data, termasuk tabel- names2024.- Output akan mirip dengan yang berikut ini: - rm: remove dataset 'myproject:babynames'? (y/N)
- Untuk mengonfirmasi perintah hapus, masukkan - y.
- Pelajari lebih lanjut cara menggunakan alat bq.
- Pelajari sandbox BigQuery.
- Pelajari lebih lanjut cara memuat data ke BigQuery.
- Pelajari lebih lanjut cara meng-kueri data di BigQuery.
Jika Anda tidak mengaktifkan penagihan untuk Cloud de Confiance project yang digunakan dalam tutorial ini, Anda akan memuat dan mengkueri data di sandbox BigQuery. Sandbox BigQuery memungkinkan Anda mempelajari BigQuery dengan sekumpulan fitur BigQuery terbatas tanpa biaya.
Download file yang berisi data sumber
File yang Anda download berukuran sekitar 7 MB yang berisi data tentang nama bayi populer. Ini disediakan oleh Administrasi Jaminan Sosial AS.
Untuk mengetahui informasi selengkapnya tentang data, lihat Informasi latar belakang untuk nama populer dari Administrasi Jaminan Sosial.
Membuat set data
Memuat data ke dalam tabel
Meng-kueri data tabel
Pembersihan
Agar akun Cloud de Confiance Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Menghapus project
Jika Anda menggunakan sandbox BigQuery untuk mengkueri set data publik, penagihan tidak akan diaktifkan untuk project Anda, dan Anda tidak perlu menghapus project.Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
Menghapus resource
Jika Anda menggunakan project yang ada, hapus resource yang dibuat: