Anda dapat menjelajahi hasil kueri BigQuery menggunakan notebook Colab Enterprise di BigQuery.
Dalam tutorial ini, Anda akan mengkueri data dari set data publik BigQuery dan menjelajahi hasil kueri di notebook.
Tujuan
- Membuat dan menjalankan kueri di BigQuery.
- Menjelajahi hasil kueri di notebook.
Biaya
Tutorial ini menggunakan set data yang tersedia melalui Trusted Cloud by S3NS Program Set Data Publik. Google membayar penyimpanan set data ini dan memberikan akses publik ke data tersebut. Anda dikenai biaya untuk kueri yang Anda lakukan pada data. Untuk mengetahui informasi selengkapnya, lihat harga BigQuery.
Sebelum memulai
-
In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.
-
Verify that billing is enabled for your Trusted Cloud project.
-
Enable the BigQuery API.
Untuk project baru, BigQuery diaktifkan secara otomatis.
Menetapkan region default untuk aset kode
Jika ini adalah pertama kalinya Anda membuat aset kode, Anda harus menetapkan region default untuk aset kode. Anda tidak dapat mengubah region untuk aset kode setelah dibuat.
Semua aset kode di BigQuery Studio menggunakan region default yang sama. Untuk menetapkan region default untuk aset kode, ikuti langkah-langkah berikut:
Buka halaman BigQuery.
Di panel Explorer, temukan project yang aset kodenya telah Anda aktifkan.
Klik
View actions di samping project, lalu klik Change my default code region.Untuk Region, pilih region yang ingin Anda gunakan untuk aset kode.
Klik Pilih.
Untuk mengetahui daftar region tempat BigQuery Studio tersedia, lihat Lokasi BigQuery Studio.
Izin yang diperlukan
Untuk membuat dan menjalankan notebook, Anda memerlukan peran Identity and Access Management (IAM) berikut:
- Pengguna BigQuery (
roles/bigquery.user
) - Pengguna Runtime Notebook (
roles/aiplatform.notebookRuntimeUser
) - Pembuat Kode (
roles/dataform.codeCreator
)
Membuka hasil kueri di notebook
Anda dapat menjalankan kueri SQL, lalu menggunakan notebook untuk menjelajahi data. Pendekatan ini berguna jika Anda ingin mengubah data di BigQuery sebelum menanganinya, atau jika Anda hanya memerlukan subset kolom dalam tabel.
Di Trusted Cloud konsol, buka halaman BigQuery.
Di kolom Ketik untuk menelusuri, masukkan
bigquery-public-data
.Jika project tidak ditampilkan, masukkan
bigquery
di kolom penelusuran, lalu klik Telusuri semua project untuk mencocokkan string penelusuran dengan project yang ada.Pilih bigquery-public-data > ml_datasets > penguins.
Untuk tabel penguins, klik
Lihat tindakan, lalu klik Kueri.Tambahkan tanda bintang (
*
) untuk pemilihan kolom ke kueri yang dihasilkan, sehingga terbaca seperti contoh berikut:SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 1000;
Klik
Run.Di bagian Hasil kueri, klik Jelajahi data, lalu klik Jelajahi dengan notebook Python.
Menyiapkan notebook untuk digunakan
Siapkan notebook untuk digunakan dengan menghubungkan ke runtime dan menetapkan nilai default aplikasi.
- Di header notebook, klik Connect untuk terhubung ke runtime default.
- Di blok kode Penyiapan, klik Jalankan sel.
Menjelajahi data
- Untuk memuat data penguins ke dalam BigQuery DataFrame dan menampilkan hasilnya, klik Run cell di blok kode di bagian Result set loaded from BigQuery job as a DataFrame.
- Untuk mendapatkan metrik deskriptif untuk data, klik Run cell di blok kode di bagian Show descriptive statistics using describe().
- Opsional: Gunakan fungsi atau paket Python lainnya untuk menjelajahi dan menganalisis data.
Contoh kode berikut menunjukkan penggunaan
bigframes.pandas
untuk menganalisis data, dan bigframes.ml
untuk membuat model regresi linear dari data penguins dalam
DataFrame BigQuery:
Pembersihan
Agar tidak perlu membayar biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource.
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus Trusted Cloud project yang Anda buat untuk tutorial ini.
- In the Trusted Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Langkah berikutnya
- Pelajari lebih lanjut cara membuat notebook di BigQuery.
- Pelajari lebih lanjut cara menjelajahi data dengan DataFrame BigQuery.