Membuat dan menjalankan notebook menggunakan galeri notebook

Mulai analisis data menggunakan galeri notebook di BigQuery Studio.

Sebelum memulai

  1. In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  3. Aktifkan BigQuery API.

    Peran yang diperlukan untuk mengaktifkan API

    Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.

    Mengaktifkan API

    Untuk project baru, BigQuery API diaktifkan secara otomatis.

  4. Opsional: Aktifkan penagihan untuk project. Jika Anda tidak ingin mengaktifkan penagihan atau memberikan kartu kredit, langkah-langkah dalam dokumen ini tetap berfungsi. BigQuery menyediakan sandbox untuk melakukan langkah-langkah tersebut. Untuk mengetahui informasi selengkapnya, lihat Mengaktifkan sandbox BigQuery.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk membuat notebook yang dapat dijalankan, minta administrator Anda untuk memberi Anda peran IAM berikut di project Anda:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Jika Anda baru menggunakan notebook di BigQuery, lihat izin yang diperlukan di halaman Membuat notebook.

Galeri notebook adalah hub pusat untuk menemukan dan menggunakan template notebook bawaan. Template ini memungkinkan Anda melakukan tugas umum seperti persiapan data, analisis data, dan visualisasi. Template notebook juga membantu Anda menjelajahi fitur BigQuery Studio, mengelola alur kerja, dan meningkatkan praktik terbaik.

Anda dapat menggunakan template galeri notebook untuk menyederhanakan seluruh alur kerja niat-ke-insight di setiap tahap siklus proses data—mulai dari penyerapan dan eksplorasi hingga analisis lanjutan dan BigQuery ML.

Galeri notebook menyediakan template untuk setiap tingkat keahlian. Galeri ini mencakup template dasar untuk SQL, Python, Apache Spark, dan DataFrame. Anda juga dapat menjelajahi topik seperti AI generatif dan analisis data multimodal di BigQuery.

Untuk mengetahui informasi selengkapnya tentang penggunaan template galeri notebook, lihat Membuat notebook menggunakan galeri notebook.

Contoh berikut menggunakan template Pengantar notebook di BigQuery Studio. Notebook ini menunjukkan cara melakukan tugas berikut:

  • Membuat kueri data: Menjalankan kueri menggunakan sel SQL.
  • Memvisualisasikan hasil kueri: Membuat visualisasi tanpa kode menggunakan sel Visualisasi.
  • Membersihkan dan mengubah data: Mengurutkan, menghapus duplikat, dan memfilter data menggunakan BigQuery DataFrames (pandas) API.
  • Menjalankan prediksi AI: Membuat prediksi menggunakan (AI.FORECAST fungsi) di BigQuery DataFrames. Fungsi AI.FORECAST menggunakan model dasar TimesFM untuk membuat prediksi langsung dari set data tanpa memerlukan pelatihan model.
  • Membuat plot data: Membuat plot data menggunakan library visualisasi bawaan Python. Anda membuat plot data menggunakan library visualisasi BigQuery DataFrames, yang didukung oleh Matplotlib dan Pandas.

Untuk menggunakan notebook, Anda membuka template, mengonversinya menjadi notebook yang dapat dijalankan, menghubungkan ke lingkungan runtime notebook, lalu menjalankan notebook.

Membuka template dan mengonversinya menjadi notebook yang dapat dijalankan

Sebelum dapat menggunakan notebook yang dibuat dari template galeri notebook, Anda harus mengonversi template menjadi notebook yang dapat dijalankan.

Untuk membuka template Pengantar notebook di BigQuery Studio di galeri notebook, dan mengonversinya menjadi notebook yang dapat dijalankan, ikuti langkah-langkah berikut:

  1. Buka halaman Studio.

    Buka Studio

  2. Klik drop-down arrow , lalu pilih Notebook > Semua template.

  3. Atau, dari halaman beranda BigQuery Studio, klik Lihat galeri notebook.

    Link Lihat galeri notebook di halaman beranda BigQuery Studio.

  4. Klik kartu Pengantar notebook di BigQuery Studio atau telusuri di galeri.

  5. Setelah template terbuka, klik Gunakan template ini untuk mengonversi template menjadi notebook yang dapat dijalankan.

Menghubungkan ke runtime default

Sebelum dapat menjalankan notebook, Anda harus menghubungkannya ke runtime Gemini Enterprise Agent Platform. Runtime adalah resource komputasi yang menjalankan kode di notebook Anda. Runtime harus berada di region yang sama dengan notebook Anda.

Untuk mengetahui informasi selengkapnya tentang runtime, lihat Runtime dan template runtime. Untuk mengetahui informasi selengkapnya tentang cara mengonfigurasi setelan regional, lihat Menetapkan region default untuk aset kode aset.

Dalam tutorial ini, Anda menggunakan runtime default. Runtime default adalah runtime preset yang memerlukan penyiapan minimal. Untuk terhubung ke runtime default, ikuti langkah-langkah berikut:

  1. Dengan notebook terbuka, klik Connect.

    Mungkin perlu waktu beberapa menit untuk terhubung ke runtime default jika Anda belum memiliki runtime aktif.

  2. Saat runtime siap, Anda akan melihat tanda centang dengan grafik RAM dan disk ditampilkan. Jika Anda mengarahkan kursor ke grafik, Anda akan melihat jenis runtime dan konfigurasi runtime.

    Setelan konfigurasi untuk runtime default

Menjalankan notebook

Pengantar notebook di BigQuery Studio berisi sel teks, SQL, visualisasi, dan kode sel. Sel selain sel teks dapat dijalankan satu per satu, atau Anda dapat menjalankan semua sel secara berurutan dari yang pertama hingga yang terakhir.

Dalam tutorial ini, Anda menjalankan sel di notebook satu per satu sehingga dapat melihat hasilnya secara bertahap. Untuk menjalankan notebook:

  1. Di bagian Query your data using SQL cells, arahkan kursor ke sel SQL, lalu klik Run cell.

    Tombol jalankan sel di sel SQL

    Sel SQL ini membuat kueri tabel bigquery-public-data.epa_historical_air_quality.pm25_frm_daily_summary di set data publik Historical Air Quality dan menampilkan rata-rata harian PM2.5 (metrik kualitas udara umum) untuk San Francisco selama beberapa tahun terakhir.

  2. Lihat hasilnya. Hasil kueri ditampilkan dalam DataFrame.

    Hasil kueri di DataFrames BigQuery

  3. Di bagian Visualize data, arahkan kursor ke sel visualisasi, dan lalu klik Run cell.

  4. Lihat visualisasi yang dihasilkan.

    Diagram yang dibuat oleh sel visualisasi

    Hasilnya menampilkan diagram deret waktu yang memplot nilai PM2.5 rata-rata harian dalam DataFrame df yang Anda buat sebelumnya. Diagram ini menunjukkan tren tingkat PM2.5 dari waktu ke waktu.

  5. Di bagian Clean the data, arahkan kursor ke sel kode, lalu klik Run cell.

  6. Lihat hasilnya. Hasilnya ditampilkan dalam DataFrame.

    Hasil dalam DataFrame BigQuery

    Kode ini melakukan hal berikut:

    • Mengimpor library bigframes.pandas.
    • Memastikan kolom date_local adalah stempel waktu.
    • Mengurutkan hasil berdasarkan tanggal, yang diperlukan untuk perkiraan.
    • Menghapus baris duplikat.
    • Menghapus baris dengan avg_pm25 adalah null.
    • Memfilter outlier.
    • Menampilkan hasil dalam BigQuery DataFrames bernama df_cleaned.
  7. Di bagian Predict values using AI.FORECAST, arahkan kursor ke sel SQL, lalu klik Run cell.

  8. Lihat hasilnya. Hasil kueri ditampilkan dalam DataFrame.

    Hasil yang dihasilkan oleh fungsi `AI.FORECAST`

    Sel SQL ini menjalankan kueri yang menggunakan fungsi AI.FORECAST untuk memperkirakan PM2.5 rata-rata harian di masa mendatang menggunakan DataFrame df_cleaned yang Anda buat sebelumnya.

  9. Di bagian Visualize data using Python, arahkan kursor ke sel kode, lalu klik Run cell.

  10. Lihat hasilnya. Hasilnya ditampilkan dalam diagram.

    Diagram yang dihasilkan oleh sel kode Python

    Kode Python ini melakukan hal berikut:

    • Mengimpor modul datetime.
    • Membuat plot data historis terlebih dahulu dan mendapatkan sumbu.
    • Membuat plot data yang diperkirakan pada sumbu yang sama.
    • Membuat plot interval keyakinan.

    Visualisasi ini menyerupai plot Python standar, tetapi df_cleaned.plot adalah perintah BigQuery DataFrames. Perintah ini hanya mengambil data yang diperlukan (sampel) untuk merender diagram, bukan seluruh set data.

Pembersihan

Agar akunAnda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut. Cloud de Confiance

  1. Di Cloud de Confiance konsol, buka halaman Manage resources.

    Buka Kelola resource

  2. Pada daftar project, pilih project yang Anda ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Atau, untuk mempertahankan project dan menghapus resource yang digunakan dalam tutorial ini, ikuti langkah-langkah berikut:

  1. Buka halaman Studio.

    Buka Studio

  2. Di panel kiri, luaskan project Anda, lalu klik Notebooks.

  3. Untuk notebook yang Anda hapus, klik Open actions > Delete.

  4. Di dialog Delete notbook, klik Delete untuk mengonfirmasi.

Langkah berikutnya

Untuk menjalankan template notebook contoh lainnya di galeri notebook, lihat:

Untuk mempelajari DataFrame lebih lanjut, lihat:

Untuk mempelajari fungsi AI generatif dan ML di BigQuery lebih lanjut, lihat Ringkasan AI Generatif.