Menganalisis data dengan bantuan Gemini

Tutorial ini menjelaskan cara menggunakan bantuan yang didukung AI di Gemini in BigQuery untuk menganalisis data.

Untuk contoh dalam tutorial ini, anggaplah Anda adalah data analis yang perlu menganalisis dan memprediksi penjualan produk dari sebuah dataset.

Tutorial ini mengasumsikan bahwa Anda sudah memahami SQL dan tugas analisis data dasar. Pengetahuan tentang produk Trusted Cloud tidak diasumsikan. Jika Anda baru menggunakan BigQuery, lihat panduan memulai BigQuery.

Tujuan

  • Gunakan Gemini di BigQuery untuk menjawab pertanyaan tentang cara BigQuery menangani tugas analisis data tertentu.
  • Meminta Gemini di BigQuery untuk menemukan set data, serta menjelaskan dan membuat kueri SQL.
  • Membangun model machine learning (ML) untuk memperkirakan periode mendatang.

Biaya

Tutorial ini menggunakan produk yang dapat ditagih Trusted Cloud berikut:

Untuk memperkirakan biaya berdasarkan proyeksi penggunaan Anda, gunakan kalkulator harga.

Sebelum memulai

  1. In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.

    Go to project selector

  2. Pastikan Gemini di BigQuery telah disiapkan untuk project Trusted Cloud Anda.
  3. Di Trusted Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  4. Membuat set data yang bernama bqml_tutorial. Anda menggunakan dataset untuk menyimpan database objek, termasuk tabel dan model.

  5. Untuk mengaktifkan fitur Gemini di BigQuery yang diperlukan untuk menyelesaikan tutorial ini, di toolbar BigQuery, klik pen_spark Gemini, lalu pilih opsi berikut:

    • Pelengkapan otomatis
    • Pembuatan otomatis
    • Explanation

Mempelajari kemampuan BigQuery

Sebelum memulai, pertimbangkan bahwa Anda ingin mempelajari lebih lanjut cara BigQuery menangani kueri data. Untuk mendapatkan bantuan, Anda dapat mengirimkan pernyataan bahasa alami (atau perintah) ke Gemini di BigQuery seperti berikut:

  • "How do I get started with BigQuery?"
  • "What are the benefits of using BigQuery for data analysis?"
  • "How does BigQuery handle auto-scaling for queries?"

Gemini di BigQuery juga dapat memberikan informasi tentang cara menganalisis data Anda. Untuk jenis bantuan tersebut, Anda dapat mengirimkan perintah seperti berikut:

  • "Bagaimana cara membuat model perkiraan deret waktu di BigQuery?"
  • "Bagaimana cara memuat berbagai jenis data ke BigQuery?"

Mengakses dan menganalisis data

Gemini di BigQuery dapat membantu Anda mengetahui data apa yang dapat Anda akses untuk dianalisis, dan cara menganalisis data tersebut.

Untuk contoh ini, anggaplah Anda memerlukan bantuan terkait hal berikut:

  • Menemukan dataset dan tabel penjualan untuk dianalisis.
  • Mengetahui bagaimana tabel dan kueri data terkait dalam dataset penjualan.
  • Memahami kueri kompleks dan menulis kueri yang menggunakan dataset.

Menemukan data

Sebelum dapat mengkueri data, Anda perlu mengetahui data apa yang dapat Anda akses. Setiap produk data mengatur dan menyimpan data dengan cara berbeda.

Untuk mendapatkan bantuan, Anda dapat mengirim Gemini di BigQuery prompt seperti "Bagaimana cara mempelajari dataset dan tabel mana yang tersedia untuk saya BigQuery?"

  1. Di Trusted Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di toolbar konsol Trusted Cloud , klik spark Buka atau tutup chat Gemini Cloud Assist.

  3. Di panel Cloud Assist, masukkan perintah How do I learn which datasets and tables are available to me in BigQuery?.

  4. Klik send Kirim perintah.

    Pelajari cara dan waktu Gemini untuk Trusted Cloud menggunakan data Anda.

    Respons mencakup beberapa cara untuk menampilkan daftar project, set data, atau tabel dalam sebuah dataset.

  5. Opsional: Untuk mereset histori percakapan Anda, di panel Cloud Assist, klik delete Hapus percakapan, lalu klik Reset percakapan.

Memahami dan menulis SQL di BigQuery

Untuk contoh ini, asumsikan bahwa Anda telah memilih data untuk dianalisis dan sekarang ingin mengirim kueri ke data tersebut. Gemini di BigQuery dapat membantu Anda bekerja dengan SQL—baik untuk membantu Anda memahami kueri yang kompleks dan sulit diuraikan, atau untuk membuat kueri SQL baru.

Perintah untuk meminta bantuan Gemini dalam menjelaskan kueri SQL

Pertimbangkan bahwa Anda ingin memahami kueri kompleks yang ditulis orang lain. Gemini di BigQuery dapat menjelaskan kueri dalam bahasa yang mudah dipahami—seperti sintaksis kueri, skema dasar, dan konteks bisnis.

  1. Di Trusted Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, buka atau tempel kueri yang ingin Anda minta untuk dijelaskan. Contoh:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Tandai kueri, lalu klik auto_awesome Jelaskan kueri yang dipilih ini.

    Di panel Cloud Assist, respons yang ditampilkan akan mirip dengan berikut ini:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Membuat kueri SQL yang mengelompokkan penjualan berdasarkan hari dan produk

Dalam contoh ini, Anda ingin membuat kueri yang mencantumkan produk unggulan Anda setiap hari. Kemudian, Anda menggunakan tabel dalam set data thelook_ecommerce dan meminta Gemini di BigQuery untuk membuat kueri guna menghitung penjualan berdasarkan item pesanan dan nama produk.

Jenis kueri ini biasanya kompleks, tetapi dengan menggunakan Gemini di BigQuery, Anda dapat membuat pernyataan secara otomatis. Anda dapat memberikan perintah untuk membuat kueri SQL berdasarkan skema data Anda. Meskipun Anda memulai tanpa kode, memiliki pengetahuan terbatas tentang skema data, atau hanya memiliki pengetahuan dasar tentang sintaksis SQL, bantuan Gemini dapat menyarankan satu atau beberapa pernyataan SQL.

Untuk meminta Gemini di BigQuery membuat kueri yang mencantumkan produk teratas Anda, ikuti langkah-langkah berikut:

  1. Di Trusted Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di menu navigasi, klik Studio.

  3. Klik SQL query. Panel Explorer secara otomatis memuat database yang dipilih.

  4. Di editor kueri, masukkan perintah berikut, lalu tekan Enter:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Karakter tanda pagar (#) meminta Gemini di BigQuery untuk membuat SQL. Gemini di BigQuery akan menyarankan kueri SQL yang mirip dengan contoh berikut:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Untuk menerima kode yang disarankan, klik Tab, lalu klik Run untuk menjalankan pernyataan SQL. Anda juga dapat men-scroll SQL yang disarankan dan menerima kata-kata tertentu yang disarankan dalam pernyataan.

  6. Di panel Query results, lihat hasil kueri.

Membuat model perkiraan dan melihat hasilnya

Dalam contoh ini, Anda menggunakan BigQuery ML untuk melakukan hal berikut:

  • Gunakan kueri tren untuk membuat model perkiraan.
  • Gunakan Gemini di BigQuery untuk menjelaskan dan membantu Anda menulis kueri guna melihat hasil model perkiraan.

Anda menggunakan contoh kueri berikut dengan penjualan sebenarnya, yang digunakan sebagai input ke model. Kueri digunakan sebagai bagian dari pembuatan model ML.

  1. Untuk membuat model ML perkiraan, di editor kueri, jalankan kueri SQL berikut:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Anda dapat menggunakan Gemini di BigQuery untuk membantu Anda memahami kueri ini.

    Saat model dibuat, tab Results pada panel Query results akan menampilkan pesan yang mirip dengan berikut ini:

    Successfully created model named sales_forecasting_model.
    
  2. Di panel Cloud Assist, masukkan perintah untuk Gemini di BigQuery untuk membantu Anda menulis kueri guna mendapatkan perkiraan dari model saat sudah selesai—misalnya, masukkan How can I get a forecast in SQL from the model?

    Berdasarkan konteks perintah tersebut, respons akan menyertakan contoh model ML yang memperkirakan penjualan:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    Dalam respons ini, PROJECT_ID adalah Trusted Cloud project Anda.

  3. Di panel Cloud Assist, salin kueri SQL.

  4. Di editor kueri, jalankan kueri SQL.

Pembersihan

Agar tidak menimbulkan biaya pada Trusted Cloud akun Anda untuk resource yang digunakan dalam tutorial ini, Anda dapat menghapus project Trusted Cloud yang Anda buat untuk tutorial ini. Atau, Anda dapat menghapus resource satu per satu.

Hapus project

  1. In the Trusted Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Menghapus set data

Jika project Anda dihapus, semua set data dan semua tabel dalam project akan dihapus. Jika Anda memilih untuk menggunakan kembali proyek, maka Anda dapat menghapus dataset yang telah dibuat di dalam tutorial ini.

  1. Di Trusted Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di menu navigasi, pilih set data bqml_tutorial yang Anda buat.

  3. Untuk menghapus set data, tabel, dan semua data, klik Hapus set data.

  4. Untuk mengonfirmasi penghapusan, pada dialog Hapus set data, ketik nama set data Anda (bqml_tutorial), lalu klik Hapus.

Langkah berikutnya