Memilih fungsi pemrosesan dokumen

Dokumen ini memberikan perbandingan fungsi pemrosesan dokumen yang tersedia di BigQuery ML, yaitu AI.GENERATE_TEXT dan ML.PROCESS_DOCUMENT. Anda dapat menggunakan informasi dalam dokumen ini untuk membantu Anda memutuskan fungsi mana yang akan digunakan jika fungsi tersebut memiliki kemampuan yang tumpang-tindih.

Secara umum, perbedaan antara fungsi ini adalah sebagai berikut:

  • AI.GENERATE_TEXT adalah pilihan yang tepat untuk melakukan tugas natural language processing (NLP) yang sebagian kontennya berada dalam dokumen. Fungsi ini menawarkan manfaat berikut:

    • Biaya yang lebih rendah
    • Dukungan bahasa yang lebih banyak
    • Throughput yang lebih cepat
    • Kemampuan penyesuaian model
    • Ketersediaan model multimodal

    Untuk mengetahui contoh tugas pemrosesan dokumen yang paling sesuai dengan pendekatan ini, lihat Menjelajahi kemampuan pemrosesan dokumen dengan Gemini API.

  • ML.PROCESS_DOCUMENT adalah pilihan yang tepat untuk melakukan tugas pemrosesan dokumen yang memerlukan penguraian dokumen dan respons terstruktur yang telah ditentukan.

Perbandingan fungsi

Gunakan tabel berikut untuk membandingkan fungsi AI.GENERATE_TEXT dan ML.PROCESS_DOCUMENT:

AI.GENERATE_TEXT ML.PROCESS_DOCUMENT
Tujuan

Melakukan tugas NLP terkait dokumen dengan meneruskan perintah ke a model Gemini atau partner atau ke an model terbuka.

Misalnya, dengan dokumen keuangan untuk perusahaan, Anda dapat mengambil informasi dokumen dengan memberikan perintah seperti What is the quarterly revenue for each division?.

Menggunakan Document AI API untuk melakukan pemrosesan dokumen khusus untuk berbagai jenis dokumen, seperti faktur, formulir pajak, dan laporan keuangan. Anda juga dapat melakukan pengelompokan dokumen.
Penagihan

Mengenakan biaya BigQuery ML untuk data yang diproses. Untuk mengetahui informasi selengkapnya, lihat Harga BigQuery ML.

Mengenakan biaya Platform Agen Gemini Enterprise untuk panggilan ke model. Jika Anda menggunakan model Gemini 2.0 atau yang lebih baru, panggilan akan ditagih dengan tarif API batch. Untuk mengetahui informasi selengkapnya, lihat Biaya pembuatan dan deployment model AI di Platform Agen.

Mengenakan biaya BigQuery ML untuk data yang diproses. Untuk mengetahui informasi selengkapnya, lihat Harga BigQuery ML.

Mengenakan biaya untuk panggilan ke Document AI API. Untuk mengetahui informasi selengkapnya, lihat Harga Document AI API.

Permintaan per menit (RPM) Tidak berlaku untuk model Gemini. Antara 25 dan 60 untuk model partner. Untuk mengetahui informasi selengkapnya, lihat Batas permintaan per menit. 120 RPM per jenis pemroses, dengan batas keseluruhan 600 RPM per project. Untuk mengetahui informasi selengkapnya, lihat Daftar kuota.
Token per menit Berkisar antara 8.192 hingga lebih dari 1 juta, bergantung pada model yang digunakan. Tidak ada batas token. Namun, fungsi ini memiliki batas halaman yang berbeda bergantung pada pemroses yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Batas.
Penyesuaian yang diawasi Penyesuaian yang diawasi didukung untuk beberapa model. Tidak didukung.
Bahasa yang didukung Dukungan bervariasi berdasarkan LLM yang Anda pilih. Dukungan bahasa bergantung pada jenis pemroses dokumen; sebagian besar hanya mendukung bahasa Inggris. Untuk mengetahui informasi selengkapnya, lihat Daftar pemroses.
Region yang didukung Didukung di semua region Generative AI for Agent Platform . Didukung di multi-region EU dan US untuk semua pemroses. Beberapa pemroses juga tersedia di region tunggal tertentu regions. Untuk mengetahui informasi selengkapnya, lihat Dukungan regional dan multi-regional.