Scegliere una funzione di elaborazione dei documenti

Questo documento fornisce un confronto tra le funzioni di elaborazione dei documenti disponibili in BigQuery ML, ovvero AI.GENERATE_TEXT e ML.PROCESS_DOCUMENT. Puoi utilizzare le informazioni contenute in questo documento per decidere quale funzione utilizzare nei casi in cui le funzioni hanno funzionalità sovrapposte.

In linea generale, la differenza tra queste funzioni è la seguente:

  • AI.GENERATE_TEXT è una buona scelta per eseguire attività di elaborazione del linguaggio naturale (NLP) in cui alcuni contenuti risiedono nei documenti. Questa funzione offre i seguenti vantaggi:

    • Riduci i costi
    • Supporto di più lingue
    • Velocità effettiva più elevata
    • Funzionalità di ottimizzazione del modello
    • Disponibilità di modelli multimodali

    Per esempi di attività di elaborazione dei documenti che funzionano meglio con questo approccio, vedi Esplorare le funzionalità di elaborazione dei documenti con l'API Gemini.

  • ML.PROCESS_DOCUMENT è una buona scelta per eseguire attività di elaborazione dei documenti che richiedono l'analisi dei documenti e una risposta strutturata predefinita.

Confronto delle funzioni

Utilizza la seguente tabella per confrontare le funzioni AI.GENERATE_TEXT e ML.PROCESS_DOCUMENT:

AI.GENERATE_TEXT ML.PROCESS_DOCUMENT
Finalità

Esegui qualsiasi attività di NLP relativa ai documenti passando un prompt a un modello Gemini o partner o a un modello aperto.

Ad esempio, dato un documento finanziario per un'azienda, puoi recuperare le informazioni del documento fornendo un prompt come What is the quarterly revenue for each division?.

Utilizza l'API Document AI per eseguire l'elaborazione specializzata dei documenti per diversi tipi di documenti, come fatture, moduli fiscali e bilanci. Puoi anche eseguire la suddivisione dei documenti in blocchi.
Fatturazione

Comporta addebiti di BigQuery ML per i dati elaborati. Per ulteriori informazioni, vedi Prezzi di BigQuery ML.

Comporta addebiti di Gemini Enterprise Agent Platform per le chiamate al modello. Se utilizzi un modello Gemini 2.0 o successivo, la chiamata viene fatturata alla tariffa dell'API batch. Per ulteriori informazioni, vedi Costo di creazione e deployment di modelli di AI in Agent Platform.

Comporta addebiti di BigQuery ML per i dati elaborati. Per ulteriori informazioni, vedi Prezzi di BigQuery ML.

Comporta addebiti per le chiamate all'API Document AI. Per ulteriori informazioni, vedi Prezzi dell'API Document AI.

Richieste al minuto (RPM) Non applicabile ai modelli Gemini. Tra 25 e 60 per i modelli partner. Per ulteriori informazioni, vedi Limiti per le richieste al minuto. 120 RPM per tipo di processore, con un limite complessivo di 600 RPM per progetto. Per ulteriori informazioni, vedi Elenco delle quote.
Token al minuto Varia da 8192 a oltre 1 milione, a seconda del modello utilizzato. Nessun limite di token. Tuttavia, questa funzione ha limiti di pagina diversi a seconda del processore utilizzato. Per ulteriori informazioni, vedi Limiti.
Ottimizzazione supervisionata L'ottimizzazione supervisionata è supportata per alcuni modelli. Non supportata.
Lingue supportate Il supporto varia in base all'LLM scelto. Il supporto linguistico dipende dal tipo di processore di documenti; la maggior parte supporta solo l'inglese. Per ulteriori informazioni, vedi Elenco dei processori.
Aree geografiche supportate Supportata in tutte le regioni di AI generativa per Agent Platform . Supportata nelle multi-regioni EU e US per tutti i processori. Alcuni processori sono disponibili anche in determinate regioni singole regioni. Per ulteriori informazioni, vedi Supporto regionale e multi-regionale.