Funktion zur Dokumentverarbeitung auswählen

In diesem Dokument werden die in BigQuery ML verfügbaren Funktionen zur Dokumentverarbeitung verglichen: die AI.GENERATE_TEXT und ML.PROCESS_DOCUMENTsind. Anhand der Informationen in diesem Dokument können Sie entscheiden, welche Funktion Sie verwenden sollten, wenn sich die Funktionen in ihren Capabilities überschneiden.

Im Wesentlichen besteht der Unterschied zwischen diesen Funktionen in Folgendem:

  • AI.GENERATE_TEXT ist eine gute Wahl für Aufgaben zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), bei denen sich ein Teil des Inhalts in Dokumenten befindet. Diese Funktion bietet folgende Vorteile:

    • Geringere Kosten
    • Support in weiteren Sprachen
    • Höherer Durchsatz
    • Funktion zur Modellabstimmung
    • Verfügbarkeit multimodaler Modelle

    Beispiele für Aufgaben zur Dokumentverarbeitung, die sich am besten mit diesem Ansatz ausführen lassen, finden Sie unter Funktionen zur Dokumentverarbeitung mit der Gemini API nutzen.

  • ML.PROCESS_DOCUMENT ist eine gute Wahl für Aufgaben zur Dokumentverarbeitung, bei denen das Parsen von Dokumenten und eine vordefinierte, strukturierte Antwort erforderlich sind.

Funktionsvergleich

In der folgenden Tabelle werden die Funktionen AI.GENERATE_TEXT und ML.PROCESS_DOCUMENT verglichen:

AI.GENERATE_TEXT ML.PROCESS_DOCUMENT
Zweck

Führen Sie beliebige dokumentbezogene NLP-Aufgaben aus, indem Sie eine Eingabeaufforderung an ein Gemini- oder Partnermodell oder an ein offenes Modell übergeben.

Wenn Sie beispielsweise ein Finanzdokument für ein Unternehmen haben, können Sie Dokumentinformationen abrufen, indem Sie eine Eingabeaufforderung wie What is the quarterly revenue for each division? eingeben.

Verwenden Sie die Document AI API, um eine spezielle Dokumentverarbeitung für verschiedene Dokumenttypen wie Rechnungen, Steuerformulare und Finanz berichte durchzuführen. Sie können auch Dokumente in Blöcke aufteilen.
Abrechnung

Es fallen BigQuery ML-Gebühren für die verarbeiteten Daten an. Weitere Informationen finden Sie unter BigQuery ML-Preise.

Für Aufrufe des Modells fallen Gebühren für die Gemini Enterprise Agent Platform an. Wenn Sie ein Gemini 2.0-Modell oder höher verwenden, wird der Aufruf zum Preis der Batch API abgerechnet. Weitere Informationen finden Sie unter Kosten für das Erstellen und Bereitstellen von KI-Modellen in der Agent Platform.

Es fallen BigQuery ML-Gebühren für die verarbeiteten Daten an. Weitere Informationen finden Sie unter BigQuery ML-Preise.

Für Aufrufe der Document AI API fallen Gebühren an. Weitere Informationen finden Sie unter Document AI API-Preise.

Anfragen pro Minute (Requests Per Minute, RPM) Gilt nicht für Gemini-Modelle. Zwischen 25 und 60 für Partnermodelle. Weitere Informationen finden Sie unter Limits für Anfragen pro Minute. 120 RPM pro Prozessortyp mit einem Gesamlimit von 600 RPM pro Projekt. Weitere Informationen finden Sie in der Liste der Kontingente. Quotas list.
Tokens pro Minute Je nach verwendetem Modell zwischen 8.192 und über 1 Million. Kein Tokenlimit. Für diese Funktion gelten jedoch je nach verwendetem Prozessor unterschiedliche Seitenlimits. Weitere Informationen finden Sie unter Beschränkungen.
Überwachte Abstimmung Die überwachte Abstimmung wird für einige Modelle unterstützt. Nicht unterstützt.
Unterstützte Sprachen Die Unterstützung variiert je nach ausgewähltem LLM. Die Sprachunterstützung hängt vom Typ des Dokumentenprozessors ab. Die meisten unterstützen nur Englisch. Weitere Informationen finden Sie in der Liste der Prozessoren .
Unterstützte Regionen Wird in allen Regionen unterstützt, in denen generative KI für die Agent Platform verfügbar ist. Wird in den EU und US Multiregionen für alle Prozessoren unterstützt. Einige Prozessoren sind auch in bestimmten einzelnen Regionen verfügbar. Weitere Informationen finden Sie unter Regionale und multiregionale Unterstützung.