Funktion zur Dokumentverarbeitung auswählen
In diesem Dokument werden die in BigQuery ML verfügbaren Funktionen zur Dokumentverarbeitung verglichen:
die
AI.GENERATE_TEXT
und
ML.PROCESS_DOCUMENTsind.
Anhand der Informationen in diesem Dokument können Sie entscheiden, welche Funktion Sie verwenden sollten, wenn sich die Funktionen in ihren Capabilities überschneiden.
Im Wesentlichen besteht der Unterschied zwischen diesen Funktionen in Folgendem:
AI.GENERATE_TEXTist eine gute Wahl für Aufgaben zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), bei denen sich ein Teil des Inhalts in Dokumenten befindet. Diese Funktion bietet folgende Vorteile:- Geringere Kosten
- Support in weiteren Sprachen
- Höherer Durchsatz
- Funktion zur Modellabstimmung
- Verfügbarkeit multimodaler Modelle
Beispiele für Aufgaben zur Dokumentverarbeitung, die sich am besten mit diesem Ansatz ausführen lassen, finden Sie unter Funktionen zur Dokumentverarbeitung mit der Gemini API nutzen.
ML.PROCESS_DOCUMENTist eine gute Wahl für Aufgaben zur Dokumentverarbeitung, bei denen das Parsen von Dokumenten und eine vordefinierte, strukturierte Antwort erforderlich sind.
Funktionsvergleich
In der folgenden Tabelle werden die Funktionen AI.GENERATE_TEXT und ML.PROCESS_DOCUMENT verglichen:
AI.GENERATE_TEXT |
ML.PROCESS_DOCUMENT |
|
|---|---|---|
| Zweck | Führen Sie beliebige dokumentbezogene NLP-Aufgaben aus, indem Sie eine Eingabeaufforderung an ein Gemini- oder Partnermodell oder an ein offenes Modell übergeben. Wenn Sie beispielsweise ein Finanzdokument für ein Unternehmen haben, können Sie
Dokumentinformationen abrufen, indem Sie eine Eingabeaufforderung wie |
Verwenden Sie die Document AI API, um eine spezielle Dokumentverarbeitung für verschiedene Dokumenttypen wie Rechnungen, Steuerformulare und Finanz berichte durchzuführen. Sie können auch Dokumente in Blöcke aufteilen. |
| Abrechnung | Es fallen BigQuery ML-Gebühren für die verarbeiteten Daten an. Weitere Informationen finden Sie unter
BigQuery ML-Preise. |
Es fallen BigQuery ML-Gebühren für die verarbeiteten Daten an. Weitere Informationen finden Sie unter
BigQuery ML-Preise.
Für Aufrufe der Document AI API fallen Gebühren an. Weitere Informationen finden Sie unter Document AI API-Preise. |
| Anfragen pro Minute (Requests Per Minute, RPM) | Gilt nicht für Gemini-Modelle. Zwischen 25 und 60 für Partnermodelle. Weitere Informationen finden Sie unter Limits für Anfragen pro Minute. | 120 RPM pro Prozessortyp mit einem Gesamlimit von 600 RPM pro Projekt. Weitere Informationen finden Sie in der Liste der Kontingente. Quotas list. |
| Tokens pro Minute | Je nach verwendetem Modell zwischen 8.192 und über 1 Million. | Kein Tokenlimit. Für diese Funktion gelten jedoch je nach verwendetem Prozessor unterschiedliche Seitenlimits. Weitere Informationen finden Sie unter Beschränkungen. |
| Überwachte Abstimmung | Die überwachte Abstimmung wird für einige Modelle unterstützt. | Nicht unterstützt. |
| Unterstützte Sprachen | Die Unterstützung variiert je nach ausgewähltem LLM. | Die Sprachunterstützung hängt vom Typ des Dokumentenprozessors ab. Die meisten unterstützen nur Englisch. Weitere Informationen finden Sie in der Liste der Prozessoren . |
| Unterstützte Regionen | Wird in allen Regionen unterstützt, in denen generative KI für die Agent Platform verfügbar ist. | Wird in den EU und US Multiregionen
für alle Prozessoren unterstützt. Einige Prozessoren sind auch in bestimmten einzelnen
Regionen verfügbar. Weitere Informationen finden Sie unter
Regionale und multiregionale Unterstützung. |