Choisir une fonction de traitement de documents
Ce document compare les fonctions de traitement de documents
disponibles dans BigQuery ML, à savoir
AI.GENERATE_TEXT
et
ML.PROCESS_DOCUMENT.
Vous pouvez utiliser les informations de ce document pour vous aider à choisir la fonction à utiliser lorsque les fonctions se chevauchent.
De manière générale, la différence entre ces fonctions est la suivante :
AI.GENERATE_TEXTest un bon choix pour effectuer des tâches de traitement du langage naturel (TLN) lorsque certains contenus se trouvent dans des documents. Cette fonction présente les avantages suivants :- Réduction des coûts
- Plus de langues disponibles
- Débit plus rapide
- Possibilité de régler le modèle
- Disponibilité de modèles multimodaux
Pour obtenir des exemples de tâches de traitement de documents qui fonctionnent le mieux avec cette approche, consultez Découvrir les fonctionnalités de traitement de documents avec l'API Gemini.
ML.PROCESS_DOCUMENTest un bon choix pour effectuer des tâches de traitement de documents qui nécessitent une analyse de documents et une réponse structurée prédéfinie.
Comparaison des fonctions
Le tableau suivant compare les fonctions AI.GENERATE_TEXT et ML.PROCESS_DOCUMENT :
AI.GENERATE_TEXT |
ML.PROCESS_DOCUMENT |
|
|---|---|---|
| Objectif | Effectuer n'importe quelle tâche de TLN liée à un document en transmettant une invite à un modèle Gemini ou partenaire ou à un modèle ouvert. Par exemple, à partir d'un document financier d'une entreprise, vous pouvez récupérer
des informations sur le document en fournissant une invite telle que |
Utiliser l'API Document AI pour effectuer un traitement de documents spécialisé pour différents types de documents, tels que des factures, des formulaires fiscaux et des états financiers. Vous pouvez également effectuer le découpage de documents. |
| Facturation | Des frais BigQuery ML sont facturés pour les données traitées. Pour en savoir plus, consultez la page
Tarifs de BigQuery ML. |
Des frais BigQuery ML sont facturés pour les données traitées. Pour en savoir plus, consultez la page
Tarifs de BigQuery ML.
Des frais sont facturés pour les appels à l'API Document AI. Pour en savoir plus, consultez la page Tarifs de l'API Document AI. |
| Requêtes par minute (RPM) | Non applicable aux modèles Gemini. Entre 25 et 60 pour les modèles partenaires. Pour en savoir plus, consultez Limites de requêtes par minute. | 120 RPM par type de processeur, avec une limite globale de 600 RPM par projet. Pour en savoir plus, consultez la liste des quotas . |
| Jetons par minute | Entre 8 192 et plus d'un million, selon le modèle utilisé. | Aucune limite de jetons. Toutefois, cette fonction présente différentes limites de pages en fonction du processeur que vous utilisez. Pour en savoir plus, consultez la section Limites. |
| Réglage supervisé | Le réglage supervisé est compatible avec certains modèles. | Non compatible |
| Langues disponibles | La compatibilité varie en fonction du LLM que vous choisissez. | La compatibilité linguistique dépend du type de processeur de documents. La plupart ne sont compatibles qu'avec l'anglais. Pour en savoir plus, consultez la liste des processeurs . |
| Régions où le service est disponible | Disponible dans toutes les régions d'IA générative pour Agent Platform regions. | Disponible dans les emplacements multirégionaux EU et US
pour tous les processeurs. Certains processeurs sont également disponibles dans certaines régions uniques. Pour en savoir plus, consultez la section
Compatibilité régionale et multirégionale. |