Es posible que parte de la información de esta página (o toda) no se aplique a Cloud de Confiance de S3NS. Consulta Diferencias con Google Cloud para obtener más información.

Se usó la API de Cloud Translation para traducir esta página.

Elige una función de procesamiento de documentos

En este documento, se proporciona una comparación de las funciones de procesamiento de documentos disponibles en BigQuery ML, que son AI.GENERATE_TEXT y ML.PROCESS_DOCUMENT. Puedes usar la información de este documento para decidir qué función usar en los casos en que las funciones tengan capacidades superpuestas.

A grandes rasgos, la diferencia entre estas funciones es la siguiente:

AI.GENERATE_TEXT es una buena opción para realizar tareas de procesamiento de lenguaje natural (PNL) en las que parte del contenido reside en documentos. Esta función ofrece los siguientes beneficios:
- Bajar los costos
- Compatibilidad con más idiomas
- Mayor capacidad de procesamiento
- Capacidad de ajuste del modelo
- Disponibilidad de modelos multimodales
Para ver ejemplos de tareas de procesamiento de documentos que funcionan mejor con este enfoque, consulta Explora las capacidades de procesamiento de documentos con la API de Gemini.
ML.PROCESS_DOCUMENT es una buena opción para realizar tareas de procesamiento de documentos que requieren el análisis de documentos y una respuesta estructurada predefinida.

Comparación de funciones

Usa la siguiente tabla para comparar las funciones AI.GENERATE_TEXT y ML.PROCESS_DOCUMENT:

	`AI.GENERATE_TEXT`	`ML.PROCESS_DOCUMENT`
Objetivo	Realiza cualquier tarea de PNL relacionada con documentos pasando una instrucción a un modelo de Gemini o de socio, o a un modelo abierto. Por ejemplo, dado un documento financiero de una empresa, puedes recuperar información del documento proporcionando una instrucción como `What is the quarterly revenue for each division?`.	Usa la API de Document AI para realizar un procesamiento de documentos especializado para diferentes tipos de documentos, como facturas, formularios fiscales y estados financieros. También puedes realizar la fragmentación de documentos.
Facturación	Se generan cargos de BigQuery ML por los datos procesados. Para obtener más información, consulta los precios de BigQuery ML. Genera cargos de Vertex AI por las llamadas al modelo. Si usas un modelo de Gemini 2.0 o posterior, la llamada se factura según la tarifa de la API por lotes. Para obtener más información, consulta Costo de crear y, luego, implementar modelos de IA en Vertex AI.	Se generan cargos de BigQuery ML por los datos procesados. Para obtener más información, consulta los precios de BigQuery ML. Genera cargos por las llamadas a la API de Document AI. Para obtener más información, consulta los precios de la API de Document AI.
Solicitudes por minuto (RPM)	No se aplica a los modelos de Gemini. Entre 25 y 60 para los modelos de socios Para obtener más información, consulta Límites de solicitudes por minuto.	120 RPM por tipo de procesador, con un límite general de 600 RPM por proyecto. Para obtener más información, consulta la lista de cuotas.
Tokens por minuto	Varía de 8,192 a más de 1 millón, según el modelo utilizado.	No hay límite de tokens. Sin embargo, esta función tiene límites de páginas diferentes según el procesador que uses. Para obtener más información, consulta Límites.
Ajuste supervisado	El ajuste supervisado es compatible con algunos modelos.	No compatible.
Idiomas compatibles	La asistencia varía según el LLM que elijas.	La compatibilidad con idiomas depende del tipo de procesador de documentos; la mayoría solo admite inglés. Para obtener más información, consulta la lista de procesadores.
Regiones admitidas	Se admite en todas las regiones de la IA generativa para Vertex AI.	Es compatible con las multirregiones `EU` y `US` para todos los procesadores. Algunos procesadores también están disponibles en ciertas regiones únicas. Para obtener más información, consulta Compatibilidad regional y multirregional.