Mistral AI lanza OCR 4: el modelo que revoluciona la digitalización documental con precisión del 72% frente a la competencia

PARÍS, Francia – 29 de junio de 2026 – Mistral AI ha anunciado hoy el lanzamiento oficial de Mistral OCR 4, su nuevo modelo de […]

Tecnología

ESCRITO POR

Comunicación LinkSpace

ACTUALIZADO

27 de junio, 2026

En este artículo

PARÍS, Francia – 29 de junio de 2026 – Mistral AI ha anunciado hoy el lanzamiento oficial de Mistral OCR 4, su nuevo modelo de inteligencia artificial enfocado y compacto diseñado para la comprensión estructural y extracción profunda de documentos. Esta actualización marca un punto de inflexión para las industrias que dependen del procesamiento masivo de datos, al transformar páginas estáticas en representaciones estructuradas listas para alimentar canalizaciones de búsqueda empresarial, sistemas RAG (Generación Aumentada por Recuperación) y flujos de trabajo de agentes autónomos.

A diferencia de los sistemas tradicionales orientados únicamente a la transcripción de caracteres, OCR 4 localiza cada elemento con cajas de delimitación (bounding boxes), clasifica la tipología de los bloques (títulos, tablas, ecuaciones matemáticas, firmas) y genera métricas de confianza integradas por palabra y página.

Rendimiento disruptivo y eficiencia en costes

En evaluaciones a ciegas realizadas por anotadores independientes sobre más de 600 documentos complejos en 12 idiomas, OCR 4 fue el preferido en el 72% de los casos frente a los sistemas de Document AI líderes del mercado. El modelo ha consolidado además el primer puesto en el benchmark público OlmOCRBench con una puntuación de 85.20.

Más allá de la precisión técnica, el modelo destaca por su optimización en entornos de producción a gran escala. Empresas de analítica e ingeniería de software que implementaron el sistema de forma temprana reportaron precisiones equivalentes a los costosos parsers «agénticos», pero operando con una latencia 17 veces menor y un coste aproximadamente 8 veces más bajo.

Características clave del lanzamiento:

  • Soporte Multilingüe Masivo: Cobertura total para 170 idiomas a través de 10 grupos lingüísticos, demostrando un rendimiento superior en lenguas especializadas o de bajos recursos (como el hindi, japonés, bengalí, hebreo o georgiano) donde otros sistemas degradan su precisión.
  • Control Absoluto de la Infraestructura: El modelo es lo suficientemente compacto como para ser desplegado en un solo contenedor dentro de la propia infraestructura del cliente, respondiendo a las exigencias corporativas de privacidad, residencia y soberanía de datos.
  • Integración con Mistral Search Toolkit: Integrado nativamente en fase de Public Preview como el componente de ingesta del framework de búsqueda de código abierto de Mistral, simplificando la alimentación de conectores de datos indexados.

Flexibilidad de integración y tarifas competitivas

Mistral AI pone a disposición el modelo mediante un único endpoint de API ejecutable bajo dos modalidades comerciales según las necesidades técnicas del cliente:

  1. Modo Extracción Pura (API Estándar): Devuelve la respuesta cruda con coordenadas, bloques y texto formateado en Markdown. Tiene un coste de $4 por cada 1,000 páginas, con un descuento del 50% si se procesa a través de la API por lotes (Batch API), reduciendo la tarifa a $2 por cada 1,000 páginas.
  2. Document AI: Capa avanzada que permite moldear la salida de la extracción directamente hacia un esquema JSON personalizado mediante instrucciones guiadas por el modelo mistral-small-2603. Esta opción tiene un precio de $5 por cada 1,000 páginas.

Disponibilidad inmediata

Mistral OCR 4 y las funciones avanzadas de Document AI se encuentran disponibles a partir de hoy en las plataformas integradas de Mistral Studio, Amazon SageMaker y Microsoft Foundry, y se sumarán próximamente al catálogo de Snowflake Parse Document.

Para apoyar a los desarrolladores en la adopción del sistema, la compañía ha liberado la guía técnica Getting Started with OCR 4 Cookbook y celebrará un seminario web interactivo (OCR4 in Production) el próximo 7 de julio a las 6:00 PM CET.

Fuente: Mistral