Вчера, 23 июня, компания Mistral AI официально представила миру OCR 4 — новую модель, отвечающую за точное извлечение текстового контента. Представители бренда рассказали, что их новая разработка может похвастаться рядом преимуществ, которых нет у конкурирующих систем. Начать стоит с того, что эту модель можно запускать в том числе на собственной инфраструктуре, так как OCR 4 является достаточно компактным решением для развёртывания в рамках одного контейнера. Это, по словам компании, позволяет обеспечить необходимую конфиденциальность данных и высокую производительность пакетной обработки данных. Telegram-канал создателя Трешбокса про технологии
Второе важное преимущество новой модели — поддержка 170 языков в 10 языковых группах. Представители компании заявили, что они заметно улучшили распознавание и извлечение текста для специализированных языков и языков, представленных с ограниченными ресурсами. В данном направлении конкурирующие решения, по данным Mistral AI, демонстрируют заметное снижение производительности. Третьим же важным преимуществом новой модели выступает продвинутая сегментация текстового контента. Суть в том, что OCR 4 умеет не только извлекать текст, но и классифицировать контент по типизированным блокам. Изображения: Mistral AI
То есть система умеет распознавать заголовки, таблицы, уравнения, различные подписи и многое другое, что положительно сказывается на финальном качестве извлечённого контента. Всё это позволило новой модели продемонстрировать очень высокую точность работы — в бенчмарке OlmOCRBench система демонстрирует 85% точности, а в Crawl Multilingual модель набирает 98%. Это впечатляющий результат, особенно с учётом того, что некоторые довольно мощные конкуренты набирают заметно меньше. Изображение: Mistral AI
Более того, независимые тесты показывают, что пользователи в рамках слепых тестов обычно отдают предпочтение именно OCR 4. Весьма примечательно, что в этом плане модель заметно обходит лидеров рынка — GPT 5.5 Pro, Gemini 3.1 Pro Preview, Azure Doc Intel и AWS Textract. Изображение: Mistral AI
При этом, что немаловажно для конечного пользователя, новую модель можно назвать относительно недорогой по современным меркам. На официальном сайте компании указано, что в режиме OCR за 1000 страниц извлечённого текста придётся заплатить всего 4 доллара. Если модель в реальных сценариях работы демонстрирует ту точность, которая показана на графиках, это очень даже недорого.
Источник: trashbox.ru