InternLM представила модели CapRL-3B и CapRL-Eval-3B для генерации текста к изображениям

Команда InternLM анонсировала две новые модели — CapRL-3B и CapRL-Eval-3B, предназначенные для создания текстовых подписей к изображениям. По точности работы они сопоставимы с гораздо более крупной моделью Qwen2.5-VL-72B, что делает их особенно интересными для разработчиков, которым нужны мощные, но компактные решения.

Главное преимущество CapRL-моделей — умение качественно обрабатывать сложные визуальные данные. Они особенно хорошо справляются с подписями к диаграммам, инфографике, документам и другим структурированным изображениям, где важны контекст, точность и логичность описания.

Новые модели обучены с применением методов reinforcement learning и системы проверяемых наград, что позволяет генерировать более разнообразные и осмысленные подписи, лучше адаптированные к содержанию изображения. Такой подход даёт моделям возможность не только описывать, но и интерпретировать визуальные объекты, повышая ценность результата для аналитики, образования или автоматической документации.

Важный плюс — лицензия Apache 2.0, которая открывает широкие возможности для коммерческого и исследовательского использования. Это означает, что компании и разработчики могут внедрять CapRL-3B и CapRL-Eval-3B в собственные продукты без сложных ограничений, а также дообучать и адаптировать модели под свои задачи.

Появление таких решений показывает, что компактные модели могут быть не менее мощными, чем гигантские системы, если их правильно обучить. Это делает генерацию подписей к изображениям более доступной, экономичной и удобной для массового применения — от автоматической разметки данных до построения интеллектуальных поисковых систем.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии