Нейросетевая модель GigaChat Pro получила значительное обновление, добавив возможность распознавания изображений. Теперь пользователи могут отправлять фотографии, чтобы получить полезную информацию о людях на фото, их одежде и советы по стилю.
Кроме того, GigaChat Pro научился распознавать как печатный, так и рукописный текст, включая формулы и графики. Студенты могут, например, загрузить изображение конспекта и получить его краткое содержание, ключевые темы и план для дальнейшей работы.
Для бизнес-клиентов функциональность доступна через API, позволяя модерировать отзывы, систематизировать контент и автоматизировать поддержку клиентов. Ретейлеры смогут загружать изображения товаров и получать продающие описания.
Также увеличен размер контекста моделей GigaChat Pro и GigaChat Lite — с 8 тыс. до 32 тыс. токенов. Теперь в один запрос можно загрузить текст, сопоставимый с 60 страницами A4, что позволяет поддерживать более длинные диалоги и реализовывать сложные сценарии.
Андрей Белевцев, старший вице-президент Сбербанка, подчеркнул, что мультимодальность является ключевым трендом в развитии генеративного искусственного интеллекта и открывает новые возможности для пользователей и бизнеса.
Источник: www.ferra.ru