Alibaba выпустила Qwen3-VL-2B и Qwen3-VL-32B

Alibaba выпустила две новые мультимодальные модели — Qwen3-VL-2B и Qwen3-VL-32B. Последняя уже успела привлечь внимание исследователей. Она демонстрирует результаты, сопоставимые и даже превосходящие те, что показывают модели вроде GPT-5 mini и Claude 4 Sonnet, особенно в задачах STEM, визуальных вопросах (VQA), распознавании текста (OCR), анализе видео и агентных сценариях.

Несмотря на «всего» 32 миллиарда параметров, Qwen3-VL-32B уверенно конкурирует с системами в десятки раз крупнее — до 235 миллиардов параметров. На ряде бенчмарков, включая OSWorld, она показывает абсолютное лидерство. Такой результат стал возможен благодаря новой архитектуре с «иерархическим вниманием», которая позволяет эффективно объединять текст, изображение и видео в одном контексте.

Alibaba утверждает, что Qwen3-VL-32B может анализировать кадры в видео последовательно, понимая сюжет и причинно-следственные связи, а не просто описывая изображение. Это делает модель особенно полезной для задач видеоаналитики, автономных агентов и образовательных сценариев, где важна способность рассуждать.

Попробовать обе модели можно уже сейчас через Hugging Face и платформу Qwen Studio, где доступны демо и API для интеграции в собственные продукты.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”