Alibaba представила превью reasoning-версии Qwen3-Max-Thinking

Китайская компания Alibaba представила предварительную версию своей новой модели Qwen3-Max-Thinking, которая позиционируется как экспериментальная reasoning-модификация флагманской линейки Qwen3-Max. Разработка ориентирована на сложные задачи, требующие логического мышления и многошаговых рассуждений.

По внутренним данным, Qwen3-Max-Thinking оснащена 1 триллионом параметров и построена на архитектуре Mixture-of-Experts (MoE), где активируется лишь часть параметров при каждом запросе. Такой подход обеспечивает высокое качество вывода при умеренном потреблении ресурсов.

В тестах модель показала 100-процентные результаты на сложных бенчмарках AIME 2025 и HMMT, которые традиционно используются для проверки способности моделей решать задачи с элементами рассуждения и аналитического анализа.

Alibaba отмечает, что Qwen3-Max-Thinking пока находится на этапе активного обучения, но уже демонстрирует потенциал, сравнимый с закрытыми системами уровня GPT-5 и Gemini 2.5. В Qwen Chat пользователи могут попробовать ранний доступ и сравнить результаты reasoning-модели с обычной Qwen3-Max.

Компания также уточнила, что отдельное внимание уделено устойчивости к ложным выводам и способности к самооценке решений, что делает Qwen3-Max-Thinking ближе к моделям класса метакогнитивных ИИ.

API версии уже доступен в Alibaba Cloud, а официальный релиз полной модели ожидается в начале 2026 года.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”