Alibaba представила превью reasoning-версии Qwen3-Max-Thinking

Китайская компания Alibaba представила предварительную версию своей новой модели Qwen3-Max-Thinking, которая позиционируется как экспериментальная reasoning-модификация флагманской линейки Qwen3-Max. Разработка ориентирована на сложные задачи, требующие логического мышления и многошаговых рассуждений.

По внутренним данным, Qwen3-Max-Thinking оснащена 1 триллионом параметров и построена на архитектуре Mixture-of-Experts (MoE), где активируется лишь часть параметров при каждом запросе. Такой подход обеспечивает высокое качество вывода при умеренном потреблении ресурсов.

В тестах модель показала 100-процентные результаты на сложных бенчмарках AIME 2025 и HMMT, которые традиционно используются для проверки способности моделей решать задачи с элементами рассуждения и аналитического анализа.

Alibaba отмечает, что Qwen3-Max-Thinking пока находится на этапе активного обучения, но уже демонстрирует потенциал, сравнимый с закрытыми системами уровня GPT-5 и Gemini 2.5. В Qwen Chat пользователи могут попробовать ранний доступ и сравнить результаты reasoning-модели с обычной Qwen3-Max.

Компания также уточнила, что отдельное внимание уделено устойчивости к ложным выводам и способности к самооценке решений, что делает Qwen3-Max-Thinking ближе к моделям класса метакогнитивных ИИ.

API версии уже доступен в Alibaba Cloud, а официальный релиз полной модели ожидается в начале 2026 года.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии