Alibaba представила Qwen3-Next-80B: мощнее, быстрее и дешевле

Alibaba сделала громкий шаг в гонке искусственного интеллекта, представив Qwen3-Next-80B-A3B — модель, которая сочетает мощность в 80 миллиардов параметров с революционной эффективностью. В отличие от традиционных гигантов, новая архитектура активирует лишь около 3 миллиардов параметров на каждый токен, что делает обучение и инференс в десять раз дешевле и быстрее, чем у прошлой Qwen3-32B. Особенно впечатляюще модель проявляет себя при работе с текстами сверхдлинного формата — от 32 тысяч токенов и выше.

В основе Qwen3-Next-80B-A3B лежит гибридная архитектура Gated DeltaNet + Gated Attention, которая объединяет точность и скорость. Дополняет её ультраразреженная схема Mixture-of-Experts: 512 экспертов, из которых одновременно задействуется лишь десять и один общий. Такой подход позволяет распределять вычислительные ресурсы максимально рационально, включаются только те модули, которые нужны здесь и сейчас.

Модель также поддерживает Multi-Token Prediction, то есть умеет предсказывать сразу несколько слов вперёд и быстро их проверять. Это обеспечивает более высокую скорость генерации текста без потери качества. В тестах Qwen3-Next-80B-A3B уверенно обходит Qwen3-32B, а в задачах рассуждений и анализа длинного контекста приближается к результатам флагмана Qwen3-235B, который стоит на порядок дороже в эксплуатации.

Особенно выделяются специализированные версии. Qwen3-Next-80B-A3B-Instruct почти достигла уровня качества 235B-модели, а Qwen3-Next-80B-A3B-Thinking сумела превзойти даже Google Gemini-2.5-Flash-Thinking в задачах рассуждений. Это делает новинку одним из самых интересных релизов 2025 года в области больших языковых моделей.

Qwen3-Next-80B-A3B уже доступна на платформах Qwen Chat, HuggingFace, ModelScope, Kaggle и в облаке Alibaba Cloud.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Подробнее

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии