Alibaba представила свою флагманскую модель Qwen-3-Max: конкурент GPT-5

Новая модель от Alibaba стала первой китайской разработкой, преодолевшей планку в триллион параметров и занявшей третье место в мировом рейтинге LMArena, опередив базовую версию GPT-5.

Китайская корпорация Alibaba запустила флагманскую языковую модель, которая бросает вызов американским лидерам в сфере искусственного интеллекта. Система получила более триллиона параметров и была обучена на массиве данных объёмом 36 триллионов токенов.

Разработчики использовали архитектуру Mixture of Experts, которая активирует только нужные блоки сети для каждой задачи, экономя вычислительные ресурсы. Контекстное окно достигает одного миллиона токенов, что позволяет анализировать целые кодовые базы без разделения текста. Благодаря оптимизации PAI-FlashMoE пропускная способность при обучении выросла на 30% по сравнению с предыдущей версией.

Инженеры стабилизировали процесс обучения методом global-batch load balancing loss, что исключило сбои и перезапуски во время тренировки. Технология ChunkFlow обеспечивает трёхкратное ускорение обработки длинных текстов.

В рейтинге LMArena модель Qwen3-Max-Instruct заняла третье место, уступив только Claude Opus 4.1 Thinking, Gemini 2.5 Pro и OpenAI GPT-5 High, но опередив базовую версию GPT-5. В тесте SWE-Bench Verified, проверяющем способности программирования, система набрала 69,6 балла. В испытании Tau2-Bench для ИИ-агентов результат составил 74,8 балла, превзойдя DeepSeek V3.1 и Claude Opus 4.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии