Мощнее DeepSeek-V3.1 и Qwen3: Alibaba выпустила ИИ с открытым кодом Ling-1T/Ring-1T

Ant Group, входящая в экосистему Alibaba, представила открытые модели Ling-1T (обычная) и Ring-1T (рассуждающая) — самые масштабные open-source-разработки на сегодняшний день. По опубликованным результатам, Ring-1T обгоняет DeepSeek-V3.1-Terminus и Qwen3-235B на многих известных бенчмарках. Модели уже можно загрузить с Hugging Face и протестировать через онлайн-площадку ZenMux.ai.

Базовая Ling-1T — языковая модель на один триллион параметров, построенная по архитектуре Mixture of Experts (смесь экспертов), где одновременно активны около пятидесяти миллиардов весов. По вычислительным затратам она сопоставима с плотной моделью на 50 миллиардов параметров, но обеспечивает заметно более высокие результаты. На ее базе построена рассуждающая версия Ring-1T, обученная на пошаговых рассуждениях и решении задач уровня AIME, ARC-AGI и Codeforces. Оба релиза выложены под лицензией MIT, с полными весами на Hugging Face.

Новинка использует несколько оригинальных приемов: эволюционную цепочку рассуждений Evo-CoT, собственный план обучения WSM без стандартного затухания, оптимизацию внимания и нормализации. Контекст — 32 000 токенов, расширяемый до 128 000. В reasoning-ветке Ring-1T применено обучение с подкреплением (RLHF / RLVR).

По данным разработчиков, Ring-1T достигает 92,6 % на AIME-2025, успешно решает несколько задач из IMO-2025 и превосходит DeepSeek-V3.1 и Qwen-3-235B-Thinking на наборах ARC-AGI-1, HMMT и LiveCodeBench. Пока это внутренняя оценка Ant Group, независимые проверки еще впереди, но заявленные цифры выглядят значительными.

Для локального запуска подходят vLLM и SGLang: разработчики выложили примеры конфигураций для параллельного распределения вычислений и уточнили, что для FP8-версии потребуется около двух терабайт памяти. Сообщество активно экспериментирует с квантованными сборками до трех бит, что делает запуск возможным даже на меньших кластерах.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии