Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

Компания Tencent выпустила новую языковую модель Hunyuan-A13B с открытым исходным кодом. В основе модели лежит динамический подход к анализу информации, который позволяет модели адаптироваться и выбирать наиболее эффективный способ решения задачи в зависимости от её сложности.

Ключевой особенностью Hunyuan-A13B является способность адаптировать глубину логического вывода в режиме реального времени. Для простых запросов используется быстрый режим, который позволяет получать ответы с минимальным логическим выводом.

Для сложных запросов активируется более глубокий процесс мышления, включающий многоэтапную обработку информации. Пользователи могут переключаться с помощью специальных команд: /think включает режим углублённой обработки, а /no_think отключает его.

Модель использует архитектуру «смесь экспертов» (Mixture of Experts, MoE) с 80 миллиардами общих параметров, но во время логического вывода активны только 13 миллиардов. Она поддерживает контекстные окна размером до 256 000 токенов.

Сосредоточение внимания на научных рассуждениях

Согласно техническому отчёту Tencent, модель Hunyuan-A13B была обучена на 20 триллионах токенов, затем настроена для решения логических задач и доработана для более широкого спектра применения. Tencent собрала 250 миллиардов токенов из областей STEM, чтобы повысить надёжность модели при решении научных задач.

Обучающие данные включают в себя учебники по математике, экзаменационные работы, открытый исходный код с GitHub, сборники логических задач и научные тексты от средней школы до университетского уровня.

Tencent утверждает, что Hunyuan-A13B-Instruct может конкурировать с ведущими моделями OpenAI, Deepseek и Qwen от Alibaba. На американском математическом конкурсе AIME в 2024 году модель показала точность 87,3% по сравнению с 74,3% у OpenAI o1.

Однако, если проанализировать итоги 2025 года, то можно заметить, что подобные сопоставления не всегда дают однозначный результат — в этом случае o1 опережает своего конкурента на 3%. Tencent также опирается на устаревшую январскую версию Deepseek-R1 для сравнения, хотя майская версия показала значительно более высокие результаты в AIME 2024 и 2025, набрав 91,4 и 87,5 баллов соответственно.

Тесты показывают, что Hunyuan-A13B не отстаёт от Deepseek-R1, OpenAI o1 и Qwen3-A22B, а в задачах на основе агентов даже опережает их

Tencent утверждает, что модель отлично справляется с автоматизированными задачами и использованием инструментов. Во внутренних тестах A13B показал наилучшие результаты почти во всех тестах агентов. Даже при тестировании контекстов с 128 000 токенов производительность Hunyuan-A13B оставалась выше, чем у Deepseek-R1 и Qwen3-A22B, хотя и уступала Gemini 2.5 Pro.

Производительность остаётся стабильной даже при использовании контекстных окон до 128 000 токенов

Модель доступна по лицензии Apache 2.0 на Hugging Face и GitHub с готовыми к использованию образами Docker для различных платформ развертывания. Доступ к API предоставляется через Tencent Cloud и демонстрационную версию для браузера.

Компания Tencent также выпустила два новых набора эталонных данных: ArtifactsBench для генерации кода и C3-Bench для оценки задач агентов.

Стратегия динамического мышления Tencent соответствует тенденциям, наблюдаемым в других ведущих лабораториях в области ИИ. Концепция переключения между различными режимами мышления перекликается с последними моделями, такими как Claude 3.7 Sonnet и Qwen3, которые также поддерживают адаптивное мышление.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Перевод, оригинальная новость здесь.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии