Qwen3-30B-A3B — маленькое обновление, большое ускорение

Обновлённая версия Qwen3-30B-A3B со значительными улучшениями в общих возможностях, включая выполнение инструкций, логическое мышление, понимание текста, математику, естественные науки, программирование и использование инструментов.

Эта модель MoE использует 3.3B активированных параметров от 128 экспертов, из которых 8 активны в любой момент времени. По сравнению с оригинальной Qwen3-30B-A3B, она обеспечивает существенный прирост объема знаний на нескольких языках и заметно лучшее соответствие предпочтениям пользователей в субъективных и открытых задачах.

Поддерживает контекст длиной до 262 144 токенов.

Расширенные возможности агента и поддержка более 100 языков и диалектов.

Примечание: для этой модели Qwen полностью отказались от   — теперь только быстрый «non-thinking» режим.

С 3B активных параметров Qwen3-30B-A3B уже приближается к уровню GPT-4o и Qwen3-235B-A22B NT, при этом модель доступна для локального запуска.

Попробовать https://chat.qwen.ai/?model=Qwen3-30B-A3B-2507HF: https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507-FP8ModelScope: https://modelscope.cn/models/Qwen/Qwen3-30B-A3B-Instruct-2507

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии