Представлено обновление для модели Qwen3-235B-A22B. Это MoE модель где 235B параметров из которых 22B активны. Упор сделан на убирание гибридного режима работы, оставив только не размышляющий режим, и увеличение размера контекста до 256к.
Гибридный режим, когда у модели можно было включить или выключить размышления через /think и /no_think, не нравился пользователям, скорость работы think было слишком медленным при запуске на ОЗУ, и пользователи предпочитали no_think режим, качество которого страдало из-за гибридного режима, поэтому разработчики приняли решение разделить это по разным моделям.
По бенчмаркам, сравнивая старую и новую версии, в целом видно, что разделение режимов хорошо сказалось на качестве.
Размер контекста увеличен с 32к (128к с YaRN) до нативных 256к. Разработчики выпускают эту модель в качестве тизера перед большим обновлением.
Веса: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507
gguf кванты: https://huggingface.co/unsloth/Qwen3-235B-A22B-Instruct-2507-GGUF
SOTA gguf кванты: https://huggingface.co/ubergarm/Qwen3-235B-A22B-Instruct-2507-GGUF
Попробовать онлайн: https://chat.qwen.ai/ или https://openrouter.ai/qwen/qwen3-235b-a22b-07-25:free
Источник: habr.com