Модель научилась сама решать, когда ей нужен поиск в интернете, а когда запуск программного кода, и при этом обходится в пять раз дешевле западных аналогов.
Alibaba обновила свою флагманскую модель ИИ — теперь Qwen3-Max-Thinking доступна всем пользователям в чат-боте Qwen Chat и через API. Система показывает результаты, сравнимые с GPT-5.2-Thinking, Claude Opus 4.5 и Gemini 3 Pro, а в некоторых тестах даже опережает их.
Главная фишка обновления — автоматический выбор инструментов. Раньше пользователю приходилось вручную указывать, нужен ли модели доступ к интернету или возможность запускать код. Теперь система сама определяет, какой инструмент поможет решить задачу. Например, если вопрос требует свежих данных, она подключит веб-поиск. Если нужны вычисления — запустит интерпретатор кода, а если важен контекст прошлых диалогов — обратится к памяти.
Такой подход снижает количество ошибок и выдуманных фактов. В тесте HLE с использованием инструментов Qwen3-Max-Thinking набрала 49,8 балла — это лучше, чем у GPT-5.2 (45,5) и Gemini 3 Pro (45,8). Модель сама понимает, когда ей не хватает информации, и восполняет пробелы без лишних запросов к пользователю.
Также у модели появилась стратегия «накопления опыта» при решении сложных задач. Обычно ИИ-модели запускают несколько параллельных попыток найти ответ, но часто эти попытки дублируют друг друга. Qwen3-Max-Thinking работает иначе: она анализирует каждую попытку, извлекает ключевые выводы и использует их в следующем раунде. Это позволяет не тратить вычислительные ресурсы на повторы и сосредоточиться на нерешенных вопросах.
Источник: hi-tech.mail.ru