Пользователи X обнаружили в коде приложения DeepSeek плейсхолдер для версии DeepThink, в которой модель, предположительно, будет тратить больше ресурсов на рассуждения.
Первыми моделями с похожим режимом были OpenAI o1-Pro и o3-Pro — эти модели просто тратили на цепочку рассуждений очень большое время, до десятков минут. Сейчас разработчики сменили подход: в Gemini 2.5 DeepThink, Grok 4 Heavy и GPT-5-Pro запускается несколько копий модели, которые параллельно работают над разными вариантами ответа. Затем специальный модуль выбирает лучший ответ или комбинирует его из нескольких. Какой подход будет использован в DeepSeek DeepThink — пока не известно.
Также на LMArena появились две тестовые модели, которые в диалоге называют себя DeepSeek-V3. V3 — текущая версия DeepSeek без режима рассуждений, но в тестовых моделях обычно скрывают настоящее название.
DeepSeek-R1 в последний раз обновлялся 28 мая, с тех пор поклонники китайского ИИ ждут абсолютно новую версию R2. По слухам, ее тренировка задержалась из-за неуспешной попытки перейти на китайские чипы Huawei Ascend, но сейчас модель готовят к релизу, который намечен на осень. Появление тестовых моделей может означать, что разработчики выбирают между несколькими чекпоинтами готовой версии и собирают оценки пользователей.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com