DeepSeek V3.1 выпущен официально. Дешевая модель с улучшенными агентскими функциями

В X-аккаунте DeepSeek опубликован подробный анонс новой модели V3.1 на английском языке — сама модель доступна уже два дня. Разработчики называют обновленную модель «первым шагом в эру агентов», что подтверждается бенчмарками:

Заметный рост виден в SWE-bench (агентская работа с репозиторием) и Terminal Bench (работа с командной строкой):

С выходом новинки заканчивается эра отдельной рассуждающей ветки R1 — V3.1 может работать как в режиме быстрых ответов, так и в рассуждающем. При этом на рассуждения модель тратит на 28-46% меньше токенов, чем R1, что положительно влияет на скорость ответа.

С 5 сентября вступают в силу новые цены на модель в API: 1M исходящих токенов обойдется в $1,68, а 1M входящих — в $0,07 (кэшированный запрос) / $0,56 (без кэша). Это означает рост цен для «быстрой» модели, но снижение для рассуждающей, которое будет еще значительнее, если учесть меньший расход токенов. К сожалению, вместе с новыми тарифами будет отменена ночная скидка на доступ к API. Напомню, что в веб-версии и мобильных приложениях DeepSeek V3.1 доступен совершенно бесплатно.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии