ИИ будет думать быстрее: Meta* показала технологию DeepConf

Meta* AI совместно с Университетом Калифорнии в Сан-Диего представили новый метод DeepConf (Deep Think with Confidence), который позволяет языковым моделям быстрее и эффективнее справляться с задачами, требующими логических рассуждений и математических вычислений. В отличие от традиционных подходов, где несколько вариантов решения оцениваются одинаково, даже если часть из них ошибочны, DeepConf использует внутренние сигналы уверенности модели.

Слева: метрики либо проверяют весь ответ, либо фокусируются на отдельных разделах, например, на заключении. Справа: двухэтапный процесс DeepConf сначала отфильтровывает пути с низкой достоверностью, а затем выбирает окончательный ответ путем взвешенного голосования среди наиболее сильных кандидатов.

За счёт анализа распределения вероятностей следующего токена система может определять, какие цепочки рассуждений с большей вероятностью приведут к правильному результату, и отдавать им приоритет. Такой подход сокращает вычислительные затраты, позволяя отбрасывать слабые варианты ещё в процессе генерации.

Когда модель говорит что-то вроде «Подождите, позвольте мне перепроверить», рассчитанная уверенность падает. Если она опускается ниже порога (s), DeepConf обрезает этот путь решения, вместо того, чтобы позволить ему завершиться.

Метод работает в двух режимах: offline, когда все возможные варианты сначала генерируются, а затем фильтруются, и online, где уверенность оценивается на лету, а бесперспективные цепочки обрываются заранее.

Эти диаграммы показывают точность в зависимости от вычислительных затрат. DeepConf (зеленый) достигает максимальной точности, используя гораздо меньше токенов, чем голосование большинством (коричневый), постоянно превосходя базовый уровень.

Тесты на математических бенчмарках, включая AIME 2024/2025 и GPQA-Diamond, показали, что DeepConf не только повышает точность, но и существенно сокращает количество вычислений. Например, в связке с моделью GPT-OSS-120B метод достиг 99,9% точности на AIME 2025 при сокращении числа токенов почти на 85% по сравнению со стандартными методами.

Таким образом, DeepConf открывает путь к более рациональному использованию ресурсов в больших языковых моделях, делая их работу быстрее и надёжнее без потери качества вывода.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

*Meta признана экстремистской организацией и запрещена на территории РФ

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”