Alibaba представила метод CoRT, который помогает языковым моделям рассуждать с помощью кода. Идея проста — ИИ учат не просто выдавать ответ, а решать задачи как программист. Если нужно вычисление, модель сама решает, стоит ли вызывать Python, и делает это осознанно.
Во время обучения в текст рассуждения вставляются подсказки вроде «давай используем Python» или «проверка не требуется». Такой подход называется Hint-Engineering. Точность в математике выросла на восемь процентов, а количество использованных токенов сократилось почти наполовину.
Даже небольшие модели теперь сопоставимы с системами, у которых есть встроенные инструменты вычислений. В одном из тестов CoRT-модель сама нашла библиотеку RDKit и решила задачи по химии, которых не было в обучающем наборе.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник
Источник: habr.com