На YouTube-канале Sequoia Capital опубликовано интервью с разработчиками экспериментальной модели OpenAI, показавшей результат уровня «золота» Международной математической олимпиады 2025 года (IMO 2025). Идея родилась 6 месяцев назад, а занималась ей команда из трех специалистов — Алекса Вэй, Ноама Брауна и Шерил Сюй. Они поставили перед собой цель не тренировать ИИ конкретно под задачи IMO 2025, а создать модель общего назначения. Одним из ключевых приемов стала система агентов, параллельно работающих над задачей — подробности в OpenAI держат в секрете, но планируют внедрить в будущих коммерческих моделях.
ИИ смог решить 5 из 6 задач — этого достаточно для «золота», но хуже результата лучших школьников, участвовавших в IMO 2025. Для шестой задачи модель не стала печатать ошибочное решение, а признала, что не может справиться — эта особенность демонстрирует пониженную склонность к галлюцинациям.
Все решения ИИ были проверены тремя участниками IMO предыдущих лет. Многие критиковали стиль решений — пусть они и правильны, но были написаны иным языком, чем решения людей-математиков. В OpenAI решили специально не адаптировать их, а показать, как размышляет модель. Ноам Браун рассказал, что ему было интересно наблюдать за «эмоциями» ИИ во время работы — он признавал ситуации, когда был не уверен, и отмечал, когда находил правильное решение.
Решение задач IMO потребовало от модели навыка самостоятельно работать на протяжении полутора часов — дольше, чем текущие коммерческие ИИ. Но впереди большой путь, ведь уровень научного открытия в математике — это тысячи часов работы. Для этого потребуются не только вычислительные ресурсы, но и человеческие — кому-то надо будет потратить тысячи часов на проверку. А отдельным вызовом в OpenAI видят олимпиаду по физике — ведь там надо проводить практические опыты.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com