GPT-5 Pro помог математику закрыть задачу оптимизации, существовавшую 42 года

Профессор математики Эрнест Рю из Калифорнийского университета в Лос-Анджелесе рассказал, что вместе с моделью GPT-5 Pro смог закрыть задачу оптимизации, которую считали нерешенной больше 40 лет. Речь идет о сходимости ускоренного метода Нестерова — одного из базовых алгоритмов выпуклой оптимизации, предложенного в 1983 году. По словам Рю, GPT-5 Pro предлагала кандидаты на ключевые математические конструкции, а он отбирал рабочие и оформлял строгие теоремы. Решение описано в трех ветках X: первая, вторая, третья.

Рю использовал GPT-5 Pro, чтобы построить убывающие энергетические функции — по сути, математические индикаторы, которые должны только уменьшаться и тем самым «прижимать» траекторию алгоритма к решению. С их помощью он доказал две ключевые вещи. Во-первых, что траектория в непрерывной модели ускоренного спуска (так называемое дифференциальное уравнение Нестерова) действительно не разъезжается по множеству минимумов, а стабилизируется в одной точке. Во-вторых, что то же самое верно и для реального дискретного алгоритма Нестерова, который используется в оптимизации на практике: последовательности итераций сходятся к одному минимуму при стандартных мягких условиях (функция выпуклая, гладкая, с липшицевым градиентом и с существующим минимумом). По словам Рю, аналогичную технику он применил и к более современному ускоренному методу OGM, показав его сходимость тем же способом.

По описанию Рю, работа шла как исследовательская сессия: он ставил подзадачи и просил GPT-5 Pro предложить путь — например, какую именно энергию ввести, какую лемму сформулировать, как перенести рассуждение из непрерывного времени в дискретные шаги алгоритма. Около 80% предложений модели были неправильными или бесполезными. Но оставшиеся 20% дали новые зацепки, которые он развил до полноценного доказательства. В его формулировке, без такой «машины перебора» он бы, скорее всего, бросил попытку за три дня — просто потому что руками перебирать столько вариантов слишком тяжело. С моделью — менее недели и около 30 часов его личной работы.

Сейчас Рю готовит препринт с полным доказательством для выкладки на arXiv и собирается отправить работу в рецензируемый журнал. По его словам, это «не история про то, что ИИ заменит математика», а про то, что больше не обязательно по неделе вручную перебирать десятки вариантов лемм и вспомогательных конструкций. Он отдельно призвал исследователей — не только в оптимизации, но и в других областях — начинать использовать модели ИИ как ускоритель перебора идей и черновиков доказательств, в то время как человек остается тем, кто проверяет корректность и собирает финальную теорему.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии