1 миллион долларов получит тот, кто научит ИИ решать математические задачи

Недавно на известной площадке для ML-соревнований Kaggle был запущен конкурс AI Mathematical Olympiad. Его участники пытаются научить модели искусственного интеллекта решать задачи по математике, записанные в формате LaTeX, на уровне человека. Сложность задач соответствует уровню международной математической олимпиады для учеников старших классов International Mathematical Olympiad (IMO). Оттуда же позаимствовано и название соревнования.

В конкурсе принимают участие уже более 800 человек и 750 команд. Суммарный призовой фонд составляет $1,048,576 и будет распределен между пятью победителями. Организатором выступает одноименный фонд AIMO Prize, бюджет которого составляет $10,000,000. Он был учрежден, чтобы стимулировать открытую разработку ИИ-моделей, которые способны математически рассуждать на уровне человека.

Предоставленные участниками решения тестируются на 110 уникальных задачах. Чтобы избежать так называемой test-train утечки данных, они были придуманы экспертами специально для соревнования и сейчас засекречены. В решениях участникам разрешено использовать открытые предобученные LLM. В разделе Code уже можно увидеть подходы, основанные на следующих моделях:

DeepSeekMath. Лидирующая по количеству использований в соревновании и к тому же самая свежая модель, заточенная специально под математические задачи. Разработана исследователями из китайской лаборатории DeepSeek в начале 2024 года. Модель достигает поразительного результата в 51.7% на бенчмарке MATH, не уступая уровню сильнейших закрытых Gemini-Ultra и GPT-4.

Кроме того, из статьи о DeepSeekMath можно подчеркнуть множество светлых идей по сбору данных, методам файнтюнинга и обучению с подкреплением, которые могут оказаться очень полезными в борьбе за миллион долларов. Вот тут можно прочитать полный и понятный разбор этой работы на русском языке.

Llemma – еще LLM для математических задач. Недавно выпущена учеными из Принстона. Обучена на миллионах образцов кода и статей, на 4-shot решила 43% задач из MATH.

MathBERT для анализа математических формул.

Gemma, Mixtral, Llama и другие LLM, которые не были специально обучены решать математические задачи, но хорошо подходят для файнтюнинга.

Соревнование завершится через месяц. Подать заявку, ознакомиться с решениями других участников и представить свое можно на странице конкурса на Kaggle.

Еще больше интересных новостей, мемов и обзоров из мира ML можно найти в нашем тг-канале: t.me/data_secrets. Подпишитесь, чтобы ничего не пропустить.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”