Nvidia достигла «золота» олимпиады по информатике на открытой модели ИИ

Компания Nvidia объявила, что ее система на основе модели с открытыми весами сумела показать уровень золотой медали на Международной олимпиаде по информатике. Ранее аналогичного результата достигала лишь экспериментальная модель OpenAI.

В основе подхода лежит модель gpt‑oss‑120B с открытыми весами. Применяя стратегию Test‑Time Compute (TTC), система генерировала тысячи вариантов решений каждой задачи, отбирала наиболее перспективные и группировала их по поведению. Затем между группами решений устраивался «турнир», и лучшие отправлялись в олимпийскую систему. При этом полностью соблюдались правила олимпиады: две соревновательные сессии по 5 ч, три задачи за сессию и лимит в ~50 посылок на задачу.

Подход Nvidia получил название GenCluster. Он показывает, что рост качества не обязательно идет через увеличение величины модели или объем дообучения. Можно перераспределить вычисления — потратить больше времени и разнообразия на этап вывода, тогда модель начинает «думать дольше» и решать сложные задачи, которые раньше считались прерогативой экспериментальных закрытых систем.

По данным NVIDIA, на решение одной задачи уходило до ~5 000 генераций. Важно, что gpt-oss-120B — это архитектура смешения экспертов (Mixture of Experts): на каждом токене активно около 5,1 млрд из ~120 млрд параметров, что снижает стоимость одного прогона. Публичных сравнений вычислительных бюджетов нет, поэтому нельзя исключать, что суммарные затраты у NVIDIA были сопоставимы с экспериментальной моделью OpenAI, а может и ниже.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”