OpenAI выпустила модель с открытыми весами, которая почти не уступает o3

Впервые с GPT-2 OpenAI выпустила open source модель под названием GPT-OSS (доступна здесь и здесь). Модель распространяется по лицензии Apache 2.0. В семействе модели на 20B и 120B параметров, при этом используется архитектура «экспертов», когда запускаются только те части модели, которые действительно нужны для ответа на вопрос. Благодаря этому, младшая версия идет на видеокартах с 16 ГБ памяти, а «старшей» требуется профессиональный ускоритель с 80 ГБ.

Модель поддерживает цепочку рассуждений, которую можно настраивать, регулируя скорость ответа. Цепочка рассуждений полностью читаема, что полезно для тонкой настройки модели. Как и в случае с закрытой GPT o3, в цепочке рассуждений доступен вызов инструментов вроде веб-поиска и Python. А вот мультимодальность отсутствует — графику и звук модель не понимает.

Но больше всего впечатляет производительность модели в популярных бенчмарках:

Старшая версия показывает уровень, близкий к передовым на данный момент моделям OpenAI o3 и o4-mini — а в AIME 2024 даже превосходит их. Младшая версия отстает незначительно — а ведь это модель, которую можно запустить на игровой видеокарте.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”