OpenAI выпустила o1 — свою первую модель со способностью рассуждать

OpenAI выпустила свою новейшую генеративную модель под названием o1. Это первая ласточка в запланированной серии «рассуждающих» нейросетей, обученных отвечать на сложные вопросы быстрее людей. Её представили вместе с o1-mini — меньшей и более дешёвой версией. Судя по всему, это и есть разрекламированный проект Strawberry, который, как сообщалось, был засекречен даже внутри компании.

Это очередной шаг создателей ChatGPT к своей ключевой цели — созданию искусственного интеллекта, сравнимого с человеческим разумом. Если говорить о практических новшествах, то новинка лучше справляется с написанием кода и решением многошаговых задач по сравнению с предшественниками. Но она также дороже и медленнее. Поэтому для повседневных дел лучше использовать старые инструменты.

Модель также способна самостоятельно исправлять ошибки, используя технику обучение с подкреплением (Reinforcement Learning, RL) — систему поощрений и штрафов. Ещё она умеет запускать «цепочку мыслей» для обработки запросов, подобно тому, как люди справляются с трудностями — шаг за шагом. Другими словами, она сама может проверять себя и делать определённые выводы на будущее, сохраняя их в своей памяти. При всём этом полностью избавиться от галлюцинаций ещё не удалось, признались разработчики. Проблема остаётся, но уже в гораздо меньшей степени.

Зато в математике она уже почти как рыба в воде. Для сравнения: GPT-4o правильно решила только 13% задач из программы Международной математической олимпиады, а o1 набрала 83%.

Она определённо лучше справляется с тестом по математике AP, чем я, а я изучал математику в колледже.

Боб МакГрю

Главный научный сотрудник OpenAI

Обучение, лежащее в основе o1, принципиально отличается от предыдущих методов, рассказал руководитель исследований в компании Джерри Творек. С ней использовали другие алгоритмы и новый набор данных. Компания называет релиз «предварительным просмотром», чтобы подчеркнуть, что она ещё молода.

Пользователи ChatGPT Plus и Team получают o1 и o1-mini уже сегодня. Клиенты Enterprise и Edu смогут начать испытывать их в начале следующей недели. Позже OpenAI обещает сделать «мини» общедоступной.

Источник: lifehacker.ru

0 0 голоса

Рейтинг новости

22032

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”