OpenAI представила новую модель — o1, которая значительно лучше GPT-4o

Компания OpenAI официально представила свой новый продукт — генеративную модель искусственного интеллекта под кодовым названием Strawberry, которая официально называется OpenAI o1.

Если говорить более точно, o1 — это коллекция моделей. Две из них уже доступны сегодня в ChatGPT и через API OpenAI: o1-preview и o1 mini (более компактная и дешевая модель). Чтобы получить доступ, вы должны быть подписаны на ChatGPT Plus или Team. Пользователи Enterprise и Edu получат доступ в начале следующей недели.

Обратите внимание, что на данный момент возможности чат-бота o1 довольно ограничены. O1 не может просматривать веб-страницы или анализировать файлы (пока). Он ограничен по скорости — в настоящее время недельные лимиты составляют 30 сообщений для o1-preview и 50 для o1-mini. И модели o1 стоят дорого. В API o1-preview стоит 15$ за 1 миллион входных токенов (в 3 раза дороже GPT-4o) и 60; за 1 миллион выходных токенов (в 4 раза дороже GPT-4o).

OpenAI заявляет, что планирует предоставить доступ к o1-mini всем пользователям ChatGPT, но пока не назначила дату релиза.

По мнению OpenAI, o1 избегает некоторых подводных камней в рассуждениях, которые обычно ставят в тупик генеративные модели ИИ. Это связано с тем, что o1 может эффективно проверять факты, уделяя больше времени рассмотрению всех частей команды или вопроса.

В OpenAI говорят, что o1, появившийся в результате внутреннего проекта компании, известного как Q, особенно хорошо справляется с задачами, связанными с математикой и программированием. Но что качественно отличает o1, работающего только с текстом, от других генеративных моделей ИИ, так это его способность «думать», прежде чем отвечать на запросы.

Когда o1 дается дополнительное время на размышления, она может рассматривать задачу комплексно — планировать ее наперед и выполнять ряд действий в течение длительного периода времени, что помогает ему прийти к ответу. Благодаря этому o1 хорошо подходит для задач, требующих синтеза результатов множества подзадач.

“O1 обучается с помощью обучения с подкреплением, которое учит систему с помощью поощрений и наказаний думать, прежде чем ответить, с помощью частной цепочки мыслей”, — поделился Ноам Браун, научный сотрудник OpenAI.

По утверждению OpenAI, на отборочном экзамене Международной математической олимпиады для старшеклассников, o1 правильно решил 83 % задач, в то время как GPT-4o — только 13 %.

В целом, по словам OpenAI, o1 должен лучше справляться с задачами по анализу данных, науке и кодированию.

Правда, есть и обратная сторона: o1 может работать медленнее, чем другие модели, в зависимости от запроса. На ответы на некоторые вопросы у модели может уходить более десяти секунд. К счастью, версия o1 для чат-ботов показывает свой прогресс, отображая метку для текущей подзадачи, которую она выполняет.

Учитывая непредсказуемую природу генеративных моделей ИИ, у o1, вероятно, есть и другие недостатки и ограничения. Ноам Браун признался, что o1 также ошибается в игре «крестики-нолики», и не отвечает так же хорошо, как другие модели, на вопросы о фактических знаниях.

Интересно, что OpenAI могла бы показать пользователям необработанные «цепочки мыслей» o1, но решила отказаться от этого, предпочтя «сгенерированное моделью резюме». Почему? В своем блоге компания сообщила, что одной из причин стало «конкурентное преимущество».

«Мы признаем, что у этого решения есть недостатки. Мы стараемся частично компенсировать их, обучая модель воспроизводить в ответе любые полезные идеи из цепочки размышлений» — пишет OpenAI.

OpenAI может быть первым, кто выпустит o1. Но если предположить, что конкуренты вскоре последуют их примеру с сопоставимыми моделями, то настоящим испытанием для компании станет широкая доступность o1.

Источник: habr.com

0 0 голоса

Рейтинг новости

22255

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”