OpenAI представила модель искусственного интеллекта o1 с уровнем рассуждений доктора наук

Компания OpenAI представила новую серию языковых моделей искусственного интеллекта под названием o1, разработанных специально для улучшения возможностей рассуждения, особенно в сложных вопросах науки, программирования и математики. Компания настолько уверена в этих достижениях, что обнулила счётчик версий модели до единицы, начав заново после GPT-4o, и заметно отошла от бренда GPT.

Первая модель серии o1, получившая название o1-preview, доступна как в ChatGPT, так и в API OpenAI. Несмотря на статус предварительной версии, компания обещает регулярные обновления и улучшения.

Модели o1 были обучены улучшать свой подход к решению задач, тратя больше времени на анализ проблемы, прежде чем предложить ответ. Этот метод позволяет моделям экспериментировать с различными стратегиями, выявлять собственные ошибки и решать сложные задачи более систематичным, человекоподобным способом.

Результаты, представленные OpenAI, свидетельствуют о значительном прогрессе новых моделей o1. По данным компании, эти модели демонстрируют уровень производительности, сравнимый с аспирантами в сложных тестах по физике, химии и биологии.

Например, модель достигла 83% точности в тесте, который позволяет студентам пройти квалификацию на Международную математическую олимпиаду, что является заметным улучшением по сравнению с 13% точностью GPT-4o.

Конечно, тесты искусственного интеллекта иногда могут быть ненадёжными, поэтому истинная производительность моделей o1 станет яснее, когда больше пользователей протестируют их в различных сценариях.

Кроме того, новые модели, похоже, разрешают некоторые давние вопросы, например, количество букв «р» в слове «strawberry» (клубника), наконец-то положив конец мемам. OpenAI также продемонстрировала пример, где модель успешно сгенерировала код Python для аркадной игры, подчеркнув свои передовые возможности.

Помимо повышения возможностей рассуждения, OpenAI также сосредоточилась на усилении защиты от «взлома», метода, используемого для обхода механизмов безопасности. По данным компании, так называемая o1-preview набрала 84 балла из 100 в одном из самых сложных тестов на взлом, по сравнению с 22 баллами у GPT-4o.

Чтобы сделать эти модели более доступными, особенно для разработчиков, OpenAI также выпускает облегчённую версию o1-mini, предназначенную для задач программирования.

Доступ к o1-mini и o1-preview в настоящее время открывается для платных подписок ChatGPT Plus и Teams.

Источник: overclockers.ru

0 0 голоса

Рейтинг новости

20908

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”