OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o

Фото: PatrickAssale / Shutterstock

12 сентября 2024 года OpenAI представила новую модель OpenAI o1, которая способна буквально «думать» как человек. Эта модель не просто генерирует текст на основе данных, а строит логические рассуждения, анализирует задачи и улучшает ответы, что делает ее в 5–6 раз производительнее предыдущей модели GPT-4o. IT-World уже сообщал о работе OpenAI над новой технологией под кодовым названием «Strawberry», которая позволит моделям ИИ не только генерировать ответы, но и планировать действия в Интернете автономно, выполняя «глубокие исследования».

Основные показатели новой модели говорят сами за себя. На квалификационном экзамене Международной математической олимпиады (IMO) GPT-4o решила только 13% задач, в то время как OpenAI o1 справилась с 83%, что соответствует уровню 500 лучших студентов США. В программировании результаты не менее впечатляющие: на платформе Codeforces o1 заняла 89-й процентиль, продемонстрировав способность решать сложные задачи на уровне ведущих участников соревнований.

OpenAI утверждает, что о1 обучена «думать», подобно человеку, используя методику обучения с подкреплением. Это значит, что модель анализирует возможные варианты, строит цепочку мыслей (chain of thought), проверяет свои шаги и только затем выдает ответ. Такой подход позволяет существенно повысить точность и эффективность модели, что особенно важно в научных приложениях, математике и программировании.

Для сравнения: GPT-4o, предыдущая версия модели, решала только 12% задач на экзамене AIME (Американская математическая олимпиада), тогда как OpenAI o1 достигла 74% правильных решений. При повторном ранжировании 1000 образцов с использованием функции подсчета баллов модель o1 показала результат в 93%. В тестах по физике, биологии и химии (GPQA diamond) OpenAI o1 также превзошла экспертов с докторскими степенями, став первой моделью, достигшей такого уровня.

Одновременно OpenAI усиливает меры безопасности, совершенствуя внутренние протоколы и взаимодействие с федеральными правительствами, чтобы соответствовать этическим нормам и минимизировать риски. По данным компании, новый подход к обучению и интеграции цепочки рассуждений в поведение модели способствует лучшему обучению модели человеческим ценностям и принципам.

У ChatGPT уже есть приложения для Android и iOS, и десктопная версия для MacOS. Тем не менее для пользователей из России доступ к ChatGPT ограничен. IT-World ранее разбирался какие нейросети доступны в России, как к ним подключиться и использовать.

Пока OpenAI o1 остается дорогим решением: стоимость использования через API составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что в 3-4 раза дороже по сравнению с GPT-4o. Но компания уверена, что эта инвестиция окупится за счет повышения качества решений и скорости работы в критически важных задачах.

На данный момент OpenAI предоставляет доступ к o1 в виде превью-версии для пользователей ChatGPT Plus и Team, а также API-доступ. Разработчики также анонсировали более доступную версию o1-mini, которая будет дешевле на 80% и также подойдет для программирования и других задач, требующих высокого уровня анализа. Полноценная версия модели обещана к релизу в ближайшее время. Читайте также Техподдержка в эпоху ИИ. Как искусственный интеллект меняет ландшафт ИТ-услуг Как ИИ помогает в работе службы технической поддержки? Почему ИИ может не справиться с некоторыми запросами клиентов? Какие навыки нужны специалистам, чтобы помогать ИИ в нестандартных ситуациях? Как можно организовать работу первой линии службы технической поддержки с использованием ИИ?

Источник: www.it-world.ru

0 0 голоса

Рейтинг новости

21031

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”