Фото: PatrickAssale / Shutterstock
12 сентября 2024 года OpenAI представила новую модель OpenAI o1, которая способна буквально «думать» как человек. Эта модель не просто генерирует текст на основе данных, а строит логические рассуждения, анализирует задачи и улучшает ответы, что делает ее в 5–6 раз производительнее предыдущей модели GPT-4o. IT-World уже сообщал о работе OpenAI над новой технологией под кодовым названием «Strawberry», которая позволит моделям ИИ не только генерировать ответы, но и планировать действия в Интернете автономно, выполняя «глубокие исследования».
Основные показатели новой модели говорят сами за себя. На квалификационном экзамене Международной математической олимпиады (IMO) GPT-4o решила только 13% задач, в то время как OpenAI o1 справилась с 83%, что соответствует уровню 500 лучших студентов США. В программировании результаты не менее впечатляющие: на платформе Codeforces o1 заняла 89-й процентиль, продемонстрировав способность решать сложные задачи на уровне ведущих участников соревнований.
OpenAI утверждает, что о1 обучена «думать», подобно человеку, используя методику обучения с подкреплением. Это значит, что модель анализирует возможные варианты, строит цепочку мыслей (chain of thought), проверяет свои шаги и только затем выдает ответ. Такой подход позволяет существенно повысить точность и эффективность модели, что особенно важно в научных приложениях, математике и программировании.
Для сравнения: GPT-4o, предыдущая версия модели, решала только 12% задач на экзамене AIME (Американская математическая олимпиада), тогда как OpenAI o1 достигла 74% правильных решений. При повторном ранжировании 1000 образцов с использованием функции подсчета баллов модель o1 показала результат в 93%. В тестах по физике, биологии и химии (GPQA diamond) OpenAI o1 также превзошла экспертов с докторскими степенями, став первой моделью, достигшей такого уровня.
Одновременно OpenAI усиливает меры безопасности, совершенствуя внутренние протоколы и взаимодействие с федеральными правительствами, чтобы соответствовать этическим нормам и минимизировать риски. По данным компании, новый подход к обучению и интеграции цепочки рассуждений в поведение модели способствует лучшему обучению модели человеческим ценностям и принципам.
У ChatGPT уже есть приложения для Android и iOS, и десктопная версия для MacOS. Тем не менее для пользователей из России доступ к ChatGPT ограничен. IT-World ранее разбирался какие нейросети доступны в России, как к ним подключиться и использовать.
Пока OpenAI o1 остается дорогим решением: стоимость использования через API составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что в 3-4 раза дороже по сравнению с GPT-4o. Но компания уверена, что эта инвестиция окупится за счет повышения качества решений и скорости работы в критически важных задачах.
На данный момент OpenAI предоставляет доступ к o1 в виде превью-версии для пользователей ChatGPT Plus и Team, а также API-доступ. Разработчики также анонсировали более доступную версию o1-mini, которая будет дешевле на 80% и также подойдет для программирования и других задач, требующих высокого уровня анализа. Полноценная версия модели обещана к релизу в ближайшее время. Читайте также Техподдержка в эпоху ИИ. Как искусственный интеллект меняет ландшафт ИТ-услуг Как ИИ помогает в работе службы технической поддержки? Почему ИИ может не справиться с некоторыми запросами клиентов? Какие навыки нужны специалистам, чтобы помогать ИИ в нестандартных ситуациях? Как можно организовать работу первой линии службы технической поддержки с использованием ИИ?
Источник: www.it-world.ru