OpenAI теперь раскрывает больше информации о мыслительном процессе своей модели o3-mini

В ответ на давление со стороны конкурентов, включая китайскую компанию DeepSeek, занимающуюся разработкой искусственного интеллекта, OpenAI меняет способ, которым ее новейшая модель искусственного интеллекта, o3-mini, передает пошаговый мыслительный процесс.

В четверг OpenAI объявила, что бесплатные и платные пользователи ChatGPT, платформы чат-ботов на базе искусственного интеллекта компании, увидят обновленную цепочку мыслей, которая показывает больше шагов рассуждения модели и то, как она пришла к ответам на вопросы. Подписчики премиальных планов ChatGPT, использующие o3-mini в конфигурации «высокого рассуждения», также увидят эту обновленную информацию, согласно OpenAI.

«Мы представляем обновленную цепочку мыслей для o3-mini, разработанную для того, чтобы людям было легче понять, как думает модель», — сообщил представитель OpenAI. «С этим обновлением вы сможете следить за рассуждениями модели, что даст вам больше ясности и уверенности в ее ответах»,- добавил он.

Модели рассуждений, такие как o3-mini, тщательно проверяют себя перед выдачей результатов, что помогает им избегать некоторых ловушек, которые обычно мешают моделям. Компромисс заключается в том, что модели рассуждений требуют немного больше времени для принятия решений — обычно на секунды или минуты дольше.

Модель DeepSeek R1, модель рассуждения по типу o3-mini, раскрывает весь свой мыслительный процесс, который многие исследователи AI считают предпочтительным подходом. Помимо того, что модель становится проще изучать, этапы рассуждения обеспечивают лучший пользовательский опыт в определенных ситуациях, помогая указать, когда модель может быть на правильном или неправильном пути.

OpenAI решила не показывать полные шаги рассуждения для o3-mini и его предшественников, o1 и o1-mini, отчасти из-за конкурентных причин. Вместо этого пользователи видели только резюме шагов рассуждения — резюме, которые иногда были ошибочными.

OpenAI до сих пор не демонстрирует полные этапы рассуждений o3-mini, но компания заявила, что нашла баланс: o3-mini может «думать свободно», а затем организовывать свои мысли в более подробные резюме.

«Чтобы повысить ясность и безопасность, мы добавили дополнительный этап постобработки, на котором модель просматривает необработанную цепочку мыслей, удаляя любой небезопасный контент, а затем упрощает любые сложные идеи», — продолжил представитель OpenAI.

Кроме того он добавил, что этот этап постобработки позволяет пользователям, не владеющим английским языком, получать цепочку мыслей на своем родном языке, создавая более доступный и дружественный опыт.

На прошлой неделе в рамках сессии вопросов и ответов на Reddit Кевин Вейл, директор по продуктам OpenAI, намекнул, что грядут перемены.

«Мы работаем над тем, чтобы показать гораздо больше, чем показываем сегодня — показ модельного мыслительного процесса будет очень, очень скоро», — сказал он.

«По всем вопросам пока не определено — демонстрация всей цепочки мыслей приводит к конкурентной дистилляции, но мы также знаем, что люди (по крайней мере, опытные пользователи) хотят этого, поэтому мы найдем правильный способ сбалансировать это».

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии