OpenAI представила CriticGPT — нейросеть-ментора по поиску и исправлению ошибок в коде ChatGPT

OpenAI разработала новую ИИ-модель CriticGPT на базе GPT-4. Нейросеть ищет ошибки в коде, написанном ChatGPT, и предлагает исправления. CriticGPT предназначена для помощи ИИ-тренерам во время обучения с подкреплением (Reinforcement Learning from Human Feedback, RLHF). Испытания показали, что её использование повышает производительность ИИ-тренеров более чем на 60%.

«По мере того, как мы совершенствуемся в рассуждениях и моделировании поведения, ChatGPT становится более точным, а его ошибки — более тонкими. Из-за этого ИИ-тренерам сложнее выявлять ошибки, что, в свою очередь, замедляет RLHF. Чтобы помочь с этой задачей, мы научили CriticGPT писать критические замечания, подчёркивающие неточности в ответах ChatGPT», — пишет OpenAI.

Как рассказывает OpenAI, CriticGPT анализирует код, сгенерированный GPT-4, подчёркивает и комментирует ошибки и предлагает правильный вариант. CriticGPT обучали на данных с преднамеренными ошибками (разработчики вписывали эти ошибки в код ChatGPT вручную). Испытания показали, что использование CriticGPT значительно повышает качество работы ИИ-тренеров: их производительность выросла на 63%.

Среди ограничений OpenAI выделила то, что CriticGPT обучалась на небольших объёмах данных, и пока может помочь только когда дело касается сравнительно мелких задач.

Тем не менее, как отмечает OpenAI, для обучения ИИ-систем, которые становятся всё сложнее, её понадобятся «более совершенные инструменты». OpenAI планирует масштабировать модели, подобные CriticGPT, и интегрировать их в процесс RLHF.

Источник: habr.com

0 0 голоса

Рейтинг новости

26619

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”