Издание The Information, ранне рассказавшее о том, что в GPT-5 применили модуль Universal Verifier для борьбы с «галлюцинациями», опубликовало отдельную статью с подробностями этой системы. Фактически речь идет об отдельной специализированной нейросети, которая используется во время обучения с подкреплением, проверяя каждый ответ модели и выставляя им баллы. При низком балле проверяемая модель генерирует ответ заново.
В OpenAI смогли добиться универсальности модуля — он эффективен при проверке математических задач, бизнес-решений и даже творческих текстов. Особенность подобных задач в том, что в них не всегда можно сразу отличить правильный ответ от неправильного. Поэтому Universal Verifier анализирует не только финальный ответ, но и цепочку рассуждений — например, в случае с математическими задачами это помогает отдельно оценить каждый этап решения, выяснив, где именно ошиблась модель.
По данным The Information, Universal Verifier использовался при тренировке экспериментальной модели OpenAI, которая смогла взять золото Международной математической олимпиады 2025. Также этот модуль применен и для GPT-5 — ее релиз ожидается в ближайшее время, поэтому оценить эффективность модуля смогут все пользователи ИИ.
Руководитель RL-направления OpenAI Джерри Творек отмечает, что подобная система с модулем-критиком уже близка к «прототипу AGI», однако независимые эксперты указывают и на риски. Во-первых, Universal Verifier тоже может ошибаться, а обучаемая модель — искать «слабости» критика и подыгрывать им, закрепляя ложные паттерны. Во-вторых, подобный подход к обучению может привести к появлению у модели новых навыков, которые могут пропустить «живые» аудиторы.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com