DeepMind разработала систему SAFE для проверки результатов ChatGPT

Команда специалистов из DeepMind, подразделения Google, создала систему на основе искусственного интеллекта (ИИ) под названием SAFE, которая может использоваться для проверки достоверности результатов больших языковых моделей (LLM), таких как ChatGPT. Они опубликовали статью, описывающую новую систему, и ее результаты на сервере предварительных публикаций arXiv.

Большие языковые модели получили широкое внимание за последние несколько лет — они могут писать статьи, отвечать на вопросы и даже решать математические задачи. Однако они сталкиваются с одной основной проблемой: точностью. Каждый результат, полученный LLM, должен быть проверен вручную, чтобы гарантировать его правильность, что существенно снижает их ценность.

В новом исследовании ученые в DeepMind создали приложение на основе искусственного интеллекта, которое может проверять результаты ответов, данных LLM, и автоматически указывать на неточности.

Одним из основных способов проверки результатов LLM людьми является исследование ответов ИИ с использованием поисковой системы, такой как Google, для поиска подходящих источников для верификации. Команда в DeepMind взяла тот же подход. Они создали LLM, который анализирует утверждения или факты в ответе, предоставленном исходным LLM, а затем использовали поиск Google, чтобы найти сайты, которые можно использовать для верификации, сравнивая два ответа для определения точности. Они назвали свою новую систему SAFE.

Для тестирования системы исследовательская команда использовала ее для проверки около 16 000 фактов, содержащихся в ответах нескольких LLM. Они сравнили свои результаты с результатами проверки фактов людьми (по данным от пользователей) и обнаружили, что SAFE совпадал с результатами людей в 72% случаев. При тестировании расхождений между SAFE и проверкой людей исследователи обнаружили, что SAFE был прав в 76% случаев.

Источник: www.ferra.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”