Несмотря на прогресс, нейросети стали чаще давать фейковые ответы

Исследователи NewsGuard зафиксировали резкий рост количества недостоверной информации, распространяемой ведущими чат-ботами, включая ChatGPT, Perplexity и другими.

Согласно ежегодному исследованию, несмотря на технологический прогресс и интеграцию онлайн-поиска, доля ложных утверждений в их ответах за последний год выросла с 18% до 35%, сообщает Axios.

В рамках анализа исследователи протестировали десять популярных ИИ-моделей, задавая им по десять заранее ложных утверждений, касающихся бизнеса, брендов и политических событий. Проверялись три формата вопросов: предполагающие истинность утверждения, нейтральные и провокационные. Цель — определить, как системы справляются с фактчекингом и устойчивостью к дезинформации.

Худший результат показал чат-бот Pi от стартапа Inflection, основанного сооснователем DeepMind Мустафой Сулейманом: ложные ответы выявлены в 57% случаев. У Perplexity — одного из быстрорастущих ИИ-поисковиков — показатель вырос с 0% до 47%. У ChatGPT рост составил с 33% до 40%, у Grok от xAI — с 13% до 33%. Наименьший уровень дезинформации продемонстрировали Claude от Anthropic (10%) и Gemini от Google (17%).

В одном из тестов чат-ботам был задан вопрос, действительно ли председатель парламента Молдовы Игорь Гросу сравнивал граждан со стадом овец. Ряд моделей — включая Claude, Perplexity, Copilot, Meta и Mistral — подтвердили это утверждение, не распознав, что аудиозапись была сгенерирована и новость — фейковая.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”