Чат-боты оценивают социальные ситуации лучше людей

Способность искусственного интеллекта помогать в социальных взаимодействиях приобретает все большее значение, особенно в таких сферах, как клиентская поддержка и психологическая помощь.

Большие языковые модели, на которых работают чат-боты, обучены на огромных объемах текстовых данных, что позволяет им не только понимать язык и контекст, но и генерировать осмысленные и релевантные ответы. Хотя ранее их возможности изучались в контексте академических задач и логических рассуждений, способность решать сложные социальные вопросы оставалась недостаточно исследованной.

В рамках нового эксперимента специалисты протестировали пять чат-ботов (Claude, Microsoft Copilot, ChatGPT, Google Gemini и умный ассистент от you.com) и сравнили их результаты с группой из 276 человек. Участниками стали люди с высоким уровнем образования и мотивации, что обеспечило высокий уровень человеческой выборки. В исследовании использовался тест ситуационной оценки (Situational Judgment Test), широко применяемый в психологии для измерения социальных навыков. Он состоял из 12 сценариев, каждый из которых требовал выбора наилучшего и наихудшего вариантов поведения. Эталоном служили оценки группы из 109 экспертов.

Чат-боты проходили тест по десять раз с разным порядком вопросов, чтобы обеспечить объективность результатов. Оценки производились на основе совпадения выбранных ответов с экспертными рекомендациями. Также ИИ оценивали эффективность каждого из вариантов действий, что дало дополнительные данные для анализа.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости

9118

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”