Некоторые диалоги с ChatGPT могут быть переданы в полицию

В блоге OpenAI опубликован рассказ о мерах безопасности в случае, если в ходе диалога с ИИ возникает подозрение, что пользователь может причинить вред себе или кому-то еще. В компании напомнили, что модели GPT обучены не выдавать пользователям инструкции по причинению вреда, а вместо этого предлагать поддержку и мягко направлять обратиться за помощью. В некоторых случаях система может заблокировать небезопасный ответ.

Если ИИ считает, что пользователь может причинить себе вред, то он подскажет номер службы, куда можно обратиться за помощью. Мой эксперимент показал, что ChatGPT указывает российские номера 112 (единый номер службы спасения) и 8-800-2000-122 (служба доверия для детей, подростков и их родителей). Если же выяснится, что речь идет о намерениях причинить вред другому человеку, то такой диалог будет передан на проверку специальной команде внутри OpenAI — и если опасения ИИ подтвердятся, то компания может передать информацию о пользователе в правоохранительные органы.

В OpenAI признают, что системы безопасности ChatGPT еще не идеальны. Проверки показали, что в случае долгих диалогов модель может сбиваться и игнорировать протоколы безопасности. Над решением этой проблемы специалисты OpenAI работают прямо сейчас. Также ИИ планируется обучить лучше определять опасные состояния пользователя, предлагая наиболее уместную помощь.

Также обсуждается улучшение интерфейса получения помощи. Если сейчас ChatGPT просто подсказывает, по какому номеру позвонить, то в будущем связаться с соответствующими службами можно будет прямо из чата.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”