Сэм Альтман рассказал, как ИИ может случайно «захватить» мир

В новом выпуске Conversations with Tyler с Тайлером Коуэном глава OpenAI Сэм Альтман коснулся вопросов безопасности ИИ, в том числе гипотетической ситуации, когда мощная модель захватывает контроль над миром. По словам Альтмана, обычно этот сценарий обсуждают в двух вариантах: или модель находится под управлением злоумышленников, или она обходит алгоритмы безопасности и начинает преследовать свои цели. Однако есть и третий сценарий — риск того, что в мире появляется одна доминирующая модель ИИ, которая незаметно влияет на взгляды и привычки миллиардов людей.

Альтман описывает «случайный захват» как мягкий, накопительный эффект монокультуры. Когда «весь мир разговаривает с одной моделью», то она — скорее всего, без злого умысла — со временем подталкивает пользователей к определенным установкам просто потому, что учится на их взаимодействиях и непрерывно прогрессирует с ними с ними. Это, по его словам, более реалистичный и опасный сценарий, чем классические сюжеты про «пробуждение» враждебного ИИ.

Альтман признает, что уже сейчас есть случаи ухудшения психического состояния некоторых пользователей из-за взаимодействия с ИИ — они редкие, но не нулевые. Поэтому OpenAI раньше ужесточала правила (особенно ради защиты подростков), а теперь — после внедрения защит по психическому здоровью — собирается возвращать часть творческих режимов для взрослых (в том числе — режим 18+). Параллельно Альтман выступает за максимально возможную приватность общения пользователей с ИИ — на уровне защиты, сопоставимом с консультациями у врача или юриста.

Для регулирования автономных ИИ-агентов Альтман предлагает пороговый подход: надзор не нужен «по умолчанию», но должен включаться для систем с высокой вероятностью массового вреда (например, способных к широкомасштабному самокопированию в сети и финансовым атакам). Глобально же миру пойдет на пользу конкуренция между несколькими мощными моделями ИИ — таком случае риск описанного Альтманом «случайного захвата» снижается.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”