Кошмар безопасности в ИИ: источники и отсутствие контроля

В то время как искусственный интеллект, в частности большие языковые модели (LLM), совершают революцию в различных областях, традиционные концепции кибербезопасности приобретают новый, вызывающий опасения вид.

Одна из концепций, которую эксперт по безопасности, автор статьи на HackerNoon, считает особенно тревожной, — это «источники и поглотители».

Что такое источники и поглотители? В традиционной кибербезопасности «источники и поглотители» означают происхождение и назначение данных в приложении. Данные поступают из источника (пользовательский ввод, базы данных и т. д.) и обрабатываются, прежде чем попасть в поглотитель (базу данных, электронную почту и т. д.). Специалисты по безопасности используют «отслеживание порчи» для идентификации этого потока данных, что является сложной задачей для больших приложений, но выполнимой благодаря их детерминированному характеру (то есть определенные входы всегда приводят к определенным выходам).

LLM существенно отличаются. Они намеренно недетерминированы, имитируя человеческие мыслительные процессы, что вносит случайность в их выходные данные. Это делает практически невозможным предсказать, что LLM будет делать с данными, особенно при выборе инструментов или места назначения данных.

Проблема усугубляется огромным количеством потенциальных источников и поглотителей в будущих системах ИИ, призванных заменить людей. Например, офисные работники получают доступ к огромным объемам информации и манипулируют ими.

Несмотря на известные риски, многие разработчики игнорируют «источники и поглотители» из-за таких факторов, как архитектура микросервисов и разделение ответственности. Это может привести к тому, что разработчики, работающие с крупномасштабным недетерминированным ИИ, получают неограниченный доступ к интернету, конфиденциальным данным и различным инструментам.

Давление, связанное с необходимостью быстрого внедрения сложных технологий, еще больше усугубляет проблему. Автор призывает вновь обратить внимание на «источники и поглотители» в условиях нынешнего бума ИИ. В то время как все в восторге от потенциала LLM, важнейшие процессы строятся на основе «пробных» реализаций, которые могут быстро усложниться.

Время моделировать потоки данных настало, пока кому-то (возможно, злоумышленнику) не пришлось их реинжинирировать.

Источник: www.ferra.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”