Группа исследователей из AIRI, МТУСИ, «Сбера» и VeinCV выложила в открытый доступ метод защиты голосовых данных. Он помогает предотвратить автоматический сбор биометрии из аудиозаписей, которые находятся в открытом доступе. Технология основана на универсальных состязательных патчах (UAP). Она встраивается в аудиофайл перед публикацией. Патч мешает алгоритмам, которые собирают и анализируют голосовую биометрию.
Такие алгоритмы могут использоваться для подделки идентификации, создания дипфейков или сбора информации о человеке без его согласия. Особенно это опасно при наличии большого количества аудио — например, подкастов, интервью или лекций.
Патч делает голосовые данные «неидентифицируемыми» для автоматических систем. Он нарушает работу алгоритмов, которые извлекают уникальные голосовые признаки. При этом качество звука почти не страдает. Речь остаётся понятной, и аудио можно использовать для транскрипции, перевода или поиска.
Технология работает с файлами любой длины — от коротких фрагментов до длинных записей. Она может быть полезна публичным людям, авторам контента, компаниям и образовательным платформам. Также её можно применять для защиты вебинаров и конференций. Разработка принята к публикации на конференции Interspeech 2025 в Роттердаме. Это мероприятие входит в список Core‑A.
По словам руководителя лаборатории Безопасного ИИ SAIL AIRI‑МТУСИ Олега Рогова, цель проекта — усилить защиту цифрового следа человека, в том числе его голосовой идентичности.
Источник: habr.com