Научная статья в журнале Nature описывает новый инструмент, который позволяет наносить водяные знаки на текст, сгенерированный большими языковыми моделями (LLM). Этот метод улучшает возможность идентификации и отслеживания синтетического контента, что важно для оценки надежности информации.
Большие языковые модели широко используются в искусственном интеллекте для генерации текста в чат-ботах и других приложениях. Однако, выявить конкретный источник ИИ-сгенерированного текста бывает сложно, что ставит под сомнение его достоверность. Хотя водяные знаки были предложены как решение этой проблемы, их массовое применение затруднено из-за требований к качеству и вычислительной эффективности.
Исследователи Сунамт Дататри и Пушмит Кохли разработали схему, использующую новый алгоритм выборки для применения водяных знаков, получивший название SynthID-Text. Этот инструмент позволяет незаметно изменять выбор слов в тексте, вставляя подпись, которую можно распознать с помощью специализированного программного обеспечения.
Эффективность водяных знаков была проверена на нескольких моделях, и SynthID-Text продемонстрировал улучшенную детектируемость по сравнению с существующими методами.
Источник: www.ferra.ru