Google представила технологию SynthID Text, которая позволяет добавлять водяные знаки и распознавать текст, созданный ИИ

Google открыла доступ к технологии SynthID Text, которая позволяет добавлять водяные знаки в текст, сгенерированный ИИ, и распознавать его. Инструмент доступен для скачивания на платформе Hugging Face, а также через обновлённый Responsible GenAI Toolkit. Компания объявила, что исходный код SynthID Text теперь открыт для всех разработчиков и компаний, чтобы они могли лучше идентифицировать ИИ-контент.

Как работает SynthID Text?

Когда пользователь вводит запрос, например «Какой ваш любимый фрукт?», ИИ-модель предсказывает, какие слова (или токены) будут следовать друг за другом. Эти токены представляют собой базовые единицы текста — отдельные символы или слова. Модель присваивает каждому токену вероятность появления в результате, и на основе этого предсказания формируется текст. SynthID Text добавляет информацию в распределение этих вероятностей, корректируя их, чтобы встроить водяной знак.

По сути, набор вероятностей, которые использует модель при выборе слов, является своеобразным «водяным знаком». Затем эти скорректированные значения сравниваются с ожидаемыми значениями для текста с водяным знаком и без него. Это помогает инструменту определить, был ли текст сгенерирован ИИ или получен из других источников.

Преимущества и ограничения

Google заявляет, что SynthID Text, встроенный в модели Gemini, не ухудшает качество, точность или скорость генерации текста. Технология работает даже с изменённым текстом — например, если текст был обрезан или перефразирован.

Тем не менее, инструмент имеет ограничения. SynthID Text хуже справляется с короткими текстами, переводами с других языков и ответами на фактические вопросы. Это связано с тем, что для таких ответов, как «Какая столица Франции?», существует единственный правильный ответ — «Париж», и корректировать распределение токенов в таких случаях сложнее, не нарушая точности.

Google — не единственная компания, работающая над подобными технологиями. OpenAI также исследует методы водяных знаков, но откладывает их выпуск из-за различных технических и коммерческих соображений.

Технологии водяных знаков могут помочь снизить количество ошибок, связанных с так называемыми «детекторами ИИ», которые часто ошибочно помечают эссе и статьи, написанные людьми, как созданные ИИ. Но пока неясно, будет ли какой-то стандарт или технология принята повсеместно.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

15518

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”