Google использует контент с YouTube для обучения моделей искусственного интеллекта, включая Gemini и генератор видео и аудио Veo 3, пишет CNBC со ссылкой на источник. По словам последнего, корпорация обращается к каталогу из 20 млрд роликов видеохостинга.
Google подтвердила CNBC, что она использует YouTube-видео для обучения своих ИИ-моделей. Однако корпорация указала на соблюдение особых соглашений с авторами видео и медиакомпаниями.
«Мы всегда использовали контент YouTube, чтобы сделать наши продукты лучше, и это не изменилось с появлением ИИ. Мы также осознаём необходимость в защитных барьерах, поэтому мы инвестировали в надёжные средства безопасности, которые позволяют создателям защищать свой образ в эпоху ИИ, и мы намерены продолжать это делать», — поделился представитель YouTube.
Эксперты считают, что подобное использование видео с YouTube способно привести к кризису интеллектуальной собственности для авторов контента и медиакомпаний. Последние не до конца понимают, что Google обучает свои ИИ-модели с использованием их видео.
YouTube не уточнил, сколько из 20 млрд видео на платформе или какие из них применяются для обучения ИИ. Однако, учитывая масштаб видеохостинга, всего на 1% каталога составит 2,3 млрд минут контента — объём в десятки раз превышает размер данных, которые используют для обучения моделей конкуренты Google, отмечают эксперты.
Осенью прошлого года Google предупредила о возможности использования контента с YouTube для «улучшения опыта использования продукта», в том числе с помощью машинного обучения и ИИ-приложений. Если пользователь загрузит контент на платформу, то он не сможет отказаться от возможности обучения моделей на его видео.
CNBC опросил несколько ведущих авторов контента и экспертов по авторскому праву, никто из них не знал и не был проинформирован YouTube о том, что их контент может быть использован для обучения ИИ-моделей корпорации.
Google представила Veo 3 в мае этого года. Это один из самых продвинутых ИИ-инструментов для генерации видео на рынке. Во время анонса Google продемонстрировала сгенерированные видео кинематографического уровня.
В среднем ежедневно на YouTube загружают 20 млн видео. Многие авторы заявили об обеспокоенности, что их работы будут использоваться для обучения ИИ-моделей, которые в перспективе могут конкурировать с ними или вовсе заменить их. По факту пользователь соглашается с возможностью использования его контента для обучения нейросетей, просто загрузив видео на YouTube.
Однако у создателей видео есть возможность обратиться к Google за возмещением ущерба, если они столкнутся и докажут факт нарушения авторских прав.
Источник: habr.com