Группа разработчиков во главе с одним из создателей RSS Экартом Вальтером представила открытый стандарт лицензирования контента Really Simple Licensing (RSL), который позволит издателям возможность определять условия оплаты за сбор ботами данных для обучения ИИ.
Стандарт предлагает веб-издателям устанавливать условия использования их произведений прямо в файле robots.txt на сайтах. Его уже поддержали многие крупные компании, в том числе Reddit, Yahoo, Medium, Quora, IGN и People Inc.
По словам Вальтера, целью было создание системы лицензирования данных обучения, которая могла бы масштабироваться по всему интернету. «Нам нужны машиночитаемые лицензионные соглашения для интернета», — заявил он.
В течение многих лет такие группы, как Альянс поставщиков наборов данных (Dataset Providers Alliance), добивались более чётких практик сбора данных, но RSL — это первая попытка создания технической и юридической инфраструктуры, способной реализовать намерения на практике.
С технической стороны протокол RSL устанавливает конкретные условия лицензирования, которые издатель определил для своего контента, будь то необходимость наличия специальной лицензии или принятия положений Creative Commons. Веб-сайты будут включать эти условия в свой файл «robots.txt» в заранее подготовленном формате.
Кроме того, команда RSL создала организацию коллективного лицензирования RSL Collective, которая может согласовывать условия и собирать роялти, аналогично ASCAP для музыкантов или MPLC для фильмов. Цель состоит в том, чтобы предоставить лицензиарам единую точку контакта для выплаты роялти, а правообладателям — возможность устанавливать условия с десятками потенциальных лицензиаров одновременно.
К коллективу уже присоединилось множество веб-издателей, включая Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis (владелец Mashable и Cnet), Internet Brands (владелец WebMD), People Inc. и The Daily Beast.
Примечательно, что в RSL Collective входят некоторые издатели, уже имеющие лицензионные соглашения, — в частности, Reddit, который получает от Google около $60 млн в год за использование своих обучающих данных. Однако ничто не мешает компаниям заключать собственные соглашения в рамках системы RSL. Вероятно, для небольших издателей новый протокол станет единственным вариантом получать роялти за свой контент.
Между тем Google летом запустила инструмент Offerwall, который позволяет издателям получать доход помимо более зависимых от трафика источников, таких как реклама. Ранее анализ Ahrefs показал, что ИИ-обзоры AI Overviews от Google снижают количество переходов на сайты, занимающие верхние позиции в рейтинге, более чем на 34%. В марте 2024 года — незадолго до выхода AI Overviews в США — средний CTR первого результата поиска на компьютере составлял 0,073. Год спустя этот показатель снизился до 0,026.
Источник: habr.com