Creative Commons представляет CC signals — платформу для открытой экосистемы ИИ

Некоммерческая организация Creative Commons, которая возглавила движение за лицензирование, позволяющее авторам делиться своими работами, сохраняя при этом авторские права, теперь готовится к эпохе ИИ. В среду организация объявила о запуске нового проекта CC signals, который позволит владельцам наборов данных подробно описывать, как их контент может или не может быть повторно использован машинами, например, для обучения моделей ИИ.

Идея заключается в том, чтобы найти баланс между открытостью интернета и потребностью в ещё большем количестве данных для подпитки ИИ.

Как объясняет Creative Commons в посте в блоге, продолжающийся сбор данных может подорвать открытость интернета и привести к тому, что организации будут закрывать свои сайты или защищать их платным доступом вместо того, чтобы делиться своими данными.

С другой стороны, проект CC signals направлен на создание юридического и технического решения, которое обеспечит основу для обмена наборами данных между теми, кто контролирует данные, и теми, кто использует их для обучения ИИ.

Спрос на такой инструмент растёт по мере того, как компании пытаются изменить свою политику и условия предоставления услуг, чтобы либо ограничить обучение ИИ на своих данных, либо объяснить, в какой степени они будут использовать данные пользователей в целях, связанных с ИИ.

Например, компания X сначала внесла изменение, которое позволяло третьим лицам обучать свои модели на её общедоступных данных, а затем отменила это. Reddit использует файл robots.txt, который предназначен для того, чтобы сообщать автоматическим поисковым роботам, могут ли они получить доступ к сайту, чтобы запретить ботам собирать данные для обучения ИИ. Cloudflare ищет решение, которое будет взимать плату с ботов за сбор данных, а также инструменты для их запутывания. Разработчики с открытым исходным кодом также создали инструменты для замедления работы и истощения ресурсов поисковых роботов с искусственным интеллектом, которые не соблюдали их директивы «не выполнять поиск».

Проект CC signals предлагает другое решение: набор инструментов, которые имеют юридическую силу и этическую значимость, подобно лицензиям CC, которые сегодня распространяются на миллиарды открытых творческих работ в интернете.

«CC signals предназначены для сохранения общего достояния в эпоху ИИ, — заявила Анна Тумадоттир, генеральный директор Creative Commons, в своём заявлении. — Мы считаем, что, как и лицензии CC помогли создать открытую сеть, CC signals помогут сформировать открытую экосистему ИИ, основанную на взаимности».

Проект только сейчас начинает обретать форму. Ранние версии были опубликованы на веб-сайте CC и странице GitHub. Организация активно собирает отзывы общественности перед планируемым альфа-запуском (ранним тестированием) в ноябре 2025 года. Также будет проведена серия встреч для получения отзывов и ответов на вопросы.

По ссылке вы можете получить 100 000 бесплатных токенов для первых задач на BotHub и уже сейчас начать работать!

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии