База данных для обучения ИИ охватывает 48 000 каналов.
Эксперты из Proof News совместно с Wired провели расследование и выяснили, что сразу несколько крупных компаний, включая Apple, Nvidia и Salesforce, использовали набор данных из 170 000 видеороликов с YouTube для обучения своих систем искусственного интеллекта.
Источники отмечают, что компании тренировали свои нейросети на субтитрах к видеороликам на YouTube. Разумеется, разрешения у блогеров или самой платформы они не брали. В датасет вошли видео с 48 000 каналов, но только текстовая часть — видео и изображения не использовались. Примечательно, что компании брали видео с популярных каналов, таких как MrBeast, MKBHD, The Verge и нескольких новостных агентств.
Эксперты Proof News выпустили интерактивный инструмент, который позволяет находить каналы в датасете. Представители платформы YouTube пока не ответили на запросы СМИ.
Источник: www.playground.ru