Группа «Т-Технологии» опубликовала T-ECD — один из крупнейших в мире открытых датасетов для рекомендательных систем в электронной торговле. Он собран на основе анонимных действий 44 млн пользователей сервисов «Город: Шопинг», «Супермаркеты» и рекламной платформы Т-Банка, включает 30 млн товаров и более 135 млрд взаимодействий. Особенность T-ECD — кросс-доменность.
Датасет объединяет историю покупок, чеки, отзывы, взаимодействие с рекомендациями по товарам повседневного спроса и непродовольственным товарам, а также активации специальных предложений и кэшбэков. Данные можно использовать отдельно или связывать по пользователям, товарам и брендам.

T-ECD подходит для различных задач, пишет пресс-служба: рекомендации следующего товара, корзины, сессии, топ-N и других. История взаимодействий охватывает от 1 года до 3,5 лет.
Датасет содержит информацию о признаках пользователей и товаров, явную и неявную обратную связь, а также данные о просмотрах с указанием источника — поиск, каталог или рекомендации.
Датасет доступен на Hugging Face под лицензией Apache 2.0, разрешающей коммерческое использование и модификацию.
Источник: www.ferra.ru