Рекомендательные системы стали частью повседневной жизни — они подсказывают, что посмотреть, прочитать или купить. Но многим знакома ситуация, когда сервис снова и снова предлагает один и тот же контент.
По словам Николая Савушкина, руководителя направления рекомендательных систем Яндекса, дело в устройстве самих алгоритмов. Они настроены на то, чтобы угадывать предпочтения, и в этом попадают в собственную ловушку.
Как только пользователь взаимодействует с каким-то популярным контентом, система получает сигнал, что он хорош, и начинает показывать его еще чаще.

Так работает механизм усиления: ролики или товары, которые уже стали популярными, с каждым просмотром усиливают свои позиции, а менее известные варианты не получают шанса.
Если алгоритм начнет предлагать что-то нестандартное, есть риск, что пользователь это не одобрит. А система, по сути, «боится» ошибок, ведь её задача — удерживать внимание. Поэтому новизна в рекомендациях часто страдает.
Технологически решить эту проблему непросто. Но, как говорит Савушкин, на помощь приходит метод обучения с подкреплением — Reinforcement Learning.
Этот подход помогает системе искать баланс между тем, что уже нравится пользователю, и новыми вариантами, которые могут понравиться.

В будущем такие технологии могут сделать рекомендации более разнообразными и полезными.
Источник: www.ferra.ru