В борьбе с домогательствами в сети Reddit будет использовать новое оружие — искусственный интеллект. В ходе разбора приложения для Android, проведенного Android Authority, был обнаружен код, намекающий на использование большой языковой модели (LLM) для обнаружения и отметки оскорбительного контента.
LLM, известные своей способностью обрабатывать и генерировать человекоподобный текст, обучаются на огромном наборе данных контента. В данном случае еще и на контенте, отмеченного модераторами Reddit и внутренними правоприменительными органами за нарушение условий использования платформы. Такое обучение помогает ИИ выявлять закономерности и нюансы языка, часто ассоциирующиеся с так называемым харассментом.
Reddit подтвердил это событие, обновив свою страницу поддержки, чтобы признать роль LLM в фильтре домогательств. На странице уточняется, что «действия модераторов и контент, удаленный внутренними инструментами Reddit», составляют основу обучающих данных ИИ.
Хотя эффективность этого нового инструмента еще предстоит оценить, он предоставляет модераторам дополнительный уровень защиты от домогательств в Интернете. Тем не менее, остаются некоторые вопросы. Сможет ли ИИ эффективно отличить настоящую травлю от страстных дискуссий?
Только время покажет, насколько хорошо эта модель ИИ ориентируется в сложностях человеческого взаимодействия в сети.
Источник: www.ferra.ru