Ученые НИУ ВШЭ разработали и успешно проверили на практике алгоритм GLDAW, который показал высокую эффективность в сравнении с другими системами искусственного интеллекта (ИИ) при определении тематической принадлежности текстов. Об этом сообщает пресс-служба вуза, ссылаясь на данные исследования.
GLDAW основан на математическом инструменте распределения Дирихле и использует векторные представления слов для более точного анализа и сравнения текстов. В рамках исследования ученые сравнили его работу с четырьмя популярными алгоритмами, включая нейросети GSM и WTM-GMM, а также системы ETM и W-LDA, отметили в пресс-службе.
Анализ показал, что GLDAW значительно превзошел другие методы по нескольким параметрам, демонстрируя высокую стабильность и точность при классификации как русскоязычных, так и англоязычных текстов. Алгоритм не требует дополнительного обучения, что делает его особенно привлекательным для использования в различных приложениях, связанных с обработкой больших объемов информации.
Источник: www.ferra.ru