VK внедрила мультимодальную ИИ-модель в поиск

VK начала внедрять в поиск своих продуктов визуально‑языковые модели (VLM) — искусственный интеллект, который одновременно анализирует текст, изображения, звук и видеоряд. Технология уже работает в VK Видео и поэтапно появится в других сервисах, где есть поисковые системы.

Модель учитывает название и описание загруженного на платформу контента и его смысл, что позволяет точнее отвечать на поисковые запросы пользователя. Новая VLM от инженеров AI VK автоматически формирует датасеты, данные о контенте, по которым поисковые алгоритмы определяют, какое видео подходит к запросу, а какое — нет.

С запуском модели в будущем улучшится векторный поиск в продуктах VK, который основан на семантическом значении запроса. Например, система будет понимать, что пользователь чаще выбирает видео с определённым стилем монтажа и цветокоррекции. Или точнее распознавать гибридные запросы, где текст и визуальные характеристики комбинируются, например, «влог из Стамбула с видами на Босфор».

Это сделает поисковую выдачу более персонализированной, а внедрение VLM ускорит в 5 раз разработку и масштабирование новых технологий для развития и улучшения поиска во всех продуктах VK.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости