Microsoft работает над крупным ИИ-обновлением для интегрированной среды разработки Visual Studio. Недавно компания внедрила GPT-5 в Visual Studio через GitHub Copilot, а теперь заменяет традиционные механизмы поиска по кодовой базе на удалённый семантический поиск.
До сих пор поиск по коду в Visual Studio основывался на алгоритме BM25, который является устоявшимся и популярным методом ранжирования для обнаружения элементов в документе. Одним из факторов, учитываемых при возврате результатов, была частота упоминаний термина в конкретном документе и его типичность в общем репозитории. Алгоритм имеет серьёзное ограничение: он основан на ключевых словах, и, если термин не совпадает с ключом, то его сложно найти.
В Visual Studio 17.14.11 Microsoft обновила панель чата Visual Studio Copilot, чтобы использовать удалённый семантический поиск вместо BM25. Новый поиск больше фокусируется на цели и смысле поиска посредством расширенного векторного встраивания, а не на точном соответствии терминов. Именно поэтому он выдаст похожий результат при запросах «извлечь учётные данные пользователя» и «получить токен аутентификации».
Контекстный поиск с учётом кодовой базы позволяет Visual Studio возвращать более точные результаты, даже если их меньше.
Пользователи Visual Studio с GitHub Copilot могут протестировать поиск через окно чата. Он индексирует решения, размещённые в репозиториях Azure DevOps и GitHub.
Источник: habr.com