Фонд Wikimedia представил новую базу данных, которая упрощает использование знаний Википедии в больших языковых моделях. Если раньше разработчики могли вытаскивать информацию в основном через ключевые слова или сложный язык SPARQL, то теперь система понимает смысл запросов. Это значит, что достаточно написать «учёный» — и вы сразу получите список учёных, переводы термина на десятки языков, иллюстрации и ссылки на связанные понятия вроде «исследователь» или «открытие».
Проект специально заточен под Retrieval-Augmented Generation (RAG) и другие архитектуры, где ИИ нужно быстро и осмысленно подтягивать факты. Новая база работает через протокол MCP (Model Context Protocol), благодаря чему интеграция с LLM становится проще и точнее. Важно, что база открыта для всех: её можно бесплатно использовать на платформе Toolforge. Wikimedia 9 октября проведёт вебинар для разработчиков, где подробно расскажет, как подключить ресурс к своим продуктам и сервисам.
Фактически это превращает Википедию в готовый фактографический слой для ИИ-моделей — с переводами, медиа и связями между понятиями. Для разработчиков это означает меньше парсинга и ручной чистки данных, а для пользователей — более точные и насыщенные ответы.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник
Источник: habr.com