Знания из Википедии теперь проще использовать для ответов AI-моделей

Фонд Wikimedia представил новую базу данных, которая упрощает использование знаний Википедии в больших языковых моделях. Если раньше разработчики могли вытаскивать информацию в основном через ключевые слова или сложный язык SPARQL, то теперь система понимает смысл запросов. Это значит, что достаточно написать «учёный» — и вы сразу получите список учёных, переводы термина на десятки языков, иллюстрации и ссылки на связанные понятия вроде «исследователь» или «открытие».

Проект специально заточен под Retrieval-Augmented Generation (RAG) и другие архитектуры, где ИИ нужно быстро и осмысленно подтягивать факты. Новая база работает через протокол MCP (Model Context Protocol), благодаря чему интеграция с LLM становится проще и точнее. Важно, что база открыта для всех: её можно бесплатно использовать на платформе Toolforge. Wikimedia 9 октября проведёт вебинар для разработчиков, где подробно расскажет, как подключить ресурс к своим продуктам и сервисам.

Фактически это превращает Википедию в готовый фактографический слой для ИИ-моделей — с переводами, медиа и связями между понятиями. Для разработчиков это означает меньше парсинга и ручной чистки данных, а для пользователей — более точные и насыщенные ответы.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии