Manticore Search 13.11.0: Автоэмбеддинги и усовершенствованный AI-поиск

Мы рады представить релиз Manticore Search 13.11.0 (август 2025). Это большое обновление, в котором добавлена функция «Автоэмбеддинги» — новый простой и эффективный способ делать семантический поиск на базе ИИ. Также в версии исправлены баги и добавлено несколько улучшений.

🚀 Aвтоэмбеддинги: AI-поиск стал простым

Главная новинка в Manticore Search 13.11.0 — Aвтоэмбеддинги. Это функция, которая делает семантический поиск таким же простым, как SQL. Не нужно внешних сервисов или сложных конвейеров: просто вставляешь текст, и можно искать естественным языком.

Что дают автоэмбеддинги

Автоматическая генерация эмбеддингов из вашего текста

Запросы на естественном языке, которые понимают смысл, а не просто ключевые слова

Поддержка нескольких моделей (OpenAI, Hugging Face, Voyage, Jina)

Работает через SQL и JSON API

Простой пример— Создаём таблицу с автоэмбеддингами CREATE TABLE products ( title TEXT, description TEXT, vector FLOAT_VECTOR KNN_TYPE=’hnsw’ HNSW_SIMILARITY=’l2′ MODEL_NAME=’sentence-transformers/all-MiniLM-L6-v2′ FROM=’title,description’ ); — Вставляем данные (эмбеддинги генерируются автоматически) INSERT INTO products(id, title, description) VALUES (1, ‘wireless headphones’, ‘Bluetooth headphones with noise cancellation’), (2, ‘hiking backpack’, ‘Lightweight backpack for outdoor adventures’); — Поиск естественным языком SELECT id, title FROM products WHERE knn(vector, 3, ‘portable audio device for music’);

В результате:

+——+———————+ | id | title | +——+———————+ | 1 | wireless headphones | … +——+———————+

Здесь семантический поиск правильно сопоставил “wireless headphones” c фразой “portable audio device for music”, несмотря на полное несовпадение ключевых слов.

Узнать больше

Полное и подробное руководство ждет вас в нашей специальной статье: : «Auto Embeddings: простой AI-поиск».

Другие улучшения

Конфигурация

Поддержка Boolean Simplify: Добавлена опция boolean_simplify для ускоренной обработки запросов.

Оптимизация системы: Конфигурация Sysctl теперь автоматически увеличивает vm.max_map_count для работы с большими наборами данных.

Управление пакетами: RPM-пакеты больше не захватывают каталог /run для улучшения совместимости.

Исправления багов

Исправлена работа опции scroll с большими 64-битными ID.

Исправлены сбои при использовании KNN с деревьями фильтров.

Исправлено поведение эндпоинта /sql (удалена неподдерживаемая команда SHOW VERSION).

Исправлена обработка duplicate ID в колоночном режиме.

Исправлены сбои при выполнении запросов с несколькими фасетами.

Исправлены коммиты операций delete/update в транзакциях.

Исправлены сбои при соединении (join) по строковым атрибутам, если они не в режиме columnar

Система и интеграции

Обновлён скрипт установки для Windows.

Исправлено определение локального часового пояса на Linux.

Улучшена совместимость JDBC+MySQL драйвера с опцией transaction_read_only.

Улучшено сообщение об ошибках в различных компонентах.

Улучшено взаимодействие между master- и agent-нодами для работы с эмбеддингами.

Совместимость

Версия 13.11.0 полностью обратно совместима:

Нет ломающих изменений для стандартных сценариев использования

Лёгкий переход с любой предыдущей версии 13.x

Автоэмбеддинги работают вместе с текущими функциями поиска

API расширены, но не заменены

Цель — чтобы всё работало с вашими существующими данными и запросами без проблем.

Обновление

Чтобы обновиться, следуйте руководству по установке.

🚀Если хотите попробовать автоэмбеддинги — начните с документации.

Если потребуется помощь или есть вопросы:

присоединяйтесь к Slack

посетите форум

сообщайте об ошибках или предлагайте фичи на GitHub

напишите на почту  contact@manticoresearch.com

Полный список изменений доступен в Changelog.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии