Релиз профайлера данных Desbordante 2.0.0

16 апреля 2024 года состоялся второй мажорный релиз профайлера данных Desbordante (исп., безграничный), который позволяет проводить поиск различных примитивов в таблицах. Исходный код проекта опубликован на GitHub под лицензией GNU Affero General Public License v3.0. Первая стабильная версия Desbordante вышла в декабре 2023 года.

Desbordante может выполнять две категории задач: поиск различных примитивов, а также выполнение какой-либо работы с использованием алгоритмов поиска примитивов. Ядро Desbordante — консольное приложение, обладающее крайне простым сценарием использования: на вход подаётся csv-таблица, указывается искомый примитив, например функциональная зависимость, алгоритм и, опционально, параметры, а на выход выдаётся набор найденных зависимостей. Кроме того, все компоненты Desbordante контейнеризованы.

В Desbordante 2.0.0 разработчики проекта добавили новые опции и примитивы, например, обнаружение точных зависимостей порядка (поиск закономерности, связанной с порядком столбцов) с двумя различными аксиоматизациями — на основе множеств и на основе списков, обнаружение вероятностных функциональных зависимостей для обеих существующих метрик PerTuple и PerValue, обнаружение зависимостей включения. Также в новой версии Desbordante расширена поддержка типов данных и обновлены алгоритмы графики, включая поддержку и проверку GFD (graph functional dependencies).

В рамках продолжения развития проекта команда Desbordante выложила на GitHub новые примеры скриптов на Python. «Поскольку проект в настоящее время недостаточно документирован, мы надеемся, что это будет полезно для наших потенциальных пользователей. Вы можете ознакомиться с ними здесь. Чтобы улучшить общий уровень документации, мы также опубликовали несколько руководств — см. раздел «Руководства»», — уточнили разработчики.

Источник: habr.com

0 0 голоса
Рейтинг новости
0
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии