Учёные из T-Bank AI Research, МИСИС и МФТИ разработали метод распознавания неизвестных объектов на фото с помощью ИИ

Специалисты из лаборатории исследований искусственного интеллекта (ИИ) T‑Bank AI Research совместно со студентами Университета МИСИС и МФТИ разработали самый точный в мире метод распознавания неизвестных объектов на фото с помощью ИИ. В решении риск ошибки при обработке и анализе изображений снизился более чем на 20%, что уменьшает необходимость перепроверки и исправления неверных решений человеком.

Метод исследователей получил название SDDE (Saliency-Diversified Deep Ensembles) и будет особенно востребован в сферах, требующих высокой точности анализа. В перспективе он поможет развить сферу беспилотных транспортных средств и медицинской диагностики, где важно различать неопознанные элементы и графические артефакты.

Открытие SDDE было признано мировым научным сообществом и представлено на Международной конференции по обработке изображений (IEEE ICIP) в Абу-Даби, ОАЭ. Это одна из крупнейших научных конференций, посвящённых обработке изображений и видео, а также компьютерному зрению (CV) — это область искусственного интеллекта, которая занимается анализом изображений и видео.

Для повышения эффективности распознавания объектов учёные применяют методы машинного обучения. В частности, метод «глубокие ансамбли», который объединяет несколько нейронных сетей для решения задачи. Это похоже на сбор мнений разных экспертов для получения лучшего решения. Предыдущие разработки в области CV сталкивались с проблемой однородности ансамблей, то есть они были слишком похожи друг на друга, что снижало качество и разнообразие их оценок.

Учёные из лаборатории T-Bank AI Research нашли решение этой проблемы с помощью нового метода SDDE, который использует карты внимания, фокусирующиеся на разных аспектах данных. Это уменьшает схожесть моделей и повышает их общую точность, благодаря чему идентификация объектов становится более надёжной и диверсифицированной.

Также исследователи из T-Bank AI Research научили модель при работе с изображениями учитывать не только те наборы данных, которые использовались при ее обучении, но и незнакомую ей информацию. Такой подход значительно улучшил работу модели в области обнаружения ранее неизвестных ей объектов и точности их идентификации.

Для оценки эффективности метода учёные T-Bank AI Research провели испытания на популярных базах данных: CIFAR10, CIFAR100 и ImageNet-1K. Метод SDDE продемонстрировал наилучшие результаты по сравнению со схожими алгоритмами, такими как Negative Correlation Learning и Adaptive Diversity Promoting.

Рис. 1. Глубокие ансамбли используют одинаковые модели для распознавания изображений. В подходе SDDE каждая модель фокусируется на разных аспектах данных, что видно на выделенных зонах — картах внимания. В SDDE карты сильнее различаются, например захватывается фон изображения

Подробное описание модели и результаты экспериментов доступны в статье Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy.

Ранее специалисты Центра искусственного интеллекта Т-Банка представили бесплатную библиотеку инструментов Turbo Alignment, предназначенную для адаптации больших языковых моделей (LLM) под специфические бизнес-задачи. По данным компании, инструмент позволит бизнесам не создавать ИИ-решения с нуля, а применять уже существующие разработки. Библиотека доступна на GitHub, где можно ознакомиться с полным описанием методов и примеров их применения. В T-Bank AI Research планируют поддерживать и развивать библиотеку Turbo Alignment, добавляя новые методы и обучающие материалы.

Источник: habr.com

0 0 голоса

Рейтинг новости

13720

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”