В пресс-службе МФТИ сообщили, что ученые вуза совместно с международным коллективом разработали технологию стереофонического зрения Un-ViTAStereo, которая определяет расстояние до объектов. В отличие от существующих алгоритмов, она не требует для обучения дорогостоящих лидаров и ручной разметки. Разработка может применяться в беспилотных автомобилях и автономных роботах.
Система работает подобно человеческому зрению: сопоставляет изображения с двух камер и строит трехмерную карту. Однако стандартные алгоритмы часто ошибаются на гладких стенах, в густой листве или тумане. Новая технология решает эту проблему с помощью «наставника» — модели Depth Anything V2, которая оценивает относительную глубину по одному изображению.
Алгоритм проверяет каждый пиксель, сверяя данные с подсказками наставника, и исправляет ошибки, используя соседние верные точки. Затем убирается цифровой шум, формируются четкие контуры объектов. В планах ученых — создать самообучающуюся нейросеть, адаптирующуюся под разные среды.
Источник: www.ferra.ru