Ученые разработали метод, позволяющий искусственному интеллекту (ИИ) лучше картографировать трехмерные пространства, используя двумерные изображения, полученные с нескольких камер. Эта техника, называемая Multi-View Attentive Contextualization (MvACon), обещает значительно улучшить навигацию беспилотных транспортных средств.
Большинство автономных автомобилей используют мощные ИИ-программы, чтобы преобразовывать 2D-изображения в представление 3D-пространства. Однако существующие методы оставляют пространство для улучшений. Новый метод MvACon можно использовать вместе с уже существующими ИИ для повышения их эффективности без необходимости увеличения вычислительных ресурсов.
Для проверки эффективности MvACon его интегрировали с тремя ИИ-программами: BEVFormer, BEVFormer DFA3D и PETR. Во всех случаях производительность ИИ значительно улучшилась, особенно в отношении определения объектов, их скорости и ориентации.
Исследователи планируют дальнейшие тесты MvACon с новыми наборами данных и видеовходами от автономных автомобилей. Если техника продолжит демонстрировать высокие результаты, ее ожидает широкое применение в индустрии.
