Компания Xiaomi официально представила и открыла исходный код своей платформы OneVL. Эта разработка предназначена для улучшения того, как системы автономного вождения воспринимают, анализируют и прогнозируют дорожные ситуации. По заявлению представителей организации, новинка стала первым в отрасли решением, объединившим в единую структуру несколько ключевых технологий, включая визуально-языковые модели действий (VLA), мировые модели и логические выводы в скрытом пространстве.
Платформа OneVL базируется на аналитических способностях модели XLA, при этом разработчикам удалось повысить скорость обработки данных и точность выводов. В сфере исследований беспилотного транспорта VLA и мировые модели обычно рассматривались как отдельные подходы. Системы VLA концентрируются на понимании дорожных сцен и генерации действий, тогда как мировые модели предсказывают развитие ситуации. Xiaomi удалось объединить эти методы, что обеспечило высокие результаты в тестах на восприятие и планирование маршрута.
Особое внимание при создании OneVL уделили интерпретируемости принимаемых решений. Модель способна объяснять логику своих действий в текстовом и визуальном форматах. Это означает, что система может описать причины выбора конкретного маневра и одновременно показать прогноз дальнейшего развития событий на дороге. Открытие исходного кода OneVL произошло вскоре после публикации алгоритма генерации аудио Omnivoice, что свидетельствует о стремлении компании укрепить позиции в сегменте интеллектуальной мобильности.
На текущий момент платформа распространяется бесплатно для исследовательских целей.
Источник: mobile-review.com