ИИ научился «понимать» комнаты — как будто он там жил

Российские исследователи из Института AIRI и Центра когнитивного моделирования МФТИ разработали метод, который помогает большим языковым моделям лучше работать с трехмерным пространством. Традиционные модели при анализе окружающей среды часто ограничиваются двухмерными изображениями или сырыми данными в виде облаков точек. Это мешает искусственному интеллекту (ИИ) правильно понять взаимосвязи между объектами, например, что стул стоит у стола и предназначен для сидения.

Новая система под названием 3DGraphLLM учитывает не только сами объекты, но и их пространственные и смысловые связи. Это особенно важно в помещениях с большим количеством предметов, таких как кухни, мастерские или офисы. Модель обучалась на известных датасетах с точными 3D-реконструкциями реальных помещений и текстовыми описаниями объектов. В качестве языковых моделей использовались Vicuna-v1.5 и LLAMA3, которые работают на энергоэффективных устройствах, подходящих для робототехники.

По результатам тестирования 3DGraphLLM превзошла по точности распознавания объектов многие существующие методы, в том числе и другие подходы с языковыми моделями. Модель показала улучшение точности более чем на 7% по сравнению с базовым решением и работает быстрее и экономнее по ресурсам по сравнению с самыми продвинутыми аналогами.

Примеры того, как разработанная модель 3DGraphLLM отвечает на вопросы по трехмерной сценеИнститута AIRI

Сейчас команда учёных занимается интеграцией метода в реальные робототехнические системы. Основная задача — чтобы роботы не просто видели объекты, а понимали их взаимосвязи и могли эффективно выполнять задачи пользователя. Такие навыки важны для создания сервисных и бытовых роботов нового поколения.

Источник: www.ferra.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”