ИИ научился превращать звуки в визуальные образы городской среды

Команда ученых из Техасского университета в Остине разработала технологию, которая с помощью генеративного искусственного интеллекта (ИИ) преобразует звуки из аудиозаписей в изображения улиц. Это открытие показывает, что машины могут воспроизводить связь между звуками и визуальными характеристиками, схожую с человеческим восприятием.

Исследователи собрали данные из разных городских и сельских местностей, включая аудиозаписи и изображения. Эти данные использовались для обучения модели искусственного интеллекта. На основе 10-секундных аудиоклипов ИИ генерировал изображения, которые затем сравнивались с реальными фотографиями.

В рамках исследования было обнаружено, что звуковые среды содержат достаточно визуальных подсказок, чтобы создавать изображения улиц, которые точно отражают реальность.

Сравнения показали, что ИИ точно воспроизводил пропорции неба, зелени и зданий, а также архитектурные стили и освещение (день или ночь). Участники эксперимента в 80% случаев правильно связывали звуковые клипы с изображениями, созданными ИИ.

По словам авторов, эта технология выходит за рамки простого распознавания окружения. Она может помочь глубже понять, как звуки формируют субъективное восприятие местности. Например, шум трафика может ассоциироваться с городом, а шелест листвы — с лесом.

University of Texas at AustinИсточник: www.ferra.ru

0 0 голоса

Рейтинг новости

9945

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”