Специалисты Центра искусственного интеллекта, который открыт в Петрозаводском государственном университете (ПетрГУ), сообщили о разработке технологии для генерации синтетических наборов данных, то есть так называемых датасетов (набор информации, на основе которого происходит обучение нейронной сети). Как пояснили учёные, основой их технологии стала модель виртуального пространства. В перспективе разработка поможет в будущем создавать более выгодный с экономической точки зрения контент, который легко адаптируется под нужды любого заказчика. «В наш центр регулярно поступают заявки от крупных промышленных предприятий, в том числе федерального уровня, на разработку различных решений в области видеоаналитики. Например, задачи по фиксации нарушений техники безопасности и охраны труда сотрудниками. Для решения таких задач, как правило, требуется обучение нейронных сетей на реальных данных, фотографиях или видеозаписях. Получить такой набор данных для простых объектов, например, кошек, машин, достаточно просто. Но когда речь идет о сложном производственном процессе, собрать такие данные либо невозможно, либо крайне дорого. Возникает потребность имитации, и здесь приходят на помощь технологии виртуальной реальности. Создается 3D-модель той или иной ситуации, процесса, явления, и на ее основе собирается датасет», – рассказал директор центра Алексей Марахтанов.
Своей проект сотрудники ПетрГУ начали с обучения нейросети, которая распознаёт средства индивидуальной защиты. Искусственный интеллект обучался именно на наборе синтетических данных. «Сотрудники нашего центра создали виртуальное производственное помещение, работников, максимально похожих на реальных людей, и поместили в этот цех виртуальные камеры, которые с разных ракурсов произвели съемку. С помощью анимации на получившейся «площадке» можно проигрывать различные ситуации. Мы создали сцены с различными рабочими в цеху, которые соблюдают правила или пренебрегают средствами индивидуальной защиты при выполнении опасных работ», – поведал Марахтанов.
В конечном итоге учёными удалось сформировать датасет, включающий более 70 000 изображений. Также они рассказали, в случае использования трёхмерного моделирования собираются заранее размеченные данные. Такой подход исключает необходимость обработки данных вручную, то есть подобная обработка происходит в разы быстрее. «В целом, нам удалось доказать, что обученная на синтетическом датасете нейронная сеть дает результаты, сравнимые с обученной на реальном наборе данных. Например, в случае с таким средством индивидуальной защиты рабочего, как каска, точность превысила 99%, а по детекции более сложного объекта — защитных очков — 95%», – отметил директор центра искусственного интеллекта ПетрГУ.
Работа по разработке технологии генерации синтетических датасетов началась в начале прошлого года. В 2025 году завершилась его пилотная стадия. В Петрозаводском университете намерены на основе собственной разработки создать полноценную платформу для обучения нейронных сетей.
Источник: trashbox.ru