В России разработали ИИ-софт для генерации музыки и песен

Сегодня, 6 мая, информационное издание «ТАСС» сообщило, что специалисты из Новосибирского государственного технического университета разработали первое в России программное обеспечение на базе нейросетевых моделей, позволяющее генерировать различного рода аудиоконтент. Более того, Егор Антонянц, руководитель данного проекта, рассказал, что передовая российская система способна генерировать музыкальные композиции, вокальные партии и отдельные звуковые эффекты по текстовым промптам в полностью автономном режиме, то есть без какой-либо привязки к облачным сервисам. Подписывайтесь на Telegram-канал про технологии

Это одно из ключевых преимуществ российской разработки — система способна обеспечивать пользователя полным циклом генерации, начиная с текстового запроса и заканчивая экспортом готового аудиоконтента в популярные форматы WAV, MP3 и FLAC. «Встроенный графический интерфейс позволяет управлять проектами, сохранять и загружать пресеты параметров генерации, предпрослушивать результаты и экспортировать треки без привлечения сторонних редакторов», — рассказал Артур Хусаинов, разработчик проекта.

При этом запустить работу системы можно на оборудовании с 6 ГБ видеопамяти или даже меньше. В теории, это существенно повышает доступность технологии, так как у неё довольно скромные системные требования, да и масштабировать ПО для выполнения сложных задач тоже будет гораздо дешевле и проще. Но это ещё не все преимущества российской разработки. «Ключевая особенность нашего решения — это полная независимость от зарубежных платформ и возможность работы в закрытом контуре. Мы дообучили базовую модель специализированными LoRA-адаптерами под три типа контента: инструментальную музыку, песни с вокалом и звуковые эффекты, что позволяет избежать эффекта смешения характеристик и добиться более точного соответствия запросу», — объяснил Егор Антонянц.

Кроме того, разработчики ПО заявили, что их разработка адаптирована для работы с русскоязычными запросами, тогда как иностранные решения, что вполне ожидаемо, заточены под англоязычный контент и пользователей, которые его потребляют. И, что немаловажно, в будущем разработчики планируют свой софт дополнительно прокачивать — появится поддержка пространственного аудио для виртуальной реальности, а также возможность создавать звуковое сопровождение для видеоигр, автоматизированной озвучки фильмов, подкастов и рекламных роликов.

Источник: trashbox.ru

0 0 голоса

Рейтинг новости