Nvidia представила Fugatto, экспериментальную ИИ-модель, способную генерировать и изменять аудио, опираясь на текстовые описания. Официально названная Foundational Generative Audio Transformer Opus 1, Fugatto описывается как «швейцарский армейский нож для звука» и была разработана международной командой исследователей.
Универсальность модели позволяет пользователям создавать различные «звуковые продукты», от музыки до эффектов. Например, музыкальные продюсеры могут генерировать и редактировать песни с различными инструментами и стилями.
Возможности Fugatto выходят за рамки предварительно обученных задач — он может воспроизводить речь с определенным акцентом и эмоциями или имитировать ливень, проходящий по ландшафту.
Nvidia не подтвердила публичную доступность инструменты. К счастью, есть достаточно генераторов музыки, и даже редакторов звуков в открытом доступе.
Источник: www.ferra.ru