Microsoft представила ИИ-модели собственной разработки. Одна из них — MAI-Transcribe-1, которую явно оценят частые посетители конференций.
MAI-Transcribe-1 умеет быстро превращать речь в текст на 25 языках мира. Расшифровка занимает секунды, даже если исходная запись длилась несколько часов.
Вместе с ней компания выпустила ещё две модели.
MAI-Voice-1 — создаёт «очень реалистичную речь», даже сохраняя характер и эмоции говорящего. Достаточно одной минуты исходной записи.
MAI-Image-2 — генерирует картинки по текстовому описанию. Она, как отмечают разработчики, особенно хороша в естественном освещении, оттенках кожи и чётком тексте внутри изображений.
Источник: www.ferra.ru