Microsoft создала ИИ, который расшифровывает часы аудио за секунды

Microsoft представила ИИ-модели собственной разработки. Одна из них — MAI-Transcribe-1, которую явно оценят частые посетители конференций.

MAI-Transcribe-1 умеет быстро превращать речь в текст на 25 языках мира. Расшифровка занимает секунды, даже если исходная запись длилась несколько часов.

Вместе с ней компания выпустила ещё две модели.

MAI-Voice-1 — создаёт «очень реалистичную речь», даже сохраняя характер и эмоции говорящего. Достаточно одной минуты исходной записи.

MAI-Image-2 — генерирует картинки по текстовому описанию. Она, как отмечают разработчики, особенно хороша в естественном освещении, оттенках кожи и чётком тексте внутри изображений.

Источник: www.ferra.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии