Французский ИИ-стартап Kyutai представил голосового помощника Moshi, который превосходит ChatGPT по своим возможностям. ИИ способен обрабатывать запросы и отвечать на них без временных задержек.
Moshi способен общаться с использованием 70 разных эмоций и акцентов. Однако ИИ пока не понимает русский язык.
«Она думает так же, как и говорит. Мы считаем, что у Moshi есть большой потенциал изменить способ общения с машинами и с помощью них», — отметил CEO организации Патрик Перес.
Разработчики обещают выложить код проекта в открытый доступ, а также доработать помощника, чтобы его можно было запускать на обычных ноутбуках.
Демо-версию уже можно опробовать по этой ссылке. Пока пользователям доступны сессии длительностью не более пяти минут.
В мае OpenAI представила новую языковую модель GPT-4o, которая может воспринимать и генерировать звук. Она способна реагировать на аудиовход всего за 232 миллисекунды, а в среднем за 320 миллисекунд, общается голосом «как человек», меняя интонации, и запоминает все беседы с пользователем.
Источник: habr.com