Исследователи из Университета штата Аризона обнаружили, что голос актрисы Скарлетт Йоханссон действительно звучит как «Sky», вариант озвучки новой модели OpenAI GPT-4o. Голоса совпадают на 98%.
Исследователи применили модель искусственного интеллекта, разработанную для анализа голосовых сходств. Sky сравнили примерно с 600 голосами актрис.
Однако модель также обнаружила, что более всего озвучка похожа на голоса Энн Хэтэуэй и Кери Рассел. Автор работы Висар Бериша считает, что голос Йоханссон «похож, но, вероятно, не идентичен» голосу Sky.
Так, если бы у ИИ-помощника был голосовой тракт, который формирует данный голос, то он был бы такой же длины, как у Йоханссон. Но озвучка была более высокой тональности и выразительности, чем голос актрисы, который оказался «немного более хриплым».
Бериша рассказал The Verge, что природа моделей ИИ для анализа представляет собой «чёрный ящик», что затрудняет «точное понимание того, какие голосовые сходства и различия выявляет модель» или почему она считает один голос более похожим на оригинал, чем другой.
И генеральный директор OpenAI Сэм Альтман, и технический директор Мира Мурати отрицают, что Sky озвучили голосом Йоханссон. После демонстрации GPT-4o в начале мая актриса заявляла, что Альтман сам попросил её озвучить модель, но она отказалась.
Йоханссон не подавала в суд против OpenAI, но сказала, что наняла адвоката для расследования всех обстоятельств. Эксперты по правовым вопросам говорят, что, если она решит подать в суд, то есть реальная вероятность, что ей, возможно, даже не придётся доказывать, что это сходство было создано намеренно.
Пока же OpenAI временно отключила этот вариант озвучки ChatGPT.
Источник: habr.com