Meta запускает новую программу в партнёрстве с ЮНЕСКО по сбору речевых записей и расшифровок, которые, по словам компании, помогут в разработке общедоступного AI в будущем.
Партнерская программа языковых технологий ищет участников, которые могут предоставить более 10 часов речевых записей с транскрипцией, большие объемы письменного текста и наборы переведенных предложений на «разных языках». По словам Meta, партнеры будут работать с командами компании по искусственному интеллекту, чтобы интегрировать эти языки в модели распознавания речи и перевода на основе AI, которые после завершения разработки будут открыты для всеобщего доступа.
Среди партнёров на данный момент — правительство Нунавута, малонаселённой территории на севере Канады. Некоторые жители Нунавута говорят на языках инуитов, известных под общим названием инукту.
«Наши усилия особенно сосредоточены на малоизученных языках в поддержку работы ЮНЕСКО, — написала Meta в блоге, предоставленном TechCrunch. — В конечном счёте, наша цель — создать интеллектуальные системы, которые смогут понимать и удовлетворять сложные потребности людей независимо от языка или культурного происхождения».
В дополнение к новой программе Meta сообщила, что выпускает бенчмарк машинного перевода с открытым исходным кодом для оценки производительности моделей языкового перевода. Бенчмарк, состоящий из предложений, составленных лингвистами, поддерживает семь языков, и к нему можно получить доступ — и внести свой вклад — с платформы для разработки AI Hugging Face.
Meta рассматривает обе инициативы как благотворительные. Но компания выиграет от усовершенствованных моделей распознавания речи и перевода.
Meta продолжает расширять количество языков, которые поддерживает её помощник на базе искусственного интеллекта Meta AI, а также тестировать такие функции, как автоматический перевод для авторов. В сентябре прошлого года Meta объявила, что начнёт тестировать инструмент для перевода голосов в Instagram Reels, позволяющий авторам дублировать свою речь и автоматически синхронизировать её с губами.
То, как Meta относится к контенту на других языках, кроме английского, на своих платформах, стало предметом многочисленных критических замечаний. Согласно одному из отчётов, Facebook оставил без пометок почти 70% италоязычной и испаноязычной дезинформации о COVID по сравнению с 29% аналогичной дезинформации на английском языке. А утечка документов компании показала, что посты на арабском языке регулярно ошибочно помечаются как разжигание ненависти.
Meta заявила, что предпринимает шаги по улучшению своих технологий перевода и модерации.
*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации
Источник
Источник: habr.com