Meta* запускает программу по сбору языковых данных для развития AI

Meta запускает новую программу в партнёрстве с ЮНЕСКО по сбору речевых записей и расшифровок, которые, по словам компании, помогут в разработке общедоступного AI в будущем.

Партнерская программа языковых технологий ищет участников, которые могут предоставить более 10 часов речевых записей с транскрипцией, большие объемы письменного текста и наборы переведенных предложений на «разных языках». По словам Meta, партнеры будут работать с командами компании по искусственному интеллекту, чтобы интегрировать эти языки в модели распознавания речи и перевода на основе AI, которые после завершения разработки будут открыты для всеобщего доступа.

Среди партнёров на данный момент — правительство Нунавута, малонаселённой территории на севере Канады. Некоторые жители Нунавута говорят на языках инуитов, известных под общим названием инукту.

«Наши усилия особенно сосредоточены на малоизученных языках в поддержку работы ЮНЕСКО, — написала Meta в блоге, предоставленном TechCrunch. — В конечном счёте, наша цель — создать интеллектуальные системы, которые смогут понимать и удовлетворять сложные потребности людей независимо от языка или культурного происхождения».

В дополнение к новой программе Meta сообщила, что выпускает бенчмарк машинного перевода с открытым исходным кодом для оценки производительности моделей языкового перевода. Бенчмарк, состоящий из предложений, составленных лингвистами, поддерживает семь языков, и к нему можно получить доступ — и внести свой вклад — с платформы для разработки AI Hugging Face.

Meta рассматривает обе инициативы как благотворительные. Но компания выиграет от усовершенствованных моделей распознавания речи и перевода.

Meta продолжает расширять количество языков, которые поддерживает её помощник на базе искусственного интеллекта Meta AI, а также тестировать такие функции, как автоматический перевод для авторов. В сентябре прошлого года Meta объявила, что начнёт тестировать инструмент для перевода голосов в Instagram Reels, позволяющий авторам дублировать свою речь и автоматически синхронизировать её с губами.

То, как Meta относится к контенту на других языках, кроме английского, на своих платформах, стало предметом многочисленных критических замечаний. Согласно одному из отчётов, Facebook оставил без пометок почти 70% италоязычной и испаноязычной дезинформации о COVID по сравнению с 29% аналогичной дезинформации на английском языке. А утечка документов компании показала, что посты на арабском языке регулярно ошибочно помечаются как разжигание ненависти.

Meta заявила, что предпринимает шаги по улучшению своих технологий перевода и модерации.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии