Обновление называют «самым масштабным за всю историю существования сервиса»
Google объявила о масштабном обновлении сервиса «Google Переводчик». Раньше переводчик поддерживал 130 самых популярных языков. Теперь в сервис добавлено еще 110 языков. Среди них есть те, на которых разговаривают в России.
Так, в список поддерживаемых попали: башкирский, бурятский, крымскотатарский, коми, осетинский, удмуртский, чеченский, чувашский, чукотский, якутский и абхазский. Из малоиспользуемых в России: кантонский диалект китайского, мэнский, креольский, афарский и панджаби. Появилась поддержка креольского языка ток-писин и системы письма нко, созданной для языков манде.
Известно, что с добавлением новых языков помогли ИИ-алгоритмы PaLM 2 (большая языковая модель). Искусственный интеллект позволяет эффективнее справляться с теми случаями, когда у того или иного языка очень много региональных диалектов и нет единой верной формы правописания слов. Задача ИИ — понять, какие вариации встречаются чаще. При переводе на любой язык алгоритмы Google будут придерживаться, прежде всего тех диалектов, которые чаще встречаются в интернете. Однако переводчик будет предлагать варианты перевода с элементами иных смежных диалектов.
Новые языки в «Google Переводчике» уже доступны большинству пользователей мобильной или десктопной версии сервиса. У всех опция появится в течение ближайших дней. Сейчас в «Google Переводчике» доступно более 200 языков, но в будущем компания хочет с помощью нейросетей расширить перечень поддерживаемых языков до 1000 штук. Для справки: на Земле насчитывается 7151 язык, относящийся к 142 разным языковым семьям. На 40 наиболее распространенных языках разговаривает примерно 2/3 человечества.
Источник: hi-tech.mail.ru