Инклюзивный ИИ: как неидеальные данные делают технологии ближе к людям

Работа с «неидеальными» данными стала одним из главных вызовов для ИИ-разработки. Какие сложности за этим стоят и как инклюзивный подход делает технологии лучше для всех пользователей — разбираемся вместе с экспертом.

Многие разработчики все еще учат ИИ на идеальных данных: чистый звук, ровный свет, четкие команды. Такой подход работает в теории. Но на практике пользователь, который работает с нейросетью, может говорить с сильным акцентом, снимать на разбитую камеру в темноте и торопиться. Сталкиваясь с такими артефактами, алгоритмы теряются и отвечают с ошибками.

Новым технологическим трендом может стать смещение фокуса с идеальных данных на репрезентативные — те, что в полной мере отражают разнообразие человеческих голосов, интонаций, почерков, внешности и паттернов поведения.

Что такое «неидеальные данные» и зачем они ИИ

«Неидеальные» данные — это все, что не укладывается в условную норму, на которой традиционно обучают модели. К ним относятся:

речь людей с особенностями артикуляции, дикции или после неврологических заболеваний;голоса с нестандартным тембром, скоростью или интонацией;визуальные сценарии, где важен не внешний вид картинки, а ее смысл;пользовательские действия, которые идут не по «ожидаемому» сценарию.

Для разработчиков такие данные считаются сложными — их мало, они сильно отличаются друг от друга и плохо поддаются автоматической разметке. Но работа с такой информацией заставляет алгоритмы учиться работе с живыми пользователями. В итоге ИИ-модели начинают лучше понимать людей в шумном метро, при плохом соединении или пользователей с особенностями речи.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости