Работа с «неидеальными» данными стала одним из главных вызовов для ИИ-разработки. Какие сложности за этим стоят и как инклюзивный подход делает технологии лучше для всех пользователей — разбираемся вместе с экспертом.
Многие разработчики все еще учат ИИ на идеальных данных: чистый звук, ровный свет, четкие команды. Такой подход работает в теории. Но на практике пользователь, который работает с нейросетью, может говорить с сильным акцентом, снимать на разбитую камеру в темноте и торопиться. Сталкиваясь с такими артефактами, алгоритмы теряются и отвечают с ошибками.
Новым технологическим трендом может стать смещение фокуса с идеальных данных на репрезентативные — те, что в полной мере отражают разнообразие человеческих голосов, интонаций, почерков, внешности и паттернов поведения.
Что такое «неидеальные данные» и зачем они ИИ
«Неидеальные» данные — это все, что не укладывается в условную норму, на которой традиционно обучают модели. К ним относятся:
речь людей с особенностями артикуляции, дикции или после неврологических заболеваний;голоса с нестандартным тембром, скоростью или интонацией;визуальные сценарии, где важен не внешний вид картинки, а ее смысл;пользовательские действия, которые идут не по «ожидаемому» сценарию.
Для разработчиков такие данные считаются сложными — их мало, они сильно отличаются друг от друга и плохо поддаются автоматической разметке. Но работа с такой информацией заставляет алгоритмы учиться работе с живыми пользователями. В итоге ИИ-модели начинают лучше понимать людей в шумном метро, при плохом соединении или пользователей с особенностями речи.
Источник: hi-tech.mail.ru