ИИ-компания Smart Engines представила новую версию системы распознавания паспорта и других документов Smart ID Engine 2.5 для удостоверения личности клиентов. Для этого разработчики обучили два нейросетевых ансамбля “Да Винчи” и “Шерлок”, которые позволят бизнесу эффективнее бороться с фродом, упростить клиентский путь и повысить конверсию. Время исполнения обеих моделей ИИ на одном изображении составляет в среднем менее 1 секунды без использования GPU.
Нейросетевая архитектура “Да Винчи” способна находить и распознавать документ, расположенный как угодно: под углом, вверх ногами или даже отраженный зеркально, а также определять его геометрию. Разумеется, мало кто будет распознавать документ через зеркало, зато в режиме “селфи” многие смартфоны отзеркаливают изображения. Скорость и выверенность действий технологии позволили сравнить ее с выдающимся итальянским художником, геометром и изобретателем Леонардо да Винчи — эталоном человека эпохи Возрождения.
В предельных случаях ИИ “Да Винчи” может извлекать паспортные данные, когда разворот документа занимает менее 15% фото с размерами 720 на 1280 пикселей. Число ошибок при распознавании полей документа на селфи сократилось в 5 раз. Это дает возможность проводить процедуру KYC по одному селфи с паспортом для клиентов с бюджетными смартфонами. Используя Smart ID Engine 2.5, банки и финтех смогут предложить передовые стандарты дистанционного обслуживания новой аудитории и увеличить клиентскую базу.
“Шерлок” – это уникальный нейросетевой ансамбль для проверки подлинности документов. Как и литературный прототип, созданный Smart Engines ИИ мыслит и действует как настоящий ученый и детектив. ИИ анализирует параллельно сотни параметров и затем делает логически обоснованный вывод, что перед ним: подлинный документ, подделка или муляж. При этом нейросетевой “Шерлок” не голословен – он аргументирует свое решение и дает понятное любому человеку объяснение.
«Шерлок» справляется как с элементарными подделками, так и со сложными — например, выполненными с использованием дипфейк-технологий. Всего ИИ осуществляет 533 проверки, разделенные на 13 групп. Ансамбль нейросетей удостоверяется в цифровой подлинности документа, обнаруживает любые вмешательства в изображения (“Антифотошоп”), как настоящий криминалист исследует образцы в ультрафиолетовом, инфракрасном и видимом диапазонах, анализирует данные на предмет согласованности. Помимо этого, «Шерлок» определяет “живость” документа (liveness), исключая подмену реальной бумаги ксерокопией или съемкой с экрана, и сверяет фотографию из документа с лицом предъявителя. Нейросеть определит подделку документа любой страны мира, а если бланк устарел или государства не существует, — сообщит об этом. «Шерлок» подходит для работы и в физическом канале, и в цифровом с фото- и видеопотоками.
Раньше нейросеть была “черным ящиком” для бизнеса, поскольку давала бинарный ответ – “подделка” или “не подделка”. Нейросетевой “Шерлок” станет незаменимым помощников, для специалистов банков, МФО или других организаций, поскольку в каждом случае будет давать понятное объяснение – почему нейросети дали положительный или отрицательный ответ. Применяемые в новой версии Smart ID Engine алгоритмы ИИ позволят усилить защиту от мошенников в цифровых каналах, не усложняя процесс получения услуг добросовестным клиентам.
Благодаря проведенным алгоритмическим оптимизациям в обновлении Smart ID Engine снижен объем потребляемой памяти для паспорта РФ на 17% и повышено качество распознавания документов. Число ошибок при распознавании паспорта РФ, заполненного от руки, снизилось на 19%, в случае с машинописным – на 6%. Улучшения коснулись и других наиболее востребованных документов: количество ошибок при распознавании СТС сократилось на 29%, водительского удостоверения – на 20%, СНИЛС – на 14%, свидетельства о рождении – на 15%. За счет интеграции 4.6-битных сверхлегких нейросетей скорость детекции печатного и рукописного текстов на изображении увеличилась на 10%.
Соответствие закону обеспечивается как на этапе обучения ИИ, так и во время работы системы у клиента. Для обучения систем и проведения замеров использовались специализированные датасеты графических данных, созданные по методологии MIDV.
Smart ID Engine 2.5 работает в контуре у заказчика, при этом документы не передаются на обработку в сторонние сервисы, облачным верификаторам, на краудсорсинговые платформы.
«Мы назвали созданные нейросетевые ансамбли так неслучайно. Имя живописца и изобретателя Леонардо да Винчи было дано, поскольку великий итальянский ученый свободно владел зеркальным письмом — как наш ИИ сейчас. Второй ансамбль назван в честь гениального сыщика Шерлока Холмса, который мастерски раскрывал сложнейшие дела и умел элегантно и просто объяснить свои умозаключения. При его разработке мы поставили себе цель – сделать ИИ с интерпретируемым результатом, чтобы компании могли снизить риски мошенничества с документами и не говорили “НЕТ” клиентам без веской и понятной причины» — рассказал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
В настоящее время Smart ID Engine позволяет распознавать все страницы паспорта РФ, в том числе рукописную прописку, водительские права, свидетельства ЗАГС и другие удостоверения личности на фотографиях, сканах и в видеопотоке. В новой версии добавлена поддержка 107 типов документов, теперь Smart ID Engine распознает 2897 типов документов. В общей сложности поддерживается 4573 шаблона документов всех стран мира.
Smart ID Engine включен в Реестр ПО Минцифры РФ и относится к классу систем ИИ. Система доступна для интеграции в серверные, десктопные, мобильные и веб-приложения, а также совместима со всеми актуальными ОС, включая отечественные дистрибутивы Linux, ОС Аврора и Эльбрус.
Источник: habr.com