Оперативные новости и аналитические материалы мира высоких технологий

Россияне научили ИИ распознавать поддельные паспорта в темноте. Видео

ПО Софт Цифровизация Бизнес-приложения Документооборот Маркет
, Текст: Дмитрий Степанов
Новая версия системы искусственного интеллекта для распознавания документов в видеопотоке и на изображениях, разработанная российской компанией Smart Engines, теперь «понимает» 40 языков и выявляет подделки среди 940 типов удостоверяющих документов даже при плохом освещении.

ИИ Smart Engines изрядно «поумнел»

Как стало известно CNews, российская компания Smart Engines представила новую версию системы искусственного интеллекта для распознавания документов в видеопотоке и на изображениях Smart IDReader 3.0.

Новая версия поддерживает распознавание 940 типов документов, в том числе и в условиях недостаточного освещения. Перечень документов включает паспорта всех стран мира, удостоверения личности (ID-карты), водительские права, визы, карточки медицинского страхования. Теперь для каждой из стран Европы и СНГ распознаются паспорта, ID-карты и водительские права. Также расширен состав обрабатываемых документов для Австралии, Канады, Китая, Кореи, Мексики, США и Японии.

По словам разработчиков, скорость обработки изображений Smart IDReader в среднем выросла на 25%. При этом все вычисления в процессе распознавания выполняются всегда на устройстве клиента. Это может быть обычный смартфон, если Smart IDReader встроен непосредственно в мобильное приложение, сервер, настольный ПК или терминал самообслуживания.

Продукт реализован на базе фирменной ИИ-платформы Hieroglyph, разработанной специалистами Smart Engines. Платформа оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86/x64 и совместим с операционными системами МОС «Аврора» (ранее Sailfish Mobile OS RUS), Android, iOS, «Эльбрус», Linux (включая Astra Linux и «Атликс»), Windows, macOS и Solaris.

Что нового в Smart IDReader 3.0

Пользователям Smart IDReader 3.0 стала доступна возможность автоматической проверки непротиворечивости данных документа на изображениях и в видеопотоке. Проверка документа, как пояснили представители Smart Engines в разговоре с CNews, включает в себя сверку распознанных текстовых данных визуальной зоны документа и машиночитаемой зоны (MRZ) при ее наличии. Для определения действительности документа, в зависимости от его типа, выполняется сопоставление текущей даты с датой рождения, датой выдачи и сроком действия документа.

В Smart IDReader 3.0 добавлены возможности по распознаванию более 650 новых удостоверяющих документов и проверка признаков их компрометации. Повышено качество распознавания всех типов банковских карт, машиночитаемой зоны на любых документах и одномерных/двумерных штрихкодов. Для распознавания MRZ был усовершенствован алгоритм поиска текстовых строк. Развитие технологии распознавания штрихкодов было направлено на улучшение качества извлечения данных из двумерных штрихкодов AZTEC и QR, которые используются на квитанциях ЖКХ, ФНС РФ и других типовых документах, рассказали CNews в компании.

В сравнении с версией 2.0 для российских клиентов добавлено распознавание временного удостоверения личности, удостоверений прокурора и адвоката, и настроены новые формы документов для вида на жительство, военного билета и полиса обязательного медицинского страхования (ОМС). По запросу страховых компаний и брокеров в Smart IDReader расширен состав распознаваемых полей в свидетельстве о регистрации ТС (СТС). В паспорте РФ повышено качество распознавания печатных штампов с регистрацией и сведениями о ранее выданном паспорте.

Для платежных решений, а также банковских сервисов мобильного и интернет эквайринга предложена возможность ввода данных карты клиента при оплате в приложении или на сайте по одной фотографии. Для этого, как пояснили CNews в Smart Engines, в серверных компонентах Smart IDReader добавлена поддержка режима распознавания данных банковских карт на отдельных изображениях, которая ранее была доступна только при работе с видео.

Платформа Hieroglyph

Платформа Hieroglyph был впервые представлена Smart Engines в марте 2018 г. На данный момент она умеет распознавать документы более 180 стран мира и поддерживает 40 языков.

Hieroglyph использует собственные наработки Smart Engines в области распознавания изображений. В основе системы лежат глубокие целочисленные нейронные сети. Для ускорения их работы, разработчики применили сепарированную архитектуру сверточных слоев и восьмибитную модель вычислений.

Чтобы экономить ресурсы, Hieroglyph генерирует компактные описания изображений, которые представляются в виде векторов многомерного метрического пространства. В этих описаниях отсеиваются искажения, которые являются следствием разной яркости освещения и ракурса съемки. По словам разработчиков, это помогает распознавать документы из видеопотока и при непредсказуемых условиях освещения.

В октябре 2018 г. CNews сообщил о внедрении разработки на базе Hieroglyph в мобильное приложение 6profis для распознавания документов работниц легальной секс-индустрии Германии.

В апреле 2019 г. Smart Engines представила кроссплатформенную программу распознавания образов танков Smart Tank Reader.

В мае 2019 г. компания анонсировала кроссплатформенный инструментарий разработчика, с помощью которого любое приложение можно наделить функциями быстрого распознавания сложных документов, а неделей позже стало известно о выходе программно-аппаратного комплекса, предназначенного для распознавания и проверки подлинности защищенных от подделки документов на базе технологий Smart Engines и компании «Интек».

Несколько фактов о Smart Engines

Smart Engines — российский разработчик систем обработки изображений и распознавания символов в видеопотоке. Компания была основана в 2010 г., но до 2015 г. работала только на зарубежном рынке. Ее штат насчитывает более 45 сотрудников из России и других стран, среди них 14 имеют ученую степень.

Генеральным директором Smart Engines является Владимир Викторович Арлазаров. Директором по научной части и соучредителем Smart Engines выступает Владимир Львович Арлазаров, сооснователь еще нескольких российских ИТ-компаний. В частности, он является основателем компании Cognitive Technologies, где с 1991 г. по 2008 г. занимал пост генерального директора.

Технологии Smart Engines используют Альфа-банк, «Почта банк», «Тинькофф банк», Рокетбанк, Dukascopy Bank SA, Совкомбанк, банк «Восточный», Локобанк, Jysan Bank, МТС, «Мегафон», «Аэрофлот», Kupibilet, ЦИАН, «Альфастрахование», группа «Ренессанс страхование» и другие.

В декабре 2016 г. система распознавания документов Smart IDReader была внесена в Реестр отечественного ПО, курируемый Минкомсвязи.

В марте 2018 г. стало известно, что Smart Engines адаптировала часть своих решений под платформу «Эльбрус» и перешла на цикл, когда новые разработки сразу создаются под отечественные процессоры, то есть не требуют последующего портирования.