Оперативные новости и аналитические материалы мира высоких технологий

Россияне научили смартфоны распознавать счета и накладные за считанные секунды

ПО Бизнес Бизнес-приложения ИТ в банках Техника Документооборот
, Текст: Дмитрий Степанов 3501
Российская компания Smart Engines представила кроссплатформенный инструментарий разработчика, с помощью которого любое приложение можно наделить функциями быстрого распознавания сложных документов.

Новая система распознавания сложных документов

Как стало известно CNews, российский разработчик ПО в области распознавания и обработки изображений компания Smart Engines создала систему, способную распознавать сложные документы с таблицами на фотографиях и сканах.

Разработка получила название Smart DocumentReader и, по заявлению создателей, может работать автономно, в том числе и на недорогих мобильных устройствах, при этом не приводя к их перегреву. В разговоре с CNews представитель Smart Engines пояснил, что время, необходимое для распознавания одного сложного документа, при использовании смартфона составляет 3-4 секунды.

Smart DocumentReader является многоплатформенным решением и представляет собой инструментарий разработчика, с помощью которого в мобильные, серверные и десктопные приложения можно встроить алгоритмы распознавания сложных документов. Новая технология реализована на базе платформы искусственного интеллекта Hieroglyph, также разработанной специалистами компании.

Разработка поддерживает аппаратные платформы «Эльбрус», «Комдив», SPARC, MIPS, ARM, x86 и совместима с операционными системами Sailfish Mobile OS RUS («Аврора»), iOS, Android, «Эльбрус», Linux, Windows, macOS, Solaris.

Решение может заинтересовать банки и иные финансовые организации, считают в Smart Engines. Внедрение технологии позволит упростить и ускорить процесс заполнения сложных форм в мобильных приложениях и интернет сервисах – для этого будет достаточно сфотографировать документ или загрузить уже имеющееся фото.

С какими документами работает Smart DocumentReader

Smart DocumentReader позволяет настроить распознавание любых сложноструктурированных документов, пояснил представитель компании-разработчика в разговоре с CNews. Их отличием от «одинаковых на просвет» документов является отсутствие регламентов, определяющих не только состав реквизитов, но и их точное расположение на форме документа.

В общем случае это могут быть как одностраничные, так и многостраничные документы, в том числе с табличной частью, размером до А4 включительно. Наиболее распространенными среди документов, удовлетворяющих данным критериям, являются справка по форме 2-НДФЛ, счет, счет-фактура, акт, товарно-транспортная накладная (ТТН), товарная накладная по форме ТОРГ12, универсальный передаточный документ (УПД), устав, договор, инвойс, анкета, заявление.

Распознавание справок 2-НДФЛ

Первым документом, доступным для распознавания в Smart DocumentReader, стала справка по форме 2-НДФЛ.

Справка 2-НДФЛ – официальный документ о доходах физического лица и удержанном с этих доходов налоге на доходы физических лиц. Информация из 2-НДФЛ используется для оценки заемщиков при оформлении ипотеки и других финансовых продуктов, а также в сервисах оформления комплекта документов для получения налоговых вычетов.

Справка представляет собой яркий пример сложного документа. С одной стороны, на нем присутствует набор статичных элементов (слов, линий) и переменных атрибутов, а с другой – стиль и взаимное размещение этих элементов может существенно меняться от документа к документу. При этом некоторые атрибуты являются необязательными и могут как присутствовать, так и отсутствовать.

Smart DocumentReader позволяет извлекать из изображения со справкой 2-НДФЛ от нескольких десятков до сотен атрибутов, включая все данные табличной части, даже когда она размещается на двух страницах. Используемые алгоритмы вычислительно эффективной зрительной памяти, по заявлению представителей Smart Engines, позволяют исправлять проективные искажения и добиваться высокого качества распознавания даже на фотографиях, сделанных пользователями при плохом освещении.

В настоящее время функциональность распознавания справки 2-НДФЛ на базе Smart DocumentReader доступна для тестирования только клиентам компании, использующим технологию распознавания удостоверяющих документов Smart IDReader или технологию распознавания банковских карт Smart CardReader.

Фреймворк Hieroglyph

Фреймворк Hieroglyph был впервые представлен Smart Engines в марте 2018 г. Он умеет распознавать удостоверения личности 55 стран и поддерживает 38 языков.

Hieroglyph использует собственные наработки Smart Engines в области распознавания изображений. В основе системы лежат глубокие целочисленные нейронные сети. Для ускорения их работы, разработчики применили сепарированную архитектуру сверточных слоев и восьмибитную модель вычислений.

Чтобы экономить ресурсы, Hieroglyph генерирует компактные описания изображений, которые представляются в виде векторов многомерного метрического пространства. В этих описаниях отсеиваются искажения, которые являются следствием разной яркости освещения и ракурса съемки. По словам разработчиков, это помогает распознавать документы из видеопотока и при непредсказуемых условиях освещения.

В октябре 2018 г. CNews сообщил о внедрении разработки на базе Hieroglyph в мобильное приложение 6profis для распознавания документов работниц легальной секс-индустрии Германии.

В апреле 2019 г. Smart Engines представила кроссплатформенную программу распознавания образов танков Smart Tank Reader.

Несколько фактов о Smart Engines

Smart Engines — российский разработчик систем обработки изображений и распознавания символов в видеопотоке. Компания была основана в 2010 г., но до 2015 г. работала только на зарубежном рынке. Ее штат насчитывает более 45 сотрудников из России и других стран, среди них 14 имеют ученую степень.

Генеральным директором Smart Engines является Владимир Викторович Арлазаров. Директором по научной части и соучредителем Smart Engines выступает Владимир Львович Арлазаров, сооснователь еще нескольких российских ИТ-компаний. В частности, он является основателем компании Cognitive Technologies, где с 1991 г. по 2008 г. занимал пост генерального директора.

Технологии Smart Engines используют Альфа-банк, «Почта банк», «Тинькофф банк», Рокетбанк, Dukascopy Bank SA, Совкомбанк, банк «Восточный», Локобанк, Jysan Bank, МТС, «Мегафон», «Аэрофлот», Kupibilet, ЦИАН, «Альфастрахование», группа «Ренессанс страхование» и другие.

В декабре 2016 г. система распознавания документов Smart IDReader была внесена в Реестр отечественного ПО, курируемый Минкомсвязи.

В марте 2018 г. стало известно, что Smart Engines адаптировала часть своих решений под платформу «Эльбрус» и перешла на цикл, когда новые разработки сразу создаются под отечественные процессоры, то есть не требуют последующего портирования.