Оперативные новости и аналитические материалы мира высоких технологий
Статья

Цифровая трансформация началась: избавляемся от бумажных документов

Цифровизация Документооборот Аутсорсинг
, Текст: Наталья Рудычева

Переход к электронным документам и данным – основа цифровой трансформации бизнеса и власти, обеспечения взаимодействия общества и государства в рамках цифровой экономики. Что при этом делать с огромными бумажными массивами? Попытаемся разобраться.

Перед государством и бизнесом стоит задача – наполнить реестры и информационные системы необходимыми сведениями, данными, информацией, чтобы автоматизировать, ускорить, упростить взаимодействие, внедрить аналитику и прогнозирование, параллельно исключая из этих процессов человеческий труд и человеческий фактор. Большинство новых данных и документов, от одного реквизита в СЭД или ERP до миллионов транзакций или потока сведений со счетчиков ЖКХ, формируются уже в цифровом виде. Все старые документы и данные расположены на бумаге и стоят в очереди на оцифровку.

Проведенный CNews совместно с корпорацией ЭЛАР анализ государственных и коммерческих закупок показывает, что за 2016-2017 гг. госведомствами и организациями было заключено 445 контрактов в сфере оцифровки документов на общую сумму ₽4 235,8 млн. Наиболее востребованными направлениями являются оцифровка дел по основной деятельности органов государственной власти для наполнения ведомственных информационных систем и реестров; оцифровка технических архивов промышленных предприятий, ТЭК и оборонного комплекса для документационного сопровождения производства, сохранения и реинкарнации разработок; оцифровка описей и фондов государственных и муниципальных архивов, включая национальные проекты, а также создание цифровых коллекций библиотек и музеев с целью внедрения современных форматов деятельности.

Кажущаяся простота оцифровки

Бумажный архив сегодня выглядит по-разному. Это может быть и огромное помещение, до самого потолка заполненное стеллажами с пыльными делами, и идеально ровные ряды папок в новых кабинетных шкафах. Оцифровать все это – значит подобрать технологии сканирования и индексирования (ретроконверсии, извлечения информации), которые будут учитывать состояние документов и позволят добиться максимально высокого результата. В то время как начальные и конечные условия процесса оцифровки хорошо известны, все, что находится между ними, требует внимательного, квалифицированного расчета.

Технология оцифровки: что надо учесть

Источник: ЭЛАР, 2018

Понятно, что такой расчет может выполнить только человек, разбирающийся в технологиях оцифровки именно ваших документов, будь то архивные дела, техническая, финансовая или любая другая документация. Поэтому любой проект оцифровки начинается с очного обследования фондов экспертом, который оценивает их состояние, формирует список необходимых работ и оборудования. 

В 2016 г. при обследовании архивных дел БТИ одного из субъектов РФ собственник дал на оценку несколько дел с содержанием чертежей 5,5%. Экспертная комиссия, на основе опыта оцифровки БТИ, согласовала параметр 15% и вывод 2 дополнительных сканеров. Благодаря этому, когда при проведении сканирования стало попадаться много широкоформатных вложений, проект был выполнен без изменения запланированных сроков и бюджета.

Такое обследование обычно проводится бесплатно. На основании этих рекомендаций экспертная комиссия готовит несколько вариантов выполнения работ, рассчитывает их временные и финансовые параметры, определяет оптимальный. Эта позволяет в дальнейшем выполнять работы без срыва сроков и изменения бюджета.

Сканирование: нужны ресурсы

Первый производственный этап оцифровки – сканирование, которое позволяет создать качественные электронные копии, в том числе для последующего индексирования. Сканирование может быть организовано как по месту нахождения документов, так и в специализированном центре компании-исполнителя. Во втором случае в целях безопасности разумно требовать, чтобы транспортировка осуществлялась самим исполнителем или спецсвязью, без привлечения третьих сторон.  

Участок сканирования, организованный в 2017 г. для проекта оцифровки Главного архивного управления Московской области

При наличии у исполнителя необходимого количества сканеров и операторов, сканирование – оперативная услуга. На рынке уже укоренилось понятие «быстрый старт», когда масштабные проекты оцифровки запускаются в течение нескольких дней в любой точке России.

Оперативность: уже через 3 дня после аварии на Саяно-Шушенской ГЭС на станции был организован участок сканирования, и электронные копии поврежденной водой и пожаром эксплуатационной документации начали предоставляться МЧС, следственным органам, ремонтным бригадам и пр. 
Ресурсы: в процессе оцифровки архивных документов для наполнения портала «Память Народа» Министерства обороны РФ только в 2017 г. отсканировано более 32 млн страниц. Только на площадке в Санкт-Петербурге были использованы 74 сканера и более 200 операторов сканирования и подготовки документов.

Особое внимание в ходе выполнения проекта оцифровки уделяется сканерам. Если документы ветхие, поврежденные, сшитые, с уходящим в корешок текстом и другими особенностями, они должны сканироваться на специальных устройствах. Компромиссов быть не может – ненадлежащее оборудование попросту нанесет ущерб бумажным оригиналам. Например, применение планшетных сканеров вместо профессиональных планетарных для книг и сшитых дел недопустимо.

Многие документы требуют дополнительного внимания – расшивки и сшивки, реставрации, подкладки непрозрачного фона, упаковки в защитные конверты перед сканированием. У компаний, придерживающихся высоких производственных стандартов, эти работы не только обязательно включены в перечень услуг, но и часто входят в стоимость.

А как же безопасность?

При оцифровке документов неизбежно встает вопрос об обеспечении их сохранности и безопасности. Огромную роль в этом процессе играет автоматизация – наличие у исполнителя работ учетной системы, которая позволяет провести документы по технологическим этапам без нарушения комплектности и риска утери. В крупных компаниях такие управляющие системы имеют огромный набор функций – RFID-учет перемещения документов, распределение и прогнозирование потребности в ресурсах, механизмы программного и выборочного ручного контроля качества.

Интеллектуальные алгоритмы умеют находить нужную информацию в текстах и вырезать соответствующий фрагмент для проверки оператором

Но что делать, если документы конфиденциальные? Во-первых, появилась интересная технология, при которой отсканированный образ разрезается на мелкие фрагменты с нужными сведениями (фамилии, суммы, даты и пр.), причем эта операция проводится по месту нахождения документов. Полученные таким образом данные передаются на индексирование в обезличенном виде – целые документы не покидают территорию собственника и не доступны ни одному сотруднику исполнителя. 

Практически всегда подготовка сопровождает сканирование технических архивов – ветхих чертежей и калек. Такими услугами пользуются крупнейшие компании и предприятия – Газпром, Лукойл, ВТЗ и пр. Исполнителям с высокими стандартами услуг доверяют даже обработку документов Архивного фонда. Например, в 2016 г. при оцифровке материалов Архива внешней политики МИД РФ дела расшивались для сканирования широкоформатных вкладышей, а затем сшивались с применением специальных переплетных материалов.

Например, такая технология в 2016 и 2017 гг. была применена для перевода в электронный вид юридических дел ключевых клиентов двух банков из Топ-20, а также при наполнении электронного архива Администрации Президента РФ.

Во-вторых, для секретной документации может организовываться полный цикл оцифровки по месту хранения документов с оформлением допусков на задействованных сотрудников. Очевидно, что такие работы можно доверять компаниям, которые имеют  опыт работы с гостайной и соответствующую лицензию ФСБ.

Данные извлечь!

Созданием просто электронных образов довольствуются только организации сферы культуры, которым необходимо перевести в электронный вид картины, плакаты, афиши. Документы же ценны содержащейся в них информацией. И эту информацию нужно извлечь для того, чтобы загрузить в соответствующую базу данных или сделать возможным поиск документа среди тысяч других.

Если речь идет о современных документах, то большая часть их индексирования осуществляется программным путем, ручной труд используется только для контроля качества. Рукописные и слабочитаемые тексты, с которыми программы справиться не могут, индексируются в основном вручную. Но и здесь интеллектуальные алгоритмы упрощают и удешевляют работу, помогая автоматически классифицировать документы по типам.

Операторы индексируют рукописные документы и проверяют результаты работы программ

При организации процесса индексирования огромную роль играют имеющиеся у подрядчика ресурсы. Количество данных обычно значительно превышает число электронных образов и исчисляется миллионами записей. Чтобы проиндексировать такой объем в разумные сроки нужны развитые программные средства и сотни операторов – если не для ввода текста, то для проверки работы программ.

Выполненный в 2016 г. в Республике Крым проект по переносу из украинских документов в ГКН сведений о более чем 900 000 земельных участках позволил зарегистрировать права без очного приема около 30% населения республики. При этом при индексировании операторы вручную ставили в соответствие старым адресам новые российские.

Важнейшую роль в этом и других проектах по подготовке эталонных данных или мастер-данных для государства и бизнеса имеет опыт и квалификация операторов, их специализация на особых типах документов, разработка четких правил индексирования сложных массивов. Привлечение необученных сотрудников приводит к большому количеству ошибок.

Вообще, в процессе индексирования качество играет важнейшую роль, так как любое недостоверное сведение – это, как минимум, не найденный вовремя документ, как максимум – неверный социальный или финансовый статус человека или объекта. Стандартом для рынка оцифровки стал показатель качества >99,8%. Однако, как показывают результаты выполнения некоторых госконтрактов, это условие часто не соблюдается даже в небольших заказах, и договоры разрываются заказчиками. Происходит это из-за отсутствия у исполнителей систем контроля качества.

Развитая система контроля качества должна, как минимум, включать в себя мультиввод (результат распознавания считается окончательным только когда он совпадает у нескольких источников), сверку данных со справочниками (например, таблицами контрагентов или ЕГРЮЛ), нормирование (приведение адресов, ФИО и других данных к заданным стандартам написания, так как любое взаимодействие систем требует, чтобы данные в них были идентичны), программный контроль наличия нестандартных символов и значений, выборочные проверки и т.д.

При создании Информационно-правовой системы Министерства обороны РФ оцифрованы и связаны гиперссылками более 65 000 приказов. А на крупнейшем онлайн-портале о Великой Отечественной войне «Память Народа» все документы имеют геопривязку: из найденного фрагмента с записью о бойце можно перейти к точке на карте, а оттуда – к карточке боя или всему боевому пути солдата.

Таким образом, если необходимо оцифровать большой объем данных, разумно выбирать проверенную компанию с подтвержденным опытом выполнения схожих проектов без срыва сроков и стандартов качества. Оценку исполнителей можно провести на основании открытой информации о закупках по 44-ФЗ и 223-ФЗ. В этом случае можно рассчитывать на получение полных и достоверных данных, а также подготовленного ресурса электронных документов – в нужном формате, с геопривязкой и гиперссылками по тексту.

И, конечно, требуйте гарантии! Компании, уверенные в своих технологиях, дают ее без проблем. А вы, как собственник документов и заказчик работ, получите нужный результат – электронные ресурсы быстрого доступа для повышения эффективности профильных производственных и бизнес-функций; массив электронный копий с поиском для совместной работы и передачи по каналам взаимодействия; чистые и достоверные данные для внесения в мастер-систему или государственный реестр.

В конечном счете, только переход всех участников цифровой трансформации на электронные документы и данные позволит построить цифровую экономику и наладить эффективное взаимодействие государства, бизнеса и общества.