Оперативные новости и аналитические материалы мира высоких технологий
Статья

Как хранить электронные документы? Советы эксперта

Цифровизация Документооборот Инфраструктура

Электронный документооборот в России становится все более распространенным. E-документы уже активно использует бизнес, на электронную форму работы переходят суды. И это только начало. В ближайшее время архивам придется принять тысячи, миллионы, и, возможно, миллиарды e-документов. Хранить их нужно будет на протяжении многих лет, не нарушая при этом целостности, аутентичности, сохраняя информацию, которая может понадобиться в любое время. А это неизбежно вызовет массу проблем.

В конечном итоге, как и в случае бумажных архивов, надежность документов определяется тем, насколько хорошо организована деятельность архива и насколько надежен его персонал.

Использовать "однократные" носители?

При хранении электронных документов на носителях однократной записи "мастер-копия" находится на носителях. Те же документы в онлайн-системе рассматриваются как рабочие копии.

У такого способа есть несомненные достоинства. Если электронные документы записываются на носитель однократной записи в момент времени, максимально близкий ко времени их создания, и носитель "закрывается", - то дальнейшее управление электронными документами аналогично управлению привычными бумажными делами. Не требуется переучивать архивных специалистов, и можно использовать апробированные стандарты и методики работы.

Рекомендации Национальных архивов США (NARA) по сохранению электронных документов на носителях однократной записи (разработаны в 2003 году для федеральных государственных учреждений)

  • Использовать носители с ожидаемым сроком службы не менее 20 лет, поддерживаемые многими производителями
  • Мигрировать документы со старых носителей на новые каждые 10 лет
  • Контролировать отсутствие изменений в документах
  • Миграцию документов осуществлять на технологически нейтральные файлы форматов XML, RTF
  • Хранить электронные носители в стабильной среде: температура 15-18 градусов, влажность 35-45%
  • Ежегодно проводить выборочную проверку документов, чтобы убедиться в их сохранности, их проверка на читаемость, и при 10 ошибках чтения - заменять носитель и восстанавливать данных; если высокий уровень ошибок характерен для определенной партии носителей - перезаписывать всю партию
  • Протоколировать все действия с документами

Этот метод также имеет и свои недостатки. Так, проблемой является оперативный доступ к документам. Более того, этот метод неудобен при больших объемах документов и при большом размере самих документов. Сложно проводить частичное уничтожение документов, а также обслуживание, конверсию и миграцию - поскольку может потребоваться вставить в привод, прочитать и извлечь из привода тысячи носителей. Кроме всего прочего, носители могут "потеряться" в хранилище, при их перемещении и использовании.

Отечественных рекомендаций по обеспечению долговременной сохранности электронных документов на носителях пока нет.

Существует несколько зарубежных норм, детально регламентирующих хранение электронных документов на съемных носителях однократной записи. Наиболее авторитетными из являются французский стандарт NF Z 42-013 "Требования к разработке и использованию информационных систем по обеспечению целостности содержащихся в них документов" и британский BIP 0008-1:2004 "Практика, обеспечивающая юридическую и доказательную силу информации, сохраняемой электронным образом".

Оба эти стандарта успешно используются в своих странах уже более десяти лет. Оба следуют принципам, предложенным в стандартах менеджмента качества.

Хранить ли онлайн?

Этот метод хранения архивных документов появился сравнительно недавно. Внешне его отличие от первого метода не бросается в глаза, поскольку, как и там, документы хранятся и в онлайн-системе (это может быть, в том числе, иерархическая система хранения данных), и на съемных носителях. Однако в данном случае мастер-копией являются данные в системе, а данные на носителях рассматриваются исключительно как резервные копии.

Принципиальное отличие этого метода заключается в том, что если нужно выполнить какие либо операции, охватывающие большие массивы документов, то не нужно тратить время на установку, извлечение и считывание носителей. Кроме того, становится возможной более глубокая автоматизация архивных операций, в том числе такой трудоемкой, как миграция.


Суды регулярно выносят решения на основе доказательств, представленных в электронном виде

Дополнительным плюсом является то, что информация постоянно доступна для использования, и архив может окупать себя, информационно поддерживая основную деловую деятельность или же оказывая платные услуги. Съемные носители такую оперативность обеспечить не могут, поэтому все чаще и государственные и коммерческие организации используют именно "онлайн"-метод.

Методических материалов по данному методу пока что немного. Можно, в частности, использовать ряд рекомендаций, содержащихся в упомянутом выше британском стандарте BIP 0008-1:2004.

Самой сложной проблемой при организации долговременного хранения электронных документов с ЭЦП является необходимость поддержания возможности в любой момент убедиться в подлинности ЭЦП. Для архивов это означает, что придется сохранять в рабочем состоянии множество версии и поколений инфраструктуры открытых ключей PKI. Большинство российских организаций (а что уж говорить про государственные архивы!), не готовы сейчас к решению таких задач, у них для этого нет ни финансовых, ни технических, ни кадровых ресурсов.

По мнению авторитетных специалистов, подтверждаемому уже имеющимся практическим опытом, решением проблемы является отказ от сохранения ЭЦП "в рабочем состоянии". Главное, по их мнению, чтобы при постоянном хранении электронных подписей (включая ЭЦП) можно было бы удостоверить роль, которую подпись выполнила в прошлом, в отношении интересов создавшей документы организации, интересов третьих сторон, культурных и исторических интересов общества.

При поступлении таких документов на постоянное или длительное архивное хранение, ЭЦП рекомендуется проверять и "снимать", фиксируя всю содержащуюся в ней информацию в метаданных документов. В дальнейшем защита целостности и аутентичности документов должна уже обеспечиваться силами и средствами архива.

Хотя электронные архивисты не горят желанием возиться с ЭЦП, те же самые технологии, на которых базируется ЭЦП, начинают все более активно использоваться в электронном архивном деле – в первую очередь для защиты целостности документов. Поскольку подписывать миллионы документов архивными ЭЦП нереально, то используется система иерархического определения дайджестов (хэшей), когда в итоге вычисляется дайджест всего архива или крупной его части. Тогда одна архивная ЭЦП способна подтвердить целостность всего огромного архива.

В статье перечислен далеко не полный перечень проблем, которые придется преодолевать в самом ближайшем будущем. К сожалению, как показывает российский опыт решения других проблем "электронного правительства", затягивание приводит тому, что все придется определять в авральном порядке, рискуя принять неверные или ошибочные решения. Государство должно в срочном порядке создать электронные архивы на федеральном и региональном уровне, с тем, чтобы успеть подготовиться к тому моменту, когда придется в массовом порядке принимать на хранение электронные документы. Иначе есть вполне ощутимый риск потерять значительную часть документального наследия страны.

Наталья Храмцовская