Электронные архивы: отечественный опыт в оцифровке документов

МИНИСТЕРСТВО КУЛЬТУРЫ И ТУРИЗМА УКРАИНЫ
ХАРЬКОВСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ КУЛЬТУРЫ
Кафедра информационных технологий
Реферат
Электронные архивы: отечественный опыт в оцифровке документов

Выполнила
студентка ф-та ДИД
Голик Ольга Валерьевна
Харьков-2009
Содержание

Введение
1. Понятие «электронный архив»
2. Проблема сохранения цифрового наследия
3. Проекты по оцифровке документов
Заключение
Перечень ссылок
Введение

Проблема возрастания объёмов документов сегодня актуальна для всех. Все чаще из-за сложности доступа к архивам увеличивается время поиска документов и, как следствие, вынужденных простоев. Наиболее эффективным решением данной проблемы является сканирование документов, организация и создание электронного архива.
Отдельные организации и учреждения культуры, науки, средств массовой информации, промышленности и др., создающие и хранящие значительные массивы цифровых информационных ресурсов и предоставляющие к ним доступ, уже неоднократно сталкивались с необходимостью специальных усилий по сохранению цифровых информационных ресурсов и предоставления долговременного доступа к ним.
Именно электронные архивы стали необходимым условием эффективной работы современной организации.
1. Понятие «электронный архив»

В последнее время, говоря об автоматизации работы архивной службы, часто употребляют термин «электронный архив».
Под электронным архивом
понимаются база документов на электронных носителях и программные средства, позволяющие осуществлять поиск необходимой информации.
Основные задачи и проблемы, возникающие при разработке программного обеспечения — хранение и обработка огромных информационных ресурсов, хранение документов в определенных форматах, их реквизитов и удостоверений, разграничение прав и защита доступа к базам. Следовательно, главным условием создания электронных архивов является существование документа в электронном виде.
Архивы предприятий накапливаются годами, некоторые — десятилетиями. Естественно, за все это время собраны колоссальные объемы архивных документов. В целях оперативного учета и розыска документов создаются системы научно-справочного аппарата (НСА). Организация учета дел и документов представляет собой создание базы данных с информацией о составе и содержании фонда. В традиционной ручной организации системы НСА существует целый ряд перекрестных архивных справочников, играющих первостепенную роль в поиске.
В 1996 году была утверждена Программа информатизации архивного дела России (1997-2000), в соответствии с которой планировалось создать правовые, нормативные и методические документы, регулирующие вопросы применения автоматизированных технологий, статуса машиночитаемых документов, стандарты и нормативы описания документов, типовые решения (автоматизированные архивные технологии, общеотраслевые базы данных) и обеспечение их совместимости и преемственности.
В настоящее время в архивном деле процесс внедрения автоматизированных архивных технологий (ААТ) развивается по двум направлениям:

1. Централизованная разработка и внедрение типовых баз данных по основным направлениям работы государственных архивов (от комплектования до использования). Эта работа осуществляется под руководством Росархива согласно программе информатизации отрасли, планов НИР и техническими заданиями на конкретные комплексы баз данных. Главной организацией и разработчиком баз данных является Всероссийский научно-исследовательский институт документоведения и архивного дела (ВНИИДАД). Цель работы — развитие перспективных архивных технологий компьютерной поддержки основных функций архивных учреждений.
2. "Стихийная" компьютеризация, осуществляемая самими архивами и находящая свое выражение в разработке баз данных, исходя из нужд архивов, требований потребителей информации, программ компьютеризации, принятых архивом, экономических и кадровых ресурсов, а также других факторов. Перспективные программы компьютеризации архива разработаны в Московском городском объединении архивов (МГОА), Российском государственном архиве научно-технической документации (РГАНТД), Государственном архиве Российской Федерации (ГАРФ), Российском государственном военном архиве (РГВА) и др.
Основные преимущества электронных архивов:

· связь электронного документа с бумажным источником, которая позволяет в подавляющем большинстве случаев обойтись без доступа к бумажному документу, а в случае необходимости работы с бумажным документом быстро его найти;
· реализация концепции ILM (Information lifecycle management), позволяющей переносить информацию из оперативного хранения в архивное с соответствующей сменой носителя информации для удешевления хранения и повышения надежности хранения;
· распределение прав и процедур доступа согласно корпоративным регламентам.
Электронные архивы позволяют:

· снизить затраты на хранение: большая часть справочных запросов может быть удовлетворена с помощью электронных образов документов, благодаря чему снижаются требования к помещениям, персоналу и другим ресурсам для работы архива;
· значительно сократить потери и повреждения архивных документов за счёт уменьшения потребности в подлинниках;
· снизить объём копировальных работ благодаря доступу к электронным образам документов;
· значительно упростить перенос документов из оперативного хранения в архивное;
· контролировать цепочку запросов и получения информации, предотвращая несанкционированный доступ и копирование документов.
2. Проблема сохранения цифрового наследия

Задача сохранения цифрового наследия не ставится ни в федеральной государственной программе «Электронная Россия (2002-2010 годы)», ни в программе «Развитие единой образовательной информационной среды (2001-2005 годы)», ни в федеральной программе «Культура России (2001 – 2005)».
В России нет единого государственного органа, занимающегося вопросами сохранения цифрового культурного и научного наследия, хотя эта проблема широко обсуждается в последние годы в рамках профессиональных сообществ.
Учет и инвентаризация цифровых информационных ресурсов, лежащая в основе деятельности по сохранению цифрового наследия, является предметом целого ряда российских и международных проектов.
В 1999 году на рынке появилось ПО, разработанное ВНИИДАД. Ведущему институту отрасли эта задача была поставлена в рамках правительственной программы «Электронная Россия». Естественно, такое ПО ориентировано на государственные, муниципальные архивы — учреждения государственной архивной службы. На взгляд автора, эта система для архива организации не очень подходит.
Корпорация «Электронный архив» известна своими решениями по созданию электронных архивов документов и переводу «бумажных» архивов в электронный вид с применением технологии поточного сканирования.
Отмечен опыт работы Российского государственного архива научно-технической документации (РГАНТД) по созданию полнотекстовых страховых копий на оптическом диске, выбору формата архивной информации на оптическом диске, принципам построения системы поиска в массиве оцифрованных документов.
Практика работы РГАНТД, длительный опыт эксплуатации автоматизированных архивных систем и технологий, создание полнотекстовых баз данных, свидетельствуют о том, что действующие в архиве основные подходы по вопросам взаимодействия и влияния задач использования на структуру НСА обеспечивают быстрое и эффективное обеспечение доступа пользователей к документной информации архива.
Огромная часть возникающей в современном обществе информации сосредотачивается в архивах, образуя социальный информационный потенциал.
При колоссальном потенциале ретроспективной информации традиционные методы хранения и распространения архивной информации теряют свою эффективность.
Кардинальное решение проблемы заключается в применение современных информационных технологий, в частности, технологий оцифровки различного вида документов.
3. Проекты по оцифровке документов

Потребности общества в ретроспективной информации имеют межгосударственное значение, так как в архивах России хранится информация интересная для целого ряда стран. Например, в фондах РГАНТД представлены материалы международного сотрудничества в области освоения космического пространства и космической техники, в частности по программе “ЭПАС”.
ЭПАС [от Э (кспериментальный) П (олёт) «А (поллон)» — «С (оюз)»], совместный экспериментальный полет американского и советского космических кораблей (КК) типа «Аполлон» и «Союз». Программа ЭПАС была утверждена Соглашением между СССР и США о сотрудничестве в исследовании и использовании космического пространства в мирных целях (24 мая 1972).
Определенный опыт получен в РГАНТД (до 1996 г. Российский научно-исследовательский центр космической документации). Представляют интерес два проекта:
· электронный архив “Вирт Йозеф — канцлер Германии”,

· электронный архив “Фотографии Ю.А. Гагарина”.

В 1992 г. РГАНТД совместно с Российским центром хранения историко-документальных коллекций осуществил проект оцифровки документов из фонда “Вирт Йозеф — государственный канцлер Германии”.

Особенности этого проекта:

1. Разноформатность документов (от ресторанных счетов и бумажных квитанций до газетных полос и плакатов).
2. Тексты машинописные и рукописные.
3. Бумага разных оттенков от серого до желтого; папки с делами при сканировании не расшивались, кроме дел, в которых подшивка затронула текст.
Всего было отсканировано 14362 документа, в том числе 455 фотографий, рисунков и гравюр.
Для сканирования текстовых документов использовались планшетные сканеры DataCopy-830 и Relisys с разрешением 200-400 точек. Для сканирования полутоновых изображений фотодокументов и документов большого формата использовался проекционный сканер DataCopy-920, выполненный в виде камеры на штативе, имеющий большую разрешающую способность и позволяющий сканировать документы в формате серой шкалы, что обеспечивает последующее воспроизведение без потери качества. Фотографии сканировались с различным (в зависимости от размера и содержания) разрешением от 200 до 1000 точек.
В 1996 г. была разработана системы хранения и поиска факсимильных копий фотодокументов Ю.А. Гагарина
на оптических дисках с включением фрагментов соответствующих текстовых документов.
Было отсканировано 850 фотографий (цветных и серно-белых). Сканирование проводилось с “контролек”, т.е. фотоотпечатков небольших размеров, применяемых в отделе использования в качестве элемента НСА. В качестве носителя был выбран оптический диск WORM фирмы “Plasman” (как и в первом проекте), в 1997 г. массив оцифрованных фотографий был записан на CD-R.
В качестве инструмента для разработки программного обеспечения баз данных была использована программная система ISIS версии 3.2 разработанная UNESCO и язык программирования Pascal ISIS.
В результате реализации рассмотренных проектов были разработаны технологии создания полнотекстовых страховых копий на оптическом диске, решены вопросы выбора формата записи архивной информации на оптическом диске, разработаны принципы построения системы поиска в массиве оцифрованных документов.
Автоматизированная информационно-поисковая система в проектах содержит следующие блоки:

1. База данных описаний отсканированных документов, которая являлась поисковым аппаратом.
2. Массив цифровых копий документов, записанный на оптический диск.
Связь между базой данных и массивом отсканированных документов организовывалась специальными программно-технологическими средствами:

· программа воспроизведения оцифрованных документов или их частей (фрагментов);
· имена оцифрованных документов (как часть рабочего листа ввода);
· программа организации доступа к оцифрованным документам;
· файл информации для программы организации доступа к оцифрованным документам.
Заключение

В заключение можно отметить, что ведение архива, с одной стороны, важно для деятельности компании, но, с другой стороны, требует значительных ресурсов, которые не приносят немедленной отдачи. Современный уровень развития информационных технологий позволяет реализовать электронные архивы. По сравнению с традиционным архивом электронный архив позволяет минимизировать затраты времени на управление архивом, снизить потребность в доступе к бумажным документам за счёт предоставления доступа к электронным образам документов, а также значительно снизить требования к помещению для архива, персоналу и другим ресурсам, используемым для его работы. При этом электронный архив не заменяет обычный, но дополняет его и резко снижает потребность в доступе к бумажным оригиналам документов. Кроме того, электронный архив позволяет организовать архивное хранение материалов, которые не существуют в бумажном виде.
Перечень ссылок

1. Залаев, Г.З. Современные принципы хранения и распространения архивной информации [Электронный ресурс]. — Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec2b/Doc12.HTML
2. Зверева, Н. Автоматизация архивной службы предприятия [Электронный ресурс]. — Режим доступа:
http://www.e-rus.ru/site.shtml?id=7&n_id=3631
3. Левчук, Л.И. Ткаченко, Н.А. Ходаковский, Н.И. Проблемы внедрения автоматизированных архивных технологий [Электронный ресурс]. — Режим доступа: http://www.artinfo.ru/eva/EVA2000M/eva-papers/200007/Khodakovsky-R.html
4. Медведева, Г.А. Из опыта РГАНТД по вопросам влияния использования на структуру НСА: конференция по вопросам совершенствования НСА (ВНИИДАД, март 2003 г.) [Электронный ресурс]. — Режим доступа: http://rgantd.ru/n_tr.php?link=tr_nsa_struct
5. Электронные архивы. Создание электронных архивов документов и организация хранилищ корпоративной информации [Электронный ресурс]. — Режим доступа: http://www.korusecm.ru/solutions/elib/