Электронная библиотека

Еще 10 лет назад стало очевидным, что традиционная структура и организация библиотек уже не могут удовлетворить растущие требования. Сегодня же состояние многих российских библиотек можно охарактеризовать как «кризисное». В чем же проблема?

Информация нужна все быстрее, количество ее источников постоянно увеличивается.

С одной стороны – существенное увеличение количества печатных изданий привело к неуклонному росту поступлений. С другой - отлаженные рабочие процессы по обращению к каталогам, учетные карточки, формы заявок и читательские карты в век персональных компьютеров и глобальных сетей превратились в архаичную и малоэффективную атрибутику.

В результате миллионы книг, практически, не будучи востребованными, осели в хранилищах мертвым грузом. Груз этот требует постоянно растущих расходов на содержание и обслуживание, но при существующем положении вещей приносит все меньше и меньше пользы.

Создание электронных библиотек – идея далеко не новая. Однако в последние годы быстрое развитие компьютерных технологий и рост глобальных сетей помогли совершить настоящую революцию в библиотечном деле.

Начало: создание Электронных Каталогов

Процесс перевода библиотек на современные цифровые технологии на территории бывшего СССР был начат еще в конце 80-х годов. На первом этапе библиотеки определили главную цель – создание электронных каталогов. Наличие электронных каталогов, построенных на базе устоявшихся стандартов группы MARC (USMARC, UNIMARC, RUSMARC) позволяет библиотекам:

  • Обеспечить удаленную работу с каталогом библиотеки (в том числе и через интернет);
  • Осуществить электронную дистрибуцию каталогов, например, на компакт-дисках;
  • Кардинально улучшить возможности поиска нужных изданий;
  • Участвовать в межбиблиотечном электронном обмене, в том числе международном;
  • Создавать объединенные и сводные каталоги с возможностью поиска из одной точки;
  • Сделать из каталога тиражируемый товар.

На этапе создания электронных каталогов главными темами информатизации для крупных библиотек стали:

  • Выбор и внедрение АБИС (автоматизированной библиотечной информационной системы).
  • Ретроспективная конверсия имеющихся карточных каталогов средствами АБИС.

При переводе каталогов в электронный вид библиотеки столкнулись с существенными трудностями. Ручной ввод данных оказался трудоемким и медленным, хотя и высококачественным, к тому же, наиболее дешевым методом. Автоматизация процесса ввода учетных карточек с использованием технологии поточного сканирования малоэффективна т.к. системы машинного распознавания текста очень плохо распознают рукописный текст. Процесс осложнился еще и тем, что информации в традиционных учетных карточках, как правило, недостаточно для электронного каталога, соответствующего UNIMARC/USMARC. В решениях задач ретроконверсии выяснилось, что различные АБИС, гибко реализующие программную функциональность (электронная информация и ее обработка), не могут полноценно эксплуатироваться без специализированного оборудования (работа с оригиналами и бумажными документами). При этом наибольшая эффективность достигается при целевом применении узкоспециализированного оборудования.

Получив доступ к электронному каталогу, пользователь имеет возможность быстро определить, имеется ли в наличии нужное ему издание. Но это лишь ссылка на информацию. Дальше следует все та же архаичная процедура заказа и ожидания. Для создания полноценной цифровой библиотеки одних электронных каталогов недостаточно. Необходимо превратить фонды библиотеки в миллионы электронных страниц, открываемых кликом мышки, обеспечить оперативную печать выбранных материалов, создать удобные системы быстрой оплаты услуг.

Несмотря на кажущуюся сложность, решить эту задачу сегодня способны многие библиотеки. Безусловно, для подавляющего их большинства перевод всех фондов, - слишком дорогое удовольствие. Более того, такой подход не оправдан экономически. Правильное решение заключается в отказе от «лобовой» атаки и поиске действительно эффективных путей. Электронный каталог и АБИС позволяют библиотеке очень быстро собрать точную статистику по обращениям пользователей и определить, какие из фондов являются наиболее востребованными.

Выборочная ретроконверсия фондов

После внедрения АБИС, создания ЭК и соответствующих им рабочих процессов и технологий, библиотеки постепенно продвигаются ко второму этапу решения: созданию Электронных Фондов. Ретроконверсия имеющихся библиотечных фондов - более ресурсоемкий и сложный процесс по сравнению с созданием электронного каталога, и различные библиотеки ищут разные подходы к решению этой задачи. Здесь, в зависимости от специфики, применяется (часто параллельно) несколько подходов к ретроконверсии с использованием уже имеющейся глубокой структуризации фондов:

  • Конверсия особо ценных и раритетных изданий;
  • Ввод активных фондов, пользующихся наибольшим спросом (по мере обращения);
  • Ввод новых поступлений;
  • Выборочный (постатейный) ввод периодики;
  • Конверсия фондов на микрофильмах, микрофишах и др.

Образ или содержание

Первые попытки применения современных технологий для перевода документов в электронный вид связаны большей частью с т.н. «захватом содержания» книг, – с системами символьного распознавания (OCR). Представляется естественным, что недостаточно просто отсканировать страницы издания - нужно превратить их в слитный текст. Так ли это важно на самом деле?

С одной стороны, несмотря на большой прогресс систем распознавания, даже лидирующие на рынке OCR-продукты в стандартном исполнении имеют существенные недостатки: малую скорость обработки, слабые возможности мультиязычного распознавания, работы с полноцветными изданиями, ограничения по передаче форматирования (таблицы), верстки (буквицы, графические элементы) и т.п.

С другой стороны, дальнейшая обработка полученных текстов представляет собой набор ресурсоемких процессов и, соответственно, целого букета новых проблем. В силу сказанного, в настоящее время целесообразным представляется не общее, а лишь выборочное распознавание, применяемое только для наиболее востребованных читателями библиотечных фондов.

Электронная библиотека: характеристика концепции:

Описываемый в данной концепции комплекс, построенный на цифровых технологиях Ксерокс, позволяет создать полнофункциональную электронную информационную систему библиотеки, включает в себя решение следующих задач:

  • Перевод карточного библиотечного каталога в электронный вид;
  • Перевод широкого спектра бумажных изданий в электронный вид;
  • Перевод изданий с электронных носителей;
  • Печать по требованию и послепечатная отделка;
  • Управление хранилищем Электронного Фонда;
  • Web-публикация и дистрибуция.

При разработке концепции основные акценты были сделаны на создании надежного, высокотехнологичного, отказоустойчивого хранилища электронных изданий, повышении производительности труда при оцифровке библиотечных фондов, легкости перехода от существующих электронных форматов хранения информации. Большое внимание было уделено переводу библиотечных услуг на новый уровень качества за счет использования передовых информационных технологий.

Логическая архитектура Системы «Электронная библиотека»

Рис. Логическая архитектура системы «Электронная библиотека»

Система «Электронная библиотека» включает в себя следующие подсистемы:

  • Подсистема «Хранилище»;
  • Подсистема импорта электронных изданий;
  • Подсистема сканирования и постобработки библиотечных фондов;
  • Подсистема перевода в электронный вид бумажной картотеки;
  • Подсистема электронной публикации (Web);
  • Подсистема электронной публикации (CD/DVD);
  • Подсистема печати по требованию (типография);
  • Подсистема предоставления доступа пользователей через внутреннюю сеть библиотеки (Интранет);
  • Подсистема предоставления доступа пользователей через Интернет.

Описание функциональности подсистем

Подсистема «Хранилище» предназначена для организации надежного долгосрочного хранения больших объемов электронных фондов библиотеки. Подсистема предоставляет возможность хранения изданий как в распознанном (полнотекстовом) формате, так и в виде изображений.

В рамках данной подсистемы решаются следующие задачи:

  • Хранение электронных версий книг в иерархической структуре (хранение атрибутивной информации о книге – библиографической записи, её электронного образа и, при необходимости, распознанного содержимого);
  • Обеспечение надежного отказоустойчивого хранения (резервное копирование, быстрое восстановление после сбоев);
  • Обеспечение целостности хранящихся ресурсов (постоянный автоматизированный контроль целостности и быстрое восстановление выявленных нарушений);
  • Индексирование и поддержка атрибутивного и полнотекстового поиска.

Подсистема импорта электронных изданий предназначена для ввода в Систему уже существующих в библиотеке электронных версий книг в форматах, перечень которых определяется на этапе разработки технического задания.

Подсистема сканирования и постобработки библиотечных фондов предназначена для организации автоматизированного ввода бумажных изданий в систему «Электронная библиотека». Данная подсистема поддерживает следующие функции:

  • Сканирование бумажных изданий;
  • Автоматизированная обработка электронных образов;
  • Автоматизированное и ручное атрибутирование изданий (составление библиографических записей);
  • Распознавание необходимых частей из отсканированных изданий;
  • Размещение электронных образов и/или распознанного содержимого изданий в подсистеме «Хранилище».
  • Для реализации данной подсистемы используется специализированное Оборудование

Подсистема перевода в электронный вид бумажной картотеки предназначена для автоматизированного ввода в Систему библиографических записей изданий. Данная подсистема поддерживает следующие функции:

  • Сканирование бумажных карточек;
  • Автоматизированное распознавание необходимых полей библиографической записи с электронного образа карточки;
  • Ручной ввод дополнительных или нераспознаваемых полей.

Подсистема электронной публикации (Web) обеспечивает возможность получения доступа ко всем подсистемам «Электронной библиотеки» через Web-интерфейс. Формат предоставляемых через Web данных при этом может отличаться от формата хранения (например, изображения могут предоставляться с более низким разрешением, текстовые файлы – в виде, не предназначенном для редактирования, и т.п.).

Подсистема электронной публикации (CD/DVD) обеспечивает возможность создания CD/DVD дисков с изданиями, размещенными в Системе, для последующего предоставления пользователям «Электронной библиотеки». Может выбираться формат предоставляемых на CD/DVD данных (например, изображения могут предоставляться как в оригинальном виде, полученном после сканирования, так и с более низким разрешением, текстовые файлы – в виде, предназначенном или не предназначенном для редактирования, и т.п.).

Подсистема печати по требованию (типография) состоит из программно-аппаратного комплекса, конкретный состав которого определяется на этапе реализации подсистемы, и предназначена для подготовки и последующей печати электронных библиотечных фондов для выполнения запросов пользователей «Электронной библиотеки». Для реализации данной подсистемы используется специализированное программное обеспечение Xerox FreeFlow. (ссылка на описание системы «ввод и обработка образов документов» – отдельный файл)

Подсистема предоставления доступа пользователей через внутреннюю сеть библиотеки (Интранет) обеспечивает интерфейс для предоставления персонифицированного доступа пользователей «Электронной библиотеки» к функциям её подсистем:

  • Поиск изданий в Системе «Электронная библиотека»: для всех ресурсов - по библиографическим записям, и, для определенной категории изданий - полнотекстовый;
  • Получение доступа к изданиям – как через специализированный интерфейс Системы, так и через Web-интерфейс;
  • Публикация изданий на цифровых носителях - CD/DVD;
  • Печать электронных изданий по требованию.

Подсистема предоставления доступа пользователей через Интернет обеспечивает web-интерфейс для предоставления персонифицированного доступа пользователей «Электронной библиотеки» к некоторым функциям её подсистем (конкретный набор таких функций определяется на этапе реализации подсистемы):

  • Поиск изданий в Системе «Электронная библиотека»: для всех ресурсов - по библиографическим записям, и, для определенной категории изданий - полнотекстовый;
  • Получение доступа к изданиям через Web-интерфейс;
  • Публикация изданий на цифровых носителях - CD/DVD;
  • Печать электронных изданий по требованию.

При необходимости может быть использован механизм предоставления доступа пользователей к некоторым функциям на коммерческой основе.

Рис. Процесс выборочной ретроконверсии фондов, внедрение - структурная схема

Характеристика программного обеспечения, используемого для реализации Системы «Электронная библиотека»

В качестве аппаратного обеспечения для реализации Системы «Электронная Библиотека» предлагается полный спектр оборудования, необходимого для функционирования всех её подсистем. К такому оборудованию относятся мощные отказоустойчивые сервера (в том числе кластерные), системы хранения и резервного копирования, и самые разнообразные устройства сканирования и печати, способные удовлетворить потребностям любой современной библиотеки.

Программное обеспечение, используемое в качестве основы для реализации Системы «Электронная библиотека» – платформа Xerox DocuShare.


создание сайта Артпрайм