Простые рекомендации по оцифровке «обычных» изданий

Одни читатели возвращаются в библиотеки, другие — ждут вакцины и больше книг, доступных из дома. Прошедшие месяцы отчетливо показали:

Составьте арт-терапевтическую анкету (в качестве опрашиваемого можно использовать самого себя)

Цифровать надо!
Хорошо, быстро и много!

НО как совместить эти три несовместимых требования к оцифровке?

«Много» и «быстро» напрямую зависит от «хорошо», т.е. от требований к качеству копий. О них и поговорим сегодня. Начнем с того, что библиотека может использовать сегодня.

Мы обнаружили всего два общедоступных действующих документа:

1. Утвержденные Министерством культуры Рекомендации по оцифровке материалов из фондов библиотек, созданные в 2013 году для библиотек, цифрующих свои фонды

2. Разработанное для портала НЭБ «Книжные памятники» Краткое техническое задание по оцифровке книжных памятников

Первый документ разработан для «много и быстро», но уже устарел, второй — для «хорошо», но слишком уж кратко и неопределенно, но главный недостаток, что он рассчитан только на раритеты.

Большинство читателей интересует современность. И библиотекарей, впрочем, тоже. Новые форматы, современные средства просмотра, скорость загрузки. Мы не можем позволить себе терять читателей. В цифровом мире их не вернешь. Что ж, попробуем помочь. Начнем с известного всем по стихотворению Маяковского вопроса «Что такое хорошо

Хорошо — это когда высокое разрешение (влияет на зум), контрастность (все видно), цветопередача (редкий читатель дойдет до середины красной страницы с зеленым шрифтом :).

Переходим к быстро: калибровка оборудования для потока однотипных материалов, квалификация сканировщиков.

И наконец, много: автоматизация пост-обработки, единоообразие форматов, наличие метаданных.

Раскроем каждый пункт подробнее:

Разрешение - 300 dpi черно-белый для большинства страниц, цветной (sRGB 24bit) - только для иллюстраций, фотографий и изоматериалов. Больше - не подойдет для распознавания и увеличит размер файла, т.е. скорость загрузки. Grayscale - не рекомендуется (сложности с контрастом).

Контрастность, цветопередача. Достигается одним из двух способов: настройкой сканера или пакетной пост-обработкой, в идеале - их комбинацией. Если нет специалистов по настройке, правило: не оставлять начатую книгу на досъемку. При повторном включении сканера цвет копии всегда меняется. Второй способ можно свести к применению авто-контраста и авто-цвета, если нет серьезных ошибок съемки или индивидуальных пакетных настроек.

Калибровка оборудования. Оптимальна одновременная калибровка сканера и мониторов компьютеров, на которых осуществляется пост-обработка. Совет: после калибровки создайте по очереди настройки для каждого вида документа и сохраните их как профили с соответствующими именами (books, newspapers, photos, etc) или запишите в файлы. Распечатать тоже годится. Главное - не потерять и быстро найти.

Квалификация сканировщиков. В библиотеках обычно сканировщиков нет, но библиотекари - народ смышленый и аккуратный. Поэтому если есть профили, то основное правило: старайтесь как можно дольше их не менять. Подбирайте однотипные документы! НЕ пропускайте страницы! Лучше снять два раза, чем пропустить. По возможности НЕ двигайте корпус книги в процессе съемки! Это упростит пост-обработку.

Автоматизация пост-обработки. Установите одну и ту же программу(и ее версию) для пакетной обработки на всех компьютерах и создайте типовые профили для каждого вида пост-обработки (темные, светлые, убрать тени и т.д.). Сохранить на всех машинах или на сервере. Новые профили создавать НА базе «стандартных». Обычная пост-обработка включает три пункта: цвет (авто-контраст, авто-цвет или индивидуально), выравнивание (ориентируемся на строчки в середине страницы), обрезка (авто-обрезка при выравнивании или индивидуально).

Единообразие форматов. Снимать лучше в форматах tiff (LZW сжатие), jpeg2000, любых других растровых графических форматах без потери качества. В pdf НЕ снимать!
Выберите для своей коллекции формат (epub, pdf, mobi, etc.), лучше один, это упрощает работу со средствами просмотра. Схема действия: собрать обработанные файлы, определить оптимальное сочетание размер файла/качество графики, дополнительные параметры (оглавление, оформление, текстовый слой, защита, etc.), сохранить в выбранном формате.

Наличие метаданных. Метаданные (в нашем случае биб.запись) должны быть готовы к моменту создания файла. Кладем готовый файл на сервер = ставим книжку на полку, добавляем в запись шифр - URL (поле связи с электронной копией - 856 для RUSMARC), и всё.

Заключение: все решения, принятые по перечисленным пунктам, включая все профили, должны быть объединены в «Рекомендации по оцифровке фондов вашей библиотеки». 

Ольга Барышева