31
чтобы уменьшить размер файлов и улучшить производительность системы.
Используемый тип сжатия, как правило, зависит от целевой задачи, хотя в некоторых системах может использоваться встроенный механизм сжатия, и тогда у пользователя нет иной альтернативы, кроме его применения. Дополнительные сведения о методах сжатия можно найти в ИСО/ТО 12033.
Методы сжатия могут основываться на различных математических подходах, однако все они могут быть разделены на два класса: сжатие с потерями и сжатие без потерь.
Применяемые методы сжатия и наличие либо отсутствие потерь при их использовании должны быть задокументированы. Документация должна содержать количественные данные и включать в себя описание алгоритма, использованного для расчета уровня потерь при сжатии.
Эта информация может сохраняться как часть файла или взаимосвязанных с ним данных либо в отдельном журнале.
Примечание — Например, в случае графических файлов в формате TIFF (и в некоторых других форматах) сведения о методе сжатия автоматически сохраняются внутри графического файла.
Методы сжатия с потерями следует использовать с осторожностью. По определению применение таких методов приводит к необратимой потере данных, пусть даже в некоторых случаях это потеря является неощутимой визуально. Какследствие, распакованный электронный файл не будет идентичен первоначальному файлу, что может затруднить доказательство целостности таких файлов. Например, в графическом файле часть текста и/или рисунков может пропасть, будучи замененной искусственно сгенерированными данными. Таким образом, возможен риск при использовании сжатия с потерями в отношении файлов, в первую очередь, содержащих текст (в том числе рукописный), чертежи и штриховые рисунки (line drawings).
Сжатие с потерями может быть пригодно для фотографических и иных материалов с непрерывным изменением оттенков; для полутоновых и цветных документов, если можно показать, что в отсканированных графических образах отсутствует существенная потеря информации.
Если применяется сжатие с потерями, то следует сопоставить тестовый набор распакованных файлов с их оригиналами, с тем чтобы убедиться в отсутствии существенной потери информации.
Если применяются методы сжатия с потерями, то следует задокументировать достигнутые степени сжатия.
Степень сжатия следует по возможности выбирать такой, чтобы вся информация, необходимая в контексте целевой задачи, присутствовала в распакованном файле.
Максимально допустимая степень сжатия может быть определена с использованием тестовой выборки исходных документов и может варьироваться для различных документов выборки. Возможно, потребуется принять решение о том, использовать ли различные степени сжатия для различных документов или использовать одну и ту же степень сжатия для всех документов. В случае использования последнего подхода результатом, как правило, будет больший средний размер графического файла, однако скорость обработки также будет выше из-за меньшего вмешательства оператора.
Если важно, чтобы не было потерь информации в отсканированных графических образах, за исключением потерь, связанных с разрешением при сканировании, то сжатие с потерями использовать не следует. К числу электронных документов, для которых использование методов сжатия с потерями не рекомендуется, относят, например, рентгенограммы (т. е. медицинские и инженерные рентгеновские снимки).
В случае применения сжатия система должна включать в себя адекватные, предпочтительно автоматизированные средства, обеспечивающие соответствие сжатых файлов требованиям к контролю качества (таким, например, как проверка качества графического образа после сканирования с возможностью проведения при необходимости повторного сканирования; контроль над точностью ассоциированных данных; контроль целостности данных).
- Разделение формы и введенной информации, «снятие» формы (form overlays and form
removal)
Если исходный документ представляет собой форму, на которую наложена информация, то форма может быть электронным образом удалена из отсканированного графического образа перед его сохранением («снятие» формы).
Если электронным образом снятая форма сохраняется отдельно от отсканированных графических образов, к которым она относится, ею следует управлять так, какесли бы она была частьюотсканирован- ного графического образа.
Следует задокументировать тот факт, что полученный графический образ (без формы) является результатом снятия формы, а также идентификатора всех шаблонов, использованных при снятии формы. Эта информация должна сохраняться в привязке к полученному графическому образу. Также должны быть сохранены копии всех использованных шаблонов.