ГОСТ Р ИСО/МЭК 27038—2016
Приложение А
(справочное)
Цензурирование документов в формате PDF
В большинстве случаев пользователи PDF-документов используют программное обеспечение, не имеющее
или имеющее ограниченные функциональные возможности для цензурирования электронных документов в этом
формате. В такой ситуации следует использовать специализированные инструменты для цензурирования содер
жащейся в PDF-документах информации.
В общем случав страницы PDF-дохумента формируются на основе объектов следующих четырех основных
типов:
1)текстовый обьехт (Text Object)— информация, для отображения которой на странице используются шрифты;
2) графический объект (Image Object) — PDF-объект, обычно используемый для представления на странице
растровой графической информации. Один и тот же графический объект может быть многократно использован в
документе;
3) встроенный графический объект (Inline Image Object) — графические данные, встроенные в контент кон
кретной страницы. Такие объекты, как правило, используются программами оптического распознавания текста для
вставки изображения отдельного слова, распознанного с низким уровнем уверенности;
4) объект типа контур (Path Object) — Набор команд векторной графики, включающий команды рисования
линий, кривых и прямоугольников. Текст на странице может быть представлен с использованием объектов типа
контур вместо текстовых объектов.
В пределах PDF-страницы эти объекты могут образовывать вложенные структуры в любой последователь ности
и на любую глубину. Процесс цензурирования PDF-страниц должен соответствовать следующим критериям: a) из
подлежащей удалению области страницы удаляются все содержащие информацию объекты, на любом
уровне вложенности;
b
) отображение незатронутых цензурированием частей PDF-страницы не изменяется.
8