ГОСТ Р 70289—2022
Под очисткой данных понимается процесс проверки и исправления данных для обеспечения их
соответствия стандартизированному формату (см. ГОСТ Р ИСО 13008). Он включает в себя анализ
качества данных в источнике данных, определение мер и предложений о том, как можно улучшить ка
чество данных, и внесение изменений в данные.
б) Управление метаданными
Управление метаданными может быть определено как сквозной процесс и структура управления
для создания, контроля, улучшения, атрибуции, определения иуправления схемой, моделью или другой
структурированной системой агрегирования метаданных, независимо или в пределах репозитория и
связанных поддерживающих процессов, как правило, для управления контентом.
в) Целостность данных
Целостность данных как цель безопасности уже обсуждалась в 8.6.1.2, но ее также можно
рассматривать и с точки зрения управления качеством данных.
г) Обеспечение качества данных
Обеспечение качества данных означает уверенность в управлении качеством данных, которое
может быть проверено посредством процедур сертификации и аудита.
д) Происхождение данных
Под происхождением данных (Data provenance) понимается запись изменения состояния данных
в течение их срока службы, времени возникновения, лиц, связанных с событием, местоположения,
программного обеспечения, причин, по которым событие произошло. Для поддержки происхождения
данных могут использоваться механизмы, обеспечивающие неизменное свидетельство
модификации, передачи и использования данных, такие как технологии распределенного реестра и
блокчейна.
8.6.2.3 Структура управления качеством данных
Достижение приемлемого уровня управления качеством данных во многом зависит от рассматри
ваемого варианта использования. Проблемы с качеством данных могут не иметь значения для мно гих
типов приложений, однако могут повлиять на другие приложения, критические для непрерывности
бизнеса. К тому же обязанности по управлению данными могут быть по-разному распределены между
поставщиком и потребителем облачной службы. На рисунке 9 показан пример того, как таксономия дан
ных структуры может быть использована для определения ответственности за управление качеством
данных.
8.7 Корпоративное управление данными
Данные — это нерасходуемый актив со многими связанными атрибутами и аспектами. Они долж
ны рассматриваться руководящим органом организации как элементы, которые могут иметь существен
ное стратегическое влияние на организацию в целом. Данные используются для отслеживания бизнеса
(например, персонала, бухгалтерского учета, запасов) и в качестве исходного материала для знаний,
инноваций и понимания. Ответственность за данные и их использование возлагается на руководящий
орган организации. Некоторые данные, такие как исследования продуктов или нераскрытые амбиции
фондового рынка, имеют высокую ценность для бизнеса, и для использования и защиты этих данных
необходимо задействовать соответствующие ресурсы. Стоимость и риск, связанные с управлением
этими данными, выше, чем у других типов данных, и стратегии и политики должны отражать это
посред ством принятия схемы классификации данных. Руководящий орган несет ответственность за
данные и их использование, включая решения по обеспечению надлежащего уровня управления
данными.
В [4] описано применение общих принципов корпоративного управления ИТ и модели ГОСТ Р ИСО/
МЭК 38500 к корпоративному управлению данными. В нем исследуются области использования органи
зацией данных, в которых должны быть внедрены политики и стратегии корпоративного управления для
обеспечения подотчетности. Исследование включает в себя понимание потенциального использования
данных (организацией, ее поставщиками и клиентами, а также ее конкурентами), включая
возможную покупку или продажу данных. Например, производитель может включить в свой продукт
возможности, которые позволяют передавать данные об использовании продукта производителю. Эти
данные могут быть использованы для улучшения продукта, оказания технической поддержки или
профилактического обслуживания. Их также можно использовать в качестве основы при расчете
оплаты использования продукта, а не прямой покупки. Данные также могут быть проданы
производителем другим производи телям для использования их при создании продуктов или услуг
или переданы поставщикам для улуч шения общей цепочки поставок. Кроме того, данные об
использовании могут быть объединены с до полнительными данными, такими как погода, чтобы лучше
понять использование продукта в различных условиях. Сами данные становятся частью цепочки
создания стоимости.
23