ГОСТ Р ИСО/МЭК 24668—2022
b
) набор результатов процесса должен быть необходимым и достаточным для достижения цели
процесса;
c) описания процессов не должны содержать или подразумевать аспекты характеристики каче
ства процесса, выходящие за рамки базового уровня соответствующих систем измерения процесса,
соответствующих ИСО/МЭК 33003:2017.
На рисунке 1 показаны категории процессов, являющихся ключевыми для развития аналитики
данных в организации. Эти ключевые категории процессов оказывают взаимное влияние друг на друга с
точки зрения готовности организации к внедрению и развертыванию аналитики больших данных.
Существует 5 категорий процессов, а именно, процессы заинтересованных сторон внутри орга
низации, процессы развития компетенций, процессы управления данными, процессы развития ана
литики и процессы интеграции технологий. Эти процессы опираются на фундамент технологической
инфраструктуры и их развитие направляется стратегией лидерства и культурой организации. Процессы
аналитики больших данных и их категории не зависят от специфики конкретной организации, и их реа
лизация не является обязательной.
Процессы заинтересованных сторон внутри организации
— высшее руководство организа
ции является ключевой стимулирующей силой, проявляющей себя по-разному, начиная от формирова
ния общего понимания потребностей в аналитике данных и до увязывания отдачи от выполнения таких
проектов со стратегическими целями организации. Предоставление заинтересованным сторонам прав
на принятие решений и установление их ответственности играет ключевую роль в обеспечении общей
успешности долгосрочных проектов аналитики данных. Желательно, чтобы высшее руководство также
способствовало выявлению ключевых поставщиков данных, потребителей данных, требований к при
ложениям и качеств данных, а также правил управления, с тем чтобы быстро начать движение по
пути внедрения аналитики данных. Также желательно обратить внимание на формирование
ориентирован ной на данные культуры и на ослабление сопротивления изменениям в подобной
ситуации.
Процессы развития компетенций
— проекты аналитики данных нуждаются в возможностях,
связанных с деятельностью сервис-провайдеров приложений больших данных (BDAP), сервис-провай-
деров среды обработки больших данных (BDFP), партнеров сервиса больших данных (BDSP), которые
описаны в ИСО/МЭК 20547—3:2020. Эти возможности могут быть либо обеспечены посредством аут
сорсинга, либо развиты внутри организации. Если предпочтение отдается аутсорсингу, то требуется
дополнительная компетенция по управлению аутсорсингом. Таким образом, наращивание соответству
ющих возможностей, их непрерывная поддержка и усиление имеют критически важное значение для
успеха проектов аналитики данных.
Процессы управления данными
— данные требуют эффективного стратегического и оператив
ного управления, предпочтительно интегрированного со стратегическим и оперативным управлением
ИТ, информацией и информационной безопасностью, которое включает отслеживание (мониторинг)
новых источников данных, измерение показателей качества данных и выполнение роли владельца дан
ных. Следует обеспечить неприкосновенность частной жизни (защиту персональных данных), безопас
ность, исполнение политик и законодательно-нормативных требований.
Процессы развития аналитики
— процессы развития аналитики данных включают в себя ис
следование данных, проверку данных (выявление выбросов и отсутствующих значений), настройку и
адаптацию алгоритмов, разработку и совершенствование алгоритмов, тонкую настройку алгоритмов,
оценку индекса стабильности популяции (population stability index, PSI) и т.д. Процессы развития ана
литики данных на всем протяжении их жизненного цикла опираются на тесное сотрудничество с ИТ-
службой организации.
Процессы интеграции технологий
— для реализации аналитики данных требуется соответству
ющая технологическая инфраструктура. Следует убедиться, что результаты отформатированы и опти
мальным образом представлены целевым потребителям / заинтересованным сторонам. Возможности
должны быть интегрированы с функциональной архитектурой. Процессы выбора этих функциональных
компонентов и их интеграции в общую архитектуру аналитики данных имеют ключевое значение. Эти
процессы включают оценку зрелости технологий, определение подхода к реализации (например, ис
пользование PaaS или SaaS) и управление конфигурацией/версиями (например, применение подхода
DevOps, предусматривающего интеграцию процессов разработки и эксплуатации).
На рисунке 1 показаны категории процессов аналитики больших данных и входящие в них про
цессы.
4