ГОСТ Р 70466—2022
l
d) языки запросов, в том числе к реляционным базам данных, для описания различных типов
данных (XML, RDF, JSON, мультимедиа и т. д.) и операций с большими данными (например, матричных
операций);
e) предметно-ориентированные языки;
f) семантика конечной согласованности данных (оптимистическая репликация);
д) расширенные сетевые протоколы для эффективной передачи данных;
h) общие и предметно-ориентированные онтологии и таксономии для описания семантики дан
ных, включая взаимодействие между онтологиями;
i) безопасность больших данных, управление доступом к персональным данным и их конфиден
циальность;
j) удаленная, распределенная и федеративная аналитика, включая обнаружение данных, их из
влечение и выявление ресурсов обработки;
k) совместное использование данных и обмен ими;
) хранение данных, например память, система хранения, распределенная файловая система,
хранилище данных и т. д.;
т ) использование результатов анализа больших данных (например, визуализация);
п) измерение энергозатрат для обработки больших данных;
о) интерфейс между реляционными (SQL) и не только реляционными (NoSQL) хранилищами
данных;
р) качество и достоверность больших данных, описание и управление.
ИСО/МЭК 20546 и серия стандартов ИСО/МЭК 20547 разработаны с учетом указанных приори
тетов.
В настоящем стандарте рассматриваются структура и процесс применения, сценарии использо
вания больших данных и требования к ним (приоритет «а»), эталонные архитектуры (приоритет «а»),
безопасность и конфиденциальность персональных данных (приоритет «i»), а также дорожная кар та
стандартов. Кроме того, организации, имеющие потребности в анализе больших данных, не могут
ждать разработки конкретных стандартов, решая задачи внедрения своих систем. Поскольку большие
данные — это, по сути, подмножество всевозможных данных, а почти каждый стандарт в области ин
формационных технологий связан с данными, сегодня существует большое число разработанных или
разрабатываемых стандартов, которые затрагивают вопросы, связанные с большими данными. Поэто му
последняя часть серии стандартов ИСО/МЭК 20547 представляет собой дорожную карту разработки
стандартов, в которой существующие стандарты приведены в соответствие с эталонной архитектурой
больших данных, что может быть использовано заинтересованными сторонами в качестве руководства
при решении текущих задач. В разделе 7 описаны все остальные части указанной серии.
7 Концептуальные основы
7.1 Общие сведения
Стандарты серии ИСО/МЭК 20547 призваны обеспечить широкому кругу заинтересованных сто
рон основу для однозначного описания и эффективного обмена сведениями о характеристиках и атри
бутах конкретной системы больших данных. В соответствии с терминами и определениями, представ
ленными в ИСО/МЭК 20546, система больших данных позволяет:
- обрабатывать большие массивы данных, отличающиеся объемом, разнообразием, скоростью
обработки и/или вариативностью, с помощью масштабируемой архитектуры для эффективного хране
ния, обработки, управления и анализа;
- применять передовые методики построения масштабируемых систем данных на основе неза
висимых ресурсов в ситуациях, когда характеристики массивов данных требуют разработки новых ар
хитектур для эффективного хранения, обработки, управления и анализа;
- реализовывать парадигму распределения систем данных по горизонтально соединенным неза
висимым ресурсам с целью достижения масштабируемости, необходимой для эффективной обработки
больших массивов данных.
Разнообразная природа систем больших данных определяет необходимость того, чтобы эталон
ная архитектура, которая представлена в серии стандартов ИСО/МЭК 20547, была достаточной для
описания широкого диапазона потенциальных сценариев использования, реализуемых системами
больших данных.
4