ГОСТ Р 55768—2013
Сервисы данныхмогут бытьиспользованы для перемещенияданныхпотребованию; для управле
ния реплицированными копями; для выполнения запросов и обновлений; для объединения на феде
ральных началах ресурсов данных. Они также предоставляют возможности, необходимые для
управления метаданными, описания этихданных, вчастности, их происхождение.
Ресурсом данных является любой объект, который можетдействовать как источник или приемник
данных. Гетерогенный характер Грид означает, что должны поддерживаться многие различные типы
данных, которые включают в себя (но неограничиваются)следующие:
- Однородныефайлы. Простейшей формойданныхявляетсяфайл, структуракоторого специфич
надля конкретногоприложения (такая, как записификсированнойдлины).Доступк таким файлам может
быть осуществлен при помощи операций записи и чтения, подобных описанным в POSIX. Некоторые
форматы файлов поддерживаютзапросы, аналогичныезапросам к базамданных, например, значения,
разделенные запятой, доступ к которым подобендоступу к реляционным таблицам; файлы XML, доступ к
которым может быть выполнен посредством XML Query или при помощи других соответствующих
языков. Сервисы доступа к данным нуждаются в поддержке этих типов данных и нуждаются в своем
расширениидля поддержки специализированных запросов к файлам любых новыхформатовданных.
- Потоки. Непрерывный потокданных называется потоком. Сервисы доступа кданным поддержи
вают запросы к этим потокам и их преобразование.
- СУБД. Некоторые виды СУБД могут быть частью Грид. Они включают реляционные, XML,
объектно-ориентированные и некоторыедругие типы базданных.
- Каталоги. Они могут структурироватьданные исвязыватьдругие сервисы данных. Простымпри
мером каталога являетсядиректория, котораяделаетструктуру посредством группировки набора фай
лов. Вложенныедиректориианалогичны иерархичномупространствуимен. Каталоги метаданных могут
давать информацию о данных, хранящихся вдругихсервисах данных.
- Извлечение. Некоторыеданные являются результатом несинхронных запросов или преобразо
ваниями других данных. Такие «извлечения» данных чаще управляются подобно ограниченным пото
кам, чемотдельнымиданными.
- Собственносервисы данныхмогут выступатьв качестве ресурсовданныхдлядругихсервисов, а
также бытьсенсорными устройствами или программами, генерирующими данные.
5.5.2 Гетерогенность и расширяемость
5.5.2.1 Прозрачностьи виртуализация
Распределенная система может содержать различные ресурсы данных. Эти ресурсы могут
использоватьразличныемоделиструктурыданных, различныефизическиеносителидляхранениядан
ных. различныесистемы программногообеспечениядля управления ресурсами, различные схемы опи
сания, а также различные протоколы и интерфейсы для доступа к ресурсу. Данные могут храниться
локально или удаленно; могут быть уникальными или являться копиями; могут быть материализованы
или получены потребованию. Сервисы данныхСОАОГСпредоставляютразличные уровнивиртуализа
ции этих ресурсов данных. Виртуализация есть абстрактное представление, позволяющее скрыть
указанные различия, и позволяющее управлять ресурсами данных без учета их физических
особенностей.
Данные сервисы позволяют клиентам игнорировать указанные различия, некоторые клиенты
могут предпочестьиспользоватьэтиразличия. Например, клиент может пожелатьиспользоватьтотили
иной язык запросов к данной базе данных или пожелать указать местоположение конкретного ресурса
данныхдля использования.
Некоторыеклиенты могутпотребоватьнепосредственныйдоступ кданным, другие жемогут затре
бовать настройку параметров производительности ресурса данных. Для поддержки таких клиентов
интерфейсы данных СОАОГС обеспечивают расширение точекдоступа таким образом, чтобы эти сер
висы могли позволить клиентам обходить виртуализацию интерфейсов доступа и обеспечить доступ к
интерфейсам конкретных ресурсов напрямую. Эти слоистые интерфейсы позволяютклиентам выбрать
сочетание мощности иабстракции, которое им подходит больше всего.
Пример — Базовый байтовы й ввод/вывод, реализуемый интерф ейсом,
к
оторы й обеспечивает
операции чтения/записи. аналогичные POSIX и подобным системам. Сервисы, реализующие э т и опера
ции. м о гут вы полнять сложные оптим изации (
к
эширование, репли
к
ацию, оптим изацию процесса пере
дачи данных).
Виртуализованные интерфейсы скрываютдетали этого процесса от клиента. Теже клиенты, кото
рые требуют более детализированного контроля, могут использовать интерфейсы, специфичные для
конкретных ресурсов, с целью управления сервисами кэширования, репликации и передачи данных,
правда, с соответствующей потерей прозрачности.
18