ГОСТР ИСО 24619—2013
Как правило, подобные связки должны конфигурироваться как воплощение их группового статуса, обычно
представляемого совместным метаинформационным описанием, в котором расставлены указатели на все состав
ляющие ресурсы.
А.1.4 Коллекции ресурсов
Коллекции — это произвольные группировки любого числа ресурсов с индивидуальными идентификатора
ми. подобранными в соответствии с конкретным критерием, но запрашиваемые тем не менее как единое целое.
Примерами таких коллекций могут служить:
- опубликованный корпус речевых оборотов голландского языка {Dutch National Spoken Corpus) или британ
ского варианта английского языка {British National Corpus) по состоянию на определенную дату;
- коллекция всех ресурсов, описывающих конкретный язык, хранимая в определенном репозитории.
- коллекция разрозненных ресурсов, используемая как основа для диссертационного исследования или на
писания монографии;
- коллекция ресурсов, объединенных с целью сохранения их как сжатого пакета21в электронном архиве;
- коллекции разделов ресурса — например ссылок на ряд сегментов мультимедийного файла и т. п.
Связи между ресурсами коллекции могут быть произвольными. Коллекции имеют свой формальный статус, и
их реализации должны быть доступны для запросов, что обычно обеспечивается с помощью метаинформационно-
го описания. Связки ресурсов, рассмотренные в А.1.3. — это коллекции ресурсов, обладающих общими лингвисти
чески значимыми параметрами.
А.1.5 Метаинформационные описания
Каждый ресурс и каждая коллекция ресурсов должны ассоциироваться с метаинформационным описанием,
реализующим их существование. Это обеспечивает оптимизацию и долговременную защиту ресурсов: при этом
различаются объекты как таковые и множество их копий, которые могут находиться в разных репозиториях. Мета
информационные описания не только служат воплощением ресурсов или коллекций, но еще и хранят дополнитель
ные сведения о них. При необходимости обращения к самим метаинформационным описаниям они тоже должны
трактоваться как объекты, наравне сдругими ресурсами. Однако часто записи метаданных порождаются вдинами
ческом режиме как результат выполнения запроса к комплексной базе данных, а это означает, что метаинформаци-
онное описание является не ресурсом, а разделом ресурса. Настоящий стандарт учитывает оба сценария развития
событий, поскольку PID может указывать либо на ресурсы, либо на различные разделы ресурсов. Сервер ресурса
не должен конфигурироваться на генерацию одной и той же информации в обоих указанных случаях.
В случае коллекций и связок ресурсов метаинформационное описание как таковое содержит ссылки на вклю
ченные в коллекцию ресурсы, и процесс разрешения этих ссылок может быть рекурсивным. Настоящий стандарт не
нацелен на определение какого-то конкретного способа представления ресурсов в рамках метаинформационного
описания. Однако он четко определяет механизм, который должен использоваться в таких описаниях для запроса
ресурсов с помощью PID-идентификаторов.
Нет также и какой-то строго установленной процедуры контроля различных версий метаданных. В некоторых
репозиториях исходный номер версии вообще не меняется; в других этот номер меняется при изменении дополни
тельной информации, бывает и так. что номер версии метаданных изменяется, когда меняется объект, к которому
эти данные относятся. Настоящий стандарт не преследует цели установления какого-то единого подхода к управ
лению версиями метаинформационных описаний.
А.1.6 Аспекты разбиения ресурсов
Различия между разделами ресурса, самим ресурсом и конкретной коллекцией ресурсов порождают множес
тво актуальных проблем, связанных с определением целесообразных уровней разбиения репозитория, которые дол
жна поддерживать организация, ответственная за архивирование данных. Существует множество разных подходов
к решению этих проблем, и все они могут отражать специфику конкретных потребностей и рабочей среды. Поэтому
на стоящий стандарт не определяет каких-либо жестких правил разбиения, а только дает некоторые руководящие
прин ципы выделения уровней PID, присваиваемых коллекциям ресурсов, ресурсам и разделам ресурсов, с
учетом конкретных целей обеспечения высокой производительности, совместимости, эффективности и
управляемости.
В рамках многих проектов разработчикам приходится решать, какие из объектов подходят для присвоения им
собственных индивидуальных PID-идентификаторов, а какие могут обрабатываться с использованием идентифи
катора раздела всочетании с PID более крупного ресурса-контейнера. Здесь важны аспекты производительности и
управляемости, и хотя инфраструктуры PID предназначаются для работы с множественными идентификаторами,
каждый идентификатор все равно требует каких-то операций технической поддержки и обработки, вследствие чего
достижениями сложившейся практики диктуется резервирование индивидуальных PID для использования в тех си
туациях. когда они действительно полезны. Существенную роль играют также соображения логической связности и
совместимости, и потому объекты одного типа должны рассматриваться по возможности на одном и том же уровне
разбиения.
2>Различные типы пакетов, которые могут использоваться для организации хранения собранных ресурсов
как идентифицируемых объектов архива, обсуждаются в модели OAIS. При этом решение по контенту пакета при
нимается его создателем на основе какого-либо содержательного или управленческого критерия. Например, стан
дарт METS (20J обеспечивает именно такую идентификацию пакетов.
12