ГОСТРИСО 24619—2013
Приложение А
(справочное)
Автономные ресурсы, агрегированные ресурсы и разделы ресурсов
А.1 Общий обзор
А.1.1 Общие замечания
В науке и а промышленной сфере все острее ощущается потребность в непротиворечивом и постоянном об
ращении к электронным языковым ресурсам и их частям, а также к коллекциям таких ресурсов. При этом желатель но
не только иметь возможность извлечения и контроля нужной информации из научных публикаций, но и
поддерживать различные типы перекрестных ссылок между языковыми ресурсами или их частями.
А.1.2 Ресурсы
Ресурсом называется всякая сущность, обладающая собственной индивидуальностью |7J. Несмотря на не
определенность такой характеристики, она важна для исследователей, которые стремятся идентифицировать лин
гвистически значимые единицы как связанные объекты репозитория для обеспечения удобства считывания их
человеком и асе чаще — машинным способом. Такие объекты должны участвовать в отдельных манипуляциях и
использоввться в различных сценариях, а это означает, что они могут существовать автономно а более простран
ных контекстах. Зачастую подобный объект может идентифицироваться как «одиночный файл» в файловой систе
ме. однако он может также извлекаться как включенный объект (например, как запись данных) из системы
управления базой данных. Такие ресурсы могут относиться к различным типам или иметь разные форматы:
- оцифрованные видеозаписи интервью;
- аудиозапись песни:
- комплексная аннотация сеанса коммуникации;
- фотография, документирующая речевое событие;
- словарь для определенного языка.
- описание грамматики;
- запись траектории движения глаза при исследовании процесса чтения;
- описание метаданных ресурса или коллекции ресурсов.
- интегрированный документ, содержащий тексты и фотографии и др.
Объем такого ресурса оставляется на усмотрение его создателя. Некоторые ресурсы образуются группой ан
нотаций разного уровня, тогда как другие могут создаваться для каждого уровня аннотирования с учетом тех или
иных научных и управленческих аспектов. Например, для многих ресурсов метаданные могут храниться в един
ственной крупной реляционной базе данных. В таких случаях «описание метаданных» существует только как ре
зультат запроса, и не вовлекается никакой идентифицируемый ресурс, поскольку запрашиваемым ресурсом
является целостная база данных. Подобный сценарий говорит о необходимости поиска способов адресации разде
лов такого ресурса.
Когда уникальный и постоянный идентификаторы ассоциируются с ресурсами, требуется, чтобы сами ресур
сы тоже оставались неизменными. Рассматриваемый репозиторий предоставляет ресурс с уникальным идентифи
катором для гарантии того, что при разрешении ссылки будет обслуживаться именно «исходный контент» (здесь не
учитываются аспекты пользовательского интерфейса, который может со временем изменяться и выдавать ту же
самую содержательную информацию в ином виде, хотя это может влиять на ее интерпретацию). Когда контент ре
сурса изменяется в результате какой-либо манипуляции, он образует новый ресурс, так как приобретает новую ин
дивидуальность. которая отделена от предыдущей версии ресурса Динамические базы данных, постоянно
меняющие свою индивидуальность именно таким образом, считаются образованными из «снимков мгновенных со
стояний» (snapshots), которые и должны быть объектами ссылок. Любые зависимости между такими снимками мо
гут выражаться соответствующими метаданными, например специфицируемыми связями, цитируемой
информацией или тем и другим вместе.
А.1.3 Связки ресурсов
Иногда а репозиториях содержится указание на то. что некоторые из его ресурсов тесно связаны в соотве
тствии с тем или иным формальным критерием. Примерами могут служить.
- сделанные одновременно аудио- и видеозаписи одинаковой длительности, которые могут включать а себя
другие записи, созданные параллельно и снабженные касающимися их аннотациями, все эти ресурсы относятся к
одному и тому же временному периоду и сделаны в одном месте, что тесно объединяет их. и пользователи часто
хотят получать доступ к таким ресурсам как к единому целому.
• словарь, содержащий фотографии или другие мультимедийные ресурсы, которые расширяют словарные
статьи; в этом случае может оказаться желательным обращение ктесно связанным объектам как кединому пакету;
- корпус текстов с соответствующими внешними аннотациями.
- корпус исторических текстов с соответствующими факсимиле.
11