ГОСТ Р 7.0.91—2015
D )П р и п о л у ч е н и и н е д о с т а т о ч н о й в ы д а ч и п о и с к м о ж е т б ы т ь а в т о м а т и ч е с к и р а с ш и р е н в ы ш е с т о
я щ и м и , н и ж е с т о я щ и м и и а с с о ц и а т и в н ы м и т е р м и н а м и .
Если поисковые термины автоматически конвертируются, замещаются, переводятся, заменяют
ся вышестоящими или нижестоящими терминами, пользователь должен быть проинформирован, что
было сделано.
16.3.6 Отношения эквивалентности в тезаурусе позволяют производить поиск по базам данных,
которые не индексировались по данному тезаурусу. Например, если тезаурус включает термины «то-tor-
bikes», «motor-cycles» и «motorcycles» в качестве дескрипторов или аскрипторов (предпочтительных или
непредпочтительных терминов) для одного и того же понятия, то поиск по любому из этих терминов может
быть расширен включением поиска по всем остальным синонимам. См. также обсуждение сино
нимических колец (synonym rings) в [6].
16.3.7 При интеграции в систему индексирования или каталогизации должны быть обеспечены
следующие функции:
a) копирование одного или более терминов прямо в формуляр индексирования без необходимо
сти вводить слова с клавиатуры:
b
) проверка по тезаурусу терминов, введенных напрямую (при вводе напрямую аскриптора не
предпочтительного термина), он должен быть заменен на дескриптор автоматически с извещением об
этом пользователя. При вводе строки символов, совпадающей с началом одного или более терми нов
тезауруса, индексатору должны быть предложены для выбора все соответствующие дескрипторы
(предпочтительные термины):
c) возможность ввода в тезаурус кандидатов в дескрипторы для рассмотрения их редактором
тезауруса (см. 13.6).
16.3.8 Если система предназначена для автоматического индексирования, а не для работы спе
циалиста, то должны быть предусмотрены средства связи каждого дескриптора (предпочтительного
термина) с алгоритмом или правилами, которые управляют его использованием.
17 Обменные форматы
Взаимодействие различных компьютерных приложений требует использования общего формата.
Хорошо известны следующие четыре формата:
-MARC (Mashine-Readable Cataloging) [22] — Этот набор стандартов, основанный на ИСО 2709,
широко используется для обмена библиографическими данными между библиотеками. Хотя основное
применение этих стандартов относится к обмену каталожными записями, в набор входят также стан
дарты по обмену «авторитетными записями», т. е. записями, взятыми из тезаурусов и других типов
контрольных словарей. Особое значение имеют:
1) MARC 21 Формат для авторитетных данных (имеется в полной и сокращенной версии) [23]:
2) MARC 21 Формат для классификационныхданных (имеется в полной и сокращенной версии) [24];
3) MADS (Metadata Authority Description Schema) — совместимый c MARC 21 формат описания на
XML данных того типа, которые содержатся в записях авторитетных данных.
Форматы MARC, выраженные на языке XML. соответствуют [25].
- SKOS — Формат SKOS (Simple Knowledge Organization Sistems) [26. 27] установлен рекомен
дацией W3C применительно к работам по семантическому вэбу и использует кодировку XML и RDF
(Resource Description Framework). Он разработан как для тезаурусов, так и для классификационных
систем, таксономий и других типов словарей.
- Zthos — Zthes [28] первоначально был разработан как прикладной профиль Z39.50 для обмена
тезаурусными данными, но впоследствии был развит для использования с SRU (Search and Retrieval via
URL: см. раздел 18).
- DD 8723-5 — Этот проект британского стандарта предлагает схему XML, которую можно исполь
зовать для обмена тезаурусом, удовлетворяющим британскому стандарту BS 8723 [29]. Схема доступ на
на
http://schemas.bs8723.org/.
Дополнительно к этим четырем форматам для удовлетворения потребностей отдельных сфер
применяют и другие форматы.
В частности, находит применение [30] — Система разметки терминологических данных TMF (Ter
minological Markup Framework) для компьютерных работ в терминологии. Эта схема разработана для
обеспечения единых принципов представления данных в терминологических коллекциях. Она включа-
88