ГОСТ Р 7.0.91—2015
индексированию и поиском в одной интегрированной системе, чаще бывает принято рассматривать эти
функции как отдельные приложения. Поэтому необходимо, чтобы тезаурусными данными можно было
беспрепятственно обмениваться между этими приложениями, при этом следует избегать ошибок и не
определенностей при текущем обновлении данных.
С распространением электронных сетей и почти всеобщим использованием компьютеров в управ
лении информацией сценарий становится все более сложным, что дает возможность обмена данными и
информацией в масштабе, который раньше нельзя было даже вообразить. Из одного компьютера,
включенного в сеть, можно одновременно опрашивать различные коллекции книг, статей, фотографий,
наборов данных и музейных экспонатов, размещенные на компьютерах, распределенных по всему
миру. Чтобы обеспечить возможность использования тезауруса в подобном сценарии, от систем тре
буется, чтобы системы были совместимыми, т. е. разные системы или их компоненты были способны
обмениваться информацией для внутрисистемного использования.
В настоящем разделе описываются:
a) свойства и функции, которые обеспечивают совместимость тезауруса с системами и сетями;
b
) свойства и функции, которые необходимы программам индексирования и поиска, использую
щим тезаурус.
Здесь не описываются свойства и функции, необходимые таким приложениям, которые использу
ют два или более связанных тезауруса. Такие требования будут включены в [6] и следующую версию
стандарта.
16.2 Совместимость, необходимая для тезаурусов
Как описано в 14.8. программное обеспечение, используемое для ведения тезауруса, должно
быть способно экспортировать и импортировать тезаурус целиком и по частям. Для этого должен ис
пользоваться стандартный формат тезауруса (см. раздел 17).
Для замены старой версии тезауруса новой должна быть предусмотрена возможность экспорти
ровать все новые, измененные и исключенные статьи.
Когда внедряется новая версия тезауруса, система должна быть в состоянии включить все новые
или измененные термины без потери данных, приписанных к сохранившимся терминам, если они еще
действительны. Например, отсылки от терминов к ресурсам, которые заиндексированы этими
терми нами.
Для предоставления возможности использования тезауруса пользователями сети (например. Ин
тернета) тезаурус должен быть опубликован в сети в стандартном формате (см. раздел 17).
Опубликованный тезаурус должен регулярно обновляться. Это может потребовать импорта и за
грузки файла обновлений из приложения, в котором поддерживается эталонная версия.
Если тезаурус опубликован в сети, для получения всех или части данных тезауруса должен ис
пользоваться стандартный протокол (см. раздел 18). Например, программе поиска может потребовать ся
выбрать всю или часть информации, связанной с отдельным понятием или понятийной группой. С
каждым понятием должен быть связан уникальный идентификатор, что облегчает распределенный
поиск.
Для удобства пользователей и широкого распространения тезаурус должен быть зарегистрирован
в каком-либо словарном регистре, который обслуживает целевую аудиторию пользователей.
16.3 Интеграция с программами индексирования и поиска
16.3.1 Если тезаурус предназначен для информационного поиска, он должен быть совместим с
системами, в которых происходит индексирование и поиск. Для печатных тезаурусов интеграция до
стигается тем, что человек, просматривая страницы, выбирает термины и вводит их в информационно
поисковую систему с соответствующим синтаксисом. Для электронных тезаурусов эти функции должны
поддерживаться дружественным интерфейсом.
Пока ведение тезауруса не объединено в одной системе с индексированием и поиском, первое
требование состоит в том. чтобы экспортировать тезаурусные данные из системы ведения тезауруса в
информационно-поисковую систему. Форматы и протоколы для этого описаны в разделах 17 и 18.
16.3.2 Все системы, которые вовлечены в обработку тезаурусных данных, должны поддерживать
все символы, которые могут быть представлены в данных. Они обычно включают скобки квалификато
ров терминов и иногда другие знаки препинания. В случае многоязычного тезауруса должны поддержи
ваться все символы письменностей и алфавитов всех его языков.
86