ГОСТ Р 7.0.66—2010
- слова и группы слов, которые в тексте подчеркнуты или выделены полиграфическими сред
ствами.
Индексирование только по заглавиям является неполноценным. При индексировании по рефера
там и аннотациям следует следить за адекватностью передачи в них содержания документа.
5.2При анализе нетекстовых (аудиовизуальных и других) документов, которые, помимо чтения,
требуют просмотра, прослушивания, испытания объекта в действии и других подобных процедур,
допускается индексирование их по имеющемуся текстовому компоненту (наименованию, краткомуопи
санию и т.п.), но и в этом случае индексатору должна быть предоставлена возможность полного озна
комления с документом, если текстовой материал представляется недостаточным.
6 Выбор понятий, характеризующих содержание документа
6.1 Число характеристик и понятий, отраженных в ПОД. определяет его полноту и является важ
нейшим показателем качества индексирования.
6.1.1 В ПОД необходимо отразить все понятия всех тем. которые могут иметь ценность для
пользователей системы.
В документе может быть выявлено более одной темы из сферы интересов пользователей. Эти
темы должны рассматриваться раздельно.
6.1.2 Тематика, отражаемая при индексировании, не должна ограничиваться узкими рамками
непосредственных интересов пользователей информационно-поисковой системы (ИПС). В ПОД также
следует включать понятия, связанные с побочными аспектами документа (например, социальные и
экономические аспекты научно-технических исследований).
6.1.3 При выборе понятий основным критерием является потенциальная ценность понятия для
отражения темы документа или для его поиска. При этом необходимо ориентироваться на типичные
запросы к ИПС:
- отбирать понятия, наиболее употребительные в коллективе пользователей ИПС;
- уточнять состав лексики и грамматические правила ИПЯ на основе обратной связи с пользова
телями.
Изменения, вносимые в ИПЯ. недолжны нарушатьобщую структуру илогику, заложенные при его
создании.
6.1.4 Число терминов индексирования, приписываемых одному документу, определяется коли
чеством сведений, содержащихся вдокументе. Ограничение числа терминов должно бытьосновано на
содержательном отборе наиболее важных понятий.
6.2 Полнота индексирования, принятая в каждой ИПС, определяется ее функциональным назна
чением. Объем документа сильно влияет на полноту индексирования. Необходимо учитывать указан
ные факторы и на их основе проводить экспертный отбор понятий из документа, не стремясь включить в
ПОД все упомянутые в нем понятия.
6.3 Специфичность ПОД определяется тем. в какой мере понятия документа нашли точное отра
жение терминами индексирования, и также является одним из параметров качества индексирования.
Представление понятия термином, имеющим более широкое значение, приводит к потере специфич
ности. Более широкие термины допускается использовать в случаях:
- если излишне специфичный термин непонятен пользователям, особенно когда соответствую
щее понятие применяется только в пограничных областяхдеятельности;
- если в документе понятие раскрыто недостаточно полно или является вспомогательным для
изложения содержания документа.
6.4 Рекомендуется в каждой ИПС разрабатывать списки характеристик, которые признаются важ
ными для отражения в ПОД. В зависимостиот потребности конкретной ИПС этот список может быть как
расширен, так и сокращен.
7 Выбор терминов индексирования
7.1В процессе выбора терминов индексирования понятия, характеризующие содержание доку
мента. представляют:
(дескрипторами или ключевыми словами),
- предпочтительными лексическими единицами
выбранными по правилам конкретного ИПЯ;
3