7
6.7. Параметрическая конструкция должна состоять из двух формально выраженных частей: наименования параметра и перечня значений параметра (см. п. 6.8), которые объединены в одну синтаксическую конструкцию.
6.8. Перечень значений в параметрической конструкции должен включать набор значений параметров и указание об альтернативности или одновременности (симультанности) значений.
Набор значений задают перечислением или указанием двух предельных значений, между которыми располагаются значения, принимаемые параметром (интервалом значений). При задании интервала значений формально указывают, которое из значений является начальным и конечным для интервала значений, а также входят ли граничные значения в указанный интервал. Одно из граничных значений интервала может отсутствовать, если значение параметра ограничено только с одной стороны.
Указание об одновременности используют, когда у одного объекта сообщения наблюдаются все заданные значения параметра. Указание об альтернативности используют, когда параметры одного объекта сообщения должны быть выбраны из числа заданных.
6.9. Значения параметра могут быть представлены синтаксической конструкцией из двух терминов индексирования - числового выражения и наименования единицы величины - при необходимости производить операции расчета или численного сравнения.
7. АВТОМАТИЗИРОВАННОЕ ИНДЕКСИРОВАНИЕ
7.1. Целью автоматизации индексирования является минимизация материальных и человеческих ресурсов, затрачиваемых на процедуру индексирования, а также достижение стабильности и единообразия ее результатов.
7.2. Автоматизированное индексирование (АИ) осуществляют по:
1) тексту первичного документа.
2) заглавию и аннотации или реферату документа;
АИ по тексту первичного документа должно включать процедуру сжатия ПОД.
7.3. С использованием вычислительной техники осуществляют следующие содержательные этапы АИ:
1) выявление информативных частей документа;
2) идентификация слов текста и приведение их к нормализованному виду (морфологический анализ и синтез);
3) формирование списка ключевых слов исходного текста;
4) подбор дескрипторов по тезаурусу;
5) формирование ПОД.
7.4. Выявление информативных частей документа
Технология АИ должна предусматривать идентификацию и предоставление индексатору или программе индексирования наиболее информативных фрагментов документа из списка указанных в п. 2. 1. Могут быть предусмотрены алгоритмы выявления информативных фрагментов по другим формальным критериям, а также по решению специалиста-индексатора.
7.5. Идентификация слов текста
7.5.1. Процесс идентификации слов текста должен включать: отождествление словоформ одного слова и определение информативных слов текста.
При этом может быть необходимо использование интеллектуальных процедур для решения таких задач, как выявление и обработка синтаксических конструкций, выявление и разрешение омонимии.
7.5.2. Для идентификации слов текста используют машинные словари (словари основ, парадигм, словосочетаний и т.д.). Словари должны быть представлены в базе данных системы и обеспечены средствами визуализации и ведения.