ГОСТР ИСО 23185—2013
- проверки достоверности (валидации)данных:
- полноты,
- лингвистической корректности,
- соответствия условиям представления;
- проверки на избыточность или дублирование;
- регулярному сопровождению данных;
■ регулярномусопровождению метаданных (например, реестраметаданныхвсоответствиистре
бованиями ИСО 11179).
Многие изхарактеристикполезности, описанные вданном подразделе, связаны с атрибутами вво
да или вывода данных.
4.3.2.1 Проверкадостоверностиданных
Проверка достоверности — это проверка системной корректности терминологических данных.
Если пользователь ознакомлен с правилами контроля достоверности представляемых данных, это
помогаетему определять ихтекущее состояние идажеделатьэто в автоматическом режиме.
Вследствие сложности структуры терминологических данных, вышеуказанная характеристика
полезностидолжна анализироваться в разныхаспектах: на полноту, лингвистическую корректностьина
соответствие требованиям к представлениюданных.
4.3.2.1.1 Полнота
Полнота означает уверенность в том, что записанные терминологические данные состоят из эле
ментов. которые отвечают требованиям соответствующих категорий, определенных в модели данных.
Этот атрибут поддается измерению, особенно в компьютеризованной рабочей среде.
Пример — В подразделе 6.1 ИСО 10241:1992 констатируется, что ядля целей стандартизации
терминологическая статья должна содержать хот я бы следующ ие элемент ы: а) номер статьи;
Ь) предпочт ит ельный термин, предст авляющ ий понятие; с) определение понят ия...*. Если термино
логическая статья не отвечает этому минимальному требованию, то она не должна квалиф
ициро ваться как статья стандартизованной терминологии ИСО. В этом случае может
использоват ься некот орый статистический показатель, указывающ ий степень соот вет ст вия ИСО
10241:1992, под раздел 6.1.
4.3.2.1.2 Лингвистическая корректность
Этот атрибут относится к проверке лингвистической правильности терминологических данных.
Для оценки лингвистической корректности необходимо проверитьвыполнение основныхлингвистичес
ких соглашений и зависящих от предметной области ограничений, применимых к терминологическим
данным. Эта характеристика измерима — особенно в компьютеризованной рабочей среде.
Пример — Для многих ест ест венных язы ков сущ ествуют орфографические корректоры.
Использование таких корректоров позволяет пользоват елю оценивать лингвист ическую коррек
тность с помощ ью статистики ошибок, выраженной в абсолют ном их количестве или в процентах.
4.3.2.1.3 Соответствие условиям представления
Данный атрибут касается стандартизованного представления контента терминологического
ресурса. Он особенно просто измеряется в компьютеризованной рабочей среде.
Пример 1 — Коды для представления названий язы ков, географических названий и др. должны
быть стандартными, такими, как они определены в ИСО 639. ИСО 3166 и ИСО 15924. Соответствие
настоящ ему стандарту может оцениваться с помощ ью статистических показателей.
Пример 2 — Представление терминологических данны х в напечатанных стандартах ИСО по
терминологии соответствует специф икациям ИСО 10241.
4.3.2.2 Проверка наизбыточность
Подпроверкойнаизбыточность понимаетсявыявлениеслучаевповторногопоявленияодной итой
же содержательной информации в терминологическом ресурсе. Установить все случаи дублирования
информации в терминологии непросто, поскольку терминологические данные всегда привязаны к кон
кретным понятиям определенной предметнойобласти.
Вопрос избыточности рассматривается в спецификациях ИСО 860, где на определение избыточ
ности накладываются различные ограничения в соответствии со схемами классификации предметных
областей. Важным фактором оценки избыточности может быть также структура механизма управления
терминологическим ресурсом.
Обычно пользователи не хотят иметь дела с дублированным контентом, так как это замедляет
работу с терминологическим ресурсом. Однако в определенных ситуациях значимой может оказаться
характеристика полезности «Контроль за уровнемдублирования понятий».
7