ГОСТ Р ИСО 24614-1—2013
«expected» (ожидаемый) или «unexpected2" (неожиданный), если они встречаются в тексте, также
представляют собой отдельные WSU.
г) Принцип максимизации области действия словосложения
Если сложное слово, найденное в тексте, включает в себя в соответствии со справочным
словарём другое сложное слово, то более длинное сложное слово рассматривается как WSU, а
более короткое сложное слово может быть помечено как альтернативная внутренняя WSU.
Например, если в английском тексте присутствует строка «network operating system» (сетевая
операционная система), то вся эта строка в целом трактуется как WSU, где более короткое
словосочетание «operating system» (операционная система) может быть альтернативной WSU.
д) Принцип сегментации для других строк
Л
юбые символьные строки, включая цифровые строки, строки иностранных символов или знаки
пунктуации и любые их комбинации могут образовывать WSU, если они воспринимаются в тексте как
несущие некоторую синтаксическую функцию. Например, в английском тексте «The Second World War
ended in 1945» (Вторая мировая война закончилась в 1945 году) цепочка цифр «1945» является WSU,
а в предложении «и is the first consonant character in Korean» (“i является символом первого
согласного звука в корейском’ языке) символ «“1» является в данном конкретном контексте единицей
пословной сегментации, где этот знак функционирует как подлежащее этого предложения.
4.5 Принцип полного охвата и совместимости при использовании данной части ИСО 24614
Данная часть стандарта ИСО 24614 предназначена для использования применительно к
любому тексту на любом языке. Однако для определённых языков необходимы некоторые изменения,
описанные в других частях ИСО 24614. В последующих частях будет также дополнительно
обсуждаться и иллюстрироваться важная роль контекста в определении крупности (гранулярности)
разбиения и области действия пословной сегментации.
11