ГОСТ Р ИСО 24614-1—2013
Многословные выражения (MWE) включают в себя сложные слова, идиомы, пословицы или
разговорные выражения (см. рисунок 3). К сложным словам относятся составные слова и фразовые
образования. Значение сложного слова не может быть выведено из значения его отдельных частей.
Например, словосочетание «White House» (Белый Дом), обозначающее резиденцию президента
США. относится к уникальному понятию, а не только к дому, который является белым. Однако
значение фразового образования может быть выведено из значений его отдельных частей.
Например, словосочетание «apple pie» (яблочный пирог) обозначает пирог (pie), сделанный из яблок
(apples); по аналогии, «blueberry pie» (черничный пирог) — это пирог, сделанный из черники
(blueberries). Тем не менее предыдущее словосочетание рассматривается как фразовое образование
(см. определение термина и пример в п. 2.20) и содержит всего одну единицу пословной сегментации,
поскольку сочетание слов «apple pie» встречается часто и даже используется в идиоматическом
выражении. «American as apple pie» (традиционный для американцев), тогда как словосочетание
«blueberry pie»’ не обладает подобным свойством.
Рисунок 3. Типы MWE
WSU состоит из форм слова и других символьных строк. Символьные строки включают в себя
либо содержат вперемешку цифровые или иностранные символы, знаки пунктуации или некоторые
другие символьные строки: например, иероглифы в китайском тексте или символы согласных
и гласных звуков в корейском тексте. Например. «Bravo!» содержит в слове восклицательный знак.
ПРИМЕЧАНИЕ 4: В некоторых случаях WSU содержат связанные морфемы, такие, как в корейском языке
субстантивные суффиксы «-в» в «hakkyo-е»" (в школе) и «-да» в «hakkyo-да» (школа - именительный падеж),
которые трактуются как принадлежащие к уникальной части речи, называемой «josa» (вспомогательная часть
речи).
Структура единиц пословной сегментации представлена на рисунке 4.
6