ГОСТ Р ИСО 24615—2013
4 Метамодель SynAF
4.1 Вводные замечания
В когнитивной обработке языковых данных синтаксические аннотации выполняют как минимум
две функции:
1. представление лингвистическойкомституентиости [подобно именнымгруппам(NP)],
описывающей структурированную последовательность морфосинтаксически аннотированных лексем
{включая пустые элементы или следы, порождённые передвижениями на уровне составляющих), а
также построение составляющих из сегментированных элементов:
2. представление отношений зависимости: например, отношения "главное слово - модификатор"
и отношения между категориями одного вида (подобные связям между главными словами в именных
аппозициях или именным соподчинениям в некоторых формализмах). Внутри синтаксической группы
может существовать информацияозависимостимеждуэлементами,прошедшими этап
морфосинтаксического аннотирования (например, прилагательное - это модификатор главного
существительного внутри именной группы) или описываться конкретное отношение между
синтаксическими составляющими на «паузальном и пропозициональном уровнях (то есть там. где
именная группа выступает как "субъект’ основного глагола элементарного или сложного
предложения). Отношение зависимости может устанавливаться также для пустых элементов
(например, для элемента pro в романских языках, где этот элемент выполняет грамматическую
функцию).
Как следствие, синтаксические аннотации должны соответствовать многоуровневой стратегии
аннотирования, обеспечивающей взаимосвязь синтаксического аннотирования по составляющим
элементам и по отношениям зависимости, как это установлено в метамодели SynAF.
4.2 О метамодели SynAF
4.2.1 Общий обзор
Метамодель SynAFпредставляетсякак совокупностьклассов универсального языка
моделирования UML, дополненная UML-парами ’атрибут - значение", которые представляют
соответствующие категории синтаксических данных. Текстовые описания SynAF определяют более
полную информацию о классах SynAF. отношениях и расширениях, которые могут быть включены в
диаграмму UML. Разработчики должны определить выбор категории данных (DCS) в соответствии с
процедурами выбора категорий данных, установленными для SynAF (см. Рисунок 1). Для
представления синтаксических аннотаций должны использоваться категории данных, указанные в
приложении А.
4.2.2 Класс SyntacticNodo
SyntacticNode - это параметризованный класс, категоризирующий как класс терминальных
узлов, так и класс нетерминальных узлов. Синтаксические узлы могут быть задействованы в любом
необходимом числе синтаксических отношений (см. п. 3.6.
синтаксические дуги).
4.2.3 Класс T_Node
Класс T_Node представляет терминальные узлы синтаксического дерева, состоящего из
словоформ, прошедших этап морфосинтаксического аннотирования, а также из пустых элементов,
когда они необходимы. Узлы этого класса определяются на одном интервале или на множестве
интервалов (множественные интервалы обеспечивают учет нарушений непрерывности составляющих
частей текста). Для аннотирования узлов T_Nodes используются средства автоматической
синтаксической категоризации, действующие на уровне отдельных слов.
4.2.4 Класс NT_Node
Класс NT_Node представляет нетерминальные узлы синтаксического дерева. Синтаксические
деревья состоят в основном из узлов T_Nodes и NT_Nodes. а также пустых элементов, когда они
необходимы. Узлы T_Nodes make reference to a span. Так с помощью древовидного синтаксического
представления могут быть получены интервалы и для NT_Nodes. Для аннотирования узлов
NT_Nodes используются средства автоматической синтаксической категоризации, действующие на
уровне фраз и на более высоких уровнях (клаузальном и сентенциальном).
4.2.5 Класс SyntacticEdge
КлассSynacticEdgoпредставляетотношениемеждусинтаксическимиузлами(как
терминальными, так и нетерминальными). Например, отношение зависимости - это бинарное
отношение, образуемое парой узлов - исходным и целевым, с одной или большим числом аннотаций.
4