ГОСТ Р ИСО 10303-21—2022
5 Формальные определения
5.1 Формальная нотация
В настоящем стандарте для определения синтаксиса структуры обмена использована синтакси
ческая нотация Вирта (WSN), описанная в приложении В.
5.2 Определение основного алфавита
Алфавит структуры обмена определен как кодовые точки от U+0020 до U+007E и от U+0080 до
U+10FFFF ИСО/МЭК 10646. Этот алфавит представлен в структуре обмена, используя схему кодирова
ния UTF-8 по ИСО/МЭК 10646. Таблица 1 делит основной алфавит на подмножества.
Результатом схемы кодирования UTF-8 является единичный октет, имеющий шестнадцатеричное
значение от 20 до 7Е для каждого символа LATIN_CODEPOINT (кодовые точки латинского алфавита) и
последовательность октетов с шестнадцатеричными значениями от 80 до F4 для каждого символа
HIGH_CODEPOINT (верхние кодовые точки). Октеты со значениями вне этих диапазонов должны при
обработке обменной структуры игнорироваться.
Примечание— Набор символов LATIN_CODEPOINT (кодовые точки латинского алфавита) эквива
лентен базовому алфавиту из первого и второго изданий ИСО 10303-21. Представление UTF-8 кодовых точек от
U+0020 до U+007E то же самое, что и символы от G(02/00) до G(07/14) в ИСО/МЭК 8859-1, которые определяют
базовый алфавит в ранних изданиях. Если требуется совместимость с предыдущими изданиями ИСО 10303-21,
можно избежать использования кодовых точек HIGH_CODEPOINT (верхние кодовые точки).
Таблица 1— Определение подмножеств основного алфавита по WSN
SPACE
= " " .
D IG IT
= "0"
I
1 | "2" | "3" | "4" | "5" | "6" |
II
n
II
I
"8"
I
"9"
"
| "
d
"
| "1"
1 "
t
"
| "
e
" |
If£ llM g "|
"
h
"
|
m
" | "
n
" | "
o
" |
M p M
|
"
u
" 1
"
v
" | "
w
"
1
"
x
"
LOWER
= "
a
"
I
| "
i
"
I
I
"
q
"
I
I
"
y
"
I
"
b
" | "
c
"
"
j
" 1
"
k
"
II
£
II
"
s
"
lfz
" .
1 "
D
"
| "
L
"
|
Ilfji II
| "
E
" | "
F
" | "
G
" |
"
H
"
| "
M
" | "
N
" | "
O
" |
IIp II
"
U
" | "
V
" | "
W
" | "
X
"
UPPER
= "
A
"
I
If j If
I
I
"
Q
"
I
| "
Y
"
I
"
B
" | "
C
"
"
j
" 1
"
K
"
"
R
" | "
S
"
"
Z
" |
II II
1 II
Q,
II
1o
SPECIA L
_II | IT
I " + "
I
I
1 ")"
1
| "&"
If II
1 "#"
I " ? "
1 "/"
II . II
1 "["
1 "]"
1 "{"
и | ii
I
II II II II
1 ff* II
1 "$"
II IIII_ II
r
I
II^ IIII_ If
I
II J IIIIA IIII 4 II
II^ II
.
REVERSE SOLIDUS
= "\"
APOSTROPHE
= " .
LATIN_CODEPOINT
=
SPACE
|
D IG IT
|
LOWER
|
UPPER
|
SPECIA L
|
REVERS E_SOLIDU S
|
APOSTROPHE
HIGH_CODEPOINT
=
(от U+0080 до U+10FFFF,
cm
.5.2)
5