ГОСТ Р ИСО 10303-21—2022
строке как одиночный символ G [(х+8)/у], где G(x/y) — символ основного алфавита, следующего за "\S\".
Таким образом, если символ основного алфавита имеет значение кода v, то его следует интерпретиро
вать как символ со значением кода v 4 + 128.
Для того чтобы указать, что только в данной строке последующие директивы управления обрат
ная косая черта, прописная буква S, обратная косая черта будут интерпретироваться как ссылки на
расширенный алфавит, определенный в том стандарте серии ИСО 8859, который определяется зна
чением UPPER, должна быть использована директива управления обратная косая черта, прописная
буква Р, UPPER, обратная косая черта. Прописная буква (обозначенная как UPPER) должна быть
одной из следующих: "А", "В", "С", "D", "Е", "F", "G", "Н", "I". В данном контексте прописная буква А опре
деляет ИСО/МЭК 8859-1; прописная буква В — ИСО/МЭК 8859-2 и т. д. Если данная директива
управ ления не появляется в строке, подразумевается значение "А", т. е. должен быть расширенный
алфавит, который определен в ИСО/МЭК 8859-1.
Примеры
Хранящаяся строка
’САГ
’Don"t’
\S\Drger’
h\S\ttel’
\PE\\S\*\S\U\S\b’
Содержание
CAT
Don’t
i
string of length zero
Arger
hotel
Нэет
Комментарии
Апостроф.
Строка нулевой длины.
Кириллица. ’Нет’.
6.4.3.3 Кодирование внутри строки набора символов из стандартов серии ИСО/МЭК 10646
В настоящем стандарте указаны директивы управления, позволяющие кодировать символы ИСО/
МЭК 10646 как последовательность шестнадцатеричных символов. Эти директивы управления могут
использоваться вместо UTF-8 кодированных символов, когда требуется совместимость с предыдущими
редакциями кодирования структуры обмена.
Директива управления обратная косая черта, латинская прописная буква X, цифра два, обрат
ная косая черта "\Х2\" указывает, что далее следует очередная последовательность из кратных четы
рем шестнадцатеричных символов. Каждая последовательность из кратных четырем шестнадцатерич
ных символов должна интерпретироваться как 16-битное число, дающее целочисленное положение в
кодовом пространстве UCS.
Директива управления обратная косая черта, латинская прописная буква X, цифра четыре,
обратная косая черта "\Х4\" указывает, что далее следует очередная последовательность из кратных
восьми шестнадцатеричных символов. Каждая последовательность из кратных восьми шестнадцате
ричных символов должна интерпретироваться как 32-битное число, дающее целочисленное положение в
кодовом пространстве UCS.
Директива управления обратная косая черта, латинская прописная буква X, цифра ноль, об
ратная косая черта "\Х0\" должна использоваться для указания конца шестнадцатеричной последова
тельности символов "\Х2\" или "\Х4\".
Примечание — Такое использование восьми шестнадцатеричных символов в кодировке "\Х4\" предше
ствует ограничению кодового пространства UCS максимальным значением 10FFFF. Первые два символа в каждой
группе из восьми символов всегда будут равны нулю.
Примеры
Хранящаяся строка
’\X2\03C0\X0Y
’\X2\03B103B203B3\
X0Y
’\X4\001F638\X0Y
Кодовая точка
U+03C0
U+03B1
U+03B3
U+1F638
’\X4\001 F638001 F596\U+1F638 U+1F596
X0Y
Символ
строчная греческая буква пи (тт)
U+03B2строчные греческие буквы альфа, бета и гамма
(ару)
ухмыляющаяся кошачья морда с улыбающимися
глазами /символ эмоции,
ухмыляющаяся кошачья морда с улыбающимися
глазами, поднятая рука с промежутком между
средним и безымянным пальцами (два символа
эмоции,№>)
12