ГОСТ Р ИСО 10303-21-2002
Пример
Хранящаяся строка
CAT’
’Don’t’
Содержание
CAT
Don’t
Комментарии
Строка нулевой длины
’\S\Drgcr’
’h\S\ttcP
’\PE\\S\*\S\U\S\b’
Arger
hotel
Нет
Кириллица. ’Нет*
6.3.3.2 Кодирование внутри строки набора символов из стандартов серии ИСО/МЭК 10646
В ГОСТ Р ИСО 10303-11 (см. 8.1.6) определено, что в строке может появиться любой символ
из стандартов серии ИСО/МЭК 10646. Настоящий стандарт устанавливает три управляющие дирек
тивы, которые позволяют кодировать символы из ИСО/МЭК 10646.
Стандарты серии ИСО/МЭК 10646 определяют каноническую форму, которая использует
четыре восьмибитные группы для представления любого символа из полного множества кодирова
ния. Эти символы определяют соответственно группу, уровень, ряд и ячейку. Дополнительно
стандарты серии ИСО/МЭК 10646 определяют основной многоязычный уровень (ОМУ), представ
ляющий уровень 00 группы 00 полного множества кодирования. Символы в ОМУ представлены
двумя байтами, определяющими ряд и ячейку.
Г1р имс ча н ис —ОМУ включает в себя символы, в основном используемые валфавитных, послоговых
и идеографических записях вместе с различными знаками и цифрами.
Для того чтобы показать, что очередная последовательность из кратных четырем шестнадца
теричным символом будет интерпретироваться как закодированная двухбайтным представлением
символов из ОМУ по ИСО/МЭК 10646-1, должна быть использована управляющая директива
обратная косая черта, прописная буква X, цифра <)ва, обратная косая черта "\Х2\". Кодирование в
строке в структуры обмена должно быть следующим:
- каждый символ представления из стандартов серин ИСО/МЭК 10646, подлежащий кодиро
ванию, должен быть преобразован в два 8-битных байта, как определено в ИСО/МЭК 10646-1;
- каждый из двух полученных в результате 8-битных байтов должен быть закодирован как два
шестнадцатеричных символа в основном алфавите, соответствующих графическому представлению
шестнадцатеричных цифр.
Пример 1—Латинскую прописную букву В преобразуют с помощью таблицы 1из ИСО/МЭК 10646-1
в шестнадцатеричное значение *0042’. Шестнадцатеричными цифрами, соответствующими этому значению,
яатяются 0,0.4 и 2. Кодирование вструктуре обмена с использованием основногоалфавита представляет собой
четыре последовательных символа: 0042.
Для того чтобы показать, что очередная последовательность из кратных восьми шестнадцате
ричных значений должна интерпретироваться как закодированная четырехбайтным представленnext
символов из полного множества кодирования по стандартах» серии ИСО/МЭК 10646, должна быть
использована управляющая директива обратная косая черта, прописная буква X. цифра четыре,
обратная косая черта “\Х 4\’\ Кодирование в строке в структуре обмена должно быть следующим:
- каждый символ в представлении из стандартов серии ИСО/МЭК 10646, который
должен быть закодирован, следует преобразовать в четыре 8-бнтных байта, как определено в
ИСО/МЭК 10646-1;
- каждый из четырех получаемых в результате 8-битных байтов должен быть закодирован как
два шестнадцатеричных значения из основного алфавита, соответствующих графическому представ
лению шестнадцатеричных цифр.
Пример 2 —Латинскую прописную букву В преобразуют с помощью таблицы 1 из ИСО/МЭК 10646-1
в шестнадцатеричное значение *00000042’. Шестнадцатеричными цифрами являются 0, 0, 0. 0, 0. 0, 4 и 2.
Кодирование в структуре обмена с использованием основного алфавита предстаатяет собой восемь последова
тельных символов 00000042.
9