ГОСТ Р ИСО/МЭК 18004-2015
7.4.6 Режим кандзи
В системе Shift JIS знаки кандзи представлены двухбайтовой комбинацией. Эти значения байта
сдвинуты относительно значений no JIS X 0208. В JIS X 0208 приведены подробные сведения о коди
рованном представлении Shift. Входные знаки данных в режиме кандзи уплотнены из двойных кодовых
слов в 13 битов в соответствии с требованиями, приведенными далее. Перед двоичными данными
добавляют индикатор режима и индикатор числа знаков. Индикатор режима в режиме кандзи состоит
или из 4 битов для символов QR Code или из числа битов, указанных в таблице 2, для символов Micro
QRCode: индикатор числа знаков представлен числом битов в соответствии с таблицей 3. Число вход ных
знаков данных преобразуют к его двоичному эквиваленту идобавляют как индикатор числа знаков после
индикатора режима и перед последовательностью двоичных данных.
1Для знаков со значениями Shift JIS от 8140НЕХ до 9FFCHEX:
a) вычитают 8140НЕХиз значения Shift JIS;
b
) умножают старший байт значения, полученного на этапе а) на С0НЕХ;
c) прибавляют младший байт значения, вычисленного на этапе а) к значению, определенному на
этапе Ь);
d) преобразуют значение в 13-битовую двоичную строку.
2 Для знаков со значениями Shift JIS от Е040
н
е
х
до EBBFhex:
a) вычитают С140ИЕХиз значения Shift JIS;
b) умножают старший байт значения, полученного на этапе а) на С0НЕХ;
c) прибавляют младший байт значения, вычисленному на этапе а) к значению, определенному на
этапе Ь);
d) преобразуют значение в 13-битовую двоичную строку.
П р и м е р
Входной знак
(значение Shift JIS):
1 Вычитают 8140 или С140
2 Умножают старший байт на СО
3 Складывают с младшим байтом
4 Преобразуют в 13-битовую строку
ЛТч
935F - 8140 = 121F
12*’ СО = 080
D80 ♦ 1F = D9F
0D9F -01101 1001 1111
•* сЁ?”
"Я”
935FЕ4АА
Е4АА - С140 = 236А
23 ...С0= 1А40
1А40 + 6А = 1ААА
1А А А -1 1010 1010 1010
3 Для всех знаков:
е)перед двоичной последовательностью, представляющей входные знаки данных, вставляют ин
дикатор режима (см. таблицу 2) и индикатор числа знаков (число битов приведено в таблице 3) в дво
ичном виде;
Для любого числа входных знаков данных размер двоичного потока для режима кандзи вычисля
ют по формуле
В = М+ С+ 13D.
где В - число битов в двоичном потоке:
М - число битов в индикаторо режима (4 - для символов OR Code или значение, приведенное в
таблице 2 для символов Micro QR Code);
С - число битов в индикаторе числа знаков (см. таблицу 3);
D - число знаков входных данных.
7.4.7 Смешанный режим
Для символа допускается начать кодирование последовательности данных в одном режиме и
затем изменить режим, если этого требует содержание данных или для увеличения плотности коди
рования. Подробное руководство приведено в приложении J. Каждый сегмент данных кодируется в
соответствующем режиме как указано в разделах с 7.4.2 по 7.4.6 на базе структуры индикатор режима/
индикатор числа знаков/данные и сопровождается индикатором режима, начинающим следующий сег
мент. На рисунке 13 представлена структура данных, содержащих п сегментов.
Ограни
читель
Сегменг 1
ИндикаторИндихатор
режима 1 числа знаков
Сегмент 2
Дан- ИндикаторИндикаторДан
режима 2 числа знаков ные
Сегмент п
...
ИндикаторИндикатор Дан
режима п числа знаков ные
Рисунок 13 — Формат данных в смешанном режиме
25