ГОСТ Р 55021— 2012/ISO/1EC TR 9789:1994
друг от друга и могут использоваться по отдельности (т. е. для понимания их смысла не требуются другие
части кода).
9.3.6 Контрольные символы
Следует рассмотретьдобавление выявляющего ошибки символа во избежание этих ошибок при за
писи. Использование самойроверяющегося кода предотвращает многие необязательные проблемы пере
дачи данных, связанные с неправильной записью и предоставлением ошибочной информации.
9.4 Наборы символов
9.4.1 Специальные символы
В структуре кода следует использовать обычные символы и избегать символов, отличных от букв и
цифр, таких как дефис, точка, пробел, звездочка и т. д. (за исключением разделителей сегментов кода,
когда могут быть использованы дефис или пробел). В кодедолжны использоваться буквы только одного
регистра, т.е. ABC...Z или abc...z. В именах, названиях и сокращениях могут использоваться буквы обоих
регистров и другие символы. Словарь для данной системы кодирования должен содержать как можно
меньше классов символов. По мерс возможности, используемый набор символов должен соответствовать
7-битовому кодовому набору для обмена информацией (см. ИСО 646).
9.4.2 Визуальное сходство
Когда необходимо использовать алфавитно-цифровую случайную структуру кода, следует избегать
символов, которые легко перепутатьсдругими. Вот некоторые примеры: буква I и цифра 1. буква О и цифра
нуль, буква Z и цифра 2. буква G и цифра 6. буквы В и S и цифра 8. буквы О и Q.
9.4.3 Акустическое сходство
В невыразительных кодахследует избегать символов, которые могут быть перепутаны при произно
шении (акустически однородны); например, буквы В. D. G. Р и Т или буквы М и N.
9.4.4 Гласные
Следует избегать использования гласных (А. Е, I, О и U) в алфавитных кодах или в позициях кодов,
имеющих три и более последовательных алфавитных символа, для исключения неумышленного образова
ния слов обычного языка.
9.4.5 Учет сортировки
В любой конкретной позиции символдолжен быть либо алфавитным, либо цифровым во избежание
несовместимости с сортировкой последовательности.
9.5 Соглашения о присваивании
9.5.1 Правила кодирования
Должны быть четко установлены правила кодирования, и эти правиладолжны последовательно при
меняться. Например, мнемонические сокращения могут образовываться путем удаления всех гласных из
названий кодируемых элементов, как вслучае DT для date (дата) или GRN для green (зеленый), или могут
использоваться первыебуквы слое кодируемых элементов, как в случае EOF для End ofFile (конецфайла).
9.5.2 Коды для количественных данных
Не следует кодировать количественныеданные или денежные суммы, так как это приводит к допол
нительным преобразованиям и потере точности. Например, можно было бы закодировать числа от 1до 99
как А. 100— 199 как В и т. д. Такое кодирование может оказаться желательнымдля задач категоризации, но
статистическая значимость будет лотерена, так как из закодированных значений не могут быть получены
фактические числа. Категоризация может быть осуществлена при последующей обработке, а не при коди
ровании входных данных.
9.5.3 Использование «естественных» данных
Не следует разрабатывать кодовую структуру, если конкретные данные в их естественной форме
(такие, как процентное содержание) являются вполне пригодными и адекватными.
9.5.4 Использование «0000» и «9999» в качестве закодированных значений
Не следует использовать последовательности из «0» или «9» в качестве присвоенных закодирован
ных значений. Эти значения следует зарезервировать для специальных ситуаций или для индикаторов
обработки.
9.5.5 Категория «разное»
С большой осторожностью нужно использовать кодирование категорий «разное» или «прочее». Нельзя
допускать размещение в этих категориях объектов, которые фактически относятся к более конкретному
классу.
18