ГОСТ Р HCO/HL7 27951— 2016
П р и м е ч а н и е — Перечень, приведенный в таблице В.7, не является полным и исключительным. На
циональные филиалы комитета HL7 могут предложить собственные рекомендации по наборам символов, исполь
зуемых на их территории. Эти рекомендации могут добавить дополнительные наборы символов и указать иные
статусы рекомендаций для наборов, перечисленных в таблице В.7.
Свойство charset должно быть известно, если значение типа ED представляет собой символьные данные
в любой форме. Если данные вложены в значение, то набор символов должен быть известен. Если зги данные
предоставляются по ссылке, и метод доступа не обеспечивает идентификацию набора символов, обычно возвра
щаемую в заголовке MIME, то эта идентификация должна быть указана как компонент типа данных ED.
Более полное обсуждение набора символов и сопутствующих вопросов можно найти в публикации «Character
Model for the World Wide Web»
[http://www.w3.org/TR/channod/
].
B.2.4.3 Свойство language: CS
Применительно к символьной информации свойство language указывает человеческий язык текста.
Необходимость указания кода языка для текстовых данных документирована в публикации RFC 2277 «IETF
Policy on Character Sets and Languages» [http./j\vww.ietf.org/rfo’rfc2277.txt]. Дополнительную базовую информацию
можно найти в документе «Using International Characters in Internet Mail» [
http://v<vn%,.invc.org/mail-i1&n.html]
(мемо
рандум консорциума Internet Mail Consortium).
Принципы, положенные в основу домена значений этого свойства изложены в стандарте Интернет RFC 3066
(http://vuww.ietf.org/rfc/rfc3066.txt
]. Система кодирования, описанная в этом документе, конструируется из основного
компонента, содержащего тег с кодом языка, определенным в стандарте ИСО 639, и двух кодов расширения язы ков,
не предусмотренных в этом стандарте. Код может содержать дополнительный компонент, содержащий тег с
двухбуквенным кодом страны, определенным в стандарте ИСО 3166, или с расширением кода языка, определен
ным организацией InternetAssigned Names Authority
[http://www.iana.org/assignments/language-t3gs]4
В то время как теги языка обычно изменяют смысл текста, код языка не меняет смысл символов текста2’.
П ри м е ча н и е — Представление тегов языка в тексте существенно зависит от спецификации реали
зуемой технологии. В ней может использоваться нативный способ указания тегов языка, предусмотренный в ее
целевой технологии реализации. В некоторых технологиях информация о языке может быть указана в отдельном
компоненте, например, в XML язык строки может быть указан в теге xmklang. В других коды языка могут быть ча
стью двоичного представления строк символов, как это специфицировано в стандарте ИСО 10646 (Unicode) и его
тегах «р1апе-14».
Если в технологии реализации тег языка не обязателен, то не должно быть обязательным и свойство
language. Семантически объявление языка в строках следует логике умолчаний. Если на данной территории реа
лизации может поддерживаться несколько языков, то эта территория сама устанавливает правила задания языка в
случае, когда никакой язык не указан. Если никаких правил не задано, то подразумевается местный язык читателя.
Если язык указан для всего сообщения или документа, то этот язык используется по умолчанию. Если язык указан
для любого элемента информации, стоящего выше в синтаксической иерархии, то этот язык используется по умол
чанию во всех подчиненных текстовых значениях.
Если теги языка присутствуют в начале кодированногодвоичного текста (например, в тегах plane-14 кодиров
ки Unicode), то они являются источником значения свойства language для инкапсулированных данных.
В.2.4.4 Свойство compression: CS
Определение: указывает, являются ли байтовые данные результатом сжатия исходных данных и какой алго
ритм сжатия был использован.
Таблица В.8 — Домен алгоритмов сжатия
КодИмя
Статус
Определение
DFdeflate
Обязательный
Формат дефляционного сжатия, предложенный в докумен
те RFC 1951
[http://www.ietf.org/rfc/rfc1951.txt
]
GZ
gzip
Индифферентный
Формат сжатия данных, совместимый с широко использу
емой утилитой GZIP и описанный в документе RFC 1952
[http://www.ietf.org>’rfc/rfc1952.txt
](используеталгоритм
дефляции)
11Система кодирования, описанная в документе RFC 3066 [
http://www.ietf.org/rfc/rfc3066.txt
], одобрена ко
митетом HL7 для всех ссылок на человеческие языки, используемых в типах данных и других местах.
2* По этой причине система или место реализации, которые неспособны обрабатывать многоязычный текст
или имена, могут спокойно игнорировать свойство language.
309