ГОСТ РИСО 11238—2014
Приложение А
(справочное)
Существующие идентификаторы и представления молекулярной структуры
А.1 Идентификаторы
А.1.1 Общие положения
Вприведенном ниже описании широко используемых идентификаторовотражены сильныеислабые стороны
их использования для уникальной идентификации субстанций а лекарственном препарате. Список рассматривае
мых типов идентификаторов не является исчерпывающим, но в него вошли те. что активно используются в инфор
мационных системах.
А.1.2 Регистрационные номера службы СAS
Регистрационные номера службы CAS представляют собой числовые идентификаторы, которые обычно
идентифицируютпростыесубстанции. Полимеру нередко присваивается единственныйномер CAS внезависимос
ти от различий в молекулярной массе или в других идентифицирующих элементах. Номера присваиваются после
довательно по мере внесения субстанций в регистр. Длина номеров не фиксирована и меняется от 5 до 10 цифр.
Каждый номер CAS содержит одну контрольную цифру. В регистре службы CAS зарегистрировано свыше 100 мил
лионов субстанций. Основное назначение регистра состоит вустановлении связей между информацией, публикуе
мой в литературе по химии, а не исключительно в идентификации субстанций. Регистр ведется Химической
реферативной службой (Chemical Abstracts Service) — подразделением Американского химического общества
(Amencan Chemical Society). Хотя номера CAS широко используются, они не являются общедоступными. Служба
CAS выпустила руководство по применению своих регистрационных номеров и попыталась ограничить их исполь
зование в общедоступных базах данных. Регистрационный номер CAS для формальдегида имеет значение
50-00-0.
А.1.3 Идентификаторы InChl и InChIKey
Аббревиатура InChl означает международный химический идентификатор, присваиваемыйМеждународным
союзом теоретической и прикладной химии (International Union of Pure and Applied Chemistry. IUPAC). Система
идентификации была разработана Национальным институтом стандартов и технологий США (National Institute of
Standards and Technology). Идентификаторы InChl являются линейными и отражают химическое представление с
помощью системы слоев. Идентификатор InChl является общедоступным структурным представлением, и
программное обеспечение, предназначенное для генерации идентификаторов InChl. распространяется по откры
той лицезии LGPL. Идентификаторы InChIKey имеют фиксированную длину (25 символов) и являются сжатыми
цифровыми представлениям идентификаторов InChl. Идентификаторы InChl и InChIKey сконструированы для
идентификации простых субстанций, имеющих определенную молекулярную структуру, а не для слож ных
веществ, например, вакцин, продуктов крови, ботанических или животных препаратов. Номер InChl для мор фина
имеет значение 1/С17Н19N03/C1-18-7-6-17-10-3-5-13(20)16(17)21-15-12(19)4-2-9( 14(15)17)8-11<lO)18/h2-S, 10-11.
13. 16. 19-20Н. 6-8Н2. 1НЗ/М0-. 11-. 13-. 16-, 17-/m0/s1. а идентификатор InChIKey — значение
BQJCRHHNABKAKUXKUOQXLYBY.
А.1.4 Номера ЕС
Номер ЕС-No. или ЕС»представляет собой семизначный цифровой код.присваиваемый Европейской комис
сией всем коммерчески доступным субстанциям, продаваемым в Европейском Союзе. Седьмая цифра кода явля
ется контрольной и код отображается как на торговое, так и непатентованное наименование конкретной
субстанции. Область применения номеров ЕС шире, чем у идентификаторов InChl. и охватывает как простые, так и
комплексныесубстанции. Система номеров ЕС охватывает более 100000субстанций, но не так уж активно исполь
зуется в фармацевтическом секторе. Номера в большинстве случаев присваиваются последовательно. Они были
позаимствованы из списков регулируемых субстанций, которые ведутся организациями EINECS (European
Inventoryof Existing Commercial Chemical Substances),ELINCS (EuropeanListofNotified Chemical Substances^други
ми. Номер ЕС» для формальдегида имеет значение 200-001-8. Европейская Комиссия больше не присваивает
новые номера ЕС».
А.1.5 Идентификатор UNII
Идентификатор UNII представляет собой 10-символьную случайную алфавитно-цифровую строку, которая в
настоящее время используется для идентификации субстанций в лекарственных средствах. Идентификатор UNII
генерируется Системой регистрации субстанций, которая ведется организацией FDA и фармакопеей USP и являет ся
надежной системой с детально разработанными регламентами ввода данных и генерации идентификаторов UNII.
присваиваемых как простым, так и комплексным субстанциям. Первые 9 символов генерируются случайно, а
последний является контрольным символом. Контроль целостности идентификаторов UNII является более
строгим по сравнению с контрольными цифрами номеров ЕС» и регистрационных номеров CAS. поскольку эти
идентификаторы случайно выбираются из большогодиапазона возможных значений идля контроля используются
36 возможных символов по сравнению с 10 цифрами у номеров ЕС» и CAS. Идентификаторы UNII являются обще-
32