ГОСТ Р 57986—2017
Если полученные данные не согласуются ни с одним образцом из библиотеки, алгоритм может не
идентифицировать образец.
Идентифицируемые на данном этапе образцы должны находиться в том же фазовом и физиче
ском состоянии, как и известные материалы на этапе валидации.
Жидкости можно измерять в чистом виде или в растворе. В любом случае длина оптического пути
в кювете для проб должна быть постоянной, одинаковой для всех жидкостей, сравниваемых с неиз
вестной. и указываться как параметр метода определения. Поскольку возможно обучение алгоритма на
данных, полученных при другой длине оптического пути, следует помнить, что уменьшение
изменчи вости внешних факторов повышает точность определения. Измерение неизвестных
материалов также должно проводиться в кювете в тех же условиях, что и измерение обучающих
веществ. Если использу ют растворы, указывают степень разбавления.
Твердые материалы могут измеряться в полученном виде, если они обладают одной или несколь
кими сравнительно ровными поверхностями. Другие материалы могут потребовать шлифовки. При
шлифовке твердых образцов для всех образцов в библиотеке используют один способ. Способ шли
фовки указывают в протоколе испытания.
Неизвестные материалы обрабатывают точно так же. как и использованные для обучения. Если
образцы шлифуют, крайне важно, чтобы неизвестные образцы шлифовались тем же самым абразивом, с
тем же самым размером зерна, что и образцы в библиотеке.
6 Используемые алгоритмы
6.1 Общие положения
В данном разделе описывают несколько компьютерных алгоритмов, доказавших свою эффектив
ность при обработке данных спектроскопии в ближней ИК области. Описания многовариантных методов
статистического анализа данных представляют собой практически чистую абстрактную математику, не
требующую подробного описания. Существует целый ряд книг по статистике и хемометрике, в которых
описаны методы многовариантного анализа при различных уровнях математической абстракции. Боль
шинство алгоритмов, используемых в качественном анализе в ближней ИК области, являются сравни
тельно простыми реализациями данных методов.
Данные методы реализованы в большинстве статистических программ. Программке обеспе
чение (ПО) для анализа спектроскопических данных также может содержать реализации указанных
алгоритмов. Кроме того, изготовители современных спектрометров в ближней ИК области включают
реализации данных алгоритмов в собственное ПО для управления спектрометрами и обработки дан
ных. Последний подход имеет преимущество в том. что все полученные на приборе данные будут об
работаны абсолютно одинаковым образом. В любом случае подробности алгоритмов и их реализации
обычно полностью прозрачны для пользователя. Тем не менее, пользователь обязан удостовериться в
правильности реализации алгоритма в используемом им программном обеспечении.
6.2 Расстояния Махаланобиса
Расчет расстояний Махаланобиса описан в литературе в применении непосредственно к спектрам в
ближней ИК области. Расчет расстояния Махаланобиса — это способ определения того, попадает ли об
разец в заданную область многомерного пространства. Малое расстояние указывает на то. что образец
находится близко к центру области и, следовательно, входит в нее. Обучающие образцы задают область
пространства таким образом, что многомерный эллипсоид включает определенную долю данных образ
цов. Расстояние от центра области до поверхности эллипсоида (т. е. эквивалент диаметра) определяет
расстояние Махаланобиса. Расстояние Махаланобиса рассчитывают с помощью матричного уравнения
^ = (хи-х(/)УМ(хи-х(/)),(1)
где Dt — расстояние Махаланобиса для неизвестного образца от центра эллипсоида для /-го члена
(класса образцов) библиотеки;
хо — вектор интенсивности поглощения для идентифицируемого неизвестного образца, взятый при
различных длинах волн;
Щ — среднее значение показаний нескольких различных образцов типа материала, представляю
щего hv\ член библиотеки;
М — обратная матрица выборочной внутригрупповой вариантности-ковариантности (описана в
приложении А).
4