ГОСТ Р 57986—2017
Приложение А
(справочное)
Расчет расстояний Махаланобиса
Для расчета обратной матрицы выборочной внутригрупповой вариантности-ковариантности М требуется об
ращение матрицы, полученной описанным ниже способом. Порядок обращения матриц описан практически во
всех книгах по компьютерной статистике и математическим методам, поэтому здесь он не приводится.
Для получения матрицы, подлежащей обращению, рассматривают набор данных, включающий данные по р
различным материалам, пробы которых измерялись на 7длинах волн (или частотах). Используют индекс /для раз
личных материалов,j — для различных длин волн. Для различных длин волн также могут использоваться индексы г
и с. Для каждого материала имеется ряд спектров, полученных для л, образцов, представляющих результаты на f
длинах волн. Используют индекс т для ряда образцов л,, соответствующих каждому из р материалов. Таким об
разом. общее количество спектров в наборе данных л будет равно £ л, .
Для представления отдельных значений поглощения для каждого спектра образца т материала на заданной
длине волны f используют обозначение х^(1), а для представления среднего поглощения для данного мо ма
териала — х/0-
Обращаемая матрица имеет размерность f*f. Каждое значение матрицы получают следующим образом.
Рассчитывают среднее значение интенсивности поглощения x^t) /-го материала на каждой длине волны по
формуле
W= £ % ( ’ ) -(А.1)
т
Среднеарифметическое значение интенсивности поглощения для данных по определенному материалу на
каждой длине волны вычитают из каждого результата измерения для данного материала на данной длине волны.
Таким образом, скорректированное значение интенсивности поглощения х’ вычисляют по формуле
Кщ М
=
~
*,<’)-(А.2)
Элемент в ряду ги столбце с матрицы V (назовем его Vrc) рассчитывают сложением вместе соответствующих
вкладов каждого из р материалов
Ч*в5Х(<1.(АЗ)
Вклады Vrc(i) рассчитывают по всем спектрам, соответствующим материалу m как суммы скорректированных
значений интенсивности поглощения при длинах волн г и с
ч,1/)=1(>^ 7 1/|).(А-4)
Матрицу М получают обращением матрицы V.
П р и м е ч а н и я
1 Расстояние Махаланобиса. определенное выше, будет показывать, во сколько раз значение л - р боль
ше. чем указано в ГОСТ Р 57987 (подраздел 16.2). Матрица V выше обозначается ХХ*/(л - р) в представлении
ГОСТ Р 57987. Матрица М. являющаяся обращенной матрицей V. будет в л - р раз больше чем (XX1)*. Масштаби
рование здесьделается для того, чтобы метрики, используемые для классификации, были не очень чувствительны
к размеру библиотеки л.
2 Если f > л. матрица V будет необращаемой. Для оценки обращаемости можно использовать математиче
ские выкладки, аналогичные приведенным в ГОСТ Р 57987.
8