ГОСТ Р 12.4.234-2012
Приложение В
(справочное)
Метод логистической регрессии
Двучленная логистическая регрессия представляет форму, применяемую в тех случаях, когда зависимая пе
ременная ограничена двумя состояниями (дихотомия), а независимая непрерывна (они также могут применяться к
множественным непрерывным независимым переменным). Метод логистической регрессии предполагает оценку с
максимальной степенью вероятности после преобразования зависимой переменной в вероятностную, несмотря на
то. что натуральный логарифм является зависимой переменной. Таким образом, можно оценить вероятность
определенного события при решении следующего уравнения:
= а +
Ьх
+ ошибка(В.1)
или
In - натуральный логарифм:
р - вероятность того, что произойдет событие Y. р (Y = 1);
pf(1- р) - вероятность успешного исхода:
(1-р) - вероятность того, что событие Y не произойдет;
In [р/(1- р)] - логарифм вероятности успешного исхода.
П р и м е ч а н и е - Правая сторона уравнения является формой стандартной линейной регрессии.
Модель логистической регрессии - это нелинейное преобразование модели линейной регрессии. Логистиче
ское распределение представляет собой S-образную функцию распределения, которая в какой-то мере сходна со
стандартным нормальным. Оценки вероятности по логистическому распределению лежат в пределах от 0 до 1. В
этом можно убедиться, преобразовав приведенные уравнения (В.2. В.З) и найдя решение для р:
I
1
[l
J
©а»!»
или
Р
+ ea*b*
(В.З)
Р
[l
е(-а-Ь х)
J
(В-4)
Если (а+bx) становится большой величиной, тор стремится к 1, если малой величиной, то р стремится к0. а
когда(а+Ьх) = 0. р = 0.5 (значение, используемое для ЗЭТВ и£ПВ
5
0в рамках этогометода). Значение 50-процентной
вероятности идентично и при измерении ЗЭТВ будет представлять точку, пересекающую кривую Столл.
Этот метод анализа не делает допущений относительно линейности отношения независимой переменной
к зависимой и не требует нормально распределенных переменных, не делает допущений о гомоскедастичности
остаточных членов (вариативность зависимей переменной остается той же при различных значениях
независимой переменной - критерии для обычной регрессии наименьших квадратов) и в целом выдвигает менее
жесткие тре бования.
В рабочем порядке для представления того или иного состояния измеряемой зависимой величины исполь
зуется фиктивная переменная 1 или 0. В приведенном примере ЗЭТВ кодирование зависимой переменной соот
ветствует следующему:
У
= 1, если значение теплоты от калориметра превышает кривую Столл.
У = 0. если значение теплоты от калориметра не превышает кривую Столл.
Независимой непрерывной переменной в этом случае является падающая энергия, возникающая при тепло
вом воздействии дуги.
Существуют несколько платных и бесплатных программных пакетов, которыми можно воспользоваться для
данного анализа.
Логистическая регрессия выполняется на базе ряда измерений, причем определяются значения
а
и
b
(а
также гласеа других описательных пара глетров: см. соответствующую документацию в используемом программном
пакете). Затем устанавливают критерии Столл (или появление вскрытия) расчетом X при
р =
0.5, т.е. 50-процентная
вероятность представляет собой простой случай, когда (а+бх) = 0, или
Р
= ©а + еЬх + ©оимбо(В.2)
1-р
29