ГОСТ Р ИСО 13379-1—2015
обучение пополнять все новыми примерами, то погрешности классификации будут незначительно ко
лебаться относительно некоторого установившегося значения.
Наконец, в отличие от многих других алгоритмов классификации, данный метод требует настрой
ки только по двум параметрам (числу деревьев и числу переменных, проверяемых при построении
ветвления), причем чувствительность к этим параметрам невысока (при отклонении указанных параме
тров от оптимальных качество работы алгоритма изменяется незначительно).
Слабой стороной метода является то, что, подобно многим другим методам классификации на
основе данных, по принципу своего действия он представляет собой «черный ящик», т.е для каждого
частного случая классификации трудно объяснить, почему она оказалась именно такой, а не другой.
6.3.7 Логистическая регрессия
6.3.7.1 Общее описание метода
Логистическая регрессия (см. [10]) моделирует соотношение между переменными (признаками) х,
и ожидаемым значением Е(у) через логистическую функцию:
Е(У)
ехр(« *-рх)
1+ехр(а +fix)’
(
1
)
В результате преобразования получаем
т
In
1-Е (у)
а ♦рх.
(
2
)
Ожидаемая величина определяет дихотомию состояний, т.е. должна принимать одно из двух воз
можных значений (0 или 1), в то время как логистическая модель дает значение ожидания между 0 и 1.
Таким образом, для получения решающего правила, преобразующего выход логистической модели в
одно из двух бинарных состояний, необходимо установить некоторое пороговое значение. Если метод
должен обеспечить распознавание нескольких неисправных состояний, то необходимо построить еще
несколько логистических моделей. Обычно основная модель соответствует дихотомии «исправно —
неисправно», а остальные позволяют выделить какую либо одну неисправность из набора всех воз
можных неисправностей.
6.3.7.2 Построение модели
Обычно для оценки параметров логистической регрессии используют метод максимального прав
доподобия. На практике для этого используют один из пакетов статистической обработки данных.
6.3.7.3 Сильные и слабые стороны метода
Коэффициенты логистической модели позволяют получить представление о том. насколько ре
зультат классификации зависит от изменений независимой переменной.
Следует обращать внимание на выбор данныхдля обучения модели. Обычно для подтверждения
качества модели требуется процедура кросс-проверки.
6.3.8 Метод опорных векторов машины
6.3.8.1 Общее описание метода
Алгоритм опорных векторов (см [11]) осуществляет нелинейное преобразование каждой точки ис
ходных признаков в пространство их изображений более высокой размерности с последующим раз
делением точек, принадлежащим разным состоянием, линейной гиперплоскостью. После обучения
(определения параметров гиперплоскости) алгоритм эффективен для классификации новых исходных
данных.
6.3.8.2 Построение модели
Для построения оптимальной разделяющей гиперплоскости обычно применяют метод градиент
ного спуска. На практике для этого используют один из стандартных пакетов обработки данных.
6.3.8.3 Сильные и слабые стороны метода
Метод опорных векторов обеспечивает единственное решение задачи классификации (в отличие
от. например, нейронных сетей, для которых существует много локальных экстремумов). Кроме того,
в отличие от метода нейронных сетей вычислительная сложность метода не зависит от размерности
входных данных.
Самым большим недостатком метода является то. что в исходном виде он применим только для
разбиения данных на два класса. Если необходимо различать большее число состояний (например,
выделять каждый вид неисправности по отдельности), то задачу классификации необходимо сводить к
нескольким бинарным задачам.
12