ГОСТ Р 50779.80—2013
p
использована к-статистика.
Существует два основных вида к-статистики: к-статистика Кохена и к-статистика Флейса. При
этих двух подходах результаты двух контролеров обрабатывают по-разному, вычисляя вероятность
случайного совпадения результатов. При вычислении к-статистики Кохена предполагают, что
контролер(ы) выбраны и фиксированы, тогда как при вычислении к-статистики Флейса предполагают,
что контролеры выбраны случайным образом из группы аналогичных контролеров. Это приводит к
двум различным методам определения вероятности. В рассматриваемом случае три контролера
были выбраны случайным образом из группы аналогичных контролеров. Таким образом,
использование к статистики Кохена неуместно. Далее рассмотрена только к-статистика Флейса.
Чем выше значение к, тем больше совпадений оценок имеется у данного контролера.
Значение к = 1 указывает на полное совпадение результатов контроля. Если к =-1, это указывает на
полную противоречивость результатов контроля. Значение к = 0 указывает на то, что совпадение
результатов контроля носит случайный характер. Значения к > 0.9 считаются превосходными.
Значение к < 0,7 указывает на то. что система контроля требует улучшения, а значение к < 0.4
указывает на то. что система контроля, возможно, является несоответствующей. Обычно требуется
значение к > 0.70, но предпочтительно значение к близкое к 0.90.
В соответствии с таблицей D.3 к-статистика Флейса для контролера No 1 имеет значение
0.92495. которое является хорошим; для контролера No 2 к-статистика равна 0.59. что является
неприемлемым. Для контролера No 3 к-статистика принимает значение 0.79. что является
приемлемым.
В таблице D.3 приведены значения к-статистики для каждого контролера. Например,
к =-0.02 для контролера No 1 и дефекта «наличие воздушных пузырей». Это значение указывает на
то. что результаты контролера No 1 были противоречивыми в процессе испытаний по этим категориям
дефектов. Дальнейший анализ показывает, что контролер No 1 по одному и тому же объекту в двух
выборках принимал решение «наличие пузырей» и «отсутствие дефоктов». Это означает, что
контролер No 1 может путать категории «наличие воздушных пузырей» и «отсутствие дефектов».
Такая информация полезна для анализа улучшения системы определения значений контролируемой
характеристики.
На основе p-значения принимают решение о справедливости нулевой гипотезы (к = 0, т.е.
совпадение результатов одного контролера является случайным), если она (нулевая гипотеза) верна.
Если p-значение тестовой статистики меньше заданного уровня значимости а (обычно а = 0.05).
нулевуюгипотезуотклоняют.Посколькуp-значениедлятрехобщих
«■-статистик Флейса меньше 0.05. нулевую гипотезу отклоняют. Таким образом, несовпадения
результатов контроля со стандартной оценкой являются чисто случайными. В таблице D.3 показаны p-
значения, соответствующие категориям дефектов и контролерам.
D.7.2 Совпадение результатов каждого контролера со стандартной оценкой
Необходимо определить насколько результаты каждого контролера в каждой выборке
соответствуют стандартной оценке.
В таблице D.4 для каждого контролера указан процент совпадения результатов со
стандартной оценкой и соответствующий доверительный интервал с уровнем доверия 95 %.
Контролерам N
p
1. No 2 и N 3 соответствуют проценты совпадения результатов контроля со
стандартной оценкой 90 %. 75 %. и 85 % соответственно.
26