ГОСТ Р 50779.25— 2005
(ИСО 3494:1976)
Н А Ц И О Н А Л Ь Н Ы ЙС Т А Н Д А Р ТР О С С И Й С К О ЙФ Е Д Е Р А Ц И И
Статистические методы
С ТА ТИ С ТИ Ч Е С К О Е П Р ЕД С ТА В ЛЕН И Е ДАННЫ Х
Мощность тестов д ля средних и дисперсий
Statistical methods. Statistical interpretation of data. Power of tests relating to means and variances
Дата введения — 2006— 01— 01
1 Область применения
Общие замечания
1) Настоящий стандарт согласован с ГО С Т Р 50779.21.
Настоящий стандарт применим, если распределение наблюдаемой случайной величины является
нормальным в каждой совокупности. В ГО С Т Р 50779.21 упомянут только риск первого рода (или уровень
значимости). Настоящий стандарт вводит понятия рисха второго рода и мощности критерия.
2) Риск первого рода, обозначаемый сх, является вероятностью отклонения нулевой гипотезы
(проверяемой гипотезы), если эта гипотеза верна (случай двусторонних критериев), или максимальным
значением этой вероятности (случай односторонних критериев). Неотклонение нулевой гипотезы при
водит к принятию гипотезы, хотя не означает, что гипотеза верна.
Соответственно, риск второго рода, обозначаемый р, — это вероятность неотклонения нулевой
гипотезы, когда она является ложной. Дополнение вероятности ошибки второго рода — это мощность
критерия (1 — Р) (см. далее в «Исторических замечаниях»).
3) Поскольку значение риска первого рода выбирает потребитель в соответствии с последствиями
(обычно используют значение а = 0.05 или и = 0.01), риск второго рода зависит от истинной гипотезы
(нулевая гипотеза Н0 является ложной), т. е. альтернативной гипотезы. При сравнении среднего сово
купности (далее — среднее) с заданным значением т 0 конкретная альтернатива [которая была откло
нена (т — т 0 * 0)] может соответствовать значению среднего совокупности т * т 0. Как правило, при
сравнительных испытаниях средние и дисперсии альтернативы определены значениями параметра.
4) Кривая оперативной характеристики критерия показывает значение риска второго рода р как
функцию параметра, определяющего альтернативу. Значение р зависит также от выбранного значения
рисха первого рода, объема выборки и типа критерия (двусторонний или односторонний).
При проверке гипотез о средних р также зависит от стандартного отклонения соеокупиости(ей).
Если стандартное отклонение неизвестно, риск р не может быть известен точно.
5) Кривые оперативной характеристики позволяют решать следующие задачи:
a) задача 1: Для данной альтернативы и заданного объема выборки определить вероятность р
неотклонения нулевой гипотезы (риск второго рода);
b
) задача 2: Для данной альтернативы и заданного значения р определить объем выборки.
Хотя решить обе задачи позволяет единственный набор кривых, для облегчения практического
использования приведены два набора кривых:
- наборы кривых 1.1— 14.1. задающие риск р как функцию альтернативы для а = 0.05 или а = 0,01
и различных значений объема выборки:
- наборы кривых 1.2— 14.2. задающие объем(ы) выборки как функцию альтернативы для « = 0.05
или а = 0.01 и различных значений риска [1.
Издание официальное
1