ГОСТ Р ИСО/МЭК 19795-1—2007
В.4 Оценка доверительных интервалов
В.4.1 Общие положения
В.4.1.1 В соответствии с центральной предельной теоремой [31] при достаточно большом числе попыток
наблюдаемые вероятности ошибок должны подчиняться нормальному закону распределения. Если значения
вероятностей ошибок близки к 0 %. а дисперсия не одинакова по выборке, то остается некоторая асимметрия до тех
лор. пока число испытуемых субьектов не станет достаточно большим.
В.4.1.2 Согласно допущению о нормальном распределении, границы 100(1- а) % доверительного интерва
ла для наблюдаемых вероятностей ошибки определяют по формуле
где z (х) — квантили стандартного нормального распределения, то есть площадь под кривой плотности
вероятности стандартного нормального распределения с серединой в нупе и дисперсией, равной единице, в
интервале от - « до z (ж) равна ж. Для 95% - ного доверительного интервала значение г (0,975} = 1,96;
а — вероятность того, что доверительный интервал не содержит истинного значения вероятности
ошибки;
р— наблюдаемая вероятность ошибки;
В.4.1.3 Часто при применении вышеупомянутой формулы доверительный интервал включает в себя отри
цательные значения наблюдаемой вероятности ошибки, но отрицательных значений вероятностей ошибок быть не
может. Это происходит вследствие отклонения от нормального распределения наблюдаемой вероятности
ошибки. В таких случаях для определения доверительных интервалов следует использовать непараметрические
методы, например, самонастройку по [32] — [34].
В.4.2 Самонастраивающиеся оценки дисперсии и доверительных интервалов
В.4.2.1 Если биометрическая система обеспечивает самонастраивающуюся оценку, это устраняет необхо
димость делать предположения относительно распределения наблюдаемых вероятностей ошибок и зависимос
тей между попытками. Распределения и зависимости система определяет по имеющимся данным. Производя
выборку с заменой первоначальных данных, может быть создан самонастраивающийся образец, по которому
проводится определение вероятности ошибки. При большом числе таких самонастраивающихся образцов может
быть получено эмпирическое распределение, используемое для определения доверительных интервалов, оцен ки
неопределенности и т.д.
В.4.2.2 Чтобы проиллюстрировать процесс, предположим, что необходимо оценить вероятность ошибки
ложного соответствия, используя полный набор перекрестных сравнений с п испытуемыми субъектами, каждый из
которых совершает по т попыток, которые будут сравниваться со всеми (л - 1) несобственными шаблонами.
Значение х (v, a. t) обозначает результат сопоставления попытки а испытуемого субъекта v с шаблоном (. Набор
данных X для оценки ВЛС включает в себя результаты всех тп (л - 1) перекрестных сравнений Х = {ж (v, а. /} [ / * » v e
(1.
». т}}. Каждый самонастраивающийся образец должен быть построен с помощью набора данных X методом,
который повторяет структуру и зависимость первоначальных данных. Данный метод заключается в следующем;
a) выборка л испытуемых субъектов с заменой: v (1)v (л). (Выборка с заменойозначает, что список будет
содержать более чем одно появление одного и того же элемента).
b
) для каждого v (г) образца с заменой (п - 1) несобственных шаблонов: t (г. 1)......t </. л - 1);
c) для каждого
v
(г) образца с заменой т попыток, выполненных испытуемым субъектом: (г. 1)
.....
(/’, т):
d) самонастраивающийся образец:
Создается множества самонастраивающихся образцов, и для каждого из них определяется вероятность
ошибки ложного соответствия. Распределение значений самонастройки для вероятности ошибки ложного соот
ветствия используется для аппроксимации наблюдаемой вероятности ошибки ложного соответствия.
В.4.2.3 Самонастраивающиеся значения позволяют определить границы 100(1 - а) % доверительного ин
тервала: выбрать такие значения L (нижний предел) и U (верхний предел), что aJ2 самонастраивающихся
значений будет меньше L. а ос/2 самонастраивающихся значений — больше U. Для определения границ
95%-ного доверительного интервала должны использоваться не менее 1000 самонастраивающихся образцов, а
для 99%-ного доверительного интервала — не менее 5000 самонастраивающихся образцов.
В.4.3 Разбиение на подмножества
В.4.3.1 Данный метод для определения границ доверительного интервала ошибок по наблюдаемым веро
ятностям ошибок заключается в разбиении собранных данных испытаний на непересекающиеся подмножества
пользователей и построении кривой КОО для каждого подмножества. Например, в отчете испытаний [11] данный
метод применен для определения эллипсов ошибки.
(В.9)
V р — оценка дисперсии вероятности ошибки.
V = «V (»). I(i.j). а (/. к)) | / е {1
.......
г»}. #е {1.........п - 1}, а е {1.........т}}.
40