ГОСТ Р HCO/HL7 27951—2016
Способ вычисления вероятности не входит в область применения настоящей спецификации.
Вероятности субъективны и (как и любое значение данных) должны интерпретироваться в индивидуальном
контексте, например, если появилась новая информация, то значение вероятности может измениться. Таким об
разом. в любом сообщении (в документе или в ином представлении информации) информация, и в частности
вероятности, отражает то. что поставщик информации полагал адекватным цели сообщения (документа) в момент
создания сообщения (документа).
Например, в начале бейсбольного сезона 2000 г. (май) в Лас-Вегасе ставки на то. что команда «Нью-Йорк Ян
киз» выиграет Мировую серию, могли приниматься букмекерами в отношении 1к 10 (то есть с вероятностью 0,100).
Во время написания настоящей спецификации команды «Нью-Йорк Янкиз» и «Нью-Йорк Мете» выиграли в своих
подгруппах, и должна была начаться Мировая серия. Очевидно, что в этот момент вероятность, что «Нью-Йорк
Янкиз» выиграют Мировую серию, стала ощутимо больше, скажем, 6 к 10 (вероятность 0.600). Все в мире
зависти от контекста, в частности, от его даты.
Поскольку вероятности являются субъективными мерами веры, то о них надо говорить не как о «правиль
ных» или «неправильных», а как о «точных» или «неточных». Примечательно, что на проведение экспериментов
по частоте появления некоторого результата, позволяющих оценить его вероятность, нельзя рассчитывать. Дей
ствительно. какие бы утверждения о людях и событиях ни делались, невозможно подтвердить их вероятность экс
периментами «частоты» соответствующих событий.
В условиях предыдущего примера букмекеры Лас-Вегаса не могут настаивать, чтобы «Янкиз» и «Мете» про
вели 1000 пробных игр до начала Мировой серии. Даже если бы это было возможно, эти игры не носили бы столь
ожесточенный характер, как реальная Мировая серия, и вероятность бы не была достаточно точной. Поэтому
букмекеры должны оценивать вероятность на основании предыдущих игр. статистики игроков, сведений о травмах
ит. д.
ternpldte<AtiY Т>
type Uncertainl’alueProbabiliStiC<T> alias L*VP<T> specializes T (
REAL probability;
l ;
Формальные ограничения на тип данных Т не накладываются. Теоретически дискретные вероятности могут
быть приписаны только дискретным значениям данных. Поэтому параметризованный тип данных UVP не должен
использоваться для базовых типов данных REAL. PQ или МО.
В.4.3.1 Свойство probability: REAL
Определение: вероятность, приписанная значению и представляющая собой десятичное значение между 0
(невероятно) и 1 (определенно) включительно.
invariant(UVP<T> х)
where x.nonNull.ana(x.probability.nonNull> t
((IVL<REAL>>(0;11).contains(x.probability»;
г.-
Значение вероятности «по умолчанию», которое можно было бы использовать, если вероятность на задана,
не существует. Поэтому невозможно провести семантическое различив между значением типа UVP, вероятность
которого не указана, и значением типа Т. Использование типа данных UVP не означает «неопределенность», а ис
пользование простого типа данных Т не означает «определенность». Действительно, вероятность значения типа
UVP может составлять 0.999 или 1. то есть это значение имеет высокую степень определенности, в то время как
значение типа Т может быть очень смутной догадкой.
В.4.4 Тип данных непараметрического распределения вероятности (NPPD) (специализация типа дан
ных SET<UVP>)
Определение: множество значений типа UVP с вероятностями (известное как гистограмма). Все элемен
ты множества рассматриваются как альтернативные и ранжируются по своей вероятности, выражающей степень
веры (или частоту) каждого из этих значений.
Тип данных NPPD в основном предназначен для обеспечения статистических отчетов по измерени
ям. полученным от многих субъектов и консолидированных в гистограмме. Подобные отчеты встречаются
в эпидемиологии, ветеринарии, лабораторном деле, а также в контроле цены и конструировании деловых
процессов.
Семантически информация об объявленном значении существует по контрасту с дополнительным множе
ством необъявленных возможных значений. Таким образом, семантически значение типа NPPD содержит все воз
можные значения, каждому из которых приписана определенная вероятность.
Наиболее простым способом визуализации является гистограмма наподобие показанной на рисунке В.14.
400