ГОСТ Р 70252—2022
1) выделить данные для слияния, частота встречаемости которых в реальном окружении ВАТС
ниже средней частоты встречаемости всех данных для слияния более чем на три стандартных откло
нения (редкие данные).
Примечание — Уровень определения редких данных является рекомендуемым и может быть изменен;
2) для выделенных данных подготовить для испытаний «смещенную» выборку, которая позво
ляет лучше проанализировать поведение алгоритма в части редких данных. Например, путем сем-
плирования с изменением частоты соответствующих данных приближена к среднему по всем вариан
там данных, или путем ввода весовых коэффициентов при оценке ошибки в соответствующих классах.
Конкретный способ должен быть явно определен в программе испытаний алгоритма до начала этих
испытаний;
3) провести испытания с подготовленной выборкой, чтобы убедиться, что алгоритм осуществляет
слияние редких данных с достаточным качеством.
Кроме того, при испытаниях алгоритма низкоуровневого слияния данных на предмет реагирова
ния на редкие дорожно-транспортные ситуации допускается использовать иные методы тестирования,
включая применение весовых коэффициентов для различных существенных факторов эксплуатации,
семплирования, аугментации (см. 7.4) и другие техники.
Такой принцип подбора тестового набора данных позволит обеспечить проверку возможностей
алгоритма по слиянию всех данных в различных контекстах (вариантах комбинаций значений суще
ственных признаков), поскольку для обеспечения доверия к результатам работы алгоритма необходи мо,
чтобы точность слияния не зависела от частоты встречаемости конкретных данных при эксплуата ции
алгоритма.
7.2 Фрагменты тестовых наборов данных (демонстрационные наборы данных)
Основной набор тестовых исходных и уже сведенных данных вариантов ситуаций дорожного дви
жения доступен по ссылке:
https://clck.ru/XufRv
.
Тестовый набор описывает существенные факторы эксплуатации и содержит следующие подбор
ки (множество файлов из демонстрационного набора, описывающих конкретную шкалу существенных
признаков ситуации):
- вид осадков;
- виды совершаемых нарушений;
- категория автомобильной дороги;
- количество и ширина полос;
- наличие вертикальной разметки;
- наличие дорожных знаков;
- наличие засветки;
- наличие и состояние горизонтальной разметки;
- наличие иных технических средств организации дорожного движения;
- наличие пешеходных тротуаров и пешеходных переходов в одном уровне;
- наличие примыканий и пересечений в одном уровне;
- наличие светофоров;
- наличие тумана;
- наличие участников дорожного движения, нарушающих правила дорожного движения;
- плотность потока транспортных средств;
- попадание посторонних предметов и объектов на дорогу;
- профиль автомобильной дороги — наибольший продольный уклон;
- скорость потока и отдельных транспортных средств;
- состав потока транспортных средств;
- состояние дорожного покрытия;
- тип осадков;
- условия освещенности.
Тестовый набор данных содержит тактико-технические характеристики видеорегистратора, мета
данные видеосъемки (координаты транспортного средства, пример видеодорожки с наличием перечня
различных ситуаций, время съемки).
Приведенный классификатор является исчерпывающим перечнем существенных факторов экс
плуатации для рассматриваемого алгоритма низкоуровневого слияния данных, при этом сценарии до-
4