ГОСТ Р 54712―2011
75
Приложение Г
(обязательное)
Психоакустические модели
Г.1 Психоакустическая модель 1 для меньших частот дискретизации
Ниже приводится описание психоакустической модели 1 с адаптацией, необходимой для поддержки мень-
ших частот дискретизации.
Вычисление психоакустической модели должно быть адаптировано к соответствующему уровню.
Нет принципиальных отличий в использовании психоакустической модели 1 на Уровнях I или II.
На уровне I новое распределение битов вычисляется для каждого блока из 12 субполосных отсчетов или
384 ИКМ-отсчетов.
На Уровне II новое распределение битов вычисляется для трех блоков [всего 36 субполосных отсчетов, со-
ответствующих 3*384 (1152) входным ИКМ-отсчетам].
Распределение битов между 32 субполосами выполняется на основе отношений сигнал — маска во всех
субполосах. Поэтому для каждой субполосы необходимо отпределить максимальный уровнень сигнала и мини-
мальный уровень порога маскирования. Минимальный порог маскирования определяется в результате психоаку-
стического расчета на основе БПФ входного ИКМ-сигнала.
БПФ, выполняемое параллельно с субполосной фильтрацией, компенсирует недостаточную частотную
селективность на низких частотах субполосного банка фильтров. Этот метод позволяет достичь достаточ-
ного разрешения во временной области для кодированного аудиосигнала (полифазный фильтр с оптимизи-
рованным окном для минимального преэха) и достаточного разрешения по частоте для вычисления поро-гов
маскирования. Частоты и уровни шумов могут быть вычислены при наложении спектров, это необходимо для
определения минимальной скорости передачи для тех субполос, которым требуются некоторые биты для
устранения компонентов элайзинга в декодере. Дополнительное усложнение для вычисления оптимальной
разрешающей способности по частоте необходимо только в кодере и не вызывает дополнительной задержки
или усложнения декодера.
Вычисление отношения сигнал — маска основано на следующих процедурах:
- шаг 1 — вычисление БПФ для преобразования сигнала из временного пространства в частотное;
- шаг 2 — определение уровня звукового давления в каждой субполосе;
- шаг 3 — определение абсолютного порога слышимости;
- шаг 4 — обнаружение тональных (близких к синусоиде) и нетональных (близких к шуму) компонент аудио-
сигнала;
- шаг 5 — прореживание маскеров для получения релевантных маскеров;
- шаг 6 — вычисление индивидуальных порогов маскирования;
- шаг 7 — определение глобального порога маскирования;
- шаг 8 — определение минимального порога маскирования в каждой субполосе;
- шаг 9 — вычисление отношения сигнал — маска в каждой субполосе.
Частота дискретизации по умолчанию равна 24 кГц. Для других двух частот дискретизации все упомянутые
частоты должны измениться соответственным образом.
Шаг 1. Вычисление спектра.
БПФ по своему принципу аналогично используемому в ГОСТ Р 54711, но из-за различия частот дискретиза-
ции длины преобразования в мс также различны.
Технические данные БПФ:
Параметры
Уровень I
Уровень II
Длина преобразования N
512 отсчетов
1024 отсчета
Размер окна при Fs = 24 кГц
21,33 мс
42,67 мс
Размер окна при Fs = 22,05 кГц
23,22 мс
46,44 мс
Размер окна при Fs = 16 кГц
32 мс
64 мс
Частотное разрешение
F
s
/512
Fs/1024
Окно Хана
éù
2
3
h
(
i
)
=
1
×
8
×
(
1
−
cos
ë
2
p
(
i
)
/N
û
)
, 0 ≤ i ≤ N – 1.