ГОСТ Р 54712-2011
Приложение Г
(обязательное)
Психоакустические модели
Г.1 Психоакустическая модель 1 для меньших частот дискретизации
Ниже приводится описание психоакустической модели 1 с адаптацией, необходимой для поддержки мень
ших частот дискретизации.
Вычисление психоакустической модели должно быть адаптировано ксоответствующему уровню.
Нет принципиальных отличий в использовании психоакустической модели 1 на Уровнях I или II.
На уровне I новое распределение битов вычисляется для каждого блока из 12 субполосных отсчетов или 384
ИШ-отсчвтов.
На Уровне II новое распределение битов вычисляется для трех блоков (всего 36 субполосных отсчетов, со
ответствующих 3*384 (1152) входным ИКМ-отсчетам).
Распределение битов между 32 субполосами выполняется на основе отношений сигнал-маска во всех субпо-
посах. Поэтому для каждой субполосы необходимо отпределить максимальный уровнень сигнала и минимальный
уровень порога маскирования. Минимальный порот маскирования определяется в результате психоакустического
расчета на основе БПФ входного ИКМ-сигнала.
БПФ, выполняемое параллельно с субполосной фильтрацией, компенсирует недостаточную частотную се
лективность на низких частотах субполосного банка фильтров. Этот метод позволяет достичь достаточного разре
шения во временной области для кодированного аудиосигнала (полифазный фильтр с оптимизированным окном
для минимального пре-эха) идостаточного разрешения почастотедля вычисления порогов маскирования. Частоты
и уровни шумов могут быть вычислены при наложении спектров, это необходимо для определения минимальной
скорости передачи для тех субполос, которым требуются некоторые битовы для устранения компонентов эпайзин-га
в декодере. Дополнительное усложнение для вычисления оптимальной разрешающей способности по частоте
необходимо только в кодере и не вызвает дополнительной задержки или усложнения декодера.
Вычисление отношения сигнал-маска основано на следующих процедурах:
шаг 1- вычисление БПФ для преобразования сигнала из временного пространства в частотное;
шаг 2 - определение уровня звуковогодавления в каждой субполосе;
шаг 3 - определение абсолютного порога слышимости;
шаг4-обнаружение тональных (близких ксинусоиде) и нетональных (близких кшуму) компонент аудиосигнала;
шаг 5 - прореживание маскеров для получения релевантных маскеров;
шаг б - вычисление индивидуальных порогов маскирования;
шаг 7 - определение глобального порога маскирования:
шаг 8 - определение минимального порога маскирования в каждой субполосе:
шаг 9 - вычисление отношения сигнал-маска в каждой субполосе.
Частота дискретизации по умолчанию равна 24 кГц. Для других двух частот дискретизации все упомянутые
частоты должны измениться соответственным образом.
Шаг 1. Вычисление спектра.
БПФ по своему принципу аналогично используемому в ГОСТ Р 54711. но из-за различия частот дискретиза
ции. длины преобразования в мс также различны.
Технические данные БПФ:
Параметры
Длина преобразования
N
Размер окна при
F s =
24 кГц
Размер окна при
F s
= 22.05 кГц
Размер окна при
F s
= 16 кГц
Частотное разрешение
Уровень 1
512 отсчетов
21,33 мс
23,22 мс
32 мс
Fs/512
Уровень II
1024 отсчета
42.67 мс
46.44 МС
64 МС
FS/1024
Окно Хана:
/>(/)= ^ -^ g -(1 -c°s[2«(f)/W j)
0 S/SW-1
Спектральная плотность мощности
Х (к ):
Г /to
X (A )= 1 0 lg | l^ (/ ) s(/)-e(
.дБ
к
=
0 ...N / 2 .
где
s (l)
- входной сигнал.
73