ГОСТ Р 54711—2011
Приложение Г
(обязательное)
Психоакустические модели
Г.1 Психоакустическая модель 1
Нет никакого принципиального различия в использовании психоакустической модели 1 в Уровне I или II.
Уровень I: процедура распределения битов выполняется для каждого блока из 12 субполосных или 384
входных ИКМ-отсчегов.
Уровень II: процедура распределения битов выполняется для трех блоков с общим количеством субполос
ных отсчетов, равным 36. соответствующих 3*384 (1152) входным ИКМ-отсметам.
Распределение битов между 32 субполосами вычисляется на основе отношения сигнал-маска в этих субпо
лосах. Поэтому для каждой субполосы необходимо определить максимальный уровень сигнала и минимальное
значение порога маскирования. Минимальное значение порога маскирования определяется из БПФ входного ИКМ
сигнала, сопровождаемого психоакустическим расчетом.
БПФ параллельно с субполосной фильтрацией компенсирует слабую частотную селективность набора по
лосовых фильтров в нижней части звукового диапазона. Этот метод обеспечивает как приемлемое временное
разрешение для кодирования звукового силнала (набор полифазных фильтров с оптимизированным окном для ми
нимального пре-эха), так и приемлемое частотное разрешение для вычисления порогов маскирования. Определя
ются частоты и уровни интерференционных искажений. Это необходимо для того, чтобы вычислить минимальную
скорость передачи для тех субполос, которые нуждаются в дополнительных битах, чтобы устранить заметность
интерференционных искажений в декодере. Дополнительные сложности, вызванные необходимостью получения
улучшенной разрешающей способности по частоте, необходимы только в кодере и не вызывают дополнительной
задержки в кодере или усложнения его алгоритма.
Вычисление отношения сигнал-маска состоит из девяти шагов:
1 вычисление БПФ для частотного преобразования:
2 определение уровня звукового давления в каждой субполосе.
3 определение абсолютного порога слышимости;
4 обнаружение тональных (близких к синусоиде) и нетональных (близких к шуму) компонентов аудиосигнала;
5 прореживание маскеров в целях оставить только значащие.
6 вычисление индивидуальных порогов маскирования;
7 вычисление глобального порога маскирования:
8 определение минимального порога маскирования в каждой субполосе;
9 вычисление отношения сигнал-маска в каждой субполосе.
Предполагается, что частота дискретизации равна 48 кГц. Для двух других частот дискретизации все указан
ные значения частот должны быть пересчитаны соответствующим образом.
Шаг 1. Вычисления для частотного преобразования БПФ
Порог маскирования определяется путем оценки спектральной плотности мощности, которая вычисляется
путем БПФ с 512 отсчетами для Уровня I или с 1024 отсчетами для Уровня II. На вход БПФ поступают непосред
ственно отсчеты входного ИКМ сигнала, умноженные на оконную функцию Ханна.
Для согласования по времени распределения битов и соответствующих субполосных отсчетов ИКМ отсчеты,
поступающие на вход БПФ. должны быть задержаны.
1. Задержка набора субполосных фильтров анализа равна 256 отсчетам, что соответствует 5.3 мс на часто
те дискретизации 48 кГц. Сдвиг окна на 256 отсчетов необходим для компенсации задержки набора субполосных
фильтров анализа.
2. Окно Ханна должно быть выровнено относительно субполосных отсчетов кадра. Для Уровня I эго приводит
кдополнительному сдвигу окна на 64 отсчета. Для Уровня II требуется дополнительный сдвиг окна на минус 64 отсчета.
Технические данные БПФ:
Уровень I
512 отсчетов
10.67 мс
11.6
мс
16 мс
Уровень II
1024 отсчета
21.3 мс
23,2 мс
32 мс
размер преобразования
размер окна при
Fs
= 48 кГц
размер окна при
Fs
= 44.1 кГц
размер окна при
Fs
= 32 кГц
разрешающая способность
по частоте
- окно Ханна h(i)
sam plingjrequencylb^
sampiingjrequency
/1024
/1(0 = ^^5*0.5*|l-coe|2*ir»(i)yW jj, 0£/£ JV-1
116