ГОСТ Р 54711—2011
- спектральная плотность мощности
Х{к
)
N 1
Х \к )
= 10lg —
^ h { iy s ( iy e f
дБ,
к =
0.../V/2,
где s(/) — входной сигнал.
" г о
Нормализация к относительному уровню звуковогодавления 96 дБ должна быть такой, чтобы максимальное
значение соответствовало 96 дБ.
Шаг 2. Определение уровня звукового давления в каждой полосе
Уровень звукового давления
L,b
(дБ) в субполосе
п
вычисляется по формуле
Lrt{o) = max[x(ft). 20«|g(acfm.x(n)*32768)-K>j,
где
Х {к )
— уровень звукового давления спектральной линии с номером
к,
полученной с помощью БПФ и соответ
ствующей максимальной амплитуде в субполосе п.
Переменная
scfmax
(
п)
является одним масштабным коэффициентом на Уровне I или максимумом из трех
масштабных коэффициентов на Уровне II для субполосы л в пределах кадра. Наличие в выражении слагаемого -10
дБ корректирует различив между уровнем
RMS
и пиковым значением. Уровень звукового давления
Lit>(
л) вы
числяется для каждой субполосы л.
Следующий альтернативный метод вычисления ^ ( л ) рассчитан для лучшей производительности кодера,
однако этот метод не был подвергнут формальному тесту качества звука.
Уровень звукового давления
Lst>.
дБ. в субполосе л вычисляется по формуле
Lib {n)
= та х [Х ад,<л). 201д|эс7тах(л)32768)- ЮJ.
где
Х4р(<л) = ю Ц ]Г 1 0х,‘ У’0|
где Xspr(n) — уровень звукового давления в полосе л.
Шаг 3. Учет абсолютного порога слышимости
Значения абсолютного порога слышимости
LTq(k)
приведены в таблицах Г.1а. Г.16. Г.1в для Уровня I и Г.1г.
Г.1д. Г.1е для Уровня II. Значения зависят от частоты дискретизации входного ИКМ сигнала и указаны для каждой
спектральной линии. В зависимости от скорости передачидля абсолютного порога слышимости используется
сме щение. которое составляет минус 12 дБ для скоростей передачи г 96 кбит/с и 0 дБ для скоростей передачи
< 96 кбит/с на канал.
Шаг 4. Обнаружение тональных и нетональных компонентов аудиосигнала
Вид маскера влияет на порог маскирования. Поэтому следует различать тональные и нетональные маскеры.
Для расчета глобального порога маскирования в спектре БПФ необходимо обнаружить тональные и нетональные
маскеры.
Этот шаг начинается с определения локальных максимумов, из которых затем выделяются тональные ма
скеры (синусоиды) и вычисляются интенсивности нетональных маскеров в пределах критической полосы. Границы
критических полос даны в таблицах Г.2а. Г.26. Г.2в для Уровня I и Г.2г, Г.2д, Г.2е для Уровня II.
Ширина критических полос меняется в зависимости от центральной частоты с шириной примерно 0.1 кГц
на НЧ и с примерно 4 кГц на ВЧ. Из психоакустических экспериментов известно, что у слуха разрешающая способ
ность по частоте на НЧ лучше, чем в более высокой области. Чтобы определить, является ли локальный максимум
тональным маскером. вокруг максимума исследуется частотный диапазон
df.
Частотные диапазоны
df:
при частоте дискретизации 32 кГц
Уровень I (# = 125 Гц
(# = 187.5 Гц
0 кГц
<f<=
4.0 кГц
4.0 кГц </<= 8.0 кГц
(#=375 Гц
Уровень II(#=62.5 Гц
с#= 93.75 Гц
8.0 кГц </ <= 15.0 кГц
0 кГц
<f
<= 3.0 кГц
3.0 кГц
<f
<= 6.0 кГц
6.0 кГц </<= 12.0 кГц
12.0 кГц </<= 24.0 кГц
(#= 187.5 Гц
(#=375 Гц
при частоте дискретизации 44.1 кГц
Уровень I
Уровень II
(#= 172.266 Гц
г#=281.25 Гц
(#= 562.50 Гц
(#= 86.133 Гц
(#= 129.199 Гц
(#=258.398 Гц
(#=516.797 Гц
0 кГц
<f<=
5.512 кГц
5.512 кГц </<= 11.024 кГц
11.024 кГц
<1
<= 19.982 кГц
0 кГц </<= 2.756 кГц
2.756 кГц </<= 5.512 кГц
5.512 кГц </<= 11,024 кГц
11.024 кГц </<=19.982 кГц
117