ГОСТ Р 54711—2011
В.1.4 Психоакустические модели
Два примера психоакустических моделей даны в приложении Г.
В.1.5 Кодирование
В.1.5.1 Кодирование на Уровне I
В.1.5.1.1 Введение
В этом пункте описывается возможный метод кодирования на Уровне I. Описание дается со ссылкой на ри
сунок В.5.
В.1.5.1.2 Психоакусгическая модель
Психоакустические параметры могут быть рассчитаны либо с психоакустической моделью 1. описанной
в пункте Г.1, либо с психоакустической моделью 2. описанной в пункте Г.2. Сдвиг блока БПФ равняется 384 отсче
там. Любая модель позволяет определить отношение сигнал-маска в каждой субполосе.
В. 1.5.1.3 Субполоская фильтрация
Субпопосная фильтрация описывается в пункте В.1.3.
В.1.5.1.4 Расчет масштабных коэффициентов
Расчет масштабных коэффициентов в каждой субполосе выполняется для каждых 12 субполосныхотсчетов.
Определяется максимум абсолютных значений этих 12 отсчетов. Ближайшее большее, чем этот максимум, значе
ние из таблицы Б.1 используется в качестве масштабного коэффициента.
В.1.5.1.5 Кодирование масштабных коэффициентов
Номер в таблице Б.1 кодируется 6 битами.
MSB
сначала. Масштабный коэффициент передается, только
если на субполосу было выделено ненулевое число битов.
В. 1.5.1.6 Распределение битов
Перед подстройкой фиксированной скорости передачи должно быть определено число битов, доступных
для кодирования отсчетов и масштабных коэффициентов. Это число гложет быть получено путем вычитания из об
щего количества битов
cb
количества битов заголовка
ЬМг (32
бита), битов
CRC bcrc.
если оно используется (16 бит),
информации о распределении бит
bbal.
и количества битов, требуемых для передачи дополнительных данных Ьапс:
adb = cb -(b b d r - bcrc + bbal - banc).
Полученное количество битое может использоваться для кодирования субполосных отсчетов и масштаб
ных коэффициентов. В основу процедуры распределения заложен принцип минимизации общего отношения шум-
маска для всего кадра с ограничением на то. что число используемых битов не должно превышать число битов,
доступных для этого кадра.
Процедура выделения выполняется итеративно, причем на каждом шаге число уровней приоритетных суб
полосных отсчетов увеличивается.
Сначала вычисляется отношение маска-шум
MNR
для каждой субполосы, путем вычитания из отношения
сигнал-шум
SNR
отношения сигнал-маска
SMR:
MNR
=
SNR - SMR.
Отношение сигнал-шум может быть найдено из таблицы В.2. Отношение сигнал-маска является выходом
психоакустической модели.
Далее на каждую субполосу и масштабный коэффициент выделяется ноль битов. Число битов для кодиро
вания отсчетов
bspl
и число битов для кодирования масштабных коэффициентов
bscf
обнуляются. Затем запуска
ется итеративная процедура, каждый цикл которой содержит следующие шаги:
- среди всех субполос определяется субполоса с минимальным
MNR.
- точность квантования субполосы с минимальным
MNR
повышается путем увеличения отведенного числа
битов на следующее большее значение;
- определяется новое значение
MNR
в этой субполосе;
- обновляется значение
bspl
в соответствии с выделенным количеством битов. Если ненулевое число битов
выделяется для субполосы впервые, то
bscf
должен быть увеличен на 6 битов;
- затем вычисляется
adb
по формуле;
adb = c b -( bhdr + bcrc + bbal + bscf + bspl - Ьэлс).
Итеративная процедура повторяетсядо тех пор пока
adb
не станет меньше любого возможною увеличения
bspl
и
bscf
в пределах одного цикла.
В. 1.5.1.7 Квантование и кодирование субполосных отсчетов
Применяется равномерное квантование с симметрией относительно нуля. Это предотвращает получение
различных результатов квантования при незначительном изменении значений вблизи нуля. Каждый из субполос
ных отсчетов нормализуется путем деления его значения на масштабный коэффициент для получения
X
и кванту
ется согласно следующему алгоритму;
- вычислить
АХ +
Б;
- оставить
N
старших значащих битов;
- инвертировать старший бит.
81