ГОСТ Р 54711—2011
Приложение В
(обязательное)
Процесс кодирования
В.1 Кодер
В.1.1 Краткий обзор
В данном приложении для каждого слоя приводится пример кодера с соответствующими блок-схемами.
В кратком введении дается общая идея кодирования.
В.1.1.1 Введение
Алгоритм, приведенный в данном стандарте, является психоакустическим алгоритмом. На рисунке В.1 по
казаны основные блоки психоакустического алгоритма.
отсчеты
Видии*К и н ю н н и
КпП1фП1И»Л
Д0ИЫЙ
погас
Ш Вор
фмътроа
»ии»»и»нчи
Распределение
ВотЛиум»
лотоса битое
Псясшусти-
чоосая марель
Отааштю
смгнал—
Рисунок В.1 — Блок-схема кодера
Четыре основные части психоакустического кодера описаны ниже.
В.1.1.1.1 Набор фильтров
Набор фильтров реализует частотно-временное преобразование. В алгоритме ISO/IEC 1117203 (MPEG
Audio) используются два разных набора фильтров: полифазный набор и гибридный полифазный/МДКП набор.
Каждый набор реализует определенное частотно-временное преобразование. Для данных наборов фильтров ко
личество отсчетов в частотной области равно количеству отсчетов во временной области. Наборы фильтров обе
спечивают основное частотное разделение в кодере и реконструкцию сигнала в декодере. Отсчеты на выходе
наборов фильтров подлежат квантованию.
В.1.1.1.2 Психоакустическая модель
В блоке психоакустической модели вычисляется минимально заметный уровень шумов в каждой полосе
набора фильтров. Этот уровень шумов используется при распределении битов или шума при определении фак
тических квантователей и уровней квантования. Есть две психоакустические модели, приведенные в приложе нии
Г. В то время как обе они могут использоваться с любым уровнем ISOЛЕС 1117203 (MPEG Audio), на практике Модель
1 используется для Уровней I и II. а Модель 2 — для Уровня III. В обеих психоакустических моделях вы ходом
является отношение сигнал-маска (
SMR
) для каждой полосы (Уровни I и II) или группы полос (Уровень III).
В.1.1.1.3 Распределение битов или шумов
Блок распределения анализирует выходные отсчеты набора фильтров и
SMR
психоакустической модели
и распределяет биты (Уровни I и II) или шумы (Уровень III), чтобы одновременно удовлетворить и требование
по скорости передачи и требования маскирования. На низких скоростях передачи зги методы нацелены на то. что
бы потратить биты на минимизацию искажений при невозможности удовлетворить психоакустические требования.
В.1.1.1.4 Блок форматирования потока битов
В блоке форматирования потока битов квантованные отсчеты набора фильтров вместе с данными о распре
делении битов (Уровни I и II) или шумов (Уровень III) и другой служебной информацией кодируются и форматиру
ются определенным образом. В случае Уровня III дополнительно используется код Хаффмана.
В.1.1.2 Набор фильтров
На Уровнях I и II используется набор фильтров с 32 субполосами. В каждой субполосе 12 или 36 отсчетов
группируются для обработки. На Уровне III набор фильтров обладает сигнально-зависимой разрешающей способ
ностью с 6 х 32 или 18 * 32 частотными линиями. Если есть 6 * 32 частотных полосы, группа из трех последова
тельных значений каждой частоты квантуется отдельно.
В.1.1.3 Метод распределения битов или шумов
В этом приложении описываются два различных способа управления скоростью передачи. На Уровнях I и II
используется распределение битов, то есть определенное количество битов отводится каждому отсчету (или груп-пе
отсчетов) в каждой субполосе. На Уровне III используется распределение шумов, при котором квантователи
76