ГОСТ Р 53556.7—2013
Приложение А
(справочное)
Параметрический аудиокодер
А.1 Краткий обзор инструментов кодера
В параметрическом кодере входной сигнал разделяется на две части, которые кодируются HVXC и инстру
ментами HILN. Это может быть сделано вручную или автоматически. Автоматическое переключение между речью и
музыкальными сигналами поддерживается HVXC для речи и HILNдля музыки. Общее средство форматирования
потока битов позволяет работу только в HVXC или только в HILN, или также в объединенных режимах, то есть
переключенном или смешанном режиме.
Следующее описание параметрического кодера HILN информативно, и также альтернативные методы для
сигнального разделения и оценки параметра могут использоваться в кодере.
А.2 Кодер HILN инструменты
Основной принцип HILN. кодердолжен проанализировать входной сигнал, чтобы извлечь параметры, описы
вающие сигнал. Эти параметры кодируются и передаются как поток битов. В декодере выходной сигнал синтезиру
ется. основанный на параметрах, извлеченных и переданных кодером.
Кодер состоит из двух основных частей: ‘экстракция параметра" и ‘кодирование параметра’. В кодере вход
ной сигнал делится на последовательные кадры, и для каждого фрейма ряд параметров, описывающих сигнал в
этом фрейме, извлекается и кодируется. Из-за этого параметрического описания возможен широкий диапазон ско
ростей передачи, частот дискретизации и длин фрейма. Обычно используется длина фрейма 32 мс. Для входных
сигналов с частотой дискретизации на 8—16 кГц обычно используется скорость передачи 6— 16 Кбит/с.
А.2.1 Экстракция параметра HILN
На экстракции параметра входной сигнал разделяется на три различные части: "гармонические строки", “от
дельные строки" и «шум».
Из этих параметров частей, описывающих сигнал, извлекаются:
гармонические строки: основная частота и амплитуды гармонических составляющих:
отдельные строки: частота и амплитуда каждой отдельной строки;
шум: спектральная форма шума.
Дополнительно параметры для амплитудных конвертов и для продолжения линий спектра от одного фрейма
до следующего могут быть определены.
Сигнальная оценка разделения и параметра реализуется в трех шагах: сначала оценивается основная ча
стота гармонической части сигнала, затем оцениваются параметры соответствующих линий спектра, и эти строки
классифицируются как “отдельные строки" или ‘гармонические строки" в зависимости от частоты относительно ос
новной частоты. После того, как все соответствующие линии спектра извлекаются, остающийся остаточный сигнал
подобен шуму, и его спектральная форма описывается рядом параметров.
Гармоническая экстракция строки инструментов HILN может быть использована в интегрированном параме
трическом кодере, использующем инструменты кодирования речи HVXC и кодирование инструментов HILN одно
временно.
А.2.1.1 Оценка основной частоты
Инструментами HILN используется метод оценки основной частоты ‘Cepstrvm*. Сначала входной сигнал
Hanning центрируется вокруг текущего фрейма. Для оконного сигнала вычисляется спектр:
w (f)= 0 -TOos f2‘pi’f/fs))/20 <= f <= fs/2
Определяются локальные максимумы в cepstrum, и идентифицируется самый большой максимум в преде
лах разрешенного ‘диапазона поиска’ задержки подачи. Вычисляется основная частота от "задержки подачи* (пе
риод основной частоты) самого большого максимума.
Основная частота, определенная на основе метода cepstrum. используется в качестве начальной (грубой)
оценки для следующей оценки параметра строки.
А.2.1.2 Гармоническая и отдельная оценка параметра строки
Оценка гармонических и отдельных параметров строки основана на ‘Цикле Анализа/Синтеза".
В первом шаге оцениваются параметры всех гармонических строк. Вычисляется оценка основной частоты
hFreq и «протяжения» hStretch, который минимизирует полную ошибку между реальными гармоническими строч
ными частотами и вычисленными согласно
hLinefreq [i] = hFreq * (/+1) * (1 + hStretch ‘ 0+i))i = 0.. harmNumLine-t.
49