ГОСТ Р 54712―2011
0 0
00
В.2.1.6 Динамическое переключение канала передачи
Во избежание слышимых артефактов, возникающих в процессе дематрицирования, необходимо выбрать
корректное распределение канала передачи. Это относится к процедурам матрицирования 0, 1 и 2. Простой, но
эффективный подход заключается в выборе для каналов передачи T2, T3, T4 каналов с наименьшими масштаб-
ными коэффициентами в рассматриваемой группе субполос. Для групп субполос, которые состоят более чем из
одной субполосы, сначала должно быть найдено максимальное значение масштабного коэффициента среди мас-
штабных коэффициентов субполос, входящих в группу. Далее три сигнала с наименьшими коэффициентами по
отношению к максимальному масштабному коэффициенту (самый высокий индекс scalefactor) распределяются
на каналы передачи T2, T3 и T4. Если выделение канала передачи одинаковое или почти одинаковое для всех
групп субполос, бит tc_sbgr_selec
t
может быть установлен в ’0’, и в этом случае будет использоваться только один
tc_allocation для всех групп субполос.
В.2.1.7 Динамическое распределение каналов
Согласно бинауральной модели человеческого уха, составлящие стерео- (многоканальных) сигналов обла-
дают широкой стереобазой, если невозможна их пространственная локализация. Такие составляющие стерео-
сигнала не маскируются, однако, с другой стороны, они не способствуют локализации источников звука. Поэтому
не требуется постоянная передача всех каналов, в особенности если в них содержатся стереокомпоненты, не
способствующие пространственной локализации источника звука. В таком случае любой канал многоканального
стерео (L, C, R, LS или RS) может заменить любой другой канал. Это может выполняться как для групп субполос
(для этих целей доступно 12 таких групп), так и для целого звукового канала. При декодировании этот канал или
его часть воспроизводятся любым каналом воспроизведения или несколькими каналами воспроизведения, без
оказания влияния на пространственное восприятие.
Динамический метод распределения каналов, используемый на Уровнях I и II, основан на кодировании
intensity stereo, описанном в ГОСТ Р 54711, приложение Ж, однако позволяет достичь существенно большей гиб-
кости при распределении между различными каналами и обеспечивает существенно более высокое разрешение
по частоте. Динамическое распределение каналов может использоваться для увеличения качества звучания при
заданной скорости передачи и/или уменьшения скорости передачи для многоканальных аудиосигналов при том
же уровне качества. Этот метод требует незначительного дополнительного усложнения декодера и не влияет на
задержку в кодере и декодере.
Динамическое распределение каналов основано на известных психоакустических эффектах. С одной сторо-
ны, в этом методе, как и в intensity stereo кодировании, используется свойство слухового анализатора локализовать
источник на высоких частотах, главным образом по огибающей во временной области, а не по микроструктуре ау-
диосигнала. С другой стороны, динамическое распределение каналов основано на том факте, что только быстрые
изменения огибающей во временной области важны для локализации. Однако стационарные части, в особенности
после атак, вносят гораздо меньший вклад в локализацию. Это означает, что для определенных временных интер-
валов в определенных областях спектра допустимо динамическое распределение каналов. Такие сигналы должны
быть выявлены в кодере в результате анализа и переданы в режиме «моно» в одном канале. Сигналы могут быть
выявлены на основе анализа групп субполос. До трех каналов передачи многоканальной части расширения могут
быть заменены.
Для тех каналов, которые заменяюся в декодере в результате динамического распределения каналов, пере-
даются только соответствующие масштабные коэффициенты и scfsi, без информации о распределении битов и
субполосных отсчетов. В результате, информация о стереокартине полностью доступна в основных каналах L /R , а
в каналах расширения передается только информация, влияющая на локализацию.
Параметр Tx
y
динамического распределения каналов означает, что субполосные отсчеты каналов воспроиз-
ведения добавляются согласно приложению Ж ГОСТ Р 54711. Распределение битов и субполосные отсчеты пере-
даются в канале передачи Tx. Масштабные коэффициены и scfsi каналов воспроизведенияя, соответствующих Tx и
Ty, должны быть переданы в каналах передачи T
x
и Ty. Это позволяет осуществить передачу информации для
управления уровнем обоих каналов воспроизведения. Таблица динамического распределения каналов позволяет
реализовать гибкое использование метода кодирования intensity stereo.
В.2.1.8 Адаптивное многоканальное предсказание
Адаптивное многоканальное предсказание используется для уменьшения межканальной избыточности. При
использовании многоканального предсказания сигналы в каналах передачи T2…4 предсказываются по совместному
сигналу стерео основного потока битов (L , R ). Вместо фактических сигналов в группе субполос передается ошибка
предсказания вместе с коэффициентами предсказания и компенсацией задержки.
Возможные уравнения предсказания (все вычисления выполняются от фрейма к фрейму):
ˆ
å
T2
(
n
)
=
2
pred_coef_T2_0
[
sbgr
][
pci
]
∗
T0
(
n
_
delay_comp
_
pci
)
+
pci
=
0
68
å
+
2
pred_coef_T2_1
[
sbgr
][
pci
]
∗
T1
(
n
_
delay_comp
_
pci
)
,
pci
=
0