ГОСТ Р 53556.2—2012
5.8.3 Процесс декодирования
idVUV
— параметр, который имеет в результате решение
V/UV
и определенный как:
0 Непроизнесенная речь
1 Интервал фонового шума
idVUV
=
2 Смешанная вокализованная речь
3 Вокализованная речь
Используя метод обнаружения фонового шума, кодирование с варьируемой скоростью выполняется
на базе фиксированной битовой скорости 2.0 Кбит/с
HVXC.
Т а б л и ц а 64 — Распределение разрядов закодированных параметров для режима варьируемой битовой
скорости
Режим
(idVUV)
Фоновый шум (1)
UV
(0)
UV(2)
1/(3)
V/UV
LSP
Возбуждение
2 бит/20 мс
0 бит/20 мс
0 бит/20 мс
2 бит/20 мс
18
бит/20 мс
8 бит/20 мс
(только усиление)
2 бит/20 мс
18 бит/20 мс
20 бит/20 мс
(Основной тон и гармоничес
кие параметры спектра)
Совокупно
2 бит/20 мс
0.1 Кбит/с
28 бит/20 мс
1.4 Кбит/с
40 бит/20 мс
2.0 Кбит/с
Для Смешанной вокализованной речи и Вокализованной речи
(idVUV
= 2.3) используется тот же са
мый методдекодирования, какдля режима фиксированной битовой скорости.
В декодере содержатся два набора параметров
LSP.prevLSP’\
и
prevLSP2,
где
prevLSP^
представ
ляет ранее переданные параметры
LSP.
a
prevLSP2
представляет ранее переданные параметры
LSP
преж
де
prevLSPI.
Для фрейма Фонового шума
(idVUV
= 1). декодер
VXC
используется тем же самым способом
какдля фрейма
UV.
но никакие параметры
LSP
не передаются. Сгенерированные линейной интерполяцией
параметры
LSP prevLSPI
и
prevLSP2.
используются для синтеза
LPC,
и тот же самый индекс усиления
предыдущего фрейма используется для генерации возбуждения декодирования
VXC.
Во время фрейма
Фонового шума, через каждые
(BGN_ INTVL
♦ 1) (=9) фреймов вставляется фрейм Невокализованный
речевой
(UV),
чтобы передать параметры фонового шума. Этот фрейм
UV
может быть или не быть реаль
ным
UVфреймом
начала речевых пакетов. Является ли фрейм реальным
UV,
оценивает переданный ин
декс усиления. Если индекс усиления меньше или равен индексу из предыдущего +2. то этот
UV
фрейм
расценивается как фрейм Фонового шума, и поэтому ранее переданный вектор
LSP
(=
prevLSPI)
использу
ется. чтобы сохранить гладкое изменение параметров
LSP.
иначе передаваемые в данное время
LSPs
используются как реальный
UV
фрейм. Индексы усиления сортируются согласно величинам. Если снова
выбран режим Фоновый шум. то используют интерполированные
LSPs.
использующие
prвvLSP^
и
provLSP2.
Идля фрейма Невокализованной речи и для Фонового шума
(idVUV
= 0.1) используется Гауссовский
шум с единичной энергией для возбуждения декодирования
VXC
(вместо стохастического кодового векто
ра формы для декодирования
VXC
).
Рисунок5 показывает пример. Предположим, чтофрейм #0 и фрейм #1 являются Невокализованным
речевым фреймом, а фрейм #2... фрейм #9 являются фреймом Фонового шума. Во время декодирования
фрейма #2... фрейма #9.
prevLSP‘\
и
prevLSP2
установлены каю
prevLSP
1= LSP(1) и
provLSP2
=
LSP
(0) и
вектор
LSP
фрейма # /.
LSP
(
i)
(2
й i й
9). генерируется как
‘
.
pr6vLSP2x(2x BGH_INTVL-2xbgnCnt -^)+ prevLSP)x{2xbgnCnt +А)
LSP1
>“ ---------------------------------------2
ZmrJNTVL
-------------------------- --------------’
где
BGN_ INTVL
— интервал максимального фонового шума (=8), и
bgnCnt
— является счетчиком после
довательных фреймов Фонового шума.
В этом примере.
bgnCnt
= 0для фрейма #2.
bgnCnt -
1для фрейма #3
bgnCnt
= 7 для фрейма #9.
Для индекса усиления декодирования
VXC
во время фрейма #2... фрейма #9 используется индекс усиле-
44