ГОСТ Р 53556.0—2009
согласно их чувствительности «ошибкам. Затем защита от ошибок индивидуально применяется к различ
ным классам, давая лучшую защиту более чувствительным битам.
Повышенная устойчивость «ошибкам для ААС обеспечивается набором инструментов. Эти инстру
менты уменьшают восприятие искажений декодированного аудиосигнала, причиненное поврежденными
битами в полезном битовом потоке.
3.2.6 Обеспечение масштабирования в системе MPEG-4 аудио
Предыдущие стандарты MPEG аудио обеспечивали определенную скорость передачи данных с по
мощью отдельного набора инструментов с различными конфигурациями для заданной полосы частот, ука
занной для использования в различных приложениях. ГОСТ Р 53556 предоставляет несколько скоростей
передачи данных и полос пропускания в пределах единого потока с функциональными возможностями
масштабирования. Они позволяют масштабироватьданный поток в соответствии с требованиями различ
ных каналов и приложений или делать его чувствительным к динамическим характеристикам пропускной
способности. Инструменты, указанные в ГОСТ Р 53556. являются современными инструментами, предо
ставляющими масштабируемое сжатие речевых и других аудиосигналов.
3.3 Набор инструментов
3.3.1 Инструменты кодирования речи
3.3.1.1 Общий обзор
Инструменты кодирования речи спроектированы для передачи и декодирования синтетической и ес
тественной речи.
ГОСТ Р 53556 предусматривает два типа инструментов кодирования речи. Инструментыдля кодиро
вания естественной речи позволяют сжать, передать и декодировать речь человека для использования в
телефонной связи, персональныхсистемах связи и системах наблюдения. Инструментыдля синтетический
речи обеспечивают интерфейс преобразования текста в речь всистемахсинтеза. Применение синтетичес
кой речи позволяет получить низкую скорость передачи данных, а также иметь встроенное подключение
речи к синтетическому лицу с анимацией для использования в приложениях видео конференц-связи с
низкой скоростью передачи данных.
3.3.1.2 Кодирование естественной речи
Набор инструментов кодирования речи MPEG-4 охватывает сжатие и декодирование естественного
речевого звука со скоростью передачи данных, располагающейся от 2 до 24 кбит/с. При кодировании с
переменной скоростью передачи данных допускается скорость ниже 2 кбит/с. например 1.2 кбит/с.
Используются два основных метода кодирования речи: первый — алгоритм параметрического рече
вого кодирования — HVXC (кодирование речевых сигналов с использованием гармонических векторов)
для низких скоростей передачи данных; и второй метод кодирования — CELP (линейное предсказание
с кодовым возбуждением). Речевые кодеры MPEG-4 предназначаются для следующих приложений:
мо бильной и спутниковой связи, телефонной связи через Интернет, для компактных носителей и баз
речевых данных. Они соответствуют широкому диапазону требований, охватывающих скорость
передачиданных, функциональность и качество звука.
Кодирование речевых сигналов с использованием гармонических векторов HVXC
MPEG-4 работает при фиксированных скоростях передачи данных от 2.0 кбит/с до 4.0 кбит/с и ис
пользует методику масштабирования скорости передачи данных; также работает при более низких
скоростях передачи данных, обычно 1.2—1.7 кбит/с, используя методику переменной скорости передачи
данных. HVXC обеспечивает качество связи с малыми потерями и качество речи, близкое к качеству
(near-toll-quality speech) с полосой частот 100—3800 Гц при частотедискретизации 8 кГц. HVXC также позво
ляет осуществлять независимое изменение скорости и тона в процесседекодирования, что является мощ
ной функцией для быстрого доступа к базам с речевыми данными. Функциональность HVXC включает в
себя режим с фиксированной скоростью передачи данных 2.0—4.0 кбит/с и режим с переменной скоро
стью передачи данных— до 2.0 кбит/с включительно.
Метод ER HVXC позволяет работать в режимес переменной скоростью передачи данныхдо 4.0 кбит/с
при более высоком качестве кодирования. Поэтому ER HVXC обеспечивает режимы фиксированной ско
рости передачи данных 2.0—4,0 кбит/с. а при переменной скорости передачи данных — меньше чем
2.0 кбит/с. а также меньше чем 4,0 кбит/с в масштабируемых и немасштабируемых режимах. В режиме
с переменной скоростью передачи данных в неголосовых сигналах обнаруживаются неречевые части,
для которых используется меньшее число бит для кодирования, чем уменьшается средняя скорость
передачи данных. Метод ER HVXC обеспечивает качество связи, близкое по восприятию звуковых
сигналов (near-toll-quality) в полосе частот 100—3800 Гц при частотедискретизации 8 кГц. Когда режим с
переменной
7