ГОСТ Р 54712―2011
111
Приложение Д
(обязательное)
Использование дополнительных данных
Д.1 Введение
Множество существующих приложений MPEG audio, включая международные стандарты (например, [4] и
[5]), определило форматы вспомогательного поля данных в соответствии с определенными требованиями этих
приложений. В данном приложении даются некоторые примеры, которые могли бы представлять интерес для бу-
дущих приложений.
Каждый фрейм настоящего стандарта может содержать некоторое количество дополнительных байт данных.
Эти данные могут быть размещены в двух отдельных полях фрейма кодированных данных. Одно поле располага-
ется в конце основного фрейма для совместимости с определением дополнительных данных ГОСТ Р 54711, другое
поле располагается в конце фрейма расширения.
Наиболее популярные из дополнительных данных — данные о программе (Programme Associated Data —
PAD), тесно связанные с аудиосигналом.
Д.2 Типичные данные о программе
Типичные примеры использования данных о программе:
- индикация типа звукового контента (музыки или речи);
- текстовая информация, имеющая отношение к программе (ITTS);
- универсальный код изделия/европейский номер изделия (UPC/EAN);
- специальные синхронные команды для ресивера/декодера;
- информация для управления динамическим диапазоном (DRC).
Сигнал DRC может дополнительно применяться в ресивере для сжатия динамического диапазона звукового
сигнала. Указанные данные могут быть востребованы при отсутствии задержки в передаче данных.
Все функции, предоставляемые PAD, и длина полей PAD определяются пользователем. Поэтому любая ин-
формация может быть размещена в поле PAD.
Д.3 Управление динамическим диапазоном
Продолжительные исследования показали, что в условиях, далеких от идеальных, прослушивание звуко-
вых программ не требует полного динамического диапазона, обеспечиваемого цифровым аудио. Методы пере-
дачи данных в кодированном потоке битов с целью сократить динамический диапазон аудио были определены в
ГОСТ Р 54711, Уровень II для использования в цифровом радиовещании DAB [4].
При помощи управления динамическим диапазоном (DRC) ресивер может уменьшить динамический диа-
пазон звукового сигнала. Цель этого состоит в том, чтобы адаптировать динамический диапазон звукового сиг-
нала к прослушиванию в шумной среде или к прослушиванию программ, обладающих большим динамическим
диапазоном (звуковые дорожки фильмов), для домашнего прослушивания. Декодеры настоящего стандарта до-
полнительно позволяют обеспечить сжатие динамического диапазона путем получения управляющей информа-
ции непосредственно из самого аудиосигнала или из подходящего сигнала DRC, переданного во вспомогатель-
ном поле данных. Передача сигнала DRC является опцией провайдера программы и не является требованием
системы.
В спецификации DAB часть дополнительных данных, передаваемых вместе с аудио (F-PAD), кроме всего
прочего, может содержать поле данных DRC размером шесть битов, которое должно использоваться для измене-
ния усиления воспроизводимого аудиосигнала. В текущих вариантах [4], когда передается управление динамиче-
ским диапазоном, шесть битов соответствуют усилению, которое будет применено к восстановленному звуковому
сигналу в диапазоне 0—15,75 дБ с шагом 0,25 дБ. Размер шага 0,25 дБ, как показали эксперименты, был наи-
более приемлем с точки зрения обеспечения плавного регулирования усиления во время медленных изменений
усиления в классической музыке. Верхний предел усиления 15,75 дБ позволяет достичь подходящего сокращения
динамического диапазона для не очень сложных условий прослушивания. Если требуется дальнейшее сокраще-
ние динамического диапазона из-за чрезвычайно неблагоприятных условий, сообщенные значения могут масшта-
бироваться при незаметном увеличении размера шага. Информация для управления динамическим диапазоном
передается при помощи шести битов один раз в 24 мс. Это соответствует скорости передачи 250 бит/с (без учета
данных, необходимых для сигнализации использования DRC).
Д.4 Индикация музыки/речи
Эти два флага указывают, состоит ли переданный звук из музыки или речи. Ресивер может использовать эту
информацию для управления любой схемой звуковой обработки. Определенная комбинация флагов сигнализи-
рует об отсутствии индикации. Индикация музыки/речи обычно требует двух битов, повторяемых приблизительно
10 раз в секунду.