ГОСТ Р 56047—2014
теризующих степеньискажения восстановленных послесжатия аудиоданныхв сравнении с исходными
оцифрованными аудиоданными. Описание метрик приведено в разделе 6 настоящего стандарта, а
порядоких расчета приведен в приложении А.
4.4Алгоритмы компрессии оцифрованных аудиоданных относят к одному из трех классов, уста
новленных в разделе 5настоящегостандарта.
5 Классификация
5.1Класс алгоритма компрессии оцифрованных данных определяют по рассчитанным для него
значениям метриккачества. Дляоценкикачества восстановленныхаудиоданныхиклассификацииалго
ритмов компрессии используют метрики качества, указанные в таблице 1.
Т а б л и ц е 1— Диапазоны значений метрик качества по классам алгоритмов компрессии оцифрованных аудио
данных
Диапазон значений метрик качества по классам алгоритмов
Метрика качества
компрессии оцифрованных аудиоданных
Класс III
Класс II
Класс 1
Пиковое отношение сигнал/шум (PSNR). дБ
Менее 30
(30; 40]
Свыше 40
Коэффициент различия форм сигналов
Более 10"4
110*: К Г 4]
МенееЮ’4
Объективная оценка аудиоданных с точки
зрения восприятия (PEAQ)
[-3.98; -2,3)
(-2.3: -0.62]
{-0.62; 0.22]
П р и м е ч а н и е — Метрики качества отражают изменения оцифрованных аудиоданных {после их обра
ботки алгоритмами компрессии и декомпрессии), которые могут оказать критическое влияние на возможность
использования восстановленных аудиоданных для установления наличия звуковых сигналов, дифференциации
звуков и речи.
5.2 В зависимости отзначений метрик качества, вычисленных в ходе проведения их оценки, алго
ритм компрессии оцифрованныхаудиоданныхотносят к одному из классов:
- класс III — алгоритмы компрессии, обеспечивающие качество восстановленных аудиоданных,
достаточное для установления наличия звуковых сигналов и не уступающее в этом качеству исходных
аудиоданных, носоздающее помехи при дифференциации звуков, понимании речи.
- класс II — алгоритмы компрессии, обеспечивающие качество восстановленных аудиоданных,
достаточноедля установленияналичиязвуковыхсигналов, дифференциациизвуков, речиинеуступаю
щее в этом качеству исходныхаудиоданных, но отличимое откачества исходныхаудиоданных;
- класс I — полнофункциональные алгоритмы компрессии, обеспечивающие качество восстанов
ленных аудиоданных, неотличимое от качества исходныхаудиоданных.
5.3 Значения метриккачестваопределяютдля каждогозвуковогофрагмента (длиной5с)оцифро
ванных аудиоданных, а в качестве результирующей оценки восстановленных аудиоданных выбирают
наименьшее значение для метрик PSNR и PEAQ и наибольшее значение для коэффициента различия
формсигналов.
Длярасчета метрик PSNRикоэффициентаразличияформсигналов исходные ивосстановленные
цифровые аудиоданные должны быть представлены с частотой дискретизации 44100 Гц. 16 битами
памяти на однодискретное значение выборки и с одним звуковым каналом. Длина звукового фрагмента 5
сдолжна включать в себя 220500 оцифрованныхзначений.
Для расчета метрики PEAQ исходные и восстановленные цифровые аудиоданные должны быть
представлены с частотой дискретизации 48000 Гц. 16 битами памяти на одно дискретное значение
выборки и содним или сдвумя звуковыми каналами. Длина звуковогофрагмента 5сдолжна включать в
себя 240000 оцифрованных значенийдля каждого канала.
Для сигналов с частотой, отличной от требуемой, необходимо предварительно выполнить
передискретизацию аудиосигнала.
5.4 Алгоритмы компрессии следует различать по степени сжатия, выражаемой через коэффици
ентсжатия. Коэффициентсжатия определяют какотношениеобъема исходныхнесжатыхданныхк объ
емусжатыхданных [порядокрасчетаданной метрики выполняют в соответствии сА.4 (приложениеА)].
4