ГОСТ Р 53556.6 -2013
В MPEG-4 общие интерфейсы определяются для синтезатораTTS и для
функциональной совместимости FA/MP. Функциональные возможности М-TTS можно
рассматривать как надмножество стандартной платформы TTS. Синтезатор TTS может
также использовать просодическую информацию естественной речи в дополнение к
входному тексту и генерировать синтезированную речь гораздо более высокого качества.
Формат потока битов интерфейса в высшей степени удобен для пользователя: если
некоторые параметры просодической информации недоступны, пропущенные параметры
генерируются, используя предварительно установленные правила. Функциональность HI
TTS, таким образом, простирается от обычной функции синтеза TTS до кодирования
естественной речи и областей его приложения, то есть, от простои функции синтеза TTS до
функций для ЕЛ и МР.
2 Термины и определения
В настоящем стандарте применены термины с соответствующими определениями,
используемые в ГОСТ Р53556.0-2009.
3 Символы и сокращения
F0основная частота (частота основного тона)
DEMUXдемультиплексор
FAанимация лица
FAPпараметр анимации лица
IDидентификатор
1РЛМеждународный фонетический алфавит
MPкинофильм
M-TTSTTS MPEG-4 Audio
STODповествователь историй по требованию
TTSпреобразование текста в речь
4Синтаксис потока битов преобразования текста в речь MPEG- 4
Audio
4.1 TTSSpecificConfig MPEG-4 Audio
TTSSpecificConfig () {
TTS_Sequetice ()
}
2