ГОСТ Р 53556.6-2013
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Звуковое вещание цифровое
КОДИРОВАНИЕ СИГНАЛОВ ЗВУКОВОГО ВЕЩАНИЯ С СОКРАЩЕНИЕМ
ИЗБЫТОЧНОСТИ ДЛЯ ПЕРЕДАЧИ ПО ЦИФРОВЫМ КАНАЛАМ СВЯЗИ.
ЧАСТЬ III (MPEG-4 AUDIO)
Интерфейс преобразования текста в речь (TTSI)
Sound broadcasting digital.
Coding of signals of sound broadcasting with reduction of redundancy for transfer on digital
communication channels. A part III (MPEG-4 audio).
Texe to speech interface (TTSI)
Дата введения 2014-09-01
1 Область применения
Стандарт определяет кодированное представление преобразования текста в речь
MPEG-Л Audio (M-TTS) и его декодер для синтеза речи высокого качества идля того, чтобы
задействовать различные приложения.
Стандарт предназначается для приложения к функциональности М-TTS, такой как
функциональностьанимациилица(FA)исовместимостькинофильмов(МР)с
кодированнымпотокомбитов.ФункциональностиМ-TTSвключаютвозможность
использованияпросодическойинформации,извлеченнойизестественнойречи.
Функциональноститакжевключают приложенияв переговорноеустройство для
инструментов FA и устройство дублирования для кинофильмов, используя форму губ и
вводимую информацию о тексте.
Технология синтеза преобразования текста в речь (7TS) становится довольно
распространенным инструментом интерфейса и начинает играть важную роль в различных
областях приложения мультимедиа. При использовании функциональности синтеза TTS
легко могут быть составлены мультимедийные коитенты с дикторским текстом, не
записывая естественный звук речи. Кроме того, функциональность синтеза TTS с
анимацией лица (FA) { кинофильма (МР) возможно сделала бы содержание контента более
выразительным. Технология TTS может использоваться в качестве устройства речевого
выхода для инструментов FA идля дублирования МР с информацией о форме губ.
Издание официальное
1