ГОСТ Р 53556.6-2013
TTS работает с МР. В этом случае MTTS должен синхронизировать синтетическую речь с
МР и согласовать функциональность ttsForward и ttsBackward. Когда флаг VideoEnable
устанавливается,М-TTSдекодериспользуетсистемныечасы,чтобывыбрать
соответствующий фрейм TTS_Sentenceи извлечьданные Sentence_Du ration,
PositionJn_Sentence, Offcet. Синтезатор TTS назначает подходящую продолжительность для
каждой фонемы, чтобы обеспечить соответствие Sentence_Dигation. Начальная точка речи в
предложении определяется Position_in_Sente>ice. Если Position_m_Sentenee равняется О
(начальная точка является началом предложения), TTS использует Offcet как время
задержки, чтобы синхронизировать синтетическую речь с МР.
Lip_Shape_Enable - однобитовый флаг, который устанавливается в ‘Г, когда
кодированный входной поток битов содержит информацию о форме губ. При наличии
информации о форме губ М-TTS просит инструмент FA изменить форму губ согласно
информации о синхронизации (Lip_Shape_in_Sentence) и предопределяет конфигурацию
формы губ.
Trick_М ode_ЕпаЫе - однобитовый флаг, который устанавливается в ‘Г, когда
кодированный входной поток битов допускает такие специальные функции, как остановка,
игра, движение вперед и назад.
5.2 Полезная нагрузка преобразования текста в речь MPEG—AAudio
TTS_Sentence_ID -десятибитовыйидентификатор,однозначно определяющий
предложение в последовательности текстовых данных М-TTS для целей индексации.
Первые пять битов равны TTS_Sequence_ID говорящего, а остальные пять битов являются
последовательным номером предложения каждого объекта TTS.
Silence - однобитовый флаг, который устанавливается в ‘Г, когда текущая позиция
является молчанием.
SilenceJDuration определяет продолжительность во времени текущего сегмента
молчания в миллисекундах. Оно принимает значение от 1 до 4095. Значение *0’
запрещается.
Gender - однобитовый флажок, который устанавливается в ‘Г, если половая
принадлежность производителя синтетической речи является мужской и ‘0‘, если женской.
Age представляет возраст говорящего для синтетической речи. Значение возраста
определяется в таблице 3.
Таблица 3 — Таблица отображения возраста
AgeВозраст говорящего
000менее 6
6