ГОСТ Р 52873—2007
б)изменять громкость, скорость воспроизведения речи, подстраивать частоту основного тона,
тембр, эффект реверберации (настраиваемые параметры области регулирования).
П р и м е ч а н и е — Подстройка тембра должна осуществляться путем цифровой фильтрации нижних и/или
верхних частот с переменным коэффициентом усиления.
4.3 Алгоритм работы программных средств
4.3.1 Программные средства синтезатора речи должны состоять изследующихблоков:
- текстовый процессор;
- транскриптор;
- звуковая база;
- формирователь речевогосигнала;
- блоквывода звука.
4.3.2 Текстовой процессор, который получает в качестве входной информации текстовые данные,
должен выполнять следующиефункции:
а) выделение предложений втексте и разбивка их насинтагмы;
б) прочтение заголовковэлектронных писем идокументов;
в) анализ использования «е» и «ё»;
г) выполнение задачи омонимии (замок или замок);
д) расстановка ударений в словах, при этомдолжна быть предусмотрена возможностьиспользо
вания словаря ударений;
е) определение типа интонации предложения, формирование интонационного контура,
ж) определение места установки идлительностьпауз в чтении.
4.3.3 Транскриптор должен преобразовывать полученный от текстового процессора нормализо
ванныйтекстс ударениями, расставленными паузами, интонационным контуром в последовательность
просодической информации, т.е. преобразовывать текст в последовательность звуков. Каждому звуку
должны соответствоватьтребуемыедлительность ичастота основноготона.
4.3.4 Формирователь речевого сигнала на основе потока просодической информации от транс
криптора, используязвуковыеэлементы из звуковойбазы, долженсформироватьречевойсигнал. Рабо
та формирователя речевогосигнала зависитоттого, какойтипзвуковойбазы используется иестьлиона
вообще. Если звуковая база не используется, то синтезатор должен формировать звуковые элементы
сам на основе формантного метода (формантный синтезатор). Такой метод синтеза самый экономный,
но качество речи невысокое(сильно роботизированное).
4.3.5 Рекомендуется использовать синтез речи на основе звуковых баз. состоящих из дифонов,
аллофонов, субаллофонов или смешанного типа. т.к. по качеству такой метод намного эффективнее
формантного иобеспечиваетхорошую разборчивость.
П р и м е ч а н и е — Степень естественности речи очень сильно зависит от качества и состава собранных
звуковых единиц, а также используемых алгоритмов модификации звука почастоте основного тона и длительности.
4.3.6 Программные средства синтезатора должны быть реализованы в виде отдельной програм
мы и должны иметь блок вывода звука. С помощью соответствующих стандартных интерфейсов про
граммные средства синтезатора должны формировать звуковой поток данных на звуковую карту
компьютера.
4.4 Объемно-временные характеристики программных средств
4.4.1 Скоростьпреобразованиятекставзвукдолжнапревышатьскоростьзвучания. Программные
средства синтезатора должны преобразовывать текстбыстрее, чем он выдается через звуковую карту.
При этом процент загрузки центрального процессора недолжен превышать25 % (при тактовой частоте
процессора 3 ГГц).
4.4.2 Объем требуемой оперативной памяти не должен превышать 120 Мб. Размер файлов про
граммных средств синтезатора не ограничивается. Ограничения на объем памяти и файлов програм
мных средств синтезатора могут быть установлены для программных средств синтезатора,
реализуемыхна платформе с ограниченными ресурсами (Palm, карманные персональные компьютеры,
мобильные телефоны). Вэтом случае ограничениядиктуют выбор платформы.
4.5 Требования надежности программных средств синтезатора
4.5.1 Программные средствасинтезаторадолжны обеспечиватькорректную иустойчивую работу
программ экранногодоступа в процессе их взаимодействия.
4.5.2 Программные средства синтезатора должны обеспечивать устойчивость работы при вос
произведении текста, обрабатыватьлюбые сочетания символов инезавершатьобработкуданных ава
рийно (зависание, зацикливаниеоперационнойсреды).
з