ГОСТ Р 53452—2009
5.6 Системы синтеза речи
Широкий спектробластейприменения, упомянутыхвыше, такжекасаетсясистем выводаразговор
ногоязыка. В процессеразработкимогутбытьприменены объективныеиспытания, нообычнодля встро
енных систем применяют субъективные оценки (например, натуральности, приятности, правильности
речи)и проверки функционирования(например, разборчивости или распознаваемости звуков). Сущест
вуют виды субъективных испытаний, которые предусматривают участие людей. Так же. как для систем
речевоговвода, виды и уровни шума являются важными факторами, и голосовая адаптация кспецифи
ческому заданию требуетаккуратности ивнимания: предупреждение, сказанное мягким приятным голо
сом, может быть не только неуместным, но и неэффективным. Например, в случае, подобном этому, не
тольковразумительностьдолжна бытьпроверена, нотакже иреакцияслушателей, которуюсложносмо
делировать.
5.7 Идентификация и верификация пользователя
Для систем идентификации и верификации пользователя, которые могут бытьотнесены кбиомет
рическим системам, главными параметрами являются виды ошибок, т. е. ошибочный прием или откло
нение пользователя и действия с ролями пользователя: претендент (предоставленный пользователь),
зарегистрированный пользователь (авторизованный пользователь), подлинный пользователь (претен
дент, который является зарегистрированным пользователем), самозванец (претендент, который не
является зарегистрированным пользователем). При ошибочном отклонении подлинного пользователя
лишаютдоступа, а при ошибочном приемесамозванца принимаютза истинногопользователя. Количес
тво пользователей иокружающая среда являются критическими факторами как при обучении, так и при
испытаниях. В отличие от устройств ввода/вывода разговорного языка системадолжна уметьзабывать,
например, если регистрацию пользователя аннулируют. Применение идентификации и верификации
пользователей какв реальном времени, так ивнеегообычнооченьчувствительно к защите. Технологии
биометрических систем в настоящее время быстро развиваются, поступают на рынок и становятся
оченьсложными. При определениипроцедуриспытанийследуетиспользоватьссылкинасоответствую
щиестандарты.
5.8 Совокупность данных
Три вида речевыхи языковых совокупностей представляют интерес:
- аналитико-диагностический материал, который, в основном, имеетзначениедля развитиянауки
испециально разработан для демонстрации специфическихфонетических илингвистических свойств;
- материал «общих целей», который включает в себя наборы слов, являющихся типичными для
широкого ряда применений (например, буквенно-цифровые слова или стандартные термины управле
ния);
- материал, ориентированныйнаконкретнуюзадачу, которыйотражаетразличныеуровниформа
лизованного разговорного монолога/диалога в пределах ограниченных областей дискурса (речи).
Очевидно, что материалобщихцелейлегкособратьион полезендля общего понимания, ноимеет
ограниченное практическое значение. Сдругой стороны, несмотря на то, что сбор материала, ориенти
рованногонаконкретную задачу, является болеетрудоемким, этот материал имеет значение толькодля
специфической области: такой материал очень полезендля исследовательских целей.
Наличие стандартных совокупностей материала имеет большое значение. Ответственность за
координацию, распространение ивыпусксоответствующихбаз данныхдолжнабыть возложена на уста
новленныеорганизации.
5.9 Источники информации
Полезным источником информации является серия справочников по речевым и лингвистическим
стандартам, выпущеннаяэкспертной консультативной группой поразработкелингвистическихстандар
тов Европейского союза. Эти справочники охватывают широкую область вопросов, включая создание и
обмен электроннымилингвистическими ресурсами, такими как речевые и текстовые наборы, формали
зованные математическиемодели, лексикииграмматики, а также количественную икачественнуюоцен
кусистем лингвистической обработки и их компонентов.
В нормативных справочниках, как правило, указаны также подходящие методы, в том числе обзор
методов статистической обработки измерений, исследование методов оценки и испытаний. Для многих
целей достаточно базовой статистики (среднее стандартное отклонение, стандартная ошибка) и дис
персионного анализа (ANOVA") в некоторыхслучаях. Также распространены показатели корреляции и
ошибок. Одной из наиболее существенных ошибок статистической обработки является слишком слож
ная интерпретация или применение неподходящего метода, например, когда смешивают качественные
ичисловыеданные. По сложным вопросам следует консультироваться сэкспертами в области матема
тической статистики, так как краткие обзоры таких вопросов, вероятно, будут вводить взаблуждение.
" ANOVA — Analysis Of Variance (дисперсионный анализ).
8