ГОСТ Р ИСО 9241-154—2015
Приложение В
(справочное)
Ошибки распознавания речи в разработке голосового меню
В.1 Ошибки распознавания, присущие голосовому меню с речевым вводом
Интерактивные системы голосового меню, допускающие речевой вводданных, используют системы автома
тического распознавания речи для интерпретации введенных данных вызывающим абонентом. Как и при исполь
зовании любой другой технологии распознавания, при использовании этой системы возможны ошибки. Несмотря на
постоянное улучшение системы ASR. полностью исключить ошибки распознавания речи в системах голосового меню
с речевым вводом невозможно. Причина этого находится в статистическом подходе, который лежит воснове
современных систем распознавания речи.
При использовании приложения с конечным числом состояний, каждому высказыванию вызывающего або
нента в процессе классификации назначают вероятности всех возможных результатов распознавания в соответ
ствии с грамматическим набором конкретного голосового меню. В результате обработки ASR формирует список
из N лучших вариантов с указанием значения коэффициента достоверности, характеризующего вероятность пра
вильности распознавания.
Для принятия адекватного решения о способе продолжения диалога, система использует установленные по
роговые значения коэффициента достоверности для определения лучших результатов распознавания.
- Если все коэффициенты достоверности лежат ниже заданного порогового значения, система отвечает от
казом. т. е. единственным действием системы в этом случае является воспроизведение сообщения примерно сле
дующего содержания: «К сожалению. Ваше сообщение не понятно. Пожалуйста, повторите его».
- Высокий коэффициент достоверности распознавания для одного варианта из списка и значительно более
низкие значения у других вариантов приводят к выполнению соответствующегодействия системой.
- Некоторые системы голосового меню обрабатывают средние значения коэффициента достоверности, пре
доставляя диалоги с некоторым множеством значений для уточнения данных введенных вызывающим абонентом.
В.2 Типы ошибок распознавания и последующие действия
В.2.1 Введение
В таблице В.1 приведен краткий обзор возможных комбинаций высказываний вызывающего абонента и ре
зультатов автоматического распознавания речи. Ошибки распознавания выделены жирным шрифтом.
Таблица В.1. — Краткий обзор возможных комбинаций высказываний вызывающего абонента и результатов
распознавания речи
Результат автоматическогораспознаванияречи
Отсутствие ввода
«о*
Нет соответствий
Ввод
абонента
Нет высказывания
Корректное
распознавание
отсутствия ввода
Ошибка вставки
Корректное
высказывание «А»
Ошибка
удаления
Корректное
распознавание
Ошибка
замещения
Ошибка
отклонения
Корректное
высказывание «В»
Ошибка
замещения
Корректное
распознавание
Некорректное
высказывание
Некорректное распознавание
Корректное
отклонение
В.2.2 Корректное распознавание отсутствия ввода
Если система не распознала какой-либо ввод данных от пользователя за установленный период времени,
происходит тайм-аут исистема распознает событие «нет ввода», которое включает заранее определенное поведе
ние системы, т.е. сообщение «Извините. Вас не слышно».
В.2.3 Ошибка вставки
Если пользователь не ввел никакой голосовой информации, но голосовое меню распознало какой-то рече
вой ввод, это является ошибкой вставки. Такой тип ошибки часто возникает, когда ошибочно обработан шум окру
жающий пользователя или неречевые звуки такие, как фоновый кашель и т. п. Ошибка вставки часто приводит
к ситуации, когда пользователь не может понять причины неадекватных действий системы. Ошибка вставки
может
29