ГОСТ Р 53452—2009
Т а б л и ц а А.1 — Время соединения и показатель ошибок соединения управляемого голосом вызова для двух
систем
Система
Поп
испытателя
Устройство
GSM
Уровень
шума
Время
соединения.
с
Средний
штрафной
балл
Уровень
значимости
(значение р)
А
—
—
—
24.7
3.1
0.03
Б
—
—
—
17.4
5.1
—
м ужской
—
—
19.9
3.3
0.08
—
ж енский
—
—
22.2
4.9
—
—
А
—
21.2
4.0
0.84
—
—
Б
—
20.9
4.2
—
—
—
80 км/ч
20.6
3.5
0.07
—
—
—
110 км/ч
21.4
4.7
А.2 Диктовка. Многоязычное сравнение системы речевого ввода текста
Данный пример касается сравнения системы речевого ввода текста дпя применений с большим словарем и
для отдельных слов. Система разработана для пяти языков (немецкий, испанский, итальянский, французский и
английский). Испытания проводипись изготовителем. Результаты опубликованы в открытой печати.
Исследуемые системы речевого ввода текста состояли изодинакового базового программного обеспечения,
но различных словарей и языковых моделей. Всегда сложно сравнивать системы, основанные на различных язы
ках. так как связанными с языком переменными сложно управлять. Особенности языка и различные обучающие
материалы могут влиять на показатели системы.
При испытаниях системы был использован один и тот же текст, переведенный на 5 разпичных языков. Допол
нительно был включен раздел из руководства пользователя системы речевого ввода текста.
Для испытаний на каждом языке были привлечены четыре пользователя, говорящие на родном языке (двое
мужчин и две женщины). Продиктованные речевые сигналы были записаны и сохранены с рекомендуемой транс
крипцией для выполнения испытаний по автоматической управляемой компьютером программе испытаний. Это
позволяло повторять испытание с одним и тем же устройством распознавания, но с различными настройками.
Испытания проводипись с возможностью адаптации системы к пользователю. Адаптация — это свойство устрой
ства распознавания обучаться распознаванию речи конкретного пользователя. Система была сделана частично
зависимой от говорящего пользователя. Испытания включали в себя два режима: с адаптацией и без нее. При усло
вии отсутствия адаптации испытания проводились с исходными заводскими регулировками системы для каждого
языка и четверых испытателей, говоривших на родном языке. В режиме адаптации для устройства распознавания
было проведено обучение по четырем текстам четырех различных авторов, после чего было проведено распозна
вание пятого автора. Это было повторено для каждого автора.
Подсчет был выполнен для четырех условий: безадаптации. с адаптацией, для слов, включенных в словарь,
и для вероятности омофонической ошибки. Очевидно, что адаптация должна улучшать распознавание текста,
однако она требует некоторых усилий для обучения системы работе с конкретным человеком. Также представляет
интерес определение показателя работы для слов, включенных в словарь. Этот показатель характеризует работу
системы с изученным материалом.
Омофоны (слова, которые имеют одну фонологическую, но разную орфографическую форму, имеют похожее
звучание, но пишутся по-разному)должны быть выявлены языковой моделью.
Некоторые результаты этого исследования приведены в таблице А.2. Очевидно, что возможность адаптации
дает существенное увеличение производительности системы. Влияние языка на интенсивность появления ошибок
распознавания слов также является значимым <р = 0.01).
Немецкий язык намного сложнее поддается распознаванию, чем итальянский или английский. Для немецкого
языка пределы распознавания с одним и тем же размером словаря намного меньше, чем для английского, из-за
наличия множества применяемых форм слов в немецком языке.
Т а б л и ц а А .2— Интенсивность появления ошибок слов системы речевого ввода текста для некоторых условий
эксперимента в зависимости от языка и наличия обучения
Условия эксперимента
Язык
Немецкий
Испанский
Итальянский
Французский
Английский
С адаптацией
82
86
89
84
87
Без адаптации
87
89
92
87
91
С адаптацией, слова из словаря
91
92
94
88
91
О м оф онические ош ибки
22
25
17
73
25
10