Введение
Глава 1. Методы представления, моделирования, обработки и распознавания речевых сигналов 7
1.1. Слуховое восприятие 7
1.2. Система речеобразования и фонетический состав речи 10
1.3. Способы представления PC 16
1.4. Представление помех 19
1.5. Модели PC 22
1.6. Задачи обработки PC 27
1.7. Улучшение качества PC 29
1.8. Задачи распознавания PC 32
1.9. Проблемы в области распознавания РК 34
1.10. Методы распознавания РК 39
1.10.1. Спектральные методы распознавания РК 39
1.10.2. Методы, основанные на вейвлет-анализе 42
1.10.3. Статистические методы распознавания РК 45
1.10.3.1. Методы распознавания РК, основанные на использовании скрытых марковских цепей 45
1.10.3.2. Распознавание РК с использованием нейронных сетей 47
1.10.4. Методы распознавания РК, основанные на обработке изображений 49
1.10.5. Выбор метода распознавания РК 51
1.11. Способы повышения помехоустойчивости распознавания РК 51
1.12. Выводы 56
Глава 2. Моделирование изменчивости PC 57
2.1. Постановка задачи 57
2.2. Анализ изменчивости PC 58
2.2.1. Статистические характеристики изменчивости длительности произнесения PC 63
2.2.2. Статистические характеристики изменчивости громкости произнесения PC 67
2.2.3 Статистическое исследование непостоянства количества квазипериодов в вокализированных фонемах PC 70
2.2.3.1. Статистические исследования количества квазипериодов в произнесениях фонем 73
2.3. Моделирование изменчивости PC с использованием авторегрессионных моделей 75
2.3.1. Создание вариантов PC с помощью двумерной модели Хабиби 75
2.3.2. Моделирование вариантов PC вдоль строк изображения, полученного двумерной моделью Хабиби 79
2.3.3. Моделирование вариантов PC вдоль траектории на изображении, полученном двумерной моделью Хабиби 83
2.3.4. Определение параметров авторегрессионных моделей вариативности PC 87
2.4. Получение вариантов РК с помощью управления количеством квазипериодов в фонемах 90
2.5. Анализ акустического восприятия моделируемых вариантов PC 93
2.6. Использование моделей вариативности при статистическом различении РК 95
2.7. Выводы 102
Глава 3. Распознавание PC на фоне интенсивных шумов 103
3.1. Постановка задачи 103
3.2. Статистическое обнаружение и распознавание сигналов на фоне шумов 104
3.2.1. Обнаружение сигналов на фоне шумов 105
3.2.2. Зашумление эталонов при распознавании сигналов на фоне шумов 108
3.3. Распознавание PC через преобразование их в автокорреляционные портреты 112
3.3.1. Построение АКП PC 112
3.3.2. Свойства АКП PC 114
3.3.3. Взаимные искажения АКП, связанные с различным произнесением PC 118
3.3.4. Построение АКП по характерным точкам PC 121
3.3.5. Совмещение АКП 125
3.3.6. Совмещение АКП с использованием алгоритма динамического программирования 128
3.4. Распознавание PC на фоне шумов через преобразование их в АКП 133
3.4.1. Использование зашумленных эталонов при & распознавании АКП PC 134
3.5. Выводы 137
Глава 4. Программный комплекс и статистическое исследование алгоритма распознавания РК 139
4.1. Введение 139
4.2. Алгоритм распознавания РК на фоне шумов с использованием зашумления эталонов 140
4.2.1. Обнаружение границ РК 140
л 4.2.2. Зашумление эталонов 141
4.2.3. Построение АКП РК 142
4.2.4. Совмещение АКП 143
4.2.5. Принятие решения о принадлежности РК одному из классов эталонов 145
4.2.6. Графический интерфейс комплекса программ для распознавания РК на фоне шумов на ЭВМ 146
4.3. Статистические исследования алгоритма распознавания РК на фоне шумов 148
4.3.1. Статистическое исследование алгоритма на имитированном речевом материале 148
4.3.2. Статистическое исследование алгоритма на реальном речевом материале 149
4.4. Вычислительные затраты и аппаратные требования при
функционировании комплекса программ распознавания РК на фоне
шумов 151
4.4.1. Расчет времени распознавания РК 151
4.4.2. Аппаратные требования для системы распознавания РК на фоне шумов «Говорун» 152
4.4.3. Аппаратные требования для системы «Редактор речевых команд» 153
4.5. Выводы 153
Заключение 154
Список использованных источников 155
Приложение. Акт внедрения результатов диссертационной работы 163


