Введение
ГЛАВА 1 . Обзор методов и систем распознавания дикторов 11
1.1. Классификация систем определения индивидуальности говорящего по речи 11
1.1.1. Идентификация и верификация 12
1.1.2. Групповая идентификация 16
1.1.3. Текстозависимые и текстонезависимые распознавание 16
1.1.4. Автоматические и экспертные системы 18
1.2. Научная сторона проблемы 20
1.2.1. Различительные признаки 20
1.2.2. Способы описания речевого сообщения в целом 28
1.2.3. Проблема эталона и его обновление 30
1.2.4. Решающие правила 30
1.2.5. Шумы, помехи, искажения 33
1.3. Критерии эффективности систем верификации 34
1.4. Обзор современных программных продуктов .... 38
1.4.1. CAVE 39
1.4.2. PICASSO 40
1.4.3. CV-UCP 42
1.4.4. SpeakEZ 42
1.5. Основные проблемы создания систем распознавания дикторов 43
1.6. Выводы 44
ГЛАВА 2. Методы построения признаковых описаний в задаче автоматического распознавания дикторов 46
2.1. Ввод речи и ее цифровое представление 46
2.2. Предварительная обработка и выделение первичных признаков... 47
2.2.1. Дискретное преобразование Фурье. 48
2.2.2. Цифровые фильтры 49
2.2.3. Использование оконных функций 53
2.3. Нормализация уровня сигнала 55
2.4. Выделение границ фразы 56
2.5. Методы получения признакового описания сигнала 61
2.5.1. Спектральные методы 61
2.5.2. Коэффициенты линейного предсказания 63
2.5.3. Кепстральное описание 66
2.6. Выделение наиболее информативных характеристик 69
2.6.1. Последовательный прямой поиск (ППП) 70
2.6.2. Последовательный обратный поиск (ПОП) 70
2.7. Выводы 71
ГЛАВА 3 . Основные математические модели принятия решений в задачах распознавания дикторов 73
3.1. Системы распознавания дикторов, основанные на сопоставлении с эталонами 73
3.2. Мера сходства речевого сигнала с эталоном 74
3.2.1. Статистический подход 74
3.2.2. Некоторые меры сходства 76
3.3. Линейное выравнивание времени 77
3.4. Алгоритм динамического искажения времени(ДИВ) 78
3.4.1. Описание алгоритма ДИВ 78
3.4.2. Принцип оптимизации Беллмана и Динамическое программирование 82
3.4.3. Симметричный алгоритм ДИВ 86
3.4.4. Алгоритм поиска глобального наименьшего маршрута 87
3.4.5. Ассиметричный алгоритм ДИВ 88
3.5. Скрытые марковские модели 92
3.5.1. Статистическое распознавание речи 92
3.5.2. Структура системы распознавания СММ 94
3.5.3. Вычисление вероятности появления последовательности наблюдений в СММ 96
3.5.4. Обучение СММ 99
3.5.5. Распознавание при помощи СММ 100
3.5.6. Архитектура системы распознавания дикторов на основе CMM 101
3.6. Нейронные сети 104
3.6.1. Алгоритм обратного распространения ошибки 106
3.6.2. Алгоритм обучения RProp ПО
3.6.3. Полносвязная нейронная сеть 112
3.6.4. Нейронная сеть с локальными связями 114
3.7. Векторное квантование и построение кодовой книги при решении задач текстонезависимой верификаций/идентификации 116
3.7.1. Меры искажения 118
3.7.2. Алгоритмы построения эталона 119
3.7.3. Идентификация по кодовой книге 123
3.8. Выводы 125
ГЛАВА 4. Модели устранения влияния шумового окружения в задачах распознавания дикторов 127
4.1. Классификация помех в речевом канале 127
4.2. Методы оптимальной фильтрации в задаче подавления стационарных шумовых помех 128
4.3. Спектральное вычитание 131
4.3.1. Метод 131
4.3.2. Описание алгоритма 133
4.4. Методы адаптивной фильтрации в задаче шумоочистки речевых сигналов 133
4.5. Wavelet-преобразование в задаче шумоочистки речевых сигналов 136
4.5.1. Использование дискретного вейвлет-преобразования для подавления шумов в речевом сигнале 137
4.5.2. Совместное использование вейвлет-преобразования и оптимальной фильтрации 142
4.6. Выводы 143
ГЛАВА 5. Экспериментальные исследования 144
5.1. Цели и задачи экспериментов 144
5.2. Исследование методов верификации дикторов на основе использования нейронных сетей 145
5.2.1. Общая схема разработанной системы верификации для НС. 145
5.2.2. Выбор речевых характеристик 147
5.2.3. Выделение наиболее информативных фарактеристик 150
5.2.4. Исследование структуры НС 151
5.2.5. Исследование влияния размера входного слоя НС 152
5.3. Исследование свойств алгоритмов динамического искажения времени (ДИВ) 153
5.3.1. Выбор метрики расстояния 154
5.3.2. Исследование влияния параметра степени искажения ДИВ на качество верификации 158
5.3.3. Исследование методов параметризации речевых сигналов на основе алгоритма динамического искажения времени 159
5.4. Экспериментальное исследование верификации дикторов на основе использования скрытых марковских моделей (СММ) 162
5.4.1. Выходные параметры системы " НММ Person Verification"... 162
5.4.2. Оценка эффективности системы верификации критерий принятия решения в системе " НММ Person Verification " 163
5.4.3. Исследование методов уменьшения числа гипотез при работе алгоритма Витерби 169
5.4.4. Выбор топологии СММ 174
5.4.5. Исследование влияния числа итераций при обучении на качество верификации 175
5.5. Результаты исследования идентификации дикторов на основе использования векторного квантования (ВК) 176
5.5.1. Исследование зависимости времени работы алгоритмов идентификации и построения кодовой книги от ее размера 176
5.6. Сравнительные результаты тестирования различных систем верификации дикторов 181
5.7 . Исследование влияния шумовых помех на эффективность распознавания дикторов 182
5.8. Выводы 192
ГЛАВА 6. Разработка программного обеспечения для решения задач распознавания дикторов 194
6.1. "Neuro-D" - программа для верификации дикторов на основе модели нейронной сети 194
6.2. "DWT-speech" - программа для исследования моделей динамического искажения времени 197
6.3. " НММ Person Verification" - программа для моделирования распознавания дикторов на основе использования скрытых марковских моделей 199
6.4. Реализация системы "VC - recognition" для автоматической идентификации диктора на основе векторного квантования 201
6.4.1. Особенности реализации 201
6.4.2. Пользовательский интерфейс 202
Заключение 205
Список литературы 207
Приложение


