Методы и модели распознавания русской речи в информационных системах

Гусев Михаил Николаевич. Методы и модели распознавания русской речи в информационных системах: диссертация ... кандидата технических наук: 05.13.10 / Гусев Михаил Николаевич;[Место защиты: Санкт - Петербургский государственный университет телекоммуникаций им . проф . М . А . Бонч - Бруевича].- Санкт-Петербург, 2014.- 378 с.
Автор
Гусев Михаил Николаевич
Год
2014
  • 99 000 UZS

Оглавление диссертации
Введение
Глава I. Основные методы, модели и алгоритмы распознавания речи 21
1.1 Классификация систем распознавания речи 21
1.2 Этапы распознавания речи 23
1.2.1 Членение речевого потока 24
1.2.2 Вычисление акустических признаков 24
1.2.3 Сравнение со звуковыми моделями 25
1.2.4 Способы определения произнесения слов не из словаря системы47
1.2.5 Языковые модели 49
1.3 Выбор структуры системы 53
1.4 Выводы 55
Глава 2. Построение моделей звуков речи и подготовка речевых баз 56
2.1 Модели звуков речи 56
2.1.1 Классификация звуков речи 57
2.1.2 Именование звуков речи 61
2.1.3 Структура скрытых Марковских моделей звуков речи 62
2.1.4 Оптимизация структур моделей звуков речи 68
2.1.5 Результаты моделирования 75
2.2 Аннотирование речевой базы 76
2.2.1 Основные этапы формирования аннотации 76
2.2.2 Подготовительный этап 77
2.2.3 Формирование идеальных транскрипций 77
2.2.4 Предварительное обучение системы распознавания 84
2.2.5 Транскрипционное моделирование 85
2.2.6 Циклический этап 90
2.2.7 Коррекция границ звуков 91
2.2.8 Завершающий этап 94
2.2.9 Особенности предложекнного способа 95
2.3 Экспериментальная проверка 96
2.4 Выводы 97
Глава 3. Статистическая модель речи 99
3.1 Альтернативы 100
3.2 Сущность статистической модели 104
3.2.1 Общие положения 104
3.2.2 Общая структура статистической модели 104
3.3 Реализация статистической модели речи 110
3.3.1 Генерация последовательностей 110
3.3.2 Статистика о составе населения и ТД 112
3.3.3 Генерация выборки звуков 113
3.3.4 Определение длительностей звуков 114
3.3.5 Наложение интонационных контуров 116
3.4 Звуковые базы 119
3.4.1 Аллофонная звуковая база 120
3.4.2 Базы слитной речи 130
3.5 Особенности статистической модели 137
3.6 Области применения 138
3.6.1 Синтез речи 138
3.6.2 Оценка качества речевых сигналов 139
3.6.3 Исследование свойств речевых сигналов 140
3.7 Выводы 141
Глава 4. Моделирование длительности звуков речи 142
4.1 Основные причины вариативности длительности звуков 142
4.2 Зависимость вероятности появления фонем от их длительности 145
4.3.Учет длительностей в алгоритме распознавания 152
4.4 Оптимизация процесса распознавания 157
4.5 Результаты экспериментов 159
4.6 Развитие модели 160
4.7 Результаты экспериментов на расширенной модели 167
4.8 Выводы 167
Глава 5. Психоакустическая модель 169
5.1 Свойства звуковых сигналов и особенности их восприятия 169
5.1.1 Чувствительность слухового анализатора 170
5.1.2 Амплитудное распределение 180
5.1.3 Временные свойства слухового анализатора 181
5.1.4 Эффекты маскировки и критические полосы слуха 186
5.1.5 Временные характеристики речевого сигнала 189
5.2 Реализация психоакустической модели 191
5.3 Применение психоакустической модели в распознавании речи 201
5.4 Выводы 203
Глава 6. Речевая аналитика 205
6.1 Возможные подходы к построению системы 205
6.2 Основные элементы разработанной системы поиска ключевых слов 209
6.3 Минимизация фонетической сети 210
6.4 Режимы работы системы 215
6.5 Критерии оценки качества системы 220
6.6 Результаты тестирования 221
6.7 Выводы 222
Глава 7. Оценка качества передачи речевых сигналов 224
7.1 Классификация методов оценки качества звука 227
7.2 Обоснование необходимости разработки новых методов 228
7.3 Метод AQuA 230
7.4 Метод NIQA 251
7.5 Метод RecQual 260
7.6 Выводы 266
Заключение 267
Основные сокращения 273
Основные термины 275
Использованная литература 280
Приложения 298

Рекомендуем вам товары

99 000 UZS
Автор
Досмухамедов Булат Рамильевич
Количество страниц
Год
2014
99 000 UZS
Автор
Евса, Яна Михайловна
Количество страниц
Год
2014
99 000 UZS
Автор
Ерашова, Оксана Валентиновна
Количество страниц
Год
2014
Модули для Opencart 2, Опенкарт 3