Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств

Шалимов Игорь Анатольевич. Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств : дис. ... д-ра техн. наук : 05.13.17 Москва, 2005 241 с. РГБ ОД, 71:06-5/528
Автор
Шалимов Игорь Анатольевич
Год
2005
  • 99 000 UZS

Оглавление диссертации
Введение
ГЛАВА 1. Анализ систем кодирования речи и формулировка проблемы повышения эффективности параметрического кодирования 24
1.1. Методы кодирование речевого сигнала 24
1.2. Кодирование формы волны речевого сигнала 29
1.3. Кодирование речи в гибридных кодерах 31
1.3.1. Рекомендация ITU-T G.723 (MP-MLQ) 34
1.3.2. Рекомендация ITU-T G.728 (Long-Delay CELP) 37
1.3.3. Рекомендация ITU-T G.729 (CS-ACELP) 40
1.3.4. Алгоритмы кодирования с частотным разбиением (SBC,ATC) 43
1.3.5. Алгоритм кодирования с многополосным возбуждением (МВЕ, 1МВЕ,АМВЕ) 45
1.4. Принципы передачи речи с переменной скоростью 55
1.4.1. Кодирование речи с переменной скоростью на основе фонетической классификации 57
1.4.2. Кодирование речи с переменной скоростью на основе энергетической классификации 61
1.4.3. Кодирование речи с переменной скоростью, обеспечивающее постоянное качество синтезируемой речи 62
1.5. Речеэлементное кодирование 66
1.6. Выводы по главе, формулировка и декомпозиция проблемы повышения эффективности параметрического кодирования речи 68
ГЛАВА 2. Построение математической модели эффективного кодирования речи 75
2.1. Описание обобщенной модели параметрического кодирования речи 75
2.2. Построение сегментно-аппроксимационной модели параметрического кодирования речи и формулировка критериев эффективности 78
2.2.1. Критерий точности аппроксимации 81
2.2.2. Оценка минимальной скорости передачи в сегментно-аппроксимационной модели кодирования 82
2.2.3. Достоинства и недостатки сегментно-аппроксимационной модели кодирования 84
2.3. Математическое определение модели параметрического кодирования речи на основе теоретико-информационного подхода 85
2.3.1. Критерий точности аппроксимации 89
2.3.2. Оценка минимальной скорости передачи в сегментно-трансформационной модели кодирования 92
2.4. Выводы по главе 93
ГЛАВА 3. Разработка автоматической системы оценки качества синтезированной речи 96
3.1. Анализ проблемы автоматического оценивания качества телефонных передач 99
3.2. Применение математического аппарата нейронных сетей для автоматической оценки качества синтезированной речи 104
3.2.1. Анализ нейросетевых технологий 104
3.2.2. Применение нейронных LVQ-сетей для автоматической оценки качества синтезированной речи 109
3.2.3. Формирование обучающих сигналов для принятия решения об оценке качества речевого сигнала 112
3.2.4. Реализация системы автоматической оценки качества синтезированной речи 114
3.3. Выводы по главе 117
ГЛАВА 4. Разработка принципов кодирования, использующих корреляционные свойства квазипериодической структуры речи 118
4.1. Анализ квазипериодических свойств речевых сигналов на вокализованных сегментах и формулировка метода параметрического компандирования речи на базе сегментно- трансформационной модели кодирования 119
4.2. Классификация вокализованных, невокализованных сегментов и пауз речевого сигнала применительно к проблеме кодирования на основе квазипериодических свойств речевых сигналов 126
4.2.1 Особенности задачи классификации типа сегмента применительно к проблеме кодирования на основе квазипериодических свойств речевых сигналов 126
4.2.2. Классификация вокализованных сегментов и оценка периода основного тона 128
4.2.3. Решение задачи классификации невокализованных сегментов и пауз речи 137
4.3. Минимизация множества векторов параметров сигнала на периоде основного тона в соответствии с сегментно- трансформационной моделью 143
4.3.1. Метод выделения сигнала на одном периоде основного тона в начале интервала анализа 143
4.3.2. Выбор модели параметрического кодера для синтеза речевого сигнала на периоде основного тона 145
4.3.3. Анализ корреляционных свойств сигнала возбуждения для сигнала на одном периоде основного тона 146
4.3.4. Применение нейронных сетей для кластеризации множества векторов параметров 149
4.3.4.1. Кластеризация множества векторов возбуждения 149
4.3.4.2. Поиск вектора - лидера 152
4.3.4.3. Определение класса произвольного вектора 153
4.4. Анализ функции преобразования параметров при синтезе речи на базе сегментно-трансформационной модели 156
4.4.1. Исследования изменения величины периода основного тона за интервал анализа 156
4.4.2. Исследования изменения энергии сигнала на периоде основного тона за интервал анализа 157
4.4.3. Интерполяция параметров предсказания 159
4.5. Выводы по главе 161
ГЛАВА 5. Практическая реализация теоретико-информационных принципов кодирования на основе квазипериодических свойств речи 163
5.1. Реализация разработанных принципов кодирования в кодерах с многоимпульсным возбуждением 163
5.1.1. Анализатор кодера переменной скорости с векторным кодированием сигнала многоимпульсного возбуждения на периоде основного тона 163
5.1.2. Синтезатор кодера переменной скорости с векторным кодированием сигнала многоимпульсного возбуждения на периоде основного тона 169
5.1.3. Результаты тестовых испытаний кодера переменной скорости с векторным кодированием сигнала многоимпульсного возбуждения на периоде основного тона 172
5.2. Реализация разработанных принципов кодирования в кодерах с возбуждением от остатка предсказания 175
5.2.1. Анализ кодера речи RPE-LTP 175
5.2.2. Исследование остаточных сигналов алгоритма RPE-LTP и разработка метода кодирования с использованием квазипериодических свойств речи 179
5.2.3. Реализация кодера переменной скорости с векторным кодированием сигнала погрешности предсказания на периоде основного тона 182
5.2.4. Результаты тестовых испытаний кодера переменной скорости с векторным кодированием сигнала погрешности предсказания на периоде основного тона 185
5.3. Кодирование параметров синтезирующего фильтра модели речеобразования 187
5.4. Выводы по главе 191
Заключение 193
Направления дальнейших исследований 196
Литература

Рекомендуем вам товары

99 000 UZS
Автор
Никоноров Артем Владимирович
Количество страниц
Год
2005
99 000 UZS
Автор
Шлумпер Леонид Олегович
Количество страниц
Год
2005
99 000 UZS
Автор
Хаджинов Александр Александрович
Количество страниц
Год
2005
99 000 UZS
Автор
Савочкин Егор Александрович
Количество страниц
Год
2005
99 000 UZS
Автор
Жуковская Наталья Константиновна
Количество страниц
Год
2004
Модули для Opencart 2, Опенкарт 3