Введение
1 Современные подходыкзадаче разделения дикторов 14
1.1 Акустические признаки 15
1.1.1 Мел-частотные кепстральные коэффициенты 16
1.1.2 Коэффициенты линейного предсказания 19
1.1.3 Перцепционные коэффициенты линейного предсказания . 22
1.1.4 Постобработка акустических признаков 24
1.2 Детектор речевой активности 29
1.3 Сегментация фонограммы 33
1.3.1 Баейсовский информационный критерий 34
1.3.2 Обобщенное отношение правдоподобия 36
1.3.3 Дивергенция Кульбака-Лейблера 37
1.4 Кластеризация речевых сегментов по дикторам 39
1.4.1 Построение голосовой модели диктора 40
1.4.2 Методы кластеризации дикторов 47
1.4.3 Метод кластеризации на основе VBA 49
1.5 Оценка эффективности систем разделения дикторов 51
1.6 Выводы 53
2 Система разделения дикторовнаоснове PLDA 55
2.1 Вероятностный линейный дискриминантный анализ 56
2.2 Модель PLDA задачи разделения дикторов 60
2.2.1 Оценка параметров PLDA 60
2.2.2 Результаты численных экспериментов 64
2.3 Кластеризация речевых сегментов 70
2.3.1 Модельный отбор 71
2.3.2 Кластеризация при известном числе дикторов 77
2.3.3 Алгоритм кластеризации 87
2.4 Выводы 89
3 Построение системы разделения дикторов 91
3.1 Методика оценки эффективности систем 92
3.1.1 Акустические базы 93
3.1.2 Критерии оценки эффективности 98
3.2 Построение опорной системы разделения дикторов на фонограмме 102
3.2.1 Акустические признаки 102
3.2.2 Детектор речевой активности 102
3.2.3 Поиск точек смены дикторов на фонограмме 104
3.2.4 Кластеризация речевых сегментов по дикторам 105
3.2.5 Схема алгоритма опорной системы 105
3.2.6 Результаты численных экспериментов 106
3.3 Выбор акустических признаков 109
3.4 Модуль сегментации фонограммы 111
3.5 Модуль кластеризации 114
3.5.1 Кластеризация при известном числе дикторов 114
3.5.2 Модельный отбор 119
3.6 Выводы 126
4 Программные средства системы разделения дикторов 128
4.1 Структура системы разделения дикторов 128
4.2 Технические характеристики системы 132
4.2.1 Поддерживаемые архитектуры и операционные системы 132
4.2.2 Количество потребляемой памяти 133
4.2.3 Быстродействие системы 135
4.3 Сравнительный анализ с системой LIUM 138
4.3.1 Описание системы LIUM 138
4.3.2 Потребление памяти и быстродействие 140
4.3.3 Оценка эффективности 140
4.4 Дальнейшая работа 141
4.5 Выводы 142
Заключение 145
Литература 147


