Введение
Глава 1: Критический анализ существующих методов представления и классификации текстов 14
1.1 Методы представления текстов 14
1.1.1 Статистический метод TF-IDF 14
1.1.2 Векторное представление слов
1.2 Байесовский метод для классификации текстов 18
1.3 Метод Роччио 21
1.4 Метод «К» ближайших соседей 22
1.5 Метод опорных векторов 24
1.6 Логистическая регрессия
1.6.1 Бинарная логистическая регрессия 28
1.6.2 Мультиномиальная логистическая регрессия - Softmax 29
1.7 ЕМ-алгоритм 29
1.7.1 Функция правдоподобия 30
1.7.2 ЕМ-алгоритм 30
1.8 Скрытая марковская модель 31
1.8.1 Марковская модель 31
1.8.2 Скрытая марковская модель 34
1.8.3 Алгоритм прямого-обратного хода 34
1.8.4 Алгоритм Витерби 36
1.9 Латентно-семантический анализ 42
1.9.1 Латентно-семантический анализ с использованием нейрон
1.9.2 Вероятностный латентно-семантический анализ 46
1.10 Рекурсивный автоэнкодер 48
1.11 Свёрточные нейронные сети для классификации текстов 51
1.12 Рекуррентные нейронные сети для классификации текстов 52
1.13 Выводы 54
Глава 2: Анализ методов глубокого обучения посредством искусственных нейронных сетей для обработки и классификации текстов 56
2.1 Многослойные нейронные сети 59
2.2 Метод обратного распространения ошибки 62
2.3 Метод стохастического градиента 64
2.4 Автоэнкодер
2.4.1 Скрытые признаки и глубинное обучение 65
2.4.2 Автоэнкодер 66
2.5 Свёрточная нейронная сеть 70
2.5.1 Свёртка 71
2.5.2 Субдискретизация 72
2.5.3 Обучение свёрточной нейронной сети 72
2.5.4 Преимущества свёрточной нейронной сети 74
2.6 Рекуррентная нейронная сеть 75
2.6.1 Long Shorterm Memory 76
2.7 Выводы 78
Глава 3: Математическое и алгоритмическое обеспечение вычислительного комплекса-классификатора текстов с использованием морфологического анализа и нейро-семантических сетей 80
3.1 Разработка метода морфологического анализа текстов 81
3.1.1 Структура морфологического словаря 84
3.1.2 Морфологический разбор 85
3.1.3 Разрешение морфологической многозначности 86
3.2 Разработка математического и алгоритмитического обеспечения
вычислительного комплекса семантической нейронной сети 88
3.3 Разработка математического и алгоритмитического обеспечения вычислительного комплекса рекурсивного автоэнкодера морфологического анализа 93
3.4 Разработка метода «К» ближайших соседей с использованием двоичного дерева 97
3.5 Выводы 100
Глава 4: Экспериментальное исследование вычислительного комплекса классификатора текстов 101
4.1 Разработка программного обеспечения вычислительного комплекса-классификатора текстов с использованием морфологического анализа и нейро-семантических сетей 101
4.2 Эксперименты и оценка результатов
4.2.1 Метод оценки результатов экспериментов 107
4.2.2 Экспериментальное исследование нейро-семантической сети на основе морфологического анализа 108
4.2.3 Экспериментальное исследование рекурсивного автоэнкодера морфологического анализа 110
4.2.4 Экспериментальное исследование алгоритма «К» ближайших соседей с использованием двоичного дерева 112
4.3 Выводы 113
Заключение
Список литературы


