Введение
ГЛАВА 1. Исследование вопросов состояния и развития технологий автоматической обработки и классификации текстов 12
1.1 Проблемы и задачи автоматической обработки текстов 12
1.2 Постановка и этапы решения задачи классификации 17
1.3 Методы классификации текстов 22
1.4 Меры близости текстов 32
Выводы к главе 45
ГЛАВА 2. Математическое моделирование задачи автоматической классификации текстов (на примере их отнесения к определенной возрастной аудитории) 47
2.1 Формальное представление категории и текста 47
2.2 Математическое представление задачи классификации 49
2.3 Признаковое пространство 54
2.4 Оценивание близости текстов 59
Выводы к главе 67
ГЛАВА 3. Программный комплекс для автоматической классификации текстов 68
3.1 Основные функции системы 68
3.2 Архитектура программного комплекса 69
3.3 Модуль хранения текстов 71
3.4 Модуль семантико-синтаксического анализа 90
3.5 Модуль классификации 98
3.6 Сравнительная характеристика программ классификации текстов 106
3.7 Вычислительный эксперимент 110
Выводы к главе 119
Заключение 120
Список литературы 120


