Введение
Глава 1. Обзор методов категоризации текстовых документов 10
1.1. Формализация задачи 10
1.2. Автоматическая категоризация 11
1.3. Индексирование документов 12
1.4. Уменьшение размерности пространства признаков 14
1.5. Методы построения классификаторов 17
1.6. Оценка эффективности 26
1.7. Ансамбли классификаторов 29
1.8. Выводы 31
Глава 2. Разработка классификатора 32
2.1. Лексическая база WordNet 32
2.2. Методы разрешения лексической многозначности 37
2.3. Алгоритм разрешения лексической многозначности 47
2.4. Построение классификатора 53
2.5. Категоризация документов 61
2.6. Выводы 64
Глава 3. Программная реализация и экспериментальные исследования 66
3.1. Программная реализация 66
3.2. Эксперименты на коллекции «Reuters-21578» 72
3.3. Эксперименты на коллекции «Reuters Corpus Volume 1» 83
3.4. Анализ результатов и рекомендации 96
3.5. Выводы 99
Заключение 100
Литература


