Введение
Глава 1. Общая характеристика проблемы интеллектуальной обработки текста 10
1.1.Предметная область 10
1.2. Общая характеристика направлений в области интеллектуальной обработки текста 14
1.3.Общая характеристика моделей представления и методов интеллектуальной обработки текста 24
1.4. Общая характеристика перспективных моделей представления и методов интеллектуальной обработки текста и сложность их применения в настоящее время 30
1.5.Общая характеристика задач и основная терминология интеллектуальной обработки текста 39
1.6. Постановка задачи 46
Выводы по главе 1 47
Глава 2. Выбор модели представления и методов интеллектуальной обработки текста 49
2.1. Выбор модели представления текста 49
2.2. Выбор метода первоначальной обработки текста и формы представления конечного результата 54
2.3. Выбор методов интеллектуальной обработки текста 63
2.4. Выбор метода кластеризации семантической сети и метода получения агрегирующих характеристик 81
2.5. Выбор метода иерархической кластеризации для формирования оглавления текста 84
Выводы по главе 2 86
Глава 3. Разработка методов и алгоритмов интеллектуальной обработки текста 88
3.1. Разработка методов кластеризации семантической сети и получения агрегирующих характеристик 88
3.2. Разработка алгоритма иерархической кластеризации и формирования оглавления текста 94
3.3. Разработка алгоритма синтеза заголовков выделенных разделов текста 98
3.4. Разработка алгоритма формирования связанного текста 101
Выводы по главе 3 105
Глава 4. Экспериментальное исследование методов и алгоритмов интеллектуальной обработки текста 107
4.1. Общее описание и характеристика эксперимента 107
4.2. Экспериментальное исследование метода получения агрегирующих характеристик 112
4.3. Экспериментальное исследование метода иерархической кластеризации и формирования структуры текста 123
4.4. Экспериментальное исследование метода синтеза заголовков выделенных разделов текста 128
4.5. Экспериментальное исследование метода формирования связанного текста 133
Выводы по главе 4 136
Заключение 137
Список использованной литературы 139


