Введение
1. Методы автоматической кластеризации и формирования информационно-поисковых образов полнотекстовых документов 18
1.1. Задача автоматической кластеризации полнотекстовых документов 18
1.2. Обзор методов автоматической кластеризации полнотекстовых документов 24
1.3. Оценка качества автоматической кластеризации полнотекстовых документов 43
1.4. Задача формирования информационно-поисковых образов полнотекстовых документов 52
1.5. Статистические алгоритмы формирования информационно-поисковых образов полнотекстовых документов 54
Выводы по разделу 1 65
2. Метод автоматического формирования рубрикатора полнотекстовых документов 67
2.1. Формирование информационно-поисковых образов документов 68
2.2. Кластеризация информационно-поисковых образов документов 78
2.3. Преобразование множества кластеров в рубрикатор коллекции полнотекстовых документов 82
2.4. Оценка алгоритма кластеризации коллекции документов 85
Выводы по разделу 2 86
3. Программная реализация метода автоматического формирования рубрикатора документов и его исследования 88
3.1. Структура программного комплекса 88
3.2. Исследование предлагаемого метода на основе испытаний программной системы 92
3.3. Оценка эмпирических значений параметров формирования информационно-поисковых образов и их влияния на алгоритм кластеризации 96
3.4. Исследование процесса формирования вербальных описаний кластеров коллекции документов 107
3.5. Испытание способа формирования образов документов с применением предложенного алгоритма редукции пространства признаков 111
3.6. Испытание модифицированного алгоритма послойной кластеризации с оценкой эмпирических значений его входных параметров 117
3.7. Выводы по разделу 3 124
4. Испытание системы автоматического формирования рубрикатора полнотекстовых документов 125
4.1. Описание тестовой коллекции текстов 125
4.2. Испытание предлагаемого метода автоматического формирования рубрикатора коллекции полнотекстовых документов 128
Выводы 132
Список литературы 134


