Введение
1. Аналитический обзор методов и стратегий поиска текстовой информации. Системы обработки текста документов 13
1.1. Задача поиска по текстам документов 13
1.2. Классификация методов полнотекстового поиска 16
Методы классического поиска (без использования контекстной информации) 17
Использование контекстной информации 24
2. Метод поиска 45
2.1. Описание метода обработки статистической сочетаемости слов 45
2.2. Статистическое выявление устойчивых сочетаний слов 49
2.3. Объединение схожих по написанию форм слов 58
2.4. Обработка данных о статистической сочетаемости слов 61
2.5. Группирование текстов по спискам устойчивых сочетаний слов .65
2.6. Выполнение естественно-языкового поискового запроса 68
Краткие выводы 70
3. Алгоритмы обработки текста документов и запросов, реализующие метод поиска 71
3.1. Подготовка документов к обработке и их хранение 71
3.2. Заполнение словаря 73
3.3. Статистическое выявление устойчивых сочетаний слов 78
3.4. Обработка данных о статистической сочетаемости слов 83
3.5. Группирование текстов по спискам связности слов 86
3.6. Определение соответствия текста поисковому запросу 89
4. Программная реализация поискового метода и ее испытания 91
4.1. Описание программной реализации 91
4.2. Описание тестового набора текстов 98
4.3. Определение эмпирических пороговых значений и коэффициентов 99
4.4. Экспериментальные оценки требуемых ресурсов при реализации разработанного метода 109
4.5. Оценка качественных и количественных показателей разработанного метода поиска 118
4.6. Сравнительная оценка ресурсоемкости разработанной поисковой системы 134
Краткие выводы 145
Основные выводы 147
Список литературы


