Введение
1 Анализ предметной области и постановка задач исследования 12
1.1 Проблема поиска информации в сети Интернет 12
1.2 Анализ Интернет-источников информации в области геоинформационных технологий 14
1.3 Анализ существующих Интернет-поисковых инструментов для ГИС-специалиста 18
1.4 Определение требований к эффективной информационно-поисковой системе по геоинформационной тематике 26
1.5 Выбор типа специализированной поисковой системы 29
1.6 Анализ инструментов создания специализированных систем на базе сбора коллекции документов из сети Интернет 33
1.7 Постановка задач исследования 35
1.8 Выводы к главе 1 38
2 Проектирование архитектуры специализированной информационно-поисковой системы 39
2.1 Проектирование каталога Интернет-ресурсов в области геоинформатики и смежных областей 39
2.2 Проектирование коллекции веб-документов 43
2.3 Разработка методики пополнения коллекции веб-документами с неизвестных Интернет-ресурсов 45
2.4 Разработка методики фильтрация и рубрикации документов на входе в коллекцию 46
2.5 Анализ геопространственного контекста веб-документов на входе в коллекцию 48
2.5.1 Геопространственный контекст информации и его значение 48
2.5.2 Методы определения геопространственного контекста 50
2.5.3 Пространственные поисковые запросы в информационно-поисковой системе 57
2.6 Проектирование интегратора новостной информации 58
2.7 Проектирование методики поиска информации в тематических онлайн-библиотеках 61
2.8 Проектирование методики поиска в сети Интернет файлов геопространственных данных 63
2.8.1 Форматы и размещение геоданных на веб-ресурсах 63
2.8.2 Распознавание файлов геоданных 64
2.9 Интегрированный поисковый интерфейс системы 65
2.10 Структурная схема ИПС 66
2.11 Выводы к главе 2 67
Реализаия модулей информационно-поисковой системы 68
3.1 Создание каталога Интернет-ресурсов в области геоинформационных технологий 68
3.1.1 Разработка структуры рубрикатора 68
3.1.2 Разработка структуры метаописания ресурса в каталоге 69
3.1.3 Разработка процедуры включения ресурсов в каталог и нормативов для модератора каталога 71
3.1.4 Разработка пользовательского интерфейса каталога 72
3.1.5 Разработка административного интерфейса каталога 75
3.1.6 Разработка функционала рейтингования ресурсов и отображения рейтингов 75
3.1.7 Разработка функционала проверки работоспособности ресурсов... 77
3.2 Разработка тематической коллекции веб-документов и алгоритмов ее
пополнения 77
3.2.1 Разработка архитектуры сетевых роботов 77
3.2.2 Разработка методики оценки релевантности веб-страницы 83
3.2.3 Разработка стратегии обхода поисковых слайдеров 88
3.3 Разработка модуля фильтрации и рубрикации документов на входе в
коллекцию 92
3.3.1 Методы автоматической классификации информации 93
3.3.2 Применение метода PrTFIDF для автоматического ру брицирования документов в веб-коллекции 98
3.4 Модуль анализа геопространственного контекста веб-документов 103
3.5 Создание модуля интеграции новостных потоков (агрегатора) 104
3.5.1 Считывание заголовков новостей в формате RSS 104
3.5.2 Считывание заголовков новостей напрямую с веб-страниц 105
3.5.3 Скачивание, фильтрация и рубрикация текстов новостей 107
3.5.4 Обработка новостного потока 108
3.6 Модуль поиска в онлайн-библиотеках 109
3.7 Разработка модуля поиска геопространственных данных 109
3.8 Разработка поисковой машины 112
3.9 Выводы к главе 3 117
Проведение экспериментальных исследований поисковой системы 118
4.1 Платформа реализации и инструментальные средства 118
4.2 Реализация модулей системы для проведения экспериментальных исследований 120
4.2.1 Структура ИПС 120
4.2.2 Интернет-каталог 121
4.2.3 Коллекция веб-документов 123
4.2.4 Новостной интегратор 127
4.2.5 Рурикатор информации 129
4.2.6 Коллекция геоданных 130
4.2.7 Интегрированный поисковый интерфейс системы 131
4.3 Экспериментальное исследование модуля «Интернет-каталог» 133
4.4 Экспериментальное исследование модуля «Новостной интегратор»... 137
4.5 Экспериментальное исследование модуля поиска геоданных 140
4.6 Экспериментальное исследование модуля рубрицирования 143
4.6.1 Описание эксперимента 143
4.6.2 Анализ результатов эксперимента 147
4.7 Исследование эффективности поискового слайдера 148
4.8 Исследование качества поиска в коллекции веб-документов 151
4.8.1 Описание эксперимента 151
4.8.2 Критерии оценки точности поиска 152
4.8.3 Анализ результатов эксперимента 154
4.9 Выводы к главе 4 156
Заключение 157
Список использованной литературы


