Введение
ГЛАВА 1. Обзор моделей информационного поиска 13
1.1. Постановка задачи информационного поиска 14
1.2. Классические модели информационного поиска
1.2.1. Булевый поиск 17
1.2.2. Модель векторного пространства 18
1.2.3. Вероятностная модель 20
1.3. Дополнительные модели информационного поиска 24
1.3.1. Модель нечетких множеств 24
1.3.2. Модель обобщенного векторного пространства 28
1.4. Оценки эффективности системы информационного поиска 31
1.4.1. Полнота и точность 32
1.4.2. Нормализованное расстояние между результатами 38
1.5. Выводы 39
ГЛАВА 2. Применение семантических технологий в решении задачи поиска информации 42
2.1. Семантические технологии 42
2.1.1. Мотивация 42
2.1.2. Методы представления знаний 44
2.1.3. Классификация онтологии 46
2.2. Подходы поиска информации на основе семантики 50
2.2.1. Семантические методы, разрабатываемые в области информационного поиска 51
2.2.2. Методы семантического поиска, разрабатываемые в области создания семантической веб-сети 53
2.2.3. Классификации подходов семантического поиска 55
2.2.4. Ограничения подходов семантического поиска 58
2.3. Выводы 59
ГЛАВА 3. Предлагаемая модель семантического поиска информации на основе метаописаний
3.1. Семантическое обеспечение системы 61
3.1.1. Математическая модель онтологии предметной области 61
3.1.2. Семантические модели объектов знания 63
3.2. Логические представления документов и запросов 65
3.2.1. Набор триплетов 65
3.2.2. Концепция RDF-графов 66
3.3. Методы семантической близости 68
3.3.1. Оценка семантической близости между компонентами триплетов 69
3.3.2. Семантическая близость между триплетами 87
3.3.3. Семантическая близость между документами и запросами
3.4. Пример вычисления семантической близости 94
3.5. Оптимизация обработки запросов 96
3.6. Выводы 98
ГЛАВА 4. Архитектура системы семантического поиска 100
4.1. Общая схема процесса поиска информации 100
4.2. Формирование метаописаний
4.2.1. Ручное формирование метаописаний 102
4.2.2. Полуавтоматическое формирование метаописаний 102
4.3. Структуры индексов и алгоритмы индексирования 112
4.3.1. Поиск элементов онтологии с помощью SPARQL-запросов 115
4.3.2. Оптимизация хранения триплетов с использованием числовых идентификаторов 116
4.3.3. Индексирования базы знания с помощью системы Lucene 119
4.3.4. Представление онтологии предметной области в виде графа... 121
4.3.5. Индексирование метаописаний 124
4.4. Программная реализация 129
4.5. Выводы 131
ГЛАВА 5. Исследования алгоритмов 133
5.1. Метод оптимизации хранения набора триплетов 133
5.1.1. Эксперимент 1: объем оперативной памяти 133
5.1.2. Эксперимент 2: время поиска триплета 135
5.2. Алгоритмы вычисления семантической близости 136
5.2.1. Эксперимент 3: оценка близости между понятиями 136
5.2.2. Эксперимент 4: близость между метаописаниями 142
5.4. Выводы 153
Заключение 154
Литература


