Модели и методы поиска информационных ресурсов с использованием семантических технологий

Нгуен Ба Нгок. Модели и методы поиска информационных ресурсов с использованием семантических технологий : диссертация ... кандидата технических наук : 05.13.11 / Нгуен Ба Нгок; [Место защиты: Ин-т вычисл. математики и мат. геофизики].- Томск, 2012.- 198 с.: ил. РГБ ОД, 61 12-5/4267
Автор
Нгуен Ба Нгок
Год
2012
  • 99 000 UZS

Оглавление диссертации
Введение
ГЛАВА 1. Обзор моделей информационного поиска 13
1.1. Постановка задачи информационного поиска 14
1.2. Классические модели информационного поиска
1.2.1. Булевый поиск 17
1.2.2. Модель векторного пространства 18
1.2.3. Вероятностная модель 20
1.3. Дополнительные модели информационного поиска 24
1.3.1. Модель нечетких множеств 24
1.3.2. Модель обобщенного векторного пространства 28
1.4. Оценки эффективности системы информационного поиска 31
1.4.1. Полнота и точность 32
1.4.2. Нормализованное расстояние между результатами 38
1.5. Выводы 39
ГЛАВА 2. Применение семантических технологий в решении задачи поиска информации 42
2.1. Семантические технологии 42
2.1.1. Мотивация 42
2.1.2. Методы представления знаний 44
2.1.3. Классификация онтологии 46
2.2. Подходы поиска информации на основе семантики 50
2.2.1. Семантические методы, разрабатываемые в области информационного поиска 51
2.2.2. Методы семантического поиска, разрабатываемые в области создания семантической веб-сети 53
2.2.3. Классификации подходов семантического поиска 55
2.2.4. Ограничения подходов семантического поиска 58
2.3. Выводы 59
ГЛАВА 3. Предлагаемая модель семантического поиска информации на основе метаописаний
3.1. Семантическое обеспечение системы 61
3.1.1. Математическая модель онтологии предметной области 61
3.1.2. Семантические модели объектов знания 63
3.2. Логические представления документов и запросов 65
3.2.1. Набор триплетов 65
3.2.2. Концепция RDF-графов 66
3.3. Методы семантической близости 68
3.3.1. Оценка семантической близости между компонентами триплетов 69
3.3.2. Семантическая близость между триплетами 87
3.3.3. Семантическая близость между документами и запросами
3.4. Пример вычисления семантической близости 94
3.5. Оптимизация обработки запросов 96
3.6. Выводы 98
ГЛАВА 4. Архитектура системы семантического поиска 100
4.1. Общая схема процесса поиска информации 100
4.2. Формирование метаописаний
4.2.1. Ручное формирование метаописаний 102
4.2.2. Полуавтоматическое формирование метаописаний 102
4.3. Структуры индексов и алгоритмы индексирования 112
4.3.1. Поиск элементов онтологии с помощью SPARQL-запросов 115
4.3.2. Оптимизация хранения триплетов с использованием числовых идентификаторов 116
4.3.3. Индексирования базы знания с помощью системы Lucene 119
4.3.4. Представление онтологии предметной области в виде графа... 121
4.3.5. Индексирование метаописаний 124
4.4. Программная реализация 129
4.5. Выводы 131
ГЛАВА 5. Исследования алгоритмов 133
5.1. Метод оптимизации хранения набора триплетов 133
5.1.1. Эксперимент 1: объем оперативной памяти 133
5.1.2. Эксперимент 2: время поиска триплета 135
5.2. Алгоритмы вычисления семантической близости 136
5.2.1. Эксперимент 3: оценка близости между понятиями 136
5.2.2. Эксперимент 4: близость между метаописаниями 142
5.4. Выводы 153
Заключение 154
Литература

Рекомендуем вам товары

99 000 UZS
Автор
Ейбоженко, Дмитрий Анатольевич
Количество страниц
Год
2012
99 000 UZS
Автор
Романников, Дмитрий Олегович
Количество страниц
Год
2012
99 000 UZS
Автор
Махнычев, Владимир Сергеевич
Количество страниц
Год
2012
99 000 UZS
Автор
Сеньков, Алексей Викторович
Количество страниц
Год
2012
Модули для Opencart 2, Опенкарт 3