Метод автоматической кластеризации текстов, основанный на извлечении из текстов имен объектов и последующем построении графов совместной встречаемости ключевых термов

Шмулевич Марк Михайлович. Метод автоматической кластеризации текстов, основанный на извлечении из текстов имен объектов и последующем построении графов совместной встречаемости ключевых термов : диссертация ... кандидата физико-математических наук : 05.13.17 / Шмулевич Марк Михайлович; [Место защиты: Ин-т програм. систем РАН].- Москва, 2009.- 120 с.: ил. РГБ ОД, 61 09-1/576
Автор
Шмулевич Марк Михайлович
Год
2009
  • 99 000 UZS

Оглавление диссертации
Введение
Глава 1. Автоматическая кластеризация текстовых коллекций 13
1.1. Общая постановка задачи кластеризации текстовых коллекций 13
1.2. Кластеризация текстовых коллекций и классификация текстов 16
1.3. Анализ предметной области 24
1.4. Подход к кластеризации текстовых коллекций, содержащих сложные термы 43
Глава 2. Метод сущностной кластеризации 50
2.1. Выделение сущностей из текстов 50
2.2. Формирование множества ключевых термов 60
2.3. Построение графа совместной встречаемости термов 67
2.4. Итоговая кластеризация текстовых коллекций 71
Глава 3. Алгоритм сущностной кластеризации и его применения 78
3.1. Описание алгоритма сущностной кластеризации 78
3.2. Создание программной реализации алгоритма сущностной кластеризации 88
3.3. Тестирование алгоритма сущностной кластеризации 94
3.4. Применения метода сущностной кластеризации 95
Заключение 99
Список литературы 102
Приложение 107

Рекомендуем вам товары

99 000 UZS
Автор
Родюков Александр Витальевич
Количество страниц
Год
2009
99 000 UZS
Автор
Алфимцев Александр Николаевич
Количество страниц
Год
2008
Модули для Opencart 2, Опенкарт 3