Введение
Глава 1. Современное состояние проблемы автоматического сводного реферирования текста 13
1.1. Актуальность задачи автоматического реферирования текста 13
1.2. Реферати аннотация : 15
1.3. Постановка задачи реферирования текста 17
1.4. Обзор методов автоматического реферирования текста 19
1.5. Современные системы автоматического реферирования текста 40
1.6. Особенности сводного автоматического реферирования 41
1.7. Обзор методов сводного автоматического реферирования 43
1.8. Современные системы автоматического сводного реферирования 46
1.9. Постановка задачи исследования диссертационной работы 48
1.10. Выводы по Главе 1 50
Глава 2. Разработка метода тематического связанного ранжирования для задач сводного реферирования 52
2.1. Метод Manifold Ranking 52
2.2. Использование метода Manifold Ranking для задачи сводного реферирования 55
2.3. Использование метода Manifold Ranking для задачи сводного реферирования новостных кластеров на русском языке
2.4. Подбор параметров метода Manifold Ranking 59
2.5. Модифицированный метод Manifold Ranking 62
2.6. Подход к описанию модели кластера документа на основе тематической связности 68
2.7. Метод тематического связного ранжирования
2.7.1. Ранжирование на основе меры лексической близости предложений 73
2.7.2. Ранжирование на основе меры лексической близости предложений с учетом более сложных лингвистических критериев 74
2.7.3. Ранжирование с учетом нелинейности текста, как связной структуры на основе метода Manifold Ranking
2.7.4. Метод построения графа тематической связности 78
2.7.5. Метод формирования сводного реферата на основе графа тематической связности 80
2.8. Выводы по Главе 2. 82
Глава 3 Разработка алгоритма, автоматического сводного реферирования научно-технических Информационных сообщений 85
3.1. Обобщенный алгоритм автоматического сводного реферирования научно-технических информационных сообщений 85
3.2. Выбор способа формулировки тем 90
3.2.1. Использование заголовков документов в качестве формулировок основных тем коллекции документов 91
3.2.2. Использование шаблонных фраз как формулировок основных тем коллекции документов 3.3. Предварительный анализ текста 93
3.4. Модель и алгоритм вычисления TF-меры с учетом связей понятий по тезаурусу 97
3.5. Алгоритм формирования связного текста сводного реферата на основе графа тематической связности 100
3.6. Выводы по Главе 3 104
Глава 4. Исследование эффективности метода тематического связного ранжирования 105
4.1. Основные подходы к функциональной оценке качества систем реферирования 105
4.2. Экспертные ручные оценки качества реферирования 106
4.3. Метрика ROUGE-RUS
4.3.1. Метрика ROUGE-N 107
4.3.2. Метрика ROUGE-L 107
4.3.3. Метрика ROUGE-RUS для кластеров на русском языке
4.4. Описание эксперимента по оценке 109
4.5. Достоверность экспертных оценок и корреляция между критериями 111
4.6. Результаты оценки 115 4.7. Оценка производительности 120
4.8. Выводы по Главе 4 121
Глава 5. Программный комплекс «MDS Evaluation» 123
5.1. Общая концепция организации программного комплекса автоматического сводного реферирования 123
5.2. Программный комплекс для автоматического сводного реферирования «MDS Evaluation» 124
5.3. Архитектура ПК «MDS Evaluation» 125
5.4. Пользовательский интерфейс ПК «MDS Evaluation» 130
5.5. Пример работы ПК «MDS Evaluation» 130
5.6. Оценка эффективности ПК «MDS Evaluation» 130
5.7. Выводы по Главе 5 132
Заключение 134
Список литературы


