Введение
Глава 1. Основные методы автореферирования 11
1.1 Экстрагирующие методы 17
1.2 Абстрагирующие методы 20
1.3 Гибридные методы 24
1.4 Выводы по главе 1 27
Глава 2. Основные понятия и постановка задачи построения тематических моделей 29
2.1 Построение модели текста 29
2.2 Построение тематической модели коллекции документов 31
2.3 Проблема согласования многословных терминов 35
2.4 Выводы по главе 2 39
Глава 3. Гибридный метод автоматического построения аннотаций научных текстов 40
3.1 Построение униграммных и расширенных тематических моделей 41
3.1.1 Выбор алгоритма тематического моделирования 41
3.1.2 Извлечение многословных терминов 43
3.1.3 Алгоритм построения расширенных тематических моделей 45
3.2 Риторический анализ и преобразования графов 47
3.2.1 Формальное описание преобразования текста 48
3.3 Операция сглаживания 52
3.4 Применение предложенных методов для обработки текстов на тюркских языках 55
3.4.1 Особенности морфологического анализа 55
3.4.2 Особенности синтаксического и риторического анализа 59
3.5 Выводы по главе 3 67
Глава 4. Оценка эффективности разработанных методов 69
4.1 Оценка тематических моделей и качества извлечения ключевых терминов 69
4.2 Оценка результатов реферирования 77
4.2.1 Метрика Rouge 77
4.2.2 Метрика RAV 78
4.2.3 Экспертная оценка 79
4.2.4 Точность, полнота, F-мера 79
4.3 Выводы по главе 4 80
Заключение 82
Список сокращений и условных обозначений 84
Литература 86
Приложения 97


