Введение
ГЛАВА 1 реферирование как особый вид аналитико-синтетической переработки текста 15
1.1 Научный текст как объект реферирования 15
1.1.1 Первичные и вторичные документы 15
1.1.2 Текст и текстуальность 18
1.1.3 Лингвистическая специфика научной статьи 24
1.1.4 Структура научной статьи и возможность ее использования для построения реферата 31
1.2 Реферат как вид вторичного документа 34
1.2.1 Реферат и его функции 34
1.2.2. Критерии классификации рефератов 37
1.2.3 Методы интеллектуального реферирования 43
1.3 Методы и системы автоматической компрессии текстов 47
1.3.1 Системы автоматического индексирования 48
1.3.2 Типология систем и методов автоматического реферирования 51
1.3.3 Статистические методы автоматического реферирования 56
1.3.4 Позиционные методы автоматического реферирования 58
1.3.5 Современные системы автоматического реферирования 61
1.4 Учет «сильных» позиций научной статьи в процессе реферирования 67
Выводы к Главе 1 70
ГЛАВА 2 Разработка базовых принципов компрессии на основе сопоставительного анализа рефератов и научных статей 72
2.1 Процедура создания и характеристика структуры массива текстов авторских рефератов и научных статей
2.1.1 Процедура создания исследовательского массива текстов 72
2.1.2 Характеристика внешней структуры исследовательского массива текстов 74
2.1.3 Характеристика внутренней структуры исследовательского массива текстов 81
2.1.4 Характеристика текстов авторских рефератов и заглавий 83
2.2 Процедура выделения ключевых лексических единиц из заглавия и авторского реферата 85
2.2.1 Создание сводного словаря антипризнаков 85
2.2.2 Выделение простых именных групп из заглавия и авторского реферата 89
2.3 Характеристика именных групп, выделенных из заглавия и авторского реферата 92
2.3.1 Анализ именных групп, выделенных из заглавий научных статей 92
2.3.2 Анализ именных групп, выделенных из рефератов научных статей 97
2.4 Использование именных групп, выделенных из заглавия и авторского реферата, в тексте статьи 101
2.4.1 Анализ распределения именных групп разной длины в тексте статьи .101
2.4.2 Анализ распределения именных групп с разной степенью распространенности в тексте статьи 108
2.5 Выявление закономерностей распределения именных групп в тексте научной статьи 113
2.5.1 Анализ распределения именных групп по структурным разделам статьи 113
2.5.2 Оценка информативности именных групп 118
Выводы к Главе 2 123
ГЛАВА 3 Разработка и апробация алгоритмической модели реферирования научного текста 125
3.1 Понятие лингвистической модели компрессии и принципы ее разработки 125
3.1.1 Лингвистические проблемы моделирования процесса компрессии 125
3.1.2 Базовые компоненты модели процесса реферирования 130
3.1.3 Пример подсчета веса предложений 136
3.2 Программная реализация модели и оценка полученных результатов 145
3.2.1 Тестирование системы 145
3.2.2 Оценка качества автоматических рефератов 151
Выводы к Главе 3 155
Заключение 156
Список условных обозначений 160
Список литературы


