Введение
Глава 1. Проблемно-ориентированное исследование и разработка модели задачи тематической сегментации научных текстов 10
1.1. Место задачи тематической сегментации научных текстов в общей структуре процесса проектирования технических систем 10
1.2 Анализ профессиональных интернет-форумов как предметной области для тематической сегментации 21
1.3 Анализ научной прозы как предметной области для тематической сегментации 28
1.4. Разработка проблемно-ориентированной модели задачи тематической сегментации научных текстов 34
1.5 Постановка задач диссертационного исследования 45
Выводы по главе 1 45
Глава 2. Разработка методики отбора и настройки параметров машинного обучения для тематической сегментации научных текстов 48
2.1. Разработка методики отбора и настройки параметров модели тематической сегментации для профессиональных интернет-форумов 48
2.1.1. Формирование и разметка обучающей выборки 48
2.1.2. Отбор признаков для машинного обучения 51
2.1.3. Выбор показателей качества суммаризации интернет-форумов 56
2.1.4. Отбор и настройка алгоритмов машинного обучения для суммаризации интернет-форумов 57
2.2. Разработка методики отбора и настройки параметров модели тематической сегментации для текстов научной прозы 72
2.2.1. Формирование и разметка обучающей выборки 72
Формирование экспериментального набора данных 72
Разметка обучающей выборки 76
Предобработка текстов обучающей выборки 78
2.2.2. Выбор показателей качества тематической сегментации для текстов научной прозы 81
2.2.3. Отбор и настройка алгоритмов машинного обучения для тематической сегментации научной прозы 82
Отбор алгоритмов 82
Специфика настройки параметров алгоритмов для тематической сегментации научной прозы 85
Эффективность тематической сегментации научной прозы в зависимости от характеристик текстов 88
Выводы по главе 2 95
Глава 3. Разработка метода композиции алгоритмов тематической сегментации научных текстов и средства его программной поддержки 96
3.1 Ансамблевый метод структуризации научных текстов 96
3.2 Программная реализации сервиса тематической сегментации для профессиональных интернет-форумов 99
3.3 Архитектура и программная реализация сервиса тематической сегментации для научной прозы 100
Выводы по главе 3 106
Глава 4. Результаты экспериментальных проверок разработанного метода композиции алгоритмов тематической сегментации 107
Выводы по главе 4 114
Заключение 115
Список литературы 116
Источники на русском языке 117
Источники на английском языке 121


