Введение
Глава 1. Исследование нарушений в текстах научной сферы 11
1.1. Типология нарушений в научных публикациях 11
1.1.1. Нарушение требований к лексике научного текста 12
1.1.2. Нарушение структуры научного текста 14
1.1.3. Нарушение правил согласования 16
1.1.4. Нарушение синтаксической и семантической связности 17
1.1.5. Лексическая избыточность 18
1.1.6. Нарушение последовательности изложения
1.2. Методы автоматического анализа качества научных текстов 21
1.3. Основные выводы и постановка задачи 26
Глава 2. Методы выделения признаков, характеризующих качество текстов научной сферы 29
2.1. Выделение устойчивых общенаучных словосочетаний 29
2.1.1. Словари общенаучной лексики 29
2.1.2. Установление синтаксических и семантических связей 32
2.1.3. Формирование общенаучного словаря устойчивых словосочетаний 35
2.1.4. Анализ встречаемости единиц словаря в текстах научной сферы... 41
2.2. Выявление структурных разделов в научной публикации 45
2.2.1. Выделение разделов формата IMRAD 45
2.2.2. Выделение и структурирование списка литературы 57
2.3. Обнаружение лингвистических ошибок в научных текстах 59
2.3.1. Описание метода обнаружения лингвистических ошибок 59
2.3.2. Обнаружение нарушений правил согласования 64
2.3.3. Обнаружение нарушений синтаксической и семантической связности 68
2.3.4. Обнаружение лексической избыточности 69
2.3.5. Обнаружение нарушений последовательности изложения 69
2.3.6. Результаты применения метода автоматического обнаружения лингвистических ошибок 70
Результаты главы 2 73
Глава 3. Применение методов машинного обучения для выявления признаков псевдонаучных текстов 75
3.1. Определение псевдонауки 76
3.2. Обнаружение псевдонаучных фрагментов
3.2.1. Описание метода обнаружения псевдонаучных фрагментов 78
3.2.2 . Экспериментальная проверка метода обнаружения псевдонаучных фрагментов
3.3. Формирование признакового пространства для обнаружения псевдонаучных текстов 95
3.4. Построение множества критериев принадлежности текста множеству псевдонаучных текстов 102
3.5. Сравнительный анализ эффективных методов классификации 104
Результаты главы 3 108
Заключение
Список использованных источников


