Введение
1 Существующие методы и алгоритмы определения происхождения текста 13
1.1 Методы текстовой атрибуции 13
1.1.1 Методы атрибуции, основанные на статистическом анализе 16
1.1.2 Методы атрибуции, основанные на использовании искусственного интеллекта 21
1.2 Автоматическая генерация текстов 24
1.2.1 Метод генерации текстов на основе использования цепи Маркова 24
1.2.2 Метод генерации текстов на основе SIMP-таблиц 28
1.2.3 Метод генерации текста с использованием словарей 30
1.2.4 Метод генерации текста, основанный на синонимизации
1.3 Методы определения массово порожденных текстов 36
1.4 Алгоритм определения искусственно созданных текстов 39
1.5 Выводы 41
2 Разработанные инварианты искусственно созданных текстов 43
2.1 Классификация текстовых произведений на основе инвариантов 43
2.2 Предложенный алгоритм формирования инвариантов классов текстов 46
2.3 Формирование инвариантов искусственных и естественных текстов на основе предложенного алгоритма 54
2.3.1 Определение качественных признаков выделенных классов текстов 56
2.3.2 Определение свойств текста, определяющих проявление качественных признаков 57
2.3.3 Формирование множества количественных характеристик 58
2.3.4 Расчет значений характеристик текста для наборов текстов известного происхождения 62
2.3.5 Проверка перечня характеристик на различительную способность 64
2.3.6 Оценка взаимозависимости характеристик 65
2.3.7 Полученные инварианты искусственных текстов 66
2.4 Выводы 68
3 Метод и программное средство определения искусственно созданных текстов 69
3.1 Предлагаемый метод определения искусственно созданных текстов 69
3.2 Программное средство фильтрации искусственно созданных текстов
3.2.1 Требования к программному средству 76
3.2.2 Структура программного средства
3.3 Тестирование метода и программного средства 87
3.4 Выводы 92
Заключение 94
Список использованной литературы 97


