Методика идентификации Интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений

Воробьева Алиса Андреевна. Методика идентификации Интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений: диссертация ... кандидата Технических наук: 05.13.19 / Воробьева Алиса Андреевна;[Место защиты: ФГАОУВО Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики], 2017.- 154 с.
Автор
Воробьева Алиса Андреевна
Год
2017
  • 99 000 UZS

Оглавление диссертации
Введение
Глава 1. Анализ состояния проблемы идентификации Интернет-пользователей при информационном обмене электронными сообщениями 18
1.1. Современное состояние проблемы идентификации Интернет-пользователей при информационном обмене электронными сообщениями 18
1.2. Модель угроз безопасности информационных процессов при информационном обмене электронными сообщениями с использованием Интернет-ресурсов 21
1.2.1. Модель вероятного нарушителя информационной безопасности 23
1.3. Существующие методы идентификации Интернет-пользователей при информационном обмене электронными сообщениями 26
1.3.1. Методы идентификации, основанные на данных о технических средствах рабочей станции пользователя - программном и аппаратном окружении 26
1.3.2. Методы идентификации, основанные на данных о поведении пользователя на веб-портале, поиск шаблонов поведения пользователя 29
1.3.3. Методы лингвистической идентификации на основе стилистических характеристик текстов электронных сообщений
1.4. Основные особенности задачи по идентификации на основе стилистических характеристик текстов электронных сообщений 44
1.5. Постановка задачи по идентификации Интернет-пользователей по лингвистическим и стилистическим характеристикам электронных сообщений
Выводы по главе 1
Глава 2. Разработка методики идентификации Интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений 51
2.1. Анализ структуры и характеристик электронных сообщений Интернет порталов 51
2.1.1. Корпус электронных сообщений 51
2.1.2. Анализ особенностей текстов электронной коммуникации и характеристик электронных сообщений на русском языке 54
2.2. Комплексная многоуровневая модель представления Интернет пользователя (КММПП) 58
2.2.1. Модель представления электронных сообщений 59
2.2.2. Идентификационные признаки 59
2.2.3. Модель представления Интернет-пользователя 67
2.3. Метод формирования динамического стилистического профиля
пользователя (ДСПП), обладающий наибольшей различающей способностью и
позволяющий повысить точность идентификации 68
2.3.1. Формирование динамического стилистического профиля пользователя 68
2.3.2. Критерии отбора идентификационных признаков
2.3.3. Алгоритм отбора идентификационных признаков на основании расчета расстояния по значению признака до k-ближайших соседей 74
2.3.4. Обоснование использования метода отбора на основании расчета расстояния по значению признака до k-ближайших соседей для формирования ДСПП 76
2.4. Метод сравнения ДСПП с эталонными ДСПП потенциальных пользователей на основе метода Случайного Леса (Random Forest, RF), отличающийся от известных предварительной дискретизацией идентификационных признаков из ДСПП 78
2.4.1. Оценка эффективности различных методов сравнения ДСПП 81
2.4.2. Использование метода случайный лес для идентификации пользователя на основе стилистических характеристик электронных текстов 83
2.4.3. Дискретизация непрерывных признаков 89
2.5. Методика идентификации Интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений 91
2.5.1. Подготовительный этап методики идентификации Интернет-пользователя: Сбор и формирование базы характеристик потенциальных пользователей, содержащей эталонные шаблоны пользователей 92
2.5.2. Основные этапы методики идентификации Интернет-пользователя... 96
2.5.3. Оценка точности идентификации пользователя 100
2.5.4. Ограничения методики 101
Выводы по главе 2 101
Глава 3. Проведение экспериментов и оценка результатов 103
3.1. Входные данные экспериментов 103
3.2. Точность идентификации при использовании разработанной комплексной многоуровневой модели представления пользователя (КММПП) 106
3.3. Точность идентификации при использовании метода формирования динамических стилистических профилей пользователей (ДСПП) 111
3.4. Точность идентификации с использованием различных методов сравнения ДСПП при различном количестве текстов и различном уровне несбалансированности обучающей выборки 114
3.5. Повышение точности идентификации путем предварительной дискретизацией идентификационных признаков из ДСПП 116
3.6. Определение итоговой точности идентификации на основе предложенной методики 120
3.7. Использование результатов исследования для повышения безопасности информационных процессов в сети Интернет 124
Выводы по главе 3 127
Заключение 130
Список сокращений и условных обозначений 132
Список использованной литературы

Рекомендуем вам товары

99 000 UZS
Автор
Биричевский Алексей Романович
Количество страниц
Год
2017
99 000 UZS
Автор
Бурлаков Михаил Евгеньевич
Количество страниц
Год
2017
99 000 UZS
Автор
Коломойцев Владимир Сергеевич
Количество страниц
Год
2018
Модули для Opencart 2, Опенкарт 3