Введение
Глава 1. Актуальность и постановка задачи 11
1.1. Системный подход к обеспечению фильтрации «спама» 11
1.1.1. Наиболее распространенные виды «спама» 13
1.1.2. Способы распространения «спама» 15
1.1.3. Причины возникновения почтового «спама» 18
1.1.4. Причиняемый вред 20
1.2. Методы борьбы с нежелательной электронной корреспонденцией 21
1.2.1. «Антиспамовые» фильтры в борьбе со «спамом» 23
1.2.2. Автоматизированная фильтрация в борьбе с нежелательной корреспонденцией 26
1.3. Методы автоматизированной фильтрации 27
1.3.1. Алгоритмы фильтрации на основе содержания письма 28
1.3.2. Соотношение полной вероятности и соотношение Байеса 31
1.3.3. Байесовская классификация 32
Выводы по первой главе 34
Глава 2. Модель и метод градации сообщений для фильтрации «спама» 36
2.1. Формулировка исходных положений метода градуированной фильтрации «спама» 36
2.2. Модель градуированной фильтрации «спама» 40
2.2.1. Постановка задачи классификации писем 41
2.2.2. Принцип работы классификатора 42
2.2.3. Правила используемые при фильтрации сообщений 46
2.2.4. Автоматизированная обработка письма 49
2.3. Обоснование использования модели и метода градуированной фильтрации «спама» 51
2.3.1. Анализ оценок нахождения «спама» различными алгоритмами с учетом эвристического коэффициента 53
2.3.2. Анализ оценок нахождения «спама» различными алгоритмами с учетом использования различных способов расчета коэффициентов «спамерности» 57
Выводы по второй главе 60
Глава 3. Имитационный технологический комплекс поддержки модели и метода градуированной фильтрации «спама» 63
3.1. Инструментально-технологический комплекс «контр-спам» 64
3.1.1. Структура и алгоритмы 64
3.1.2. Функциональные возможности работы инструментально-технологического комплекса «контр-спам», созданного на базе метода градуированной фильтрации «спама» 75
3.2. Механизм управления автоматизированной системой фильтрации «спама» 80
3.2.1. Механизм управления «обучением» частотных словарей 82
3.2.2. Механизм управления фильтрацией входящего потока сообщений 85
3.2.3. Механизм управления корректировкой частотных словарей 87
Выводы по третьей главе 88
Глава 4. Результаты экспериментального использования модели и метода градуированной фильтрации «спама» 90
4.1. Исследование динамики изменения значений величин в частотных словарях инструментально-технологического комплекса «контр-спам» 91
4.1.1. Исследование изменения значений величин в частотных словарях с одинаковым количеством писем выбранных для заполнения словарей 91
4.1.2. Исследование изменения значений величин в частотных словарях с преобладанием количества писем выбранных для заполнения частотного словаря «спам» 94
4.1.3. Исследование изменения значений величин в частотных словарях с преобладанием количества писем выбранных для заполнения частотного словаря «не-спам» 96
4.1.4. Анализ результатов исследования динамики изменения значений величин в частотных словарях 99
4.2. Исследование степени корректной фильтрации входящего потока в инструментально-технологическом комплексе «контр-спам» 99
4.2.1. Исследование степени корректной фильтрации входящего потока сообщений в комплексе «контр-спам» в зависимости от значения порога коэффициента «спамерности» слова 101
4.2.2. Анализ результатов исследования степени корректной фильтрации входящего потока сообщений в комплексе «контр-спам» в зависимости от значения порога коэффициента «спамерности» слова 109
4.2.3. Исследование степени корректной фильтрации входящего потока сообщений в комплексе «контр-спам» в зависимости от значения порога для оценки письма 109
4.2.4. Анализ результатов исследования степени корректной фильтрации входящего потока сообщений в комплексе «контр-спам» в зависимости от значения порога для оценки письма 117
4.2.5. Анализ результатов исследования степени корректной фильтрации входящего потока сообщений в комплексе «контр-спам» 118
Выводы по четвертой главе 119
Заключение 121


