Введение
Глава 1. Применение методов интеллектуального анализа данных для классификации объектов разнородных выборок 11
1.1. Исследование методологии и стандартов интеллектуального анализа данных 11
1.2. Выявление прикладных проблем анализа данных применительно к классу задач бинарной классификации 22
1.3. Деревья решений, их особенности и применение 29
1.4. Метод k ближайших соседей, его особенности и применение 35
1.5. Метод опорных векторов, его особенности и применение 39
1.6. Искусственные нейронные сети, их особенности и применение 44
1.7. Выводы 51
Глава 2. Исследование эффективности методов бинарной классификации для анализа разнородных данных на примере класса задач прогнозирования 54
2.1. Построение классификаторов для решения задач прогнозирования 54
2.1.1. Построение логического классификатора 54
2.1.2. Построение метрического классификатора 60
2.1.3. Построение SVM-классификатора 62
2.1.4. Построение нейросетевого классификатора 68
2.2. Разработка модифицированных критериев качества бинарной классификации для задач анализа разнородных выборок 75
2.2.1. Разработка критерия качества классификации, учитывающего длительность выполнения алгоритма 75
2.2.2. Разработка критерия качества классификации, учитывающего разбалансированность исследуемой выборки 80
2.2.3. Сравнение методов бинарной классификации с помощью модифицированных критериев качества 83
2.3. Исследование набора признаков в выборке для повышения качества бинарной классификации 91
2.3.1. Первичное преобразование набора признаков анализируемой выборки 91
2.3.2. Методы снижения числа переменных в анализируемой выборке 96
2.4. Дополнительная обработка анализируемых данных 101
2.5. Выводы 105
Глава 3. Разработка модифицированного подхода, основанного на подборе оптимального классификатора посредством генетических алгоритмов 107
3.1. Постановка задачи 108
3.2. Первоначальная настройка архитектуры генетического алгоритма 112
3.3. Повышение эффективности оптимизации посредством модификации генетического алгоритма 122
3.4. Разработка комбинированного генетического алгоритма для подбора оптимальных параметров классификаторов 129
3.5. Выводы 136
Заключение 140
Литература 142
Приложение 1. Свидетельство о государственной регистрации программы для ЭВМ 153
Приложение 2. Акты о внедрении результатов диссертационной работы 154


