Введение
Глава 1. Обзор и сравнительный анализ инструментальных средств, моделей и методов Data Mining 13
1.1. Постановка задачи 13
1.2 Классификация и сравнительный анализ инструментов DM 15
1.3. Выбор класса DM-инструментов для реализации аналитического проекта масштаба предприятия 23
Выводы по 1-й главе 25
Глава II. Разработка двухуровневого сценарного подхода к реализации DM-проектов на основе аналитических платформ 26
2.1. Постановка задачи 26
2.2 Разработка 2-уровневого сценарного подхода к организации аналитического процесса 28
2.4. Разработка сценариев II уровня 34
2.4.1. Сценарий построения модели численного предсказания на основе нейронной сети .34
2.4.2 Сценарий для построения классификационной модели на основе дерева решений 54
2.4.3 Построение кластерной модели на основе карты Кохонена 65
2.4.4. Построение ассоциативной классификационной модели на основе метода Apriori 80
2.5. Разработка интеллектуальной модели для оценки сложности аналитических проектов 90
Глава 3. Разработка интеллектуальной модели урожайности зерновых по данным агрохимического обследования почв 98
3.1. Постановка задачи 98
3.2. Исходные данные для моделирования 100
3.2. Построение нейросетевой модели урожайности 111
3.3. Моделирование урожайности с помощью деревьев решений 138
3.4.1. Постановка задачи 138
3.4.2. Построение карты Кохонена 139
3.4.2. Обучение карты Кохонена 147
3.4. Моделирование урожайности на основе ассоциативного анализа 151
3.4.1. Постановка задачи 151
3.6.1. Генерация ассоциативных правил 153
3.5.1. Актуальность ассоциативных правил 159
3.6.1. Ассоциативные модели 162
3.6.2. Практическая работа с ассоциативной моделью 165
3.5. Оценка обобщающей способности моделей урожайности 170
3.6. Построение ансамбля моделей 172
3.6.1 Выбор метода построения ансамбля 172
3.6.2. Построение ансамбля моделей на основе стекинга 175
Выводы по 3-й главе 180
Глава 4. Разработка бинарной классификационной модели для анализа клиентской базы кредитной организации 181
4.1. Постановка задачи 181
4.2. Описание источника данных 182
4.3. Снижение размерности исходных данных 184
4.3. Построение моделей отклика 188
Выводы по 4 главе 195
Заключение 196
Библиографический список 198


