Введение
1 Основные понятия и обозначения 17
1.1 Статистические решающие функции 17
1.2 Метод минимизации эмпирического риска 18
1.2.1 Постановка задачи классификации с учителем . 18
1.2.2 Емкость класса решающих функций 20
1.3 Метод структурной минимизации эмпирического риска . 24
1.3.1 Описание метода 24
1.3.2 Метод кросс-проверки 27
1.4 Индуктивное построение баз знаний. Подход КЕХ 29
1.4.1 Терминология и обозначения 29
1.4.2 Определение базы знаний 31
1.4.3 Алгоритм КЕХ 33
1.4.4 Базы знаний и решающие функции 35
1.5 Статистические критерии проверки гипотез 37
1.5.1 Критерий согласия %2 37
1.5.2 Критерий однородности %2 38
1.5.3 Критерий знаков 39
1.6 Упорядочение признаков. Алгоритм ReliefF 39
1.7 Дискретизация непрерывных признаков 42
1.7.1 Постановка задачи дискретизации и терминология . 42
1.7.2 Алгоритм дискретизации системы КЕХ 44
1.7.3 Алгоритм дискретизации ChiMerge 47
1.7.4 Алгоритм дискретизации САШ 49
1.7.5 Алгоритм дискретизации TSE 50
Индуктивное построение баз знаний 52
2.1 Процедуры генерации комбинаций 53
2.1.1 Построение баз знаний по возрастанию длины антецедента 53
2.1.2 Построение баз знаний по возрастанию количества наиболее информативных признаков антецедента 60
2.2 Поиск оптимального класса решающих функций 63
2.2.1 Схемы реализации метода структурной минимизации эмпирического риска 63
2.2.2 Нахождение оптимального класса решающих функций по возрастанию длины антецедента . 67
2.2.3 Нахождение оптимального класса решающих функций по возрастанию количества наиболее информативных признаков антецедента 76
Предварительная обработка обучающей выборки 79
3.1 Нахождение множества наиболее информативных признаков 80
3.1.1 Постановка задачи 80
3.1.2 Пошаговый алгоритм нахождения множества наиболее информативных признаков 81
3.1.3 Результаты вычислительных экспериментов . 85
3.2 Дискретизация непрерывных признаков 91
3.2.1 Постановка задачи 91
3.2.2 Алгоритм ChiSplit 92
3.2.3 Результаты вычислительных экспериментов 97
3.3 Система СТАТКОП 99
3.3.1 Описание системы СТАТКОП 99
3.3.2 Определение факторов риска в кардиологии . 100
3.3.3 Проективные стратегии и современный
потенциал сельских домохозяйств Карелии 102
4 Индуктивное построение баз знаний статистических экспертных систем 105
4.1 Наилучшие совместные критерии 106
4.1.1 Постановка задачи 106
4.1.2 Наилучшие двусторонние статистические критерии 108
4.1.3 Использование эмпирической информации о возможных альтернативах для построения совместных статистических критериев 113
4.2 Использование частичной априорной информации для построения двусторонних критериев 116
4.2.1 Постановка задачи 116
4.2.2 Псевдонаилучшие двусторонние критерии 118
4.2.3 Интерактивное назначение априорного распределения 121
4.2.4 Алгоритм интерактивного построения
псевдонаилучших двусторонних критериев 122
Заключение 126
Литература


