Введение
Глава 1. Обзор основных функций PDM-систем 13
1.1. Место PDM-систем в САПР 13
1.1.1. Распространенные PDM-системы 15
1.1.2. Основные функции PDM-систем 15
1.1.2.1. Хранение и управление данными . 17
1.1.2.2. Управление классификацией и кластеризацией 19
1.1.3. Недостатки современных PDM-систем 19
1.2. Обзор методов кластеризации 20
1.2.1. Классификация методов кластеризации 20
1.2.2. Общая схема кластеризации 22
1.2.2.1. Определение множества признаков . 23
1.2.2.2. Выбор меры сходства 23
1.2.2.3. Проверка достоверности результатов . 24
1.2.3. Нечеткие методы кластеризации 25
1.2.3.1. FCM алгоритм 26
1.2.3.2. Gustafson-Kessel алгоритм 27
1.2.4. Выбор метода для применения к задаче кластери зации электронных информационных ресурсов . 28
1.3. Варианты ускорения fuzzy c-means 29
1.3.1. Параллельные реализации fuzzy c-means алгоритма 29
1.3.2. Обзор программного обеспечения для создания вычислительного кластера 31
1.3.2.1. Apache Hadoop 32
1.3.2.2. GridGain 35
1.3.3. Обоснование выбора программного продукта для создания кластера 39
1.4. Выводы по главе и постановка исследования 40
1.4.1. Выводы по главе 40
1.4.2. Постановка исследования 42
Глава 2. Модели и средства кластеризации электронных информационных ресурсов 43
2.1. Адаптированный fuzzy c-means 43
2.1.1. Описание объекта кластеризации 43
2.1.2. Адаптация к входным данным 44
2.1.3. Возможность иерархической кластеризации . 45
2.1.4. Уточнённый алгоритм FCM 47
2.1.4.1. Шаг 1. Инициализация 47
2.1.4.2. Шаг 2. Вычисление центров кластеров . 49
2.1.4.3. Шаг 3. Вычисление степеней принадлежности 50
2.1.4.4. Шаг 4. Проверка условий остановки ал- горитма 51
2.1.4.5. Шаг 5. Сохранение результатов 52
2.2. Метод организации поисковой системы на основе результатов кластеризации 52
2.2.1. Матрица принадлежностей как основа для ассоциативного поиска 52
2.2.2. Алгоритм поиска 54
2.3. Вариант параллельного выполнения алгоритма FCM . 55
2.4. Вариант выполнения алгоритма FCM на вычислительном кластере 56
2.4.1. Вычисление центров кластеров 60
2.4.2. Вычисление матрицы принадлежности 61
Глава 3. Реализация приложений 63
3.1. Программное обеспечение и технологические средства . 63
3.2. Структуры данных 64
3.2.1. Структура входных данных 64
3.2.2. Структура выходных данных 66
3.3. Кластеризатор 70
3.3.1. Варианты использования 70
3.3.2. Функции по работе с базой данных 71
3.3.3. Выполнение кластеризации 75
3.3.4. Работа с отчетами 78
3.3.5. Редактирование иерархии кластеров 79
3.3.6. Сервисные функции 80
3.4. Приложение поиска 87
3.4.1. Варианты использования 87
3.4.2. Диаграмма компонентов 90
Глава 4. Вычислительные эксперименты по кластеризации 92
4.1. Эксперименты по качеству кластеризации 92
4.1.1. План экспериментов 92
4.1.2. Математическая модель оценки качества кластеризации 93
4.1.3. Результаты экспериментов 94
4.2. Эксперименты по производительности кластеризатора . 97
4.2.1. Производительность параллельной реализации адап тированного FCM алгоритма 97
4.2.1.1. Вычисление центров кластеров 98
4.2.1.2. Вычисление матрицы принадлежности 100
4.2.1.3. Общее время выполнения 103
4.2.2. Производительность кластерной реализации адап тированного FCM алгоритма 104
4.2.2.1. Вычисление центров кластеров 106
4.2.2.2. Вычисление матрицы принадлежности 109
4.2.3. Сравнение многопоточной и кластерной реализаций 109
Заключение 116
Литература 118
Приложение


