ВВЕДЕНИЕ .................................................................................................................. 4
1. НОРМАЛИЗАЦИЯ ДАННЫХ В СИСТЕМАХ АВТОМАТИЧЕСКОЙ
ГРУПППИРОВКИ ПРОМЫШЛЕННОЙ ПРОДУКЦИИ......................................... 11
1.1 Современные методы нормализации данных о промышленной продукции . 11
1.2 Подход к нормализации на основе данных промышленной продукции ........ 14
1.3 Об оценке сходства и разнообразия выборочных наборов данных ............... 17
1.4 Методика сравнительного исследования подходов к нормализации данных 18
1.5 Результаты вычислительных экспериментов .................................................. 22
Результаты Раздела 1 ................................................................................................. 36
2. АЛГОРИТМ АВТОМАТИЧЕСКОЙ ГРУППИРОВКИ С ИСПОЛЬЗОВАНИЕМ
ЖАДНОЙ ЭВРИСТИЧЕСКОЙ ПРОЦЕДУРЫ ВЫБОРА РАДИУСА
ЛОКАЛЬНЫХ КОНЦЕНТРАЦИЙ ........................................................................... 37
2.1 Математическая постановка задачи автоматической группировки ............... 37
2.2 Теоретический анализ алгоритма кластеризации электрорадиоизделий ....... 38
2.3 Методика исследования нового алгоритма на примере автоматической
группировки электрорадиоизделий........................................................................ 40
2.4 Результаты вычислительных экспериментов .................................................. 41
Результаты Раздела 2 ................................................................................................. 46
3. РАСШИРЕННЫЙ АЛГОРИТМ КЛАСТЕРИЗАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ
ПРИБЛИЖЕННОГО ПОИСКА БЛИЖАЙШЕГО СОСЕДА ................................... 47
3.1 Обзор литературы о решении задачи поиска ближайшего соседа ................. 47
3.2 Описание расширенного алгоритма кластеризации для решения задачи
приближенного поиска ближайшего соседа .......................................................... 56
3.3 Результаты экспериментальных исследований ............................................... 59
Результаты Раздела 3 ................................................................................................. 64
4. АЛГОРИТМ АВТОМАТИЧЕСКОЙ ГРУППИРОВКИ ПОВТОРЯЮЩИХСЯ ФРАГМЕНТОВ БЛОКОВ ДАННЫХ ....................................................................... 65
4.1 Обзор литературы об алгоритмах автоматической группировки с применением хеширования с учетом местоположения LSH обзор источников . 65
4.2 Новый гибридный алгоритм автоматической группировки повторяющихся фрагментов блоков данных .................................................................................... 77
4.3 Результаты вычислительного эксперимента по решению задач автоматической группировки повторяющихся фрагментов блоков данных ....... 80
Результаты Раздела 4 ................................................................................................. 85
5. АЛГОРИТМ ИНИЦИАЛИЗАЦИИ ЦЕНТРОВ КЛАСТЕРОВ ДЛЯ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ ........................................................................ 86
5.1 Обзор литературы об алгоритмах инициализации центров кластеров для алгоритмов кластеризации...................................................................................... 87
5.2 Новый алгоритм инициализации центров кластеров для алгоритмов кластеризации использующий вспомогательную структуру данных .................. 92
5.3 Вычислительные эксперименты с новым алгоритмом инициализации ......... 98
Результаты Раздела 5 ............................................................................................... 104
ЗАКЛЮЧЕНИЕ ........................................................................................................ 106
СПИСОК ЛИТЕРАТУРЫ ........................................................................................ 108


