Введение
Глава 1. Анализ существующих методов оценки времени выполнения запросов вПКСБД 13
1.1. Обзор ПКСБД как современного направления исследований и анализ истоков его появления 14
1.1.1. Традиционные СУБД и их ограничения 14
1.1.2. Колоночное хранение информации 17
1.1.3. Направления исследований в области ПКСБД 20
1.1.4. Преимущество ПКСБД при обработке аналитических запросов 24
1.1.5. Краткий обзор существующих коммерческих ПКСБД 26
1.1.6. Выводы по части 28
1.2. Анализ информационных процессов обработки запросов в ПКСБД 29
1.2.1. Хранение информации на физическом (дисковом) уровне 29
1.2.2. Обработка информации на логическом уровне 31
1.2.3. Синхронный конвейер 32
1.2.4. Итераторная модель 34
1.2.5. Скобочный шаблон 36
1.2.6. Операция материализации 38
1.2.7. Сжатие данных 39
1.2.8. Скрытое соединение 40
1.2.9. Параллельная обработка запросов 43
1.2.10. Выводы по части 45
1.3. Критический анализ существующих методов оценки быстродействия ПКСБД 46
1.3.1. Системный подход к оценке быстродействия ПКСБД на этапе проектирования 46
1.3.2. Экспертная оценка архитектур хранилищ данных з
1.3.3. Опытное сравнение производительности систем баз данных на основании тестирования 50
1.3.4. Существующие математические модели оценки времени выполнения запроса 55
1.3.5. Выводы по части 1.4. Постановка цели, предмета и объекта исследования 58
1.5. Выводы по главе 60
Глава 2. Аналитическая модель оценки времени выполнения запросов в ПКСБД 61
2.1. Общий подход к оценке времени выполнения запросов на базе операционного исчисления 62
2.1.1. Свойства ПЛС и ПФ 62
2.1.2. Пример использования ПЛС иПФ 64
2.2. Анализ выполнения запроса к одной таблице в ПКСБД 66
2.2.1. Формализация процесса выполнения запроса к одной таблице в ПКСБД 67
2.2.2. Вывод ПЛС времени выполнения запроса для последовательного плана с ранней материализацией 68
2.2.3. Вывод ПЛС времени выполнения запроса для последовательного плана с поздней материализацией 70
2.3. Анализ процесса соединения отношений в ПКСБД 72
2.3.1. Формализация процесса соединения отношений в ПКСБД 73
2.3.2. Вывод ПЛС времени соединения отношений в ПКСБД 74
2.4. Анализ процесса обработки запроса к параллельному колоночному хранилищу данных 78
2.4.1. Формализация процесса «скрытого соединения» в ПКСБД 79
2.4.2. Вывод ПЛС времени чтения ключевых атрибутов измерений (этап 1) 80
2.4.3. Вывод ПЛС времени извлечения битовой маски таблицы фактов и передачи значений внешних ключей (этап 2) 81
2.4.4. Вывод ПЛС времени чтения значений атрибутов измерений (этап 3) 83
2.4.5. Итоговое ПЛС времени обработки запроса к ПКХД 84
2.5. Аналитическая модель режимов работы системы 85
2.5.1. Пакетный режим 85
2.5.2. Режим «запрос-ответ» 87
2.5.3. Оценка среднего времени выполнения запроса 89
2.6. Проверка адекватности полученной аналитической модели 91
2.6.1. Адаптация модели 91
2.6.2. Натурное моделирование запроса к одной таблице 92
2.6.3. Выводы по проверке адекватности модели 2.7. Сравнение быстродействия строчной и колоночной системы баз данных на основе моделирования 95
2.8. Сравнение быстродействия режимов работы ПКСБД на примере соединения таблиц 2.8.1. Архитектура SE - режим online 100
2.8.2. Архитектура SN - режим online 102
2.8.3. Пакетный режим 103
2.8.4. Сравнение архитектур параллельных систем 104
2.9. Сравнение быстродействия соединения методом NLJ и скрытого соединения в ПКХД 107
2.10. Выводы по главе ПО
Глава 3. Разработка программного комплекса поддержки принятия решения на этапе проектирования ПКСБД 112
3.1. Обоснование создания и требования кКППРП 112
3.2. Методика проектирования 114
3.3. Функциональное описание системы 116
3.3.1. Ввод информации о моделируемой системе 116
3.3.2. Моделирование и расчет характеристик системы 117
3.3.3. Анализ результатов моделирования
3.4. Структурное описание системы 121
3.5. Проектирование структур данных 123
3.6. Проектирование модуля расчета характеристик системы
3.6.1. Проектирование структуры классов 125
3.6.2. Алгоритм расчета характеристик системы
3.7. Архитектура системы 130
3.8. Выводы по главе 131
Глава 4. Применение разработанного КППРП для проектирования хранилища данных в крупной организации 132
4.1. Описание предметной области 132
4.1.1. Система менеджмента качества 133
4.1.2. Система менеджмента качества в кредитной образовательной организации 134
4.1.3. Процессный подход к СМКв банке 136
4.1.4. Описание показателей эффективности процессов банка 138
4.1.5. Постановка задачи моделирования 141
4.2. Описание проектируемого хранилища данных 142
4.2.1. Концептуальный проект нормализованного хранилища 142
4.2.2. Концептуальный проект ненормализованного хранилища 146
4.2.3. Технический проект централизованной системы 149
4.2.4. Технический проект распределенной системы 150
4.3. Результаты моделирования хранилища данных с помощью КППРП
151
4.3.1. Сравнение колоночной и строчной системы баз данных 152
4.3.2. Сравнение вариантов архитектур хранилища 153
4.3.3. Сравнение вариантов двух схем баз данных 154
4.3.4. Исследование пиковых нагрузок 154
4.4. Рекомендации по итогам моделирования 157
4.5. Выводы по главе 158
5. Заключение 159
Список использованных источников


