Встречная оптимизация класса задач трёхмерного моделирования для архитектур многоядерных процессоров

Сударева Ольга Юрьевна. Встречная оптимизация класса задач трёхмерного моделирования для архитектур многоядерных процессоров: диссертация ... кандидата Физико-математических наук: 05.13.11 / Сударева Ольга Юрьевна;[Место защиты: ФГБУН Институт системного программирования им. В.П. Иванникова Российской академии наук], 2018
Автор
Сударева Ольга Юрьевна
Год
2018
  • 99 000 UZS

Оглавление диссертации
Введение
Глава 1. Производительность процедур трёхмерного моделирования на гибридных системах 14
1.1 Современные высокопроизводительные вычислительные системы общего назначения и специализированные вычислительные системы разработки НИИСИ РАН 14
1.2 Методы программирования 24
1.3 Модель гибридной вычислительной системы 28
1.4 Целевые вычислительные процедуры 33
1.5 Метод оценки ожидаемой производительности 37
1.6 Формальный критерий сбалансированности вычислительной системы на заданной вычислительной процедуре 42
Глава 2. Исследование реализаций процедур на GPU 44
2.1 Процедура NPB FT 45
2.1.1 Схема вычислений 45
2.1.2 Оценки производительности 47
2.1.3 Производительность на GPU 49
2.2 Процедура NPB MG 52
2.2.1 Схема вычислений 52
2.2.2 Оценки производительности 55
2.2.3 Практическая реализация 57
2.2.4 Результаты тестирования 62
2.3 Процедура NPB CG 67
2.3.1 Формат упаковки разреженной матрицы 67
2.3.2 Схема вычислений 69
2.3.3 Оценки производительности 71
2.3.4 Практическая реализация 73
2.3.5 Результаты тестирования 77
2.4 Выводы 82
Глава 3. Исследование реализаций процедур на гибридных процессорах КОМДИВ 84
3.1 Процедура БПФ 84
3.1.1 Схема вычислений 84
3.1.2 Вычислительные ядра для CP2 86
3.1.3 Оценки производительности 88
3.1.4 Результаты тестирования 89
3.1.5 Процедура свёртки 91
3.1.6 Сравнение с производительностью на других процессорах 93
3.2 Процедура NPB MG 94
3.2.1 Схема вычислений 94
3.2.2 Вычислительные ядра для CP2 97
3.2.3 Оценки производительности 99
3.2.4 Результаты тестирования 101
3.2.5 Сравнение с производительностью на других процессорах 104
3.2.6 Реализация для многопроцессорного комплекса 105
3.3 Процедура SpMV 108
3.3.1 Формат упаковки матрицы и схема вычислений 108
3.3.2 Вычислительное ядро для CP2 110
3.3.3 Оценки производительности 113
3.3.4 Результаты тестирования 114
3.3.5 Сравнение с производительностью на других процессорах 116
3.4 Выводы 118
Глава 4. Рекомендации по дальнейшему развитию архитектуры гибридных многоядерных процессоров НИИСИ РАН 120
4.1 Критерий сбалансированности процессоров НИИСИ РАН на выбранном классе задач 120
4.2 Проект оптимизации архитектуры гибридных процессоров НИИСИ РАН 123
4.3 Достоинства и недостатки гибридных процессоров НИИСИ РАН в контексте высокопроизводительных вычислений 129
Заключение 134
Список сокращений и условных обозначений 137
Список литературы 141
Список рисунков 160
Список таблиц 161
Приложение А. Параметры вычислительных систем и процедур 162
Приложение Б. Результаты замеров производительности вычислительных процедур 165

Рекомендуем вам товары

99 000 UZS
Автор
Кейно Павел Петрович
Количество страниц
Год
2017
99 000 UZS
Автор
Коломейченко Максим Игоревич
Количество страниц
Год
2017
99 000 UZS
Автор
Алфимцев Александр Николаевич
Количество страниц
Год
2016
Модули для Opencart 2, Опенкарт 3