Введение
1 Обзор средств и методов отладки распределенных систем 9
1.1 Постановка задачи и основные понятия 9
1.2 Средства и методы отладки 11
1.2.1 Детерминированное воспроизведение и интерактивная отладка распределенных программ 11
1.2.2 Мониторинг 18
1.2.3 Средства самоконтроля программ 25
1.2.4 Средства и методы, ориентированные на отладку сложных систем 27
1.2.5 Отладка в жизненном цикле программы. Интегрированное использование средств отладки, тестирования, контроля выполнения 29
1.3 Вопросы архитектуры и реализации средств отладки 30
1.3.1 Архитектура средств отладки 30
1.3.2 Функциональность агентов и псевдо-агентов отладки . 31
1.3.3 Взаимодействие менеджера и агента 32
1.3.4 Аппаратная поддержка отладки 33
1.3.5 Стратегии передачи данных трассировки 34
1.3.6 Настраиваемость и масштабируемость 34
1.4 Выводы 3G
2 Контролируемое выполнение, ассоциированные понятия и требования 38
2.1 Контролируемое выполнение и ассоциированные понятия . 38
2.2 Роль контролируемого выполнения и его составляющих . 40
2.3 Требования к средствам контролируемого выполнения и их реализации 44
2.4 Интеграция средств отладки и управления 45
2.5 Выводы 47
3 Организация инструментального комплекса "СОМ" 49
3.1 Пример применения комплекса 49
3.2 Организация инструментального комплекса 52
3.2.1 Архитектура 52
3.2.2 Взаимодействие со средами выполнения 55
3.3 Функциональные возможности комплекса и вопросы реализации 59
3.3.1 Инициализация системы 59
3.3.2 Интерактивная отладка 62
3.3.3 События 64
3.3.4 Контроль целостности и отказоустойчивость комплекса. Многопользовательская работа 73
3.4 Выводы 74
4 Средства внешнего и внутреннего контроля программ 76
4.1 Библиотека средств самоконтроля 77
4.2 Связь инструментального комплекса "СОМ" с системой управления OpenNMS 87
4.3 Выводы 89
5 Средства детерминированного воспроизведения распреде ленных программ 91
5.1 Постановка задачи 91
5.2 Реализация системы воспроизведения 92
5.2.1 Архитектурные и технические решения 92
5.2.2 События и векторное время в распределенном приложении 93
5.2.3 Первичное выполнение и воспроизведение распределен ного приложения 95
5.3 Обоснование алгоритма воспроизведения распределенного приложения 103
6 Реализация контролируемого выполнения с помощью комплекса "СОМ" 106
6.1 Классификация программных ошибок и функциональные возможности комплекса "СОМ" 106
6.1.1 Логические ошибки и ошибки кодирования 107
6.1.2 Утечка ресурсов и ошибки работы с памятью 107
6.1.3 Ошибки указателей 108
6.1.4 Ошибки синхронизации 108
6.1.5 Ошибки в распределенных приложениях 108
6.1.6 Ошибки систем реального времени 109
6.2 Анализ средств мониторинга 109
6.3 Пример отладки распределенной программы для ППС 117
6.3.1 Постановка задачи 117
6.3.2 Первая ошибка 120
6.3.3 Вторая ошибка 124
6.4 Пример отладки распределенной программы для ос2000 . 127
6.4.1 Постановка задачи 127
6.4.2 Ошибка 128
6.5 Анализ опыта применения комплекса "СОМ" 130
Заключение 132
Литература


