Введение 8
Актуальность проблемы 8
Цель и задачи работы 9
Положения, выносимые на защиту 10
Научная новизна 10
Теоретическая значимость диссертационной работы 13
Практическая значимость диссертационной работы 13
Апробация работы 15
Публикации 16
Личный вклад автора 17
Структура и объем диссертации 17
Технические замечания 17
Глава 1. Обзор литературы 18
1.1 Системная биология 18
1.1.1 Понятие системной биологии 18
1.1.2 Экспериментальные методы системной биологии 20
1.1.3 Воспроизводимость и стандарты в системной биологии 20
1.1.3.1 Воспроизводимость моделей биологических систем 20
1.1.3.2 COMBINE 24
1.1.3.3 SBML 25
1.1.3.4 SBGN 27
1.1.3.5 MIASE, SED-ML 27
1.2 Методы моделирования биологических систем 28
1.2.1 Математические методы 28
1.2.2 Визуальное моделирование 30
1.2.3 Модульное моделирование 33
1.2.4 Агентное моделирование 35
1.2.5 Цифровые двойники и виртуальные организмы 36
1.3 Программные комплексы для моделирования биологических систем 38
1.3.1 Модульное моделирование 39
1.3.2 Агентное моделирование 40
1.3.3 BioSimulators 42
1.4 Анализ биомедицинских данных 44
1.4.1 Установка и запуск программ 44
1.4.2 Реестры программ 453
1.4.2.1 Dockstore 45
1.4.2.2 Biocontaners 46
1.4.2.3 ELIXIR, bio.tools 47
1.4.2.4 Bioconda 47
1.4.3 Сценарии анализа данных 48
1.4.3.1 CWL 48
1.4.3.2 WDL 51
1.4.3.3 Nextflow 52
1.4.2.4 Galaxy 54
1.4.4 Jupyter 55
1.4.5 SoS 57
1.4.6 R, Bioconductor, RStudio 57
1.5 Графическое представление биологических данных 58
1.5.1 Диаграммы метаболических путей и пути передачи сигнала в клетке 59
1.5.2 Геномный браузер 60
1.5.3 Выравнивания и филогенетические деревья 63
1.5.4 Графическое представление 2D структур 66
1.5.5 Графическое представление 3D структур 66
1.6 Обзор предшествующих работ автора 67
1.7. Заключение по обзору литературы 70
Глава 2. ПК BioUML 71
2.1 Интерфейс пользователя 71
2.2 Архитектура ПК BioUML 73
2.3 Используемые технологии 74
2.3.1 OSGi – модульная архитектура 74
2.3.2 Технология JavaBeans 75
2.3.3 Технология BeanExplorer 75
2.3.4 Динамические свойства 76
2.3.5 Доступ и поиск информации в БД 77
2.3.6 Библиотека графических объектов 77
2.3.7 Git, GitLab 77
2.3.8 Docker 77
2.3.9 Jupyter notebook, hub 78
Глава 3. Технология создания и использования модульных моделей биологических систем 80
3.1 Мета-модель 80
3.2 Объектно-ориентированное представление биологических данных 814
3.3 Визуальное моделирование 82
3.3.1 Графическая нотация 82
3.3.2 Исходная графическая нотация ПК BioUML 85
3.3.3 Расширенная нотация SBGN 85
3.3.4 Моделирование физиологических систем 85
3.3.5 Артериальное дерево 88
3.4 Модульное моделирование 89
3.5 Агентное моделирование 92
3.6 Текстовое представление модели, его синхронизация с графическим представлением 92
3.7 Автоматическая генерация кода 93
3.7.1 Разбор математических выражений 94
3.8 Численное моделирование 95
3.9 Тестирование численного моделирования 97
3.10 Определение параметров моделей 98
3.11 Использование практик из разработки программного обеспечения 100
3.12 Тестирование моделей 101
3.13 Создание математических моделей сложных биологических систем эволюционным
путем 102
Глава 4. Анализ и графическое представление биомедицинских данных 103
4.1 Интерфейс для анализа биомедицинских данных 105
4.2 Сценарии анализа данных 106
4.2.1 WDL 106
4.2.2 Nextflow 109
4.2.3 Интеграция с Galaxy и Galaxy Toolshed 110
4.3 Геномный браузер 113
Глава 5. База данных GTRD 115
5.1 Постановка задачи 115
5.2 Методы и подходы 116
5.2.1 Отбор видов эукариот 117
5.2.2 Аннотация данных 117
5.2.3 Единый словарь клеточных линий и типов 121
5.2.4 Единообразная обработка NGS данных при помощи сценариев 122
5.2.5 Контроль качества данных 124
5.2.6 Мета-кластеры – интеграция данных ChIP-seq экспериментов 126
5.2.7 Мета-анализ для наиболее достоверного выявления регуляторных районов 128
5.2.8 Мастер-сайт и мастер-трек 129
5.2.9 Структура БД 1295
5.2.10 Веб-интерфейс 130
5.3 Использование БД GTRD 131
5.3.1 Построение цистрома 131
5.3.2 Ресурсы, построенные на основе данных GTRD 134
5.3.3 Предсказание уровня экспрессии генов 134
5.4 Обсуждение 135
5.4.1 Сравнение с другими БД по ChIP-seq экспериментам 135
5.4.2 Полнота покрытия ТФ 135
5.4.3 Полнота покрытия ССТФ 136
Глава 6. Моделирование сложных биологических систем 140
6.1 Модульная модель апоптоза 140
6.1.1 Эволюционное создание моделей 141
6.1.2 Планирование 142
6.1.3 Приемочные тесты 143
6.1.4 Кодирование 144
6.1.5 Итерация 1 144
6.1.6 Итерация 2 146
6.1.7 Итерация 3 146
6.1.8 Итоговая модель 149
6.2 Модульная модель регуляции генной экспрессии при физической нагрузке
в скелетных мышцах 152
6.2.1 Модель энергетического метаболизма в клетках скелетной мышцы 152
6.2.2 Регуляциея экспрессии генов через Ca2+-зависимый сигнальный путь 157
6.2.3 Итоговая модульная модель 162
6.3 Модели COVID-19 166
6.3.1 Эпидемиологические модели 166
6.3.1.1. Первая версия модели 166
6.3.1.2. Вторая версия модели 167
6.3.1.3. Третья версия модели 169
6.3.2 Агентная модель 173
6.3.3 Мультимасштабная эпидемиологическая модель 175
6.3.4 Взаимодействие вируса и организма хозяина 177
6.4 Модели регуляции артериального давления у человека 177
6.4.1 Модель Гайтона 179
6.4.2 Резервуарная модель 179
6.4.3 Модель долговременной почечной регуляции 186
6.4.4 Гидродинамическая модель артериальной системы 1876
6.4.5 Комплексная модель регуляции артериального давления 188
Глава 7. Цифровой двойник пациента 190
7.1 Концепция цифрового двойника пациента 190
7.2 Генерация виртуального пациента 192
7.3 Генерация виртуальной популяции 194
7.4 Моделирование действия антигипертензивных препаратов 196
7.4.1 Алискирен 198
7.4.2 Лозартан 203
7.4.3 Бисопролол 205
7.4.4 Эналаприл 206
7.4.5 Амлодипин 207
7.4.6 Гидрохлоротиазид 208
7.5 Валидация модели на основе клинических данных 209
7.5.1 Генерация популяции виртуальных пациентов 210
7.5.2 Моделирование АГП терапии 211
7.5.3 Сравнение с результатами клинических исследований 211
7.6 Персонализация параметров модели виртуального пациента 212
7.7 Моделирование лечения пациента 216
7.8 Валидация прогноза результата лечения артериальной гипертонии 218
7.9 Обсуждение 220
Глава 8. Другие разработки на основе ПК BioUML 223
8.1 Биоинформатическая платформа для одномолекулярного секвенирования ДНК 223
8.2 Подсистемы для прототипа «Национальной базы генетической информации» 226
8.3 Платформа geneXplain 226
8.4 Платформа Genome Enhancer 227
8.5 Платформа Sirius-web 229
8.5.1 Постановка задачи 229
8.5.2 Накапливаемые данные 230
8.5.3 Архитектура 231
8.5.4 Использование 233
8.6 Платформа u-science 233
Заключение 236
Выводы 238
Список сокращений и условных обозначений 239
Список литературы 246
Свидетельства о регистрации программ для ЭВМ 2817
Список основных публикаций по теме диссертации 282
Благодарности 290
Приложение 1.1 Высокопроизводительные технологии для сбора численных данных 292
Приложение 1.2 Краткое описание формата SED-ML 295
Приложение 2.1 Основные этапы развития ПК BioUML 297
Приложение 2.2 Основные модули (plug-ins) ПК BioUML 300
Приложение 2.3 Java библиотека для доступа и поиска информации в БД 304
Приложение 2.4 Java библиотека графических объектов 307
Приложение 3.1 Основные Java интерфейсы для задания графической нотации 311
Приложение 3.2 Исходная графическая нотация ПК BioUML 315
Приложение 3.3 Расширение и синхронизация SBGN Process Diagram и Antimony 321
Приложение 5.1 Перспектива GTRD для ПК BioUML 329
Приложение 5.2 Веб-интерфейс БД GTRD на платформе BeanExplorer EE 334
Приложение 5.3 Сравнение GTRD с другими БД по ChIP-SEQ экспериментам 340
Приложение 6.1 Экспериментально подтвержденные РСТФ в промоторных
областях генов NR4A2, NR4A3 и PPARGC1A 342
Приложение 6.2 Результаты численных расчетов второй версии модели
для эпидемиологии COVID-19 344
Приложение 6.3 Результаты численных расчетов третьей версии модели
для эпидемиологии COVID-19 349
Приложение 6.4 Результаты численных расчетов агентной модели
для эпидемиологии COVID-19 350
Приложение 7.1 Список оптимизируемых параметров для генерации
виртуальных пациентов с АГ 351
Приложение 8.1 Пример сценария для биоинформатической платформы
для анализа данных одномолекулярного секвенирования 354
Приложение 8.2 Подсистемы для прототипа «Национальной базы
генетической информации» 357
Приложение 8.3 Платформа geneXplain 362
Приложение 8.4 Платформа Genome Enhancer 366
Приложение 8.5 Примеры использования платформы Sirius-web 370
Приложение 8.6 Апробация платформы u-science в проекте "Супер С-тау фабрика" 379
Приложение 8.7 Акты внедрения результатов диссертационной работы:
ПК BioUML и разработанных на его основе компьютерных систем 384



