Введение
1 Обзор литературы 7
1.1 Особенности строения бактериальных геномов 7
1.2 Транскрипция в прокариотах 10
1.2.1 РНК-полимераза и её роль в процессе транскрипции 10
1.2.2 Механизмы регуляции инициации транскрипции 14
1.3 Промоторы 16
1.3.1 Основные элементы нуклеотидной последовательности 70-промоторов 17
1.3.2 Физико-химические и структурные характеристики молекулы ДНК, вносящие вклад в процесс промоторно-полимеразного узнавания 20
1.3.3 Промоторные островки 20
1.4 Методы предсказания положения промоторов 22
1.4.1 Анализ нуклеотидной последовательности 22
1.4.2 Анализ структурных особенностей ДНК в промоторах 23
1.5 Роль электростатического потенциала в ДНК-белковом взаимодействии 25
2 Материалы и методы 28
2.1 Источники данных 28
2.2 Построение баз данных 29
2.3 Используемые методы 30
2.3.1 Расчет электростатического потенциала 30
2.3.2 Дискриминантный анализ на основе проекций на латентные структуры 31
2.3.3 SAX- и iSAX-представления числовых рядов 33
2.4 Оценка предсказательной способности классификационных моделей 35
2.5 Обработка и визуализация данных 36
3 Хранение, поиск и анализ профилей физических свойств ДНК 37
3.1 База данных для хранения профилей физических свойств 37
3.1.1 Возможные запросы к базе данных 41
3.2 Графовая база данных 42
3.2.1 Основные служебные категории 49
3.2.2 Возможные запросы к базе данных 51
4 Анализ нуклеотидной последовательности промоторов 54
4.1 Подготовка данных 54
4.2 Анализ структуры нуклеотидного состава промоторов 55
4.2.1 Описание алгоритма 55
4.2.2 Множественные потенциальные -10 и -35 области 56
4.2.3 Функциональные элементы нуклеотидной последовательности в экспериментально подтвержденных и предсказанных промоторах 59
4.3 Анализ гексануклеотидного состава промоторных областей 61
5 Предсказание положения промоторов по распределению электростатического потенциала вдоль молекулы ДНК 66
5.1 Предсказание положения промоторов на основе профилей электростатического потенциала 67
5.1.1 Подготовка данных 67
5.1.2 Построение классификационных моделей и оценка их характеристик 68
5.1.3 Анализ кривых ошибок 72
5.1.4 Вклад переменных в результат классификации 73
5.2 Построение редуцированных классификационных моделей 76
5.2.1 Модели с максимальной точностью 76
5.2.2 Модели на основе 10 значений электростатического потенциала 77
5.3 Методы предсказания промоторов по закономерностям нуклеотидного состава 78
5.3.1 Краткое описание рассмотренных алгоритмов 78
5.3.2 Сравнение характеристик 79
5.3.3 Положительные предсказания рассмотренных алгоритмов 80
5.4 Ошибочно классифицируемые промоторы 82
6 Поиск промоторов на полной последовательности хромосомы E.coli 91
6.1 Подготовка данных 91
6.2 Анализ полученных предсказаний 93
6.3 Предсказания для промоторных островков 95
6.4 Методы текстового анализа последовательностей 96
Заключение 100
Список рисунков 106
Список таблиц 108
Литература 109
Приложение А 125


