Введение
Глава 1. Анализ современного состояния математического и программного обеспечения информационного анализа биологических последовательностей 12
1.1. Статистический анализ и предсказание сайтов связывания рибосом 13
1.2. Исследование сложности генетических текстов 17
1.3. Нахождение повторяющихся участков в последовательностях 24
1.3.1. Статистическая значимость повторов 26
Глава 2. Реализация пакета прикладных программ для исследования структурной организации последовательностей 32
2.1. Интерфейс пользователя и типы входных данных 36
2.2. Сервисные программы 37
2.2.1. Программа BNKFREQ - формирование по базе данных выборки участков 39
2.2.2. Программа BNKFR2 - формирование по базе данных выборок участков 43
2.2.3. Программа RANDSEQ - генерирование псевдослучайной последовательности 44
2.2.4. Программа TAKESEQ - подготовка заданного фрагмента последовательности 48
2.3. Специальные программы для исследования серий последовательностей 48
2.3.1. Программа G2 - вычисление информационного содержания выборки 49
2.3.2. Программа ABACK- выравнивание выборки участков 50
2.3.3. Программы SHHIST, SHHIST2-расчет статистик 52
2.3.4. Программы EXCELF1, EXCELF2, EXCELF3 - расчет данных для электронных таблиц 53
2.3.5. Программы TEST1, TEST2, TEST3 - - расчет активности участков выборки 54
2.3.6. Программы ERHIST, ERHIST - расчет характеристик распределения значений функции, полученных на выборке 55
2.3.7. Программа STAT - оценка качества расчета активностей выборок 57
2.4. Программы обработки 57
2.4,1. Высоко- и низкочастотная компоненты графа-программного разложения 58
2.4.2. Программа SHENON - расчет информационной избыточности текста 59
2.4.3. Программа LZW- алгоритмическая сложность текста 60
2.4.4. Программа MOTIFS - поиск неточных повторов 61
2.4.5. Программа ZGRAMM - построение словаря последовательности 66
Глава 3. Методика распознавания функциональных блоков на полных геномах 67
3.1. Поиск общего сигнала в сериях участков биологических последовательностей 68
3.2. Равновесное состояние графа программного разложения 70
3.3. Выбор параметров скользящего окна и длины программ 72
3.4. Какие особенности генетических последовательностей определяет новая информационная мера 74
Заключение 77
Библиография 81
Приложение 1 89
Приложение 2 92
Приложение 3 96
Приложение 4 97
Приложение 5 100


