Введение
Глава 1 . Обзор основных проблем биоинформатики и анализа символьных последовательностей 13
1.1. Основные задачи в исследованиях символьных последовательностей 13
1.2. Проблема аннотирования геномов 15
1.3. Модели генетических текстов 17
1.4. Построение словарей генетических текстов 20
1.5. Распознавание структурных закономерностей в генетических текстах 22
1.6. Методы сравнения генетических текстов 27
1.7. Информация и энтропия 32
1.8. Выводы Главы 1 37
Глава 2. Частотный словарь. Случай глобального восстановления. 38
2.1. Соотношение "последовательность - конечно-частотный словарь" и проблема восстановления целого из частей 38
2.2. Конечно-частотный словарь и проблема восстановления полной последовательности 39
2.3. Характеристики конечно-частотных словарей для реальных нуклеотидных последовательностей 41
2.4. Изменение избыточности генов в результате сплайсинга 52
2.5. О распределении наидлиннейших повторов в различных участках последовательности 76
2.6. О распределении наидлиннейших повторов в геномах некоторых организмов 85
2.7. Выводы Главы 2 97
Глава 3. Частотный словарь. Случай локального восстановления 98
3.1. Задача локального восстановления. Гипотеза наиболее вероятного продолжения 98
3.2. Принцип максимума энтропии частотного словаря и восстановление частотных словарей большей толщины по заданному 99
3.3. Локальное востановление частотных словарей и проблема выбора статистической модели генетического текста 102
3.4. Информационное содержание частотных словарей 105
3.5. Предельная энтропия, удельная энтропия и качество восстановления частотных словарей 112
3.6. Качество восстановления для некоторых реальных символьных последовательностей 116
3.7. Отличия реальных и восстановленных частотных словарей некоторых генетических текстов 119
3.8. Сравнительное исследование информационных свойств генов вирусов и генов их хозяев 139
3.9. Информационная ёмкость некоторых геномов 164
3.10. Микроинформационная структура генов и геномов 169
3.11. Самоподобие геномов 199
3.12. Выводы Главы 3 225
Глава 4. Распределение информационно значимых слов в геномах 227
4.1. Поиск и выделение информационно значимых сайтов в символьных последовательностях 228
4.2. Поиск и выделение информационно значимых сайтов в некоторых биологических последовательностях 231
4.3. Поиск и выделение информационно значимых сайтов в геномах 239
4.4. Информационно значимые сайты функционально различных частей в геномах 255
4.5. Связь между информационно значимыми сайтами различной длины в геномах 258
4.6. О связи структуры и функции в геномах: статистическая семантика геномов 274
4.7. Выводы Главы 4 278
Глава 5. Информационные и статистические подходы к определению близости символьных последовательностей 280
5.1. Сравнение символьных последовательностей по носителям их конечно-частотных словарей 282
5.2. Сравнение генетических текстов по носителям их конечно-частотных словарей 287
5.3. Сравнение символьных последовательностей по их конечно частотным словарям 290
5.4. Сравнение нескольких символьных последовательностей с помощью их конечно-частотных словарей 292
5.5. Сравнение символьных последовательностей по их частотным словарям 294
5.6. Сравнение генетических текстов по их частотным словарям 302
5.7. Сравнение геномов по наборам их информационно значимых слов 350
5.8. Сравнение функционально различных частей генома по наборам их информационно значимых слов 362
5.9. Выводы Главы 5 369
Заключение 371
Выводы 377
Список литературы 380


