Мультимодельный подход к эффективному картированию сайтов связывания транскрипционных факторов по данным ChIP-seq экспериментов

Мультимодельный подход к эффективному картированию сайтов связывания транскрипционных факторов по данным ChIP-seq экспериментов

1.5.8. — Математическая биология, биоинформатика (биологические науки) ДИССЕРТАЦИЯ на соискание учёной степени кандидата биологических наук

Автор
Цуканов Антон Витальевич
Год
2024
  • 99 000 UZS

Оглавление диссертации

2
Список сокращений 4
Введение 6
1. Литературный обзор 14
1.1 Функции транскрипционных факторов 14
1.2 Структура транскрипционных факторов 19
1.3 Общие представления о связывании ТФ с ДНК 27
1.4 Модели, используемые для описания сайтов связывания
транскрипционных факторов 29
1.4.1 Стандартные модели 29
1.4.1.1 Консенсус 29
1.4.1.2 Позиционная весовая матрица 31
1.4.2 Альтернативные модели ССТФ 34
1.4.2.1 Марковские модели 35
1.4.2.2 Модель, учитывающая структурные особенности ДНК 38
1.4.2.3 Модели на основе дискриминантного анализа 40
1.4.3 Оценка точности поиска мотивов разными моделями 42
1.5 Структурное разнообразие ССТФ 46
1.6 Биоинформатический анализ данных полученных ChIP-seq
экспериментом 51
1.6.1 Первичная обработка данных ChIP-seq 53
1.6.2 Вторичная обработка данных ChIP-seq – de novo поиск мотивов 55
2. Методы 58
2.1 Используемые данные 58
2.2 Конвейер программ для выявления структурной гетерогенности ССТФ.
58
2.3 Подготовка данных ChIP-seq 59
2.4 Выбор моделей и их параметров 60
2.5 Выбор порога для моделей на основе фиксированной ошибки
перепредсказания 61
2.6 Классификация пиков ChIP-seq по результатам распознавания сайтов
разными моделями мотива 63
2.7 Сравнение найденных мотивов с известными мотивами ТФ с помощью
программы TomTom 65
2.8 Аннотация пиков, содержащих ССТФ и анализ терминов ГО 65
2.9 Сравнение специфики поиска мотивов разными моделями 66
2.10 Статистический анализ и визуализация 67
3
3. Результаты и обсуждение 68
3.1 Анализ данных на примере FOXA2 68
3.1.1 Фильтрация данных на основе сравнения мотивов программой
TomTom 69
3.1.2 Оценка точности распознавания ССТФ для FOXA2 разными
моделями и выбор оптимальных длин 69
3.1.3 Классификация пиков ChIP-seq без учёта пересечения сайтов,
найденных разными de novo моделями 72
3.1.4. Классификация пиков ChIP-seq с учётом пересечения сайтов,
найденных разными моделями 76
3.1.5 Перекрёстная проверка моделей PWM на данных ChIP-seq, на
которых модели не обучались 79
3.2 Массовый анализ данных ChIP-seq для A. thaliana 81
3.2.1 Подготовка данных и выбор оптимальных моделей для анализа 81
3.2.2 Оценка качества исходных данных 82
3.2.3 Выбор оптимальных параметров и оценка точности распознавания
ССТФ для моделей 84
3.2.4 Сравнение структуры мотивов, распознаваемых разными моделями
для одних данных обучения 90
3.2.5 Сравнение специфики поиска мотивов разными моделями 96
3.2.6 Совместное применение моделей PWM, BaMM и SiteGA для
поиска ССТФ 100
3.2.7 Сравнительный анализ списков терминов генной онтологии,
полученных путём применения моделей PWM, BaMM и SiteGA 109
3.3 Массовый анализ данных ChIP-seq для M. musculus 116
3.3.1 Подготовка данных и выбор оптимальных моделей для анализа 116
3.3.2 Оценка качества исходных данных 117
3.3.3 Выбор оптимальных параметров и оценка точности распознавания
ССТФ для моделей 118
3.3.4 Совместное применение моделей PWM, BaMM и SiteGA для
поиска ССТФ 122
3.3.5 Сравнительный анализ списков терминов генной онтологии,
полученных путём применения моделей PWM, BaMM и SiteGA 124
3.3.6 Модель SiteGA распознаёт разные структурные варианты мотива
сайтов связывания для транскрипционного фактора JUNB 129
Заключение 132
Выводы 135
Список литературы 137
Приложение А 162
Приложение Б 199

Рекомендуем вам товары

99 000 UZS
Автор
Швецов Дмитрий Анатольевич
Количество страниц
157
Год
2024
99 000 UZS
Автор
Шмаков Николай Александрович
Количество страниц
159
Год
2024
99 000 UZS
Автор
Аникина Екатерина Валентиновна
Количество страниц
177
Год
2024
99 000 UZS
Автор
Гасумова Светлана Евгеньвна
Количество страниц
Год
2024
Модули для Opencart 2, Опенкарт 3