Введение
2. Обзор литературы 8
2.1. Интеллектуальный анализ биомедицинских текстов 9
2.1.1. Распознавание названий белков (генов) в публикациях 11
2.1.2. База данных белков UniProt 14
2.1.3. Применение ИАТ для выявления белковых взаимосвязей 17
2.1.4. Оценка релевантности документов 22
2.1.5. База данных MEDLINE и поисковая система PubMed 27
2.2. Семантические модели молекулярной биологии 31
2.2.1. Онтология генов Gene Ontology 32
2.2.2. Энциклопедия метаболических путей KEGG 37
2.2.3. UMLS - унифицированная система медицинского языка 38
2.3. Семантические сети генов и белков 39
3. Материалы и методы 47
3.1. Алгоритм построения и анализа семантических сетей 47
3.2. Выборки белков 48
3.3. Методика работы с реферативной базой данных 50
3.4. Идентификация названий белков
3.5. Мера семантического сходства между белками 53
4. Результаты и обсуждение 58
4.1. Контекстный поиск названий белков в текстах рефератов 58
4.2. Матрица семантического сходства 64
4.3. Семантические сети белков 71
4.4. Сопоставление сетевых подграфов с разделами KEGG и с аннотациями GO 80
4.5. Сопоставление сетевых подграфов с видовой принадлежностью белков 88
5. Заключение 91
6. Выводы 96
7. Список литературы 97
Благодарности 105


