Введение
Глава 1. Разрешение лексической многозначности 9
1.1. Используемая терминология 11
1.1.1. Терминология классической лингвистики 11
1.1.2. Терминология компьютерной лингвистики 13
1.2. Основные проблемы разрешения лексической многозначности . 16
1.2.1. Значение 17
1.2.2. Контекст 19
1.2.3. Методы оценки 22
1.3. Обзор работ 26
1.3.1. Работы 50-х — 80-х годов 27
1.3.2. Методы, основанные внешних источниках знаний . 30
1.3.3. Методы, основанные на обучении по размеченным корпусам 39
1.3.4. Методы, основанные на обучении по неразмеченным корпусам 45
1.4. Выводы к первой главе 47
Глава 2. Вычисление семантической близости в сетях документов 49
2.1. Сети документов 49
2.2. Семантическая близость в сетях документов 52
2.2.1. Локальные методы 54
2.2.2. Глобальные методы 56
2.3. Википедия 59
2.3.1. Вычисление семантической близости между статьями Ви-кипедии 61
2.3.2. Обработка Википедии 65
2.4. Обзор работ, использующих Википедию для устранения лексической многозначности 70
2.5. Выводы ко второй главе 74
Глава 3. Снятие лексической многозначности 76
3.1. Общий процесс обработки 77
3.2. Метод, использующий однозначный контекст 79
3.2.1. Описание метода 79
3.2.2. Эксперименты 81
3.2.3. Выбор параметров и результаты 84
3.2.4. Выводы 86
3.3. Метод на основе специализированной марковской модели . 89
3.3.1. Описание метода 89
3.3.2. Эксперименты 93
3.3.3. Выводы 94
3.4. Метод на основе марковской модели, обобщенной на случай нескольких независимых цепей 95
3.4.1. Мотивация и примеры 95
3.4.2. Обобщение марковской модели 97
3.4.3. Алгоритм для нахождения наиболее вероятной последовательности состояний 102
3.4.4. Применение модели к задаче устранения лексической многозначности 113
3.4.5. Эксперименты 117
3.4.6. Выводы 119
3.5. Выводы к третей главе 120
Заключение 122
Литература 123


