Построение модели извлечения информации из технических текстов

Бабина Ольга Ивановна. Построение модели извлечения информации из технических текстов : Дис. ... канд. филол. наук : 10.02.21 Челябинск, 2006 272 с. РГБ ОД, 61:06-10/1568
Автор
Бабина Ольга Ивановна
Год
2006
  • 99 000 UZS

Оглавление диссертации
Введение
Глава I Модели и средства извлечения информации 16
1 1. Основные понятия и определения теории информационного поиска 16
1.2. Информационно-поисковые системы 18
1.2.1. ТшгаИПС 18
1.2.2. Лингвистический компонент ИПС 20
1.2.2Л. Информационно-поисковые языки : 20
1.2.2,2. Словарные средства ИПС 22
1.2.3- Оценка эффективности ИПС 25
1.3. Модели документального информационного поиска 27
1.3.1. Статистические модели поиска 27
1.3.1.1. Теоретико-множественные модели 27
1,3 Л .2. Векторные модели 29
13.1.3. Вероятностные модели 31
1.3.2. Лингвистические модели поиска 32
1.3.2.1, Синтаксические модели 32
3.3.2.2. Семантические модели 38
1.4. Поиск и извлечение информации в патентных исследованиях 39
1.5. Выводы по главе 1 45
Глава 2. Подъязык формул изобретения патентов на способ в фармакологаи ,,.47
2.1. Корпус текстов формул изобретения патентов 47
2.2. Общая характеристика лексики 53
2.3. Знаменательная лексика аргументов предикатов 55
2.4. Грамматическая и лексическая семантика предикатов 56
2.4Л. Морфологические характеристики предикатов 56
2.4.2. Валентности предикатов 64
2АЗ, Семантическая классификация предикатов 74
2,4.3.L Состав семантических классов предикатов 74
2.4.3.2. Семантический класс предикатов «Изменение состояния» 78
2.4.3.3. Семантический класс предикатов «Динамическое взаимодействие» 85
2.4.3.4. Семантический класс предикатов «Получение нового объекта»... 88
2.4.3.5. Семантический класс предикатов «Выявление» 91
2.4.3 А Семантический класс предикатов «Воздействие» 92
2,4.4. Функционирование предикатов в тексте патентной формулы 97
2.5. Служебные слова 103
2.6. Выводы по главе 2 108
Глава 3. Модель извлечения информации из поискового массива формул изобретения патентов на способ 111
3.1. Общая схема модели извлечения информации 111
3.2. Модуль формирования «индексной» части информационного массива 113
3.2.1. Разработка лексического компонента индексирования 113
3.2.1.1. Структура лексикона для автоматического анализа текста 113
3.2.1.2. Адаптация лексикона для патентных формул на способы в области фармакологии 120
3.2.2, Процедура индексирования и ее грамматический компонент 122
3.2.2.1. Общая схема индексирующей процедуры анализа 123
3.2.2.2. Первичное разбиение текста 129
3.2.2.3. Лексико-грамматический анализ текста 130
3.2.2.4. Семантико-синтаксический анализ текста 134
3.2.2.4.1. Восходящий анализ синтаксических конструкций 134
3.2.2.4.2. Восстановление кореференции именных групп 137
3.2.2.4.3. Поиск семантических зависимостей 139
3.2.2.5. Преобразование аргументов предиката 142
3.2.2.6. Определение состава компонентных зон 145
3.2.2.7. Заключительные замечания 148
3.3. Модуль формирования поискового предписания 149
3.4. Модуль выявления релевантных запросу документов 154
3.4.1. Тезаурус предметной области для процедуры сопоставления ПП и ПОД 154
3.4.2. Процедура сопоставления ПП и ПОД 157
3.4.2.1. Общая схема процедуры сопоставления 157
3.4.2.2. Поиск в ПОД кандидатов на соответствие единицам ПП 164
3.4.2.3. Сопоставление ПП и ПОД на уровне предикатно-аргументной конструкции 170
3.4.2.3.1. Сопоставление именных групп 172
3.4.2.3.1.1. Сопоставление головных существительных именных групп 176
3.4.2.3.1.2. Сопоставление прочих элементов в лексическом составе именных групп 186
3.4.2.3.1.3. Сопоставление валентностей аргументных выражений.. 190
3.4.2.3.1.4. Оценка сходства именных групп в целом 192
3.4.2.3.2. Сопоставление аргументного состава конструкций ПП и ПОД 193
3.4.2.3.3. Сопоставление предикатно-аргументных конструкций 193
3.4.2.4. Сопоставление ПП и ПОД на уровне компонентной зоны 195
3.4.2.5. Сопоставление ПП и ПОД на уровне запроса/документа 196
3.5. Выдача релевантных документов 199
3.6. Эксперимент по отбору текстов 200
3.7. Выводы по главе 3 206
Заключение 208
Список литературы

Рекомендуем вам товары

99 000 UZS
Автор
Варинская Виктория Михайловна
Количество страниц
Год
2005
99 000 UZS
Автор
Уткина Ирина Владимировна
Количество страниц
Год
2006
99 000 UZS
Автор
Долотин Константин Иванович
Количество страниц
Год
2007
99 000 UZS
Автор
Чернышов Михаил Юрьевич
Количество страниц
Год
2008
99 000 UZS
Автор
Корочков Александр Викторович
Количество страниц
Год
2005
Модули для Opencart 2, Опенкарт 3