Автоматическая рубрикация новостных сообщений средствами синтаксической семантики

Добров Алексей Владимирович. Автоматическая рубрикация новостных сообщений средствами синтаксической семантики: диссертация ... кандидата филологических наук: 10.02.21 / Добров Алексей Владимирович;[Место защиты: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный университет"].- Санкт-Петербург, 2014.- 418 с.
Автор
Добров Алексей Владимирович
Год
2014
  • 99 000 UZS

Оглавление диссертации
Введение
ГЛАВА 1. Проблемы математического моде лирования языковых единиц в области автоматической обработки текстов 16
1.1 Виды автоматической обработки текстов и области ее применения 19
1.2 Унив ерсальные способы моделирования знаний в об ластях
автоматической обработки текстов и искусственного интеллекта 22
1.2.1 Направления исследований в области и скусственного инт еллекта, относящиеся к автоматической обработке текстов 23
1.2.2 Проблема универсальных алгоритмов в автоматической обработке текста и искусственном интеллекте 24
1.2.3 Спо собы пре дставления знаний в сис темах а втоматической обработки текстов и искусственного интеллекта в контексте проблемы машинного обучения 26
1.2.4. Проблема разграничения знаний о языке и знаний о мире в сист емах автоматической обработки текстов и искусственного интеллекта 28
1.3 Проблемы математического моделирования синтаксических структур в различных лингвистических концепциях 29
1.3.1 Структуры непосредственных составляющих 31
1.3.2 Моделирование линейного порядка слов и взаимодействия грамматических признаков в трансформационной порождающей грамматике Н. Хомского 34
1.3.3 Проблема линеаризации структур составляющих: идеи , ал ьтернативные трансформациям 44
1.3.4 Структуры зависимостей 47
1.3.5 Комбинированные с труктуры непосредственных сост авляющих и зависимостей 48
1.4 Проблемы мод елирования грамматической семан тики в области автоматической обработки текста 50
1.4.1 Проблемы моделирования категориальных грамматических значений и учета грамматической полисемии при автоматической обработке текста 51
1.4.2 Свойства формальности и интенциональности грамматических значений в контексте автоматической обработки текста 52
1.4.3 Проблема моделирования межкатегориального взаимодействия 53
1.5 Пробл емы онтологич еского моделиро вания лексической семант ики в области автоматической обработки текста 55
1.6 Выводы 61
ГЛАВА 2. Теории син таксической семантики и их значение для автоматической обработки текста 62
2.1 Онтологоцентрический подход к моделированию семантики предложения 64
2.2 Концептоцентрический подход к моделированию семантики предложения 65
2.2.1 Пропозициональное направление в рамках концептоцентрического подхода к моделированию семантики предложения 65
2.2.2 Падежно-ролевые подходы к моделированию семантики предложения 66
2.2.3 Непропозициональное направление в рамках концептоцентрического подхода к моделированию семантики предложения 70
2.3 Синтактикоцен трический подход к моделированию семанти ки предложения 71
2.4 Антропоцентрический подход к моделированию семантики предложения 72
2.5 Комплексные подходы к моделированию семантики предложения 74
2.6 Подходы, основанные на сетевом моделировании семантики предложения 77
2.7 Подходы к моделированию семантики связного текста 82
2.7.1 Моделирование семантики анафорических отношений 83
2.7.2 Проблема моделирования актуального членения 86
2.7.3 Моделирование тематических прогрессий 89
2.7.4 Моделирование синтаксиса связного текста 90
2.8 Выводы 91
ГЛАВА 3. Методы автомат ической обра ботки текста и способы оценки их эффективности 93
3.1. Методы автоматического морфологического анализа текста 93
3.1.1 Основные проблемы автоматического морфологического анализа 93
3.1.2 Декларативные и процедурные методы автоматического морфологического анализа 95
3.1.3 Методы снятия морфологической неоднозначности 97
3.1.4 Способы оценки эффективности морфологического анализа 98
3.2. Методы автоматического синтаксического анализа текста 99
3.2.1 Основные проблемы автоматического синтаксического анализа 99
3.2.2 Одноцелевые, многоцелевые и комбинированные методы автоматического синтаксического анализа 101
3.2.3 Направленность ме тодов ав томатического синтакс ического анализа на построение графа зависимостей и на пост роение структуры непоср едственных составляющих 102
3.2.4 Формаль но-грамматические и вероя тностно-статистические методы автоматического синтаксического анализа 104
3.2.5 Методы снятия синтаксической неоднозначности 104
3.3. Методы автоматического семантического анализа текста 106
3.3.1 Проблемы семантического анализа текстов 106
3.3.2 Опубликованные универсал ьные онтологии, использу емые в с истемах автоматической обработки текстов 108
3.4 Тематическая к лассификация новостных т екстов. Методы автоматической рубрикации текста 118
3.4.1 Методы автоматической рубрикации текста 119
3.4.2 Автоматическая рубрикация текстов и информационный поиск 124
3.5 Анализ способов измерения эффективности автоматической рубрикации текста 127
3.5.1 Меры точности и полноты автоматической рубрикации текста 127
3.5.2 Статистические меры эффективности автоматической рубрикации текста 129
3.6 Особенности новостных сообщений как материала для автоматической рубрикации 132
3.6.1 Новостные сообщения и новостные тексты 134
3.6.2 Использование новос тных с ообщений как материала для оценки эффективности систем автоматической рубрикации текстов 140
3.7 Выводы 141
ГЛАВА 4. Система автоматической рубрикации новостных сообщений сред ствами синтаксического и семантического анализа текстов 143
4.1 Возможности применения комплексного лингвистического анализа текста к его автоматической рубрикации 143
4.2.1 Морфологический анализ узуальных и окказиональных словоформ в тексте 144
4.2.2 Алгорит мы анализа деривационных отношений в морфологии, словообразовании и синтаксисе 150
4.2.3 Алгоритм семантического анализа 160
4.3. Струк тура лингвис тического процес сора и ли нгвистических модулей русского языка 162
4.3.1 Структура лингвистического процессора 165
4.3.2 Разработанная система грамматических категорий 169
4.3.3 Разработанный морфологический словарь русского языка 171
4.3.4 Грамматические модули русского синтаксиса и синтаксической семантики. Моделирование разрывных составляющих 172
4.3.5 Разработанная онтология 187
4.4 Структура системы автоматической рубрикации новостных сообщений,
основанной на синтаксическом и семантическом анализе текстов 188
4.5 Пров ерка эфф ективности разработанной системы автоматической
рубрикации новостных сообщений 190
Заключение

Рекомендуем вам товары

99 000 UZS
Автор
Шевцова Анна Юрьевна
Количество страниц
Год
2014
99 000 UZS
Автор
Атаманова, Ольга Викторовна
Количество страниц
Год
2012
99 000 UZS
Автор
Салагай, Марина Олеговна
Количество страниц
Год
2011
99 000 UZS
Автор
Хохлова, Мария Владимировна
Количество страниц
Год
2010
99 000 UZS
Автор
Демидова Екатерина Викторовна
Количество страниц
Год
2008
Модули для Opencart 2, Опенкарт 3