Введение
1. Распознавание и идентификация адресов сообщений и автоматическая обработка текстов 9
1.1. Проблема автоматической индексации сообщений 9
1.2. Обзор методов автоматической обработки текстов и выработка подхода к решению задачи 20
1.3. Постановка задачи
Выводы 32
2. Исследования адресной части сообщений и разработка метода автоматической индексации 34
2.1. Анализ информационной структуры адресной части сообщений 34
2.2. Анализ отклонений в основании адреса 44
2.3. Методика классифицирования и классификация лексем адресной части сообщений 52
2.4. Формальное представление основания адреса 71
2.5. Метод автоматической индексации 77
Выводы 83
3. Синтез функциональной структуры и алгоритмы автоматической системы индексации сообщений 85
3.1. Способ формального представления программного обеспечения 85
3.2. Функциональная структура автоматической системы индексации сообщений и представление алгоритмов 93
3.3. Метод нейтрализации орфографических ошибок..., 100
3.4. Расчет вероятности и достоверности автоматической индексации , 107
Выводы НО
4. Организация базы данных III
4.1. Концептуальная модель III
4.2. Внутренняя модель и организация работы с базой данных 120
4.3. Оптимизация объема базы данных и выбор версии автоматической системы индексации сообщений 126
Выводы 130
5. Показатели эффективности автоматической системы индексации сообщений 132
5.1. Выбор и обоснование показателей эффективности 132
5.2. Вероятностная оценка среднего числа обращений к накопителю на магнитном диске 138
5.3. Методика расчета экономической эффективности 144
5.4. Результаты испытаний автоматической системы индексации сообщений 148
Выводы 154
Заключение 155
Литература 158
Приложения 167
Приложение i. Гримеры адресов 168


