Введение
Глава 1. Аналитический обзор предметной области и постановка задачи исследования 11
1.1 Концептуальные основы разработки системы распознавания архивных документов с автоматической корректировкой результатов 11
1.2 Обзор и сравнительный анализ систем оптического распознавания символов при обработке архивных документов 18
1.3 Классификация ошибок оптического распознавания символов 24
1.4 Методы корректировки ошибок правописания слов и оптического распознавания символов 27
1.5 Выводы по первой главе 36
Глава 2. Автоматическая корректировка ошибок оптического распознавания на основе рейтинго-ранговой модели текста 38
2.1 Описание метода вычисления расстояния Левенштейна между словами и алгоритма поиска схожих слов методом анаграмм 38
2.2 Общий алгоритм метода автоматической корректировки ошибок распознавания на основе рейтинго-ранговой модели текста 45
2.3 Предварительная обработка результатов распознавания архивных документов и подготовка структур данных для выявления ошибок и генерации набора корректировок 47
2.4 Генерация набора корректировок и правила их ранжирования и выбора наиболее подходящих для замены ошибочных слов 51
2.5 Выводы по второй главе 57
Глава 3. Технология и система автоматической корректировки результатов распознавания архивных документов
3.1 Технология распознавания архивных документов с корректировкой результатов и ее интеграция в бизнес процесс обработки документов электронного архива 59
3.2 Архитектура и компонентная модель системы распознавания архивных документов и корректировки результатов 65
3.3 Программный комплекс настройки процесса обработки архивных документов различных тематических областей 68
3.4 Программный комплекс пакетного распознавания изображений и корректировки результатов 77
3.5 Программный комплекс автономной обработки отдельного изображения 79
3.6 Выводы по третьей главе 84
Глава 4. Апробация технологии и системы автоматической корректировки результатов при распознавании документов архивного фонда 87
4.1 Последовательность и условия проведения опытной эксплуатации разработанной технологии и системы 87
4.2 Критерии оценки качества 92
4.3 Оценка метода автоматической корректировки результатов распознавания на основе рейтинге-ранговой модели текста и результаты автоматической корректировки всего корпуса распознанных документов .. 94
4.4 Выводы по четвертой главе 105
Заключение 108
Список литературы 111


