Технология и система автоматической корректировки результатов при распознавании архивных документов

Смирнов Сергей Владимирович. Технология и система автоматической корректировки результатов при распознавании архивных документов: диссертация ... кандидата технических наук: 05.13.11 / Смирнов Сергей Владимирович;[Место защиты: Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук, www.spiiras.nw.ru/dissovet].- Санкт-Петербург, 2015.- 130 с.
Автор
Смирнов Сергей Владимирович
Год
2015
  • 99 000 UZS

Оглавление диссертации
Введение
Глава 1. Аналитический обзор предметной области и постановка задачи исследования 11
1.1 Концептуальные основы разработки системы распознавания архивных документов с автоматической корректировкой результатов 11
1.2 Обзор и сравнительный анализ систем оптического распознавания символов при обработке архивных документов 18
1.3 Классификация ошибок оптического распознавания символов 24
1.4 Методы корректировки ошибок правописания слов и оптического распознавания символов 27
1.5 Выводы по первой главе 36
Глава 2. Автоматическая корректировка ошибок оптического распознавания на основе рейтинго-ранговой модели текста 38
2.1 Описание метода вычисления расстояния Левенштейна между словами и алгоритма поиска схожих слов методом анаграмм 38
2.2 Общий алгоритм метода автоматической корректировки ошибок распознавания на основе рейтинго-ранговой модели текста 45
2.3 Предварительная обработка результатов распознавания архивных документов и подготовка структур данных для выявления ошибок и генерации набора корректировок 47
2.4 Генерация набора корректировок и правила их ранжирования и выбора наиболее подходящих для замены ошибочных слов 51
2.5 Выводы по второй главе 57
Глава 3. Технология и система автоматической корректировки результатов распознавания архивных документов
3.1 Технология распознавания архивных документов с корректировкой результатов и ее интеграция в бизнес процесс обработки документов электронного архива 59
3.2 Архитектура и компонентная модель системы распознавания архивных документов и корректировки результатов 65
3.3 Программный комплекс настройки процесса обработки архивных документов различных тематических областей 68
3.4 Программный комплекс пакетного распознавания изображений и корректировки результатов 77
3.5 Программный комплекс автономной обработки отдельного изображения 79
3.6 Выводы по третьей главе 84
Глава 4. Апробация технологии и системы автоматической корректировки результатов при распознавании документов архивного фонда 87
4.1 Последовательность и условия проведения опытной эксплуатации разработанной технологии и системы 87
4.2 Критерии оценки качества 92
4.3 Оценка метода автоматической корректировки результатов распознавания на основе рейтинге-ранговой модели текста и результаты автоматической корректировки всего корпуса распознанных документов .. 94
4.4 Выводы по четвертой главе 105
Заключение 108
Список литературы 111

Рекомендуем вам товары

99 000 UZS
Автор
Тележкин Александр Михайлович
Количество страниц
Год
2015
99 000 UZS
Автор
Лапин, Виталий Александрович
Количество страниц
Год
2011
99 000 UZS
Автор
Теплов Алексей Михайлович
Количество страниц
Год
2015
Модули для Opencart 2, Опенкарт 3