Введение
ГЛАВА 1. Состояние проблемьї идентификации объектов в базах данных 7
1.1 Проблемы идентификации объектов в базах данных 7
1.2 Ограничения существующих поисковых алгоритмов 15
1.3 Постановка задач исследования 27
ГЛАВА 2. Разработка процедур нестрогого соответствия .32
2.1 Процедура определения функции релевантности 32
2.2 Процедура вычисления расстояния между строками 51
2.3 Процедура приближенного поиска по длинным строкам 56
2.4 Процедура формирования ключа фонетической похожести 65
Выводы 70
ГЛАВА 3. Разработка алгоритмов идентификации объектов в базах данных 71
3.1 алгоритм поиска и устранения дубликатов 71
3.2 алгоритм идентификации физических лиц 81
3.3 алгоритм поиска по отдельным атрибутам 89
Выводы 92
Глава 4. Практическое применение алгоритмов идентификации объектов в базах данных 93
4.1 Особенности программной реализации средств автоматизации поиска дубликатов в базе данных 93
4.2 Исследование эффективности разработанных алгоритмов в коммерческих базах данных 100
4.3 Альтернативные применения 120
Выводы 125
Заключение l 126
Основные результаты работы 130
Литература


