Разработка математического обеспечения оценки схожести WEB-документов на основе структурно-семантического разбиения

Косинов Дмитрий Иванович. Разработка математического обеспечения оценки схожести WEB-документов на основе структурно-семантического разбиения : диссертация ... кандидата технических наук : 05.13.11 / Косинов Дмитрий Иванович; [Место защиты: Воронеж. гос. техн. ун-т].- Воронеж, 2008.- 146 с.: ил. РГБ ОД, 61 09-5/678
Автор
Косинов Дмитрий Иванович
Год
2008
  • 99 000 UZS

Оглавление диссертации
Введение
Глава 1. Проблема обнаружения схожих документов . 13
1.1. Задача распознавания схожих документов 15
1.2. Определение понятия схожих документов 17
1.3. Источники схожих документов в Интернете 19
1.4. Основные метрики подобия документов 20
1.5. Методы обнаружения схожих документов 22
1.6. Методы кластеризации 31
1.7. Предварительная обработка документа 33
1.8. Постановка задачи 34
Глава 2. Моделирование системы оценки схожести документов на уровне блоков 36
2.1. Модель представления web-документа 36
2.2. Метод выделения блоков из web-документа 39
2.3. Метод оценки схожести блоков 41
2.4. Подходы к формализации нечеткости знаний о схожести документов 44
2.5. Метод оценки схожести web-документов 45
2.6. Выводы 56
Глава 3. Алгоритмизация процедуры оценки схожести web-до кументов на уровне блоков 57
3.1. Алгоритмы разбиения web-страниц на блоки 57
3.2. Алгоритмы создания единого отпечатка на основе локальных параметров документа 74
3.3. Выводы 87
Глава 4. Программная реализация метода оценки схожести web-документов 89
4.1. Структура программного обеспечения 89
4.2. Программная платформа 92
4.3. Программная реализация 92
4.4. Графический интерфейс 95
4.5. Последовательность работы с программой 101
4.6. Тестирование программы 103
4.7. Результаты практической апробации метода оценки схожести web-документов на уровне составляющих их блоков 103
4.8. Выводы 111
Заключение 113
Литература

Рекомендуем вам товары

99 000 UZS
Автор
Павлов Павел Александрович
Количество страниц
Год
2025
99 000 UZS
Автор
Трифанов, Виталий Юрьевич
Количество страниц
Год
2013
99 000 UZS
Автор
Лавров Валерий Александрович
Количество страниц
Год
2005
99 000 UZS
Автор
Смирнов Сергей Владимирович
Количество страниц
Год
2005
Модули для Opencart 2, Опенкарт 3