Содержание
Введение
Глава 1. Проблема обнаружения схожих документов .
1.1. Задача распознавания схожих документов
1.2. Определение понятия схожих документов .
1.3. Источники схожих документов в Интернете .
1.4. Основные метрики подобия документов
1.5. Методы обнаружения схожих документов
1.6. Методы кластеризации
1.7. Предварительная обработка документа
1.8. Постановка задачи
Глава 2. Моделирование системы оценки схожести документов на уровне блоков
2.1. Модель представления документа
2.2. Метод выделения блоков из документа .
2.3. Метод оценки схожести блоков.
2.4. Подходы к формализации нечеткости знаний о схожести документов .
2.5. Метод оценки схожести доку ментов
2.6. Выводы.. .
Глава 3. Алгоритмизация процедуры оценки схожести документов на уровне блоков .
3.1. Алгоритмы разбиения страниц на блоки.
3.2. Алгоритмы создания единого отпечатка на основе локальных параметров документа .
3.3. Выводы.
Глава 4. Программная реализация метода оценки схожести деЬдокументов
4.1. Структура программного обеспечения
4.2. Программная платформа
4.3. Программная реализация.
4.4. Графический интерфейс .
4.5. Последовательность работы с программой .
4.6. Тестирование программы
4.7. Результаты практической апробации метода оценки схожести дкментов на уровне составляющих их блоков.
4.8. Выводы.
Заключение .
Литература
- Київ+380960830922