СОДЕРЖАНИЕ
ВВЕДЕНИЕ.
1. Технические задачи информационного поиска.
2. Поиск в Вебпространстве
3. Постановка задачи данной работы
4. Цель работы
5. Основные задачи работы.
6. Положения научной новизны
7. Результаты.
ПРЕДСТАВЛЕНИЕ ВЕБПРОСТРАНСТВА
1.1. Структура Вебграфа
1.2. Степенной закон распределения гиперссылок в Вебфафе.
1.3. Обход ВебГрафа
1.4. Выводы.
ВЕБКРАУЛЕРЫ В ИНФОРМАЦИОННОМ ПОИСКЕ
2.1. Критерии эффективной работы Вебкраулера.
2.2. Архитектурные особенности Вебкраулеров
2.3. Архитектура Вебкраулера с универсальным ядром и ее реализация
2.4. Поиск и обновление значимых Вебстраниц
2.4.1. Метрики значимости Вебстраниц.
2.4.2. Типы Вебкраулеров.
2.4.3. Обновление Вебстраниц.
МЕТОДЫ И МОДЕЛИ ИНФОРМАЦИОННОГО ПОИСКА.
3.1. Модель документа
3.2. Модель на множестве слов
3.2.1. Проблемы выделения слов в документе.
3.2.2. Модель па стемминге документа.
3.2.3. Модель на взвешивании слов документа
3.3. Модель с использованием пар слов
3.4. Семантическая модель документа
3.5. Модель на анализе гиперссылок.
3.5.1. Модель на алгоритме Клейнбсрга I.
3.5.1.1. Построение фокусированного Вебграфа в I алгоритме.
3.5.1.2. Вычисление индексных и авторитетных источников информации
3.5.2. Модель на алгоритме
3.5.2.1. Стандартный .
3.5.2.2. Модифицированный
3.5.2.3. Итеративное вычисление
ОЦЕНКА КАЧЕСТВА ИНОРМАЦИОННОГО ПОИСКА.
4.1. Базовые метрики оценки качества.
4.2. Дополнительные метрики оценки качества
4.3. точечный график полноты и точности.
4.4. Стандартные тестовые коллекции
4.5. Выводы
РЕАЛИЗАЦИЯ
5.1. Реализация тематического Вебкраулера.
5.1.1. Тематический Вебкраулер на основе I взвешивания
5.1.2. Тематический Вебкраулер на основе алгоритма I
5.1.3. Тематический Вебкраулер на основе совместного использования алгоритма I и взвешивания I.
5.2. Сравнение с аналогами.
5.3. Среда разработки
5.4. Выводы
ЭКСПЕРИМЕНТ
6.1. Описание эксперимента
6.2. Результаты эксперимен та.
6.3. Выводы.
СПИСОК ЛИТЕРАТУРЫ
- Київ+380960830922