Ви є тут

Повышение релевантности периодического тематического поиска информации в Web

Автор: 
Максаков Алексей Владимирович
Тип роботи: 
диссертация кандидата физико-математических наук
Рік: 
2007
Кількість сторінок: 
117
Артикул:
14864
179 грн
Додати в кошик

Вміст

ВВЕДЕНИЕ.
1. Обзор методов решения задачи периодического тематического поиска
1.1 Особенности задачи информационного поиска в УеЬ
1.2 Показатели качества поиска
1.3 Требования к системам периодического тематического поиска и критерии их эффективности
1.4 Существующие решения задачи периодического поиска в УеЬ.
1.4.1 Периодический поиск с использованием систем поиска по ключевым словам
1.4.2. Периодический поиск с использованием метаинформационнных поисковых систем.
1.4.3. Периодический поиск новой информации на подмножестве источников информации УеЬ.
1.4.4.Поиск обновлений в тематических каталогах.
1.5 Основные подходы к решению задачи тематической фильтрации .
1.5.1 Сравнение метода поиска по ключевым словам с методами поиска, основанными на использовании методов машинного обучения
1.5.2 Оценка необходимого объема вычислений для обработки новой информации УеЬ
1.5.3 Варианты практического использования методов машинного обучения для решения задачи периодического тематического поиска.
1.6 Выводы
2. Метод периодического тематического поиска, основанный на использовании классификаторов.
2.1 Постановка задачи.
2.2 Описание предложенного метода.
2.2.1 Схема работы метода.
2.3 Алгоритм составления запроса по ключевым словам на основе обучающей выборки
2.4 Обоснование предложенного метода.
2.5 Выводы.
3. Методы решения задачи классификации текстов.
3.1 Требования к алгоритмам классификации
3.2 Метрики качества классификации.
3.3 Основные этапы классификации текстов.
3.4 Основные подходы к представлению текстов.
3.4.1 Использование морфологического анализа.
3.4.2 Использование синтаксического анализа
3.4.3 Определение пространства признаков.
3.4.4 Методы выбора признаков
3.4.5 Кластеризация признаков
3.4.6 Отбор фраз.
3.4.7 Определение весов признаков
3.5 Оценка алгоритмов классификации на коллекциях документов.
3.6 Критерии сравнения алгоритма классификации.
3.7 Обзор алгоритмов классификации.
3.7.1 Метод Байеса.
3.7.2 Алгоритм ЯоссЫо
3.7.3 Вероятностный классификатор ТБГОБ
3.7.4 Метод кближайших соседей
3.7.5 Метод опорных векторов.
3.7.6 Нейронные сети.
3.7.7 Деревья решений
3.7.8 Алгоритмы построения булевских формул
3.8 Сравнительный анализ алгоритмов классификации
3.9 Описание масштабируемых алгоритмов классификации текстов
3.9.1 Модификация метода Байеса
3.9.2 Метод построения нескольких разделяющих гиперплоскостей
ЗЛО Сопоставление весов признакам для метода опорных векторов ЗЛ1 Экспериментальное исследование алгоритмов классификации и
способов представления документов
31 Методология проведения экспериментов
32 Описание тестовых коллекций.
33 Результаты экспериментов
34 Выводы
4. Практическая реализация предложенного подхода.
4.1 Архитектура реализации
4.2 Способы получения анализируемого множества документов из
4.3 Практическая апробация предложенного подхода.
4.4 Выводы.
Заключение.
Список литературы