Вы здесь

Комбинаторные оценки вероятности переобучения и их применение в логических алгоритмах классификации

Автор: 
Ивахненко Андрей Александрович
Тип работы: 
Кандидатская
Год: 
2010
Артикул:
322070
179 грн
Добавить в корзину

Содержимое

Оглавление
Введение
1 Обобщающая способность
1.1 Задача классификации
1.2 Проблема переобучения.
1.3 Логические алгоритмы классификации
1.4 Постановка задачи.
2 Комбинаторные оценки вероятности переобучения
2.1 Метод порождающих и запрещающих множеств .
2.2 Оценки расслоениясвязности.
2.3 Структура классов эквивалентности
2.4 Обобщение на случай номинальных и порядковых признаков
2.6 Численные методы оценивания вероятности переобучения
2.6 Информативность с поправкой на переобучение.
2.7 Численные эксперименты на модельных данных .
2.7.1 Анализ завышенности оценки расслоениясвязности.
2.7.2 Экспериментальное подтверждение методики
3 Построение логических алгоритмов классификации
3.1 Методы оценивания информативности правил
3.1.1 Эвристический пороговый е, 5критерий.
3.1.2 Гипергеометричсский критерий точный тест Фишера
3.1.3 Энтропийный критерий и индекс Джини.
3.1.4 Паретооптималышй фронт по паре критериев р,л.
3.2 Методы поиска информативных конъюнкций
3.2.1 Бинаризация исходной информации.
3.2.2 Стабилизация набора правил
3.2.3 Случайный поиск.
3.2.4 Случайный поиск с адаптацией
3.2.5 Усеченный поиск в ширину
3.3 Методы построения композиций информативных правил
3.3.1 Решающий список.
3.3.2 Взвешенное голосование .
3.3.3 Логистическая регрессия.
3.4 Методы оценивания апостериорных вероятностей
4 Вычислительные эксперименты на реальных данных
4.1 Модифицированный критерий информативности.
4.2 Анализ переобучениости правил.
4.3 Уменьшение переобучениости .
4.4 Оценивание апостериорной вероятности .
Заключение
Введение
Диссертационная работа относится к математической теории распознавания и классификации и посвящена проблеме повышения обобщающей способности логических алгоритмов классификации, основанных на поиске информативных конъюнктивных закономерностей в массивах прецедентных данных с вещественными, порядковыми и номинальными признаками.
Актуальность