Ви є тут

Модели и методы автоматической классификации текстовых документов

Автор: 
Шабанов Владислав Игоревич
Тип роботи: 
Дис. канд. техн. наук
Рік: 
2003
Артикул:
15256
179 грн
Додати в кошик

Вміст

Содержание стр.
Введение
1. Посгановка задачи
1.1. Формулировки задач классификации и распознавания образов
1.2. Методы оценки эффективности системы классификации текстов.
1. 2.1. Определение меры эффективности классификации.
1.2.2. Возможные виды меры эффективности классификации
1.2.3. Тестовые наборы
1.3. Анализ требований, предъявляемых к обучающим выборкам.
1.4. Жизненный цикл системы автоматической классификации.
2. Обзор методов распознавания образов и классификации
2.1. Основные группы методов распознавания и классификации.
2.1.1. Предъявление обучающего множества
2.1.2. Варианты описаний объектов.
2.1.3. Правила классификации
2.2. Математические модели для одноуровневых рубрикаторов.
2.2.1. Классификаторы, основанные на правиле Байеса3
2.2.2. Сжатие словаря терминов байесовского классификатора
2.2.3. Метод максгшизации энтропии.
2.2.4. Классификация методом поиска Кближайших соседей кИИ
2.2.5. Метод центроид
2.2.6. Нейронные сети.
2.2.7. Ассоциативные сети.
2.3. Математические модели для иерархических рубрикаторов.
2.3.1. Метод вложенных классификаторов.
2.3.2. Метод стягивания параметров классификатора
2.4. Учет гиперссылок
2.5. Сравнение методов классификации.
Содержание продолжение стр.
3. Математическая модель автоматического классификатора текстовых документов
3.1. Математическая модель представления текстового документа
ЗАЛ. Выбор вида терминов.
3.1.2. Выбор методы сопоставления терминов.
3.1.3. Критерии выбора вида терминов и функции нормализации
3.1.4. Алгоритм приближенного выделения словосочетаний.
3.2. Математические модели для оценки значимости терминов
3.2.1. Собственная морфологическая значимость терминов
3.2.2. Контекстная значимость терминов.
3.2.3. Статистическая значимость терминов
3.2.4. Вычисление значимости выделенных из текста дат, денежных
сумм и т. д.
3.3. Математическая модель документов и рубрик, метод классификации
3.3.1. Модель семантического образа рубрики.
3.3.2. Модель классифицируемого документа
3.3.3. Метод классификации, основанный на полнотекстовом поиске
3.4. Математическая модель документов обучающей выборки, метод
обучения
3.4.1. Формирование семантических образов рубрик одного уровня
иерархии
3.4.2. Вычисление пороговых весов терминов и рубрик
3.5. Детальное описание алгоритма обучения классификатора
3.5.1. Структура базы данных системы автоматической
классификации.
3.5.2. Алгоритм обучения классификатора.
3.5.3. Вы числение весов терминов.
Содержание продолжение стр.
3.5.4. Формирование оптимального покрытия.
3.5.5. Формирование семантических образов рубрик
3.6. Структура программного комплекса.
4. Автоматическое выявление ассоциативных связей между словами и словосочетаниями
4.1. Метод построения ассоциативных связей
4.1.1. Виды ассоциаций
4.1.2. Автоматический показ ассоциативных запросов
4.1.3. Алгоритм формирования ассоциативных связей.
4.2. Расширение семантических образов рубрик ассоциативными
терминами.
4.3. Дальнейшее развитие метода.
5. Автоматическое распознавание текстовых метаконструкций
5.1. Структура системы распознавания
5.2. Алгоритм работы системы распознавания
5.2.1. Этапы обработки текста.
5.2.2. Разбиение входного текста на фрагменты.
5.2.3. Операции над распознанными конструкциям и
5.2.4. Параметры, передаваемые процедурам обработки шаблонов
5.3. Алгоритм модификации очереди фрагментов шаблонами
5.4. Язык описания шаблонов.
6. Результаты экспериментов
6.1. Описания тестовых наборов
6.2. Описание тестов и результаты.
6.2.1. Влияние вида выделяемых из документа терминов на
эффективность классификации.
6.2.2. Вклад алгоритма сопоставления, использующего
полнотекстовый поиск
Содержание продолжение стр.
6.2.3. Вклад алгоритма расчета контекстной значимости
6.2.4. Эффективность классификации при увеличении объема обучающей выборки и ручной настройке.
6.2.5. Использование ассоциативных связей для повышения качества классификации
6.2.6. Использование объектов для повышения качества классификации
6.2.7. Скорость обучения и классификации
6.3. Выводы
Заключение
Основные результаты
Направления дальнейшей работы
Литература