Ви є тут

Многомерный количественный анализ и классификация текстов на основе лингвостатистических характеристик

Автор: 
Суровцова Татьяна Геннадьевна
Тип роботи: 
диссертация кандидата технических наук
Рік: 
2008
Кількість сторінок: 
134
Артикул:
15661
179 грн
Додати в кошик

Вміст

Оглавление
ВВЕДЕНИЕ.
ГЛАВА 1. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ДЛЯ ВЫДЕЛЕНИЯ ГРУПП ТЕКСТОВ.
1 Использование кластерного анализа.
1.1 Метод кластеризации.
1.2 Метод иерархической кластеризации.
1.3 Классификация на основе полученных кластеров
2 Методы для исследования переходов между сос тавляющими единицами текста
2.1 Метод сильного графа
2.2 Метод подсчета отличий между матрицами переходов
3 Методы, основанные на проверке статистических гипотез
3.1 Общее распределение частей речи.
3.2 Средняя длина слова в буквах, вычисляемая на основании выборок размером в 0 слов.
3.3 Общее распределение длины слова.
3.4 Средняя длина предложения в словах, вычисляемая на основании выборок размером в предложений.
3.5 Общее распределение длины предложения.
3.6 Лексический спектр текста па уровне словаря.
3.7 Лексический спектр текста на уровне текста
3.8 Индекс разнообразия лексики.
4 Метод, основанный на индуктивном построении классификаторов.
4.1 Описание метода.
5 Сравнение методов и их совместное применение.
5.1 Комитеты классификаторов
5.2 Методика построения статистического критерия на основе классификатора
ЗАКЛЮЧЕНИЕ К ПЕРВОЙ ГЛАВЕ.
ГЛАВА 2. ОПИСАНИЕ ИНФОРМАЦИОННОАНАЛИТИЧЕСКОЙ СИСТЕМЫ ДЛЯ АНАЛИЗА ЛИИГВОСТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ЛИТЕРАТУРНЫХ ПРОИЗВЕДЕНИЙ.
1 Цели и задачи разработки информационноаналитической СИСТЕМЫ.
1.1 Описание ПК СМАЛТ.
1.2 Информационноаналитическая система для анализа лингвостатистических характеристик литературных произведешь
2 Описание информационной системы
2. 1 Организация и основные принципы работы информационноаналитической системы.
2.2 Описание архитектуры информационноаналитической системы
2.3 Интерфейс пользователя
2.3 Описание модулей
2.4 Описание структуры базы данных
2.5 Описание использованного программного обеспечения.
3 Описание спецификации на основе языка X
3.1 Цели разработки спецификации
3.2 Описание спецификации на основе языка X.
3.3 Выводы и дальнейшее использование формата.
ЗАКЛЮЧЕНИЕ КО ВТОРОЙ ГЛАВЕ
ГЛАВА 3. РЕЗУЛЬТАТЫ ПРИМЕНЕНИЯ ИНФОРМАЦИОННОАНАЛИТИЧЕСКОЙ СИСТЕМЫ.
1 Описание материала для исследования.
2 Использование методов кластерного анализа
2.1 Метод кластеризации.
2.2 Метод иерархической кластеризации.
2.3 Дальнейшая обработка данных.
2.4 Заключение.
3 Использование методов для исследования переходов между
СОСТАВЛЯЮЩИМИ ЕДИНИЦАМИ ТЕКСТА
3.1 Выбор характеристик для анализа.
3.2 Построение сильных графив произведений и их анализ
3.3 Метод подсчета отличий между матрицами переходов синтаксических классов
3.4 Заключение
4 Использование методов, основанных на проверке статистических гипотез.
4.1 Общее распределение частей речи на различных позициях предложения.
4.2 Средняя длина слова в буквах, вычисляемая на основании выборок размером в 0 слов.
4.3 Общее распределение длины слова.
4.4 Средняя длина предложения в словах, вычисляемая на основании выборок размером в предложений.
4.5 Общее распределение длины предложения.
4.6 Лексический спектр на уровне словаря и на уровне текста
4.7 Индекс разнообразия лексики.
4.9 Заключение
5 Использование метода, основанного на индуктивном построении классификаторов.
5.1 Рассматриваемые лингвостатистические характеристики
5.2 Формирование обучающей и тестовой выборок.
5.3 Построение классификатора.
5.4 Проверка гипотез об авторстве на основе построенного
классификатора
5.5 Заключение.
ЗАКЛЮЧЕНИЕ К ТРЕТЬЕЙ ГЛАВЕ
ОСНОВНЫЕ ВЫВОДЫ И РЕКОМЕНДАЦИИ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ