ОГЛАВЛЕНИЕ
Введение.
1. Обзор методов и программ количественного анализа текстов и постановка задач исследований и разработок.
1.1. Проверка текстов на близость стилей или однородность по стилю.
1.2. Кластеризация текстов.
1.3. Классификация текстов.
1.4. Программные продукты
1.5. Постановка задач исследований и разработок
2. Методы и алгоритмы сравнения стилей текстов по частотным признакам.
2.1. Сравнение стилей текстов но частотам появления признаков на основе статистических критериев
2.1.1. Гипергсометрический критерий двусторонний точный критерий
Фишера
2.1.2. Критерий хиквадрат.
2.1.3. Сравнение распределений по критерию хиквадрат
2.1.4. Метод кластеризации текстов но частотным признакам
2.1.5. Примеры анализа текстов.
2.2. Классификация текстов с помощью деревьев решений
2.2.1. Алгоритм построения дерева решений
2.2.2. Оверфиттинг и отсечение.
2.2.3. Классификация по авторству. Влияние объемов фрагментов
2.2.4. Классификация но авторству. Влияние порога отсечения
2.2.5. Классификация по жанровым типам.
2.2.6. Классификация по источникам газет.
2.2.7. Оценка информативности признаков
2.3. Классификация текстов с помощью метода Хмелева и его модификаций
2.3.1. Проверка марковости текстов.
2.3.2. Мера Хмелева и альтернативные ей меры.
2.3.3. Классификация по авторству. Влияние объема фрагментов.
2.3.4. Классификация по жанровым типам.
2.3.5. Классификация по источникам газет.
2.4. Классификация текстов с помощью нейронных сетей прямого
распространения.
2.4.1. Нормализация данных
2.4.2. Алгоритм обучения.
2.4.3. Классификация по авторству. Вычислительные эксперименты.
2.5. Сравнение рассмотренных методов классификации.
2.6. Выводы
3. Инструментарий анализа стилей текстов СтилеАнализатор
3.1. Язык задания частотных признаков
3.1.1. Схема извлечения частотных признаков текстов
3.1.2. Формат запроса. Язык задания частотных признаков
3.1.3. Устройство интерпретатора языка.
3.2. Общая схема количественного анализа текстов в программе СтилеАнализатор
3.3. Работа с вертикальным текстом.
3.4. Предварительная обработка текстов.
3.5. Извлечение частотных признаков текстов
3.5.1. Пользовательский интерфейс
3.5.2. Привязка количественных данных к фрагментам текстов.
3.6. Предварительная обработка количественных данных.
3.7. Анализ частотных данных.
3.8. Выводы
Заключение.
Список использованной литературы
- Київ+380960830922