Ви є тут

Разработка модели и метода структурирования текста с целью его идентификации

Автор: 
Панкратова Анна Зурабовна
Тип роботи: 
кандидатская
Рік: 
2002
Кількість сторінок: 
204
Артикул:
170890
179 грн
Додати в кошик

Вміст

Введение.
Глава Т. Автоматизация анализа структуры текста обзор современного состояния .
1.1. Текст и перспективы его автоматического анализа
1.2. Лексика как структурное образование
1.3. Синтаксические модели предложения
1.4.Анализ структурной организации текста
1.5. Постановка задачи.
Выводы.
Глава II. Разработка модели и метода
структурирования текста.
2.1. Системность языка и текста4
2.2.Ранговые распределения б тексте
и системах различной природы
2.3. Модель структуры текста
Выводы.7
Глава III.Идентификация текстов по информационному портрету
3.1.Понятие стиля литературного произведения
и возможности его изучения.7
3.2. Метод изучения стиля, основанный на применении автором сочетаний грамматических форм.
3.3. Информационный портрет текста и возможность
его атрибуции.
3.4. Построение информационного портрета
3.5. Сравнение информационных портретов и
идентификация текстов
Выводы.
Заключение.
Библиографический список.
Работы автора
Приложения
Приложение 1. Модифицированный ранговый закон распределения
букв русского и английского алфавита.
Приложение 2. Модифицированный ранговый закон распределения
слов из словаря Э.А. Штейнфельдт
Приложение 3. Сравнительный анализ текстов .. Пушкина,
А.П. Чехова, А. Куприна .
Приложение 4. Сравнительный анализ текстов художественного,
научного и публицистического стиля
Приложение 5. Идентификация текстов.
Приложение 6. Алгоритм статистической
обработки текста
Приложение 7. Акт о внедрении результатов кандидатской диссертации в учебный процесс НГЛУ
Введение.
Диссертация посвящена разработке модели структурирования текста, знание которой необходимо для построения эффективных алгоритмов его автоматической обработки.
Классические методы статистической обработки текста с целью выяснения его структуры, которые сводятся чаще всего к оценке рангового закона распределения закона Ципфа, подверглись в последние годы существенной критике, поскольку, в сущности, ОКИ носят эмпирический характер.
Согласно новой парадигме, которая сложилась в последние годы, текст предполагается рассматривать как некоторую целостность, но в литературе отсутствуют какиелибо результаты в этом направлении, поэтому данная работа является актуальной.
В данной работе модель текста представлена в виде системы, количественный состав компонентов языковых единиц которой вычисляется априорно на основании закона золотого деления.
Результаты расчета с высокой точностью совпали с результатами соответствующей обработки текстов.
Разработана новая методика идентификации текстов, основанная на описании структурных связей между языковыми единицами посредством взедения взаимной информации.
Таким образом, разработанный автором новый метод идентификации текста может быть рекомендован как инструмент для его анализа как более эффективного, по сравнению с известными.
Актуальность