Оглавление
ВВЕДЕНИЕ
Актуальность темы исследования.
Предмет работы.
Цель работы
Методы исследования
Практическая ценность и апробация работы.
Публикации
Структура и объем работы.
1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ КОНТЕКСТНОЙ ОБРАБОТКИ
1.1. граммы.
1.2. Динамическое программирование.
1.2.1. Дискретный процесс управления
1.2.2. Метод динамического программирования.
1.2.3. Ачгоритм Левенштейна,
1.2.4. Обзор работ
1.3. Скрытые марковские модели.
1.3.1. Определение СММ
1.3.2. Обзор работ
1.4. Нейронные сети
1.5. Методы коррекции и валидации текстов
1.5.1. Словарные методы.
1.5.2. Вероятностные методы.
1.5.3. Техника похожих ключей,
1.5.4. Сравнение методов
1.6. Классификационные методы
1.7. Методы синтаксического анализа
1.7.1. Формальные языки. Компилирование.
1.7.2. Естественные языки. Компьютерная лингвистика.
1.8. Выводы
2. СИНТАКСИЧЕСКИЕ МЕТОДЫ КОНТЕКСТНОЙ ОБРАБОТКИ
2.1. Представление результатов распознавания. АРсеть, цепь, АРматрица. .
2.2. Формальные языки и грамматики, синтаксические диаграммы.
2.2.1. Язык.
2.2.2. Понятие грамматики. Грамматика Хомского
2.2.3. Нотация БэкусаНаура.
2.2.4. Синтакси ческие диаграммы
2.2.5. грамматика.
2.3. Классификация типов полей на формах.
2.3.1. Словарное поле.
2.3.2. Текст па естественном языке
2.3.3. Поле с заданным синтаксисом
2.3.4. Поле, описываемое синтаксисом частично.
2.3.5. Поле с нефиксированным текстовым представлением
2.3.6. Поля со специачьными ограничениями.
2.4. Постановка задачи контекстной обработки
2.4.1. Восстановление текстового значения
2.4.2. Классификация текстового значения.
2.4.3. Приведение распознанного значения к нормальной форме
2.4.4. Оценка степени надежности распознанного значения.4
2.4.5. Локализация ненадежных фрагментов.
2.4.6. Нахождение опорных фрагментов.
2.5. Поиск заданного текстового фрагмента в АРцепи. Алгоритм .
2.5.1. Структура результатов распознавания.
2.5.2. Описание алгоритма
2.6. Синтаксический подход
2.6.1. О подходе.
2.6.2. Основная алгоритмическая схема
2.6.3. ОПпроцедура.5
2.6.4. Эксперименты и результаты.
2.7. Подход с использованием частичноопределенного синтаксиса
2.7.1. Предпосылки создания .
2.7.2. Схема алгоритма.
2.7.3. Эксперименты и результаты.
2.7.4. Выводы
2.8. Классификация полей с нефиксированным текстовым представлением.
2.8.1. Признаки и функции выделения признаков
2.8.2. Построение первичного классификатора
2.8.3. Сравнение функций выделения признаков.
2.8.4. Задача с неизвестными классами
2.8.5. Сглаживание.
2.8.6. Проблема зависимости признаков
2.8.7. Реализация и выводы.
2.9. Выводы.
3. ВНЕДРЕНИЯ И ОСОБЕННОСТИ ТЕХНИЧЕСКОЙ РЕАЛИЗАЦИИ.
3.1. Система массового ввода структурированных документов.
3.1.1. Обзор системы.
3.1.2. Стадии технологической цепочки ввода документов.
3.1.3. Основные компоненты системы.
3.2. Подсистема контекстной обработки.
3.2.1. Назначение подсистемы.
3.2.2. Структура подсистемы
3.2.3. Процесс создания функций контекстной обработки
3.3. Внедренные проекты и особенности технической реализации.
3.3.1. Ввод документов пенсионного страхования.
3.3.2. Ввод анкет школьников и студентов.
3.3.3. Ввод банковских документов
3.3.4. Ввод отгрузочныхразнадядок в ОАО Сибнефть ,.
3.3.5. Ввод счетовфактур в Магнитогорском Металлургическом Комбинате
ЗАКЛЮЧЕНИЕ. ВЫВОДЫ.ИЗ
СПИСОК ЛИТЕРАТУРЫ
- Київ+380960830922