Ви є тут

Лингвистические корпусы с разметкой на основе грамматики зависимостей и их применение при автоматическом синтаксическом анализе

Автор: 
Чардин Иван Сергеевич
Тип роботи: 
Дис. канд. филол. наук
Рік: 
2004
Артикул:
568855
179 грн
Додати в кошик

Вміст

1. Введение
О проблематике и строении настоящей работы.
2. Корпусы с синтаксической разметкой и автоматический синтаксический анализ.
Общие замечания.
Лингвистические корпусы с синтаксической разметкой
Характеристики.
Существующие корпусы .
Применение корпусов с синтаксической разметкой
Стратегии разработки приложений автоматического синтаксического анализа и корпуса с синтаксической разметкой на основе грамматики зависимостей
Количественная оценка программ автоматического синтаксического анализа на материале корпусов с синтаксической разметкой.
3. Корпус с синтаксической разметкой для русского языка
Состав корпуса
Уровни разметки..
Формат разметки.
Типы лингвистической информации.
Морфологическая информация.
Синтаксическая информация
Разработка соглашений по разметке.
Программное обеспечение для подготовки корпуса и работы с ним.
Инструменты разметки
Инструменты для сбора информации по корпусу.
4. Применение корпуса с разметкой при разрешении синтаксической неоднозначности в лингвистическом процессоре ЭТАП3.
Проблема разрешения синтаксической неоднозначности в автоматической обработке текста
Синтаксический компонент лингвистического
процессора ЭТЛП3
Предварительная обработка предложения и порождение
гипотетических связей.
Разрешение синтаксической неоднозначности
на основе правил
Комбинированный алгоритм разрешения синтаксической
неоднозначности для лингвистического процессора ЭТАП3
Реализация комбинированной стратегии обработки языковых данных как одно из направлений развития лингвистического
процессора ЭТАП35
Комбинированный алгоритм разрешения синтаксической
неоднозначности.
Архитектурные ограничения и альтернативные подходы
Экспериментальный модуль для
лингвистического процессора ЭТАП3
Наборы данных и их получение
Качественная оценка комбинированного алгоритма.
5. Количественная оценка алгоритмов автоматического синтаксического анализа для русского языка
Предлагаемые принципы оценки алгоритмов синтаксического анализа для русского языка.
Количественная оценка алгоритма синтаксического анализа лингвистического процессора ЭТАП3.
Экспериментальные данные.
Программный комплекс.
Результаты оценки
Анализ полученных результатов
Эксперимент по установлению наличия синтаксических связей в пространстве поиска алгоритма синтаксического анализа
Эксперимент по определению вклада правил предпочтения и корпусного модуля в работу алгоритма синтаксического анализа
6. Результаты и перспективы.
7. Приложения
Приложение 1. Образцы данных, собранных по корпусу
Приложение 2. Список морфологических характеристик, используемых в корпусе ИППИ РАН.
Приложение 3. Основные синтаксические отношения, используемые в корпусе ИППИ РАН.
8. Список иллюстраций
Литература