Ви є тут

Методи та моделі функціонально-семантичної обробки текстів природної мови у системах штучного інтелекту

Автор: 
Валенда Наталя Анатоліївна
Тип роботи: 
Дис. канд. наук
Рік: 
2007
Артикул:
3407U000675
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
ФОРМАЛЬНЫЕ МОДЕЛИ СЕМАНТИКИ И ИХ ПРИМЕНЕНИЕ ДЛЯ АНАЛИЗА ЕСТЕСТВЕННОГО ЯЗЫКА
2.1. Модель формализации семантики естественного языка на основе функций

Семантика изучает значение слов, фраз и предложений, а также способы его передачи в выражениях ЕЯ [14]. Она может рассматриваться на поверхностном и глубинном уровне. Глубинная семантика характеризуется как не имеющая конкретно-языковой организации и не закрепленная за определенными языковыми средствами. Поверхностная же семантика, базируясь на глубинной, относится уже к данному, конкретному языку. Глубинные понятийные инварианты здесь выступают в вариантах, общая конфигурация которых и многие детали характерны именно для данного языка. Основой для рассмотрения поверхностной семантики конструкций естественного языка может являться толковый словарь, где для каждого слова существует множество значений, приписываемых ему в языке.
Степень формализации языка определяется степенью формализации его семантики. По отношению к естественным языкам это утверждение приводит к важным последствиям. Так как в основе семантической структуры ЕЯ лежит модель окружающего нас мира, то возможность точного описания ЕЯ прямо зависит от возможности построения точных моделей реальной действительности. Ясно, что реальная действительность неформализуема, следовательно, казалось бы, абсурдна даже постановка вопроса о возможности формализации ЕЯ. Но это неправильный вывод. Для формализации семантики ЕЯ, достаточно языковой модели мира, а эта модель содержится в словарном составе ЕЯ. Можно говорить о формальной модели естественного языка, не выходя за его рамки [43-47].
Основой для формальной модели семантики выступает толковый словарь, который содержит лексические значения слов. Слово становится основной информационной единицей, а словарь - основой работы лингвистической системы. Любой словарь может быть представлен как лексикографическая система [77, 78].
Пусть существует некоторый естественный язык, его текстовую интерпретацию будем обозначать L. Чтобы задать язык, необходимо определить его алфавит А. В данной работе под языком будет пониматься множество простых предложений русского языка. А будет состоять из таких элементов:
* большие и маленькие буквы русского языка;
* знаки пунктуации;
* цифры;
* разделители;
* спецсимволы.
Тогда . Обозначим как конечное множество всех слов входящих в L. Пусть слово x, имеет в языке L несколько значений. Для установления связи между словом и его значением введем функцию значения слова - V(x). Областью определения для функции V(x) является , областью значений - концепты предметной области.

,(2.1)
где - значения, приписываемые слову .
Каждому значению слова соответствует статья толкового словаря. Формально это можно записать следующим образом:

Для отображения необходимы знания, позволяющие сделать выбор. Вне контекста такое значение определить невозможно, поэтому каждому значению слова необходимо сопоставляется описание некоторой ситуации, при которой слово принимает данное значение.
Для описания ситуации необходимо указать множество объектов, принимающих в ней участие, их связи и взаимное влияние. Построение соответствующих формализмов давно является предметом изучения компьютерной лингвистики. Система падежей, введенная Филмором и дополненная его последователями, является одним из наиболее распространенных способов описания семантики языковых конструкций.
Для описания событий удобно использовать функциональную структуру естественного языка. В качестве функций рассматриваются отношения, которые существуют между объектами. Будем называть такие функции семантическими, поскольку они позволяют описать ситуацию, используя семантические категории объекта, действия, их признаков.
Семантическая функция имеет вид:

,(2.2)
где i - задает номер семантического отношения, ;
- аргумент функции;
- индекс, указывающий роль данного аргумента в функции, .
Для каждого аргумента функции указывается роль, в которой он выступает в функции, в аргументе роль задает индекс . В данной работе взят за основу перечень ролей или семантических валентностей, выделенных в работах Филмора для глагольных функций, который был дополнен новыми ролями. Это связано с расширением перечня функций.
Список ролей, используемых для аргументов функций: ?=?субъект; =?действие; =?контрагент; ?=?объект; ?=?адресат; ?=?пациенс; ?=?результат; ?=?инструмент; ?=?признак; ?=?значение.

.

В данной работе используются следующие семантические функции:
?=?действие - действие, совершаемое субъектом над объектом;
?=?способ - действие осуществляется способом, который указывает объект или действие;
?=?принадлежность - объект 1 принадлежит объекту 2;
?=?признак - объект или субъект обладает признаком, имеющим значение;
?=?состояние - действие или объект находится в состоянии, которое определяется значением;
?=?средство - действие совершается с помощью объекта;
?=?количество - объект находится в количестве, выраженном значением;
?=?назначение - действие или объект предназначено для действия или объекта;
?=?направление - действие осуществляется в направлении объекта, или объект указывает на объект;
?=?степень - действие или объект характеризуется степенью, имеющей значение;
?=?место - действие или объект совершаются или находятся в месте объект;
?=?содержание - объект является содержанием действия или объекта;
?=?причина - объект является причиной действия;
?=?время - действие или объект происходит во время, выраженное значением;
?=?период - действие или объект происходит в период, выраженный значением;
?=?часть - объект_1, ..., объект_n являются частями объекта.
Ниже приведен вид соответствующих функций:

;
, ;
;
, ;
;