Ви є тут

Автоматизована метапошукова система на основі адаптивної онтології

Автор: 
Даревич Романа Романівна
Тип роботи: 
Дис. канд. наук
Рік: 
2007
Артикул:
3407U004085
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2 застосування онтології для оцінювання подібності текстових документів
за змістом
2.1. Обґрунтування моделі онтології
Як показано в першому розділі дисертаційної роботи, проблема адекватного
подання інформаційних потреб користувачів та пов’язана з нею задача
автоматичного формування онтології бази знань МПС є складною науково-технічною
задачею. При її розв’язанні виникають також задачі розробки методу
автоматичного визначення вагових коефіцієнтів понятть та зв’язків між ними у
онтології, розроблення та дослідження алгоритмів оптимізації на основі вибраних
критеріїв з урахуванням вагових коефіцієнтів та ряд інших, які доводиться
вирішувати шляхом переходу від аналізу конкретної системи до її узагальненої
моделі.
Для розв’язання цих задач доцільно використовувати імітаційні матема­тичні
моделі об'єкта досліджень, які б відтворювали процес функціонування системи в
цілому шляхом моделювання елементарних явищ в системі. При дослідженні складних
ієрархічних систем, до яких, зокрема, відноситься онто­логія бази знань МПС,
моделювання в багатьох випадках залишається єдиним практичним методом отримання
інформації про поведінку такої системи.
З метою побудови адекватної імітаційної моделі процесу генерування,
функціонування та оптимізації онтології МПС необхідно врахувати особливості її
реалізації, зокрема моделі подання знань та вимоги до технічних характеристик
системи.
2.1.1. Вибір моделі подання знань
Для ефективної реалізації онтології МПС, що наповнюється і оптимізується під
час її експлуатації, необхідно вибрати найбільш адекватну модель подання знань.
Відмінності між даними та знаннями, а саме: внутрішня інтерпретованість,
струк­турованість, зв’язність між інформаційними одиницями, семантична метрика
та активність [85], зумовлюють необхідність застосування спеціальних
формалізмів подання знань. Модель подання знань у роботі Уінстона [86]
визначається як “множина синтаксичних та семан­тичних правил, які забезпечують
опис предмету”. Під “предметом” тут мається на увазі стан ПрО, тобто понять
даної області, їх властивостей, зв’язків між поняттями в деякий фіксований
момент часу. Сучасними джерелами інформації про досягнення в цій області є
праці міжнародної конференції "Принципи подання знань та логічне міркування"
[87].
Розглянуто основні моделі подання знань з точки зору необхідної виражальної
сили, обчислювальної ефективності, придатності для оптимізації структури та
змісту онтології БЗ, побудованої на їх основі.
Концептуальний граф семантичної мережі
Ідея подання семантичних і логічних зв'язків між об'єктами у вигляді графів
бере свій початок від робіт Пайерса [88]. Семантична мережа – це орієнтований
граф, де вершини відображають поняття, а дуги – відношення між ними. Однією з
реалізацій семантичних мереж є концептуальні графи, запропоновані Дж. Совою
[89], що ставив собі за мету розроблення універсальної мови подання знань, яка
б поєднувала експресивну потужність природної мови з точністю символічної
логіки. Концептуальний граф – це скінчений, орієнтований, зв'язний
двосторон­ній граф [74]. Два різні види вершин цього графа - це поняття і
зв’язки між ними. За допомогою концептуального графа можна зобразити логічні
твердження або предикати.
Також концептуальним графом, враховуючи його семантич­ні виразні можливості,
ефективно представляти текстові документи, як наприклад у роботі [90] з метою
їх подальшого порівняння та рангування.
Одна з переваг такої моделі подання знань – спрощення представлення n-арних
відношень через виділення відношень між поняттями в окремі вершини
концептуального графа. Недолік цієї моделі – складна організація процедури
пошуку виводу на семантичній мережі.
Логічні моделі. Числення висловлювань та предикатів
Відповідно до логічної моделі подання знань, БЗ є кон’юнкцією елементарних
тверджень – концептуальних одиниць [85, 91]. Можна вважати, що кожне з них
відповідає окремому реченню природної мови. Концептуальні одиниці можуть бути
або фактами, або правилами виведення. Якщо концептуальна одиниця являє собою
факт, вона може бути опи­сана відповідним предикатом, тобто логічною функцією,
що залежить від тієї чи іншої кількості змінних і може приймати одне з двох
можливих значень: істинність або хибність. У рамках логічної моделі істинному
твердженню відповідає теорема, тобто правильно побудована формула (ППФ), яка
може бути виведена з аксіом шляхом скінченого числа застосувань правил
виведення. Формально логічна модель задається четвіркою <Т, Р, А, В>, де Т –
множина базових елементів (алфа­віт), Р – множина синтаксичних правил, на
основі яких конструю­ється правильно побудовані формули; А – множина аксіом,
тобто формул, які приймаються за істинні, В – множина правил виведення.
Позитивною характеристикою логічних моделей виступає однозначність теоретичного
обґрунтування і можливість реалізації формально точних логічних побудов;
недоліком – формальний процедурний стиль подання знань та погана читабельність
предикатів.
Продукційні правила
Продукція в продукційній моделі визначається як вираз виду [85]:
(і) Q; Р; А => В; N.
де (і) ? ім 'я продукції, за допомогою якого вона виокремлюється серед усієї
множини продукцій; Q ? сфера застосування продукції, ПрО, до якої вона
належить; Р ? умова застосування продукції: А => В ? ядро продукції;
інтерпретація залежить від конкретної си­туації; N ? постумова продукції,
постулює процедури, які необхідно виконати після реалізації ядра.
Продукції, з одного боку, близькі до логічних моделей, що дозволяє
організовувати ефективні процедури міркувань, а з другого боку, більш наочно
відоб