РОЗДІЛ 2 застосування онтології для оцінювання подібності текстових документів
за змістом
2.1. Обґрунтування моделі онтології
Як показано в першому розділі дисертаційної роботи, проблема адекватного
подання інформаційних потреб користувачів та пов’язана з нею задача
автоматичного формування онтології бази знань МПС є складною науково-технічною
задачею. При її розв’язанні виникають також задачі розробки методу
автоматичного визначення вагових коефіцієнтів понятть та зв’язків між ними у
онтології, розроблення та дослідження алгоритмів оптимізації на основі вибраних
критеріїв з урахуванням вагових коефіцієнтів та ряд інших, які доводиться
вирішувати шляхом переходу від аналізу конкретної системи до її узагальненої
моделі.
Для розв’язання цих задач доцільно використовувати імітаційні математичні
моделі об'єкта досліджень, які б відтворювали процес функціонування системи в
цілому шляхом моделювання елементарних явищ в системі. При дослідженні складних
ієрархічних систем, до яких, зокрема, відноситься онтологія бази знань МПС,
моделювання в багатьох випадках залишається єдиним практичним методом отримання
інформації про поведінку такої системи.
З метою побудови адекватної імітаційної моделі процесу генерування,
функціонування та оптимізації онтології МПС необхідно врахувати особливості її
реалізації, зокрема моделі подання знань та вимоги до технічних характеристик
системи.
2.1.1. Вибір моделі подання знань
Для ефективної реалізації онтології МПС, що наповнюється і оптимізується під
час її експлуатації, необхідно вибрати найбільш адекватну модель подання знань.
Відмінності між даними та знаннями, а саме: внутрішня інтерпретованість,
структурованість, зв’язність між інформаційними одиницями, семантична метрика
та активність [85], зумовлюють необхідність застосування спеціальних
формалізмів подання знань. Модель подання знань у роботі Уінстона [86]
визначається як “множина синтаксичних та семантичних правил, які забезпечують
опис предмету”. Під “предметом” тут мається на увазі стан ПрО, тобто понять
даної області, їх властивостей, зв’язків між поняттями в деякий фіксований
момент часу. Сучасними джерелами інформації про досягнення в цій області є
праці міжнародної конференції "Принципи подання знань та логічне міркування"
[87].
Розглянуто основні моделі подання знань з точки зору необхідної виражальної
сили, обчислювальної ефективності, придатності для оптимізації структури та
змісту онтології БЗ, побудованої на їх основі.
Концептуальний граф семантичної мережі
Ідея подання семантичних і логічних зв'язків між об'єктами у вигляді графів
бере свій початок від робіт Пайерса [88]. Семантична мережа – це орієнтований
граф, де вершини відображають поняття, а дуги – відношення між ними. Однією з
реалізацій семантичних мереж є концептуальні графи, запропоновані Дж. Совою
[89], що ставив собі за мету розроблення універсальної мови подання знань, яка
б поєднувала експресивну потужність природної мови з точністю символічної
логіки. Концептуальний граф – це скінчений, орієнтований, зв'язний
двосторонній граф [74]. Два різні види вершин цього графа - це поняття і
зв’язки між ними. За допомогою концептуального графа можна зобразити логічні
твердження або предикати.
Також концептуальним графом, враховуючи його семантичні виразні можливості,
ефективно представляти текстові документи, як наприклад у роботі [90] з метою
їх подальшого порівняння та рангування.
Одна з переваг такої моделі подання знань – спрощення представлення n-арних
відношень через виділення відношень між поняттями в окремі вершини
концептуального графа. Недолік цієї моделі – складна організація процедури
пошуку виводу на семантичній мережі.
Логічні моделі. Числення висловлювань та предикатів
Відповідно до логічної моделі подання знань, БЗ є кон’юнкцією елементарних
тверджень – концептуальних одиниць [85, 91]. Можна вважати, що кожне з них
відповідає окремому реченню природної мови. Концептуальні одиниці можуть бути
або фактами, або правилами виведення. Якщо концептуальна одиниця являє собою
факт, вона може бути описана відповідним предикатом, тобто логічною функцією,
що залежить від тієї чи іншої кількості змінних і може приймати одне з двох
можливих значень: істинність або хибність. У рамках логічної моделі істинному
твердженню відповідає теорема, тобто правильно побудована формула (ППФ), яка
може бути виведена з аксіом шляхом скінченого числа застосувань правил
виведення. Формально логічна модель задається четвіркою <Т, Р, А, В>, де Т –
множина базових елементів (алфавіт), Р – множина синтаксичних правил, на
основі яких конструюється правильно побудовані формули; А – множина аксіом,
тобто формул, які приймаються за істинні, В – множина правил виведення.
Позитивною характеристикою логічних моделей виступає однозначність теоретичного
обґрунтування і можливість реалізації формально точних логічних побудов;
недоліком – формальний процедурний стиль подання знань та погана читабельність
предикатів.
Продукційні правила
Продукція в продукційній моделі визначається як вираз виду [85]:
(і) Q; Р; А => В; N.
де (і) ? ім 'я продукції, за допомогою якого вона виокремлюється серед усієї
множини продукцій; Q ? сфера застосування продукції, ПрО, до якої вона
належить; Р ? умова застосування продукції: А => В ? ядро продукції;
інтерпретація залежить від конкретної ситуації; N ? постумова продукції,
постулює процедури, які необхідно виконати після реалізації ядра.
Продукції, з одного боку, близькі до логічних моделей, що дозволяє
організовувати ефективні процедури міркувань, а з другого боку, більш наочно
відоб
- Київ+380960830922