Розділ 2. Синтез інформаційних технологій реалізації семантичного аналізу
В роботі розглядається створення інформаційної технології організації,
зберігання та пошуку графічних об’єктів за вмістом, тому було запропоноване
рішення – доповнити формат зберігання графічного об’єкта відповідним
семантичним описом його вмісту. Тоді задача створення інформаційної технології
пошуку та зберігання графічних об’єктів за вмістом зводиться до пошуку опису
заданого фрагменту в описах об’єктів. У відомій літературі не знайдено опису
систем аналізу семантики графічного об’єкту на основі даних про графічні
об’єкти. Тому для розв’язання задачі пошуку в масивах графічних об’єктів
модифіковано апробований семантичний логіко-математичний апарат як найбільш
актуальний, оскільки суть відображуваної інформації в масивах графічних
об’єктів також визначається їх семантикою.
2.1 Розроблення семантичного словника для систем пошуку графічних об’єктів
Основою будь-якого семантичного аналізу є такі фактори:
наявність системи інтерпретації;
наявність правил використання системи інтерпретації;
гомоморфізм між правилами використання системи інтерпретації та правилами
побудови та представлення об’єктів, які передбачається інтерпретувати;
семантична несуперечність системи опису та представлення графічних об’єктів
системи інтерпретації.
В роботі розглядаються лише графічні об’єкти, і буде досліджуватися лише
семантичний аналіз їх вмісту. Складовими частинами системи інтерпретації є
компоненти:
семантичний словник системи графічних об’єктів;
семантичне середовище ;
система правил використання середовища, яка формально записується у вигляді .
Семантичний словник представляє собою певним чином упорядковану множину
елементів, графічних примітивів та їх атрибутів, які використовуються для опису
вмісту графічних об’єктів. Кожен з елементів, графічних примітивів та атрибутів
ідентифікується певним ідентифікатором, який в подальшому буде
використовуватися для формального опису в якості значення певної змінної.
Кожний окремий графічний об’єкт розглядаємо як об’єкт, з якого можна виокремити
елементи, або графічні примітиви.
Семантичний словник представляє собою більш складну структуру, ніж традиційний
словник, оскільки він орієнтований на використання для розв’язку задач,
пов’язаних з семантичним аналізом вмісту графічного об’єкту. Оскільки елементи
та графічні примітиви, які використовуватимуться для опису графічних об’єктів є
скінченою множиною, відповідний семантичний словник піддається структуризації.
При необхідності словник буде збільшуватися тільки за рахунок додавання до
нього нових графічних примітивів або їх атрибутів. Серед елементів словника,
при необхідності, можна ввести певну ієрархічну залежність важливості елементів
при описі предметної області. Цей принцип досить давно та широко
використовується в різноманітних аналізаторах і відомий, як принцип визначення
ключових, або контрольних елементів [55, 73]. Мінімальний рівень структуризації
словника представляє собою призначення ключових елементів у словнику, а
максимальний рівень структуризації словника представляє собою виродження
семантичного словника в набір фрагментів графічних об’єктів, які визначають
єдино можливі форми і способи опису вмісту графічних об’єктів.
Важливим є дослідження можливості створення системи оцінки якості пошукової
системи на основі використання семантичних аналізаторів [24]. В цьому випадку
виникає задача створення і дослідження моделей оцінки результату пошуку для
певної системи. Для створення таких моделей можна скористатися з таких
підходів, що надають можливість розв’язувати задачу визначення оцінки пошуку в
графічних об’єктах на семантичному рівні:
аналіз міри зменшення ефективності функціонування системи;
аналіз міри завантаженості системи;
аналіз значущості об’єкта та результату пошуку.
Розглянемо більш детально підходи до реалізації семантичного пошуку графічних
об’єктів за вмістом.
Перший підхід полягає у реалізації семантичного аналізу самих носіїв семантики,
якими для графічного об’єкту є елементи, графічні примітиви, та їх атрибути, їх
набори, фрагменти та об’єкт в цілому. Ці компоненти є засобами, що
безпосередньо містяться в графічному об’єкті і складають цей об’єкт.
Опосередненими носіями семантики є засоби, за допомогою яких об’єкти
створюються або аналізуються. До цих засобів відносяться такі компоненти:
структура семантичного словника ;
система правил побудови (аналізу) графічних об’єктів ;
система параметрів, що характеризують об’єкт .
Дослідимо можливість формальний опису структури семантичного словника, що
складається з елементів графічного об’єкта.
Величина значення елемента зі словника означає величину його семантичної
значущості для всього середовища предметної області. Очевидно, що міра такої
значущості може бути різна у різних елементів та графічних примітивів. Це
означає, що словник можна розбити на підмножини, які об’єднують набори
елементів або примітивів з рівними, або близькими значеннями семантичної
значущості. Такі підмножини незалежні від конкретної інтерпретації окремого
набору елементів . Тому, існує можливість формально представити структуру
словника у вигляді дерева . Семантична критичність елемента , набору може мати
певний рівень в заданому контексті використання інших елементів та примітивів з
нижчими рівнями критичності, для яких , якщо є критичним елементом в . Такі
елементи будемо називати ключовими. Приймемо, що критична залежність від
контексту вмісту графічного об’єкта може бути поширена тільки на один рівень
ієрархії міри значущості елементів контексту. Подальші міри з
- Київ+380960830922