Ви є тут

Інформаційні технології семантичного захисту інформації в системах документообігу

Автор: 
Сабат Володимир Іванович
Тип роботи: 
Дис. канд. наук
Рік: 
2005
Артикул:
0405U003266
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2
Інформаційні технології реалізації
семантичного аналізу документів
2.1. Математичні моделі визначення основних параметрів
текстових документів
В системах документообігу, що використовуються на підприємствах, найбільш актуальним є їх семантичний аналіз, оскільки суть відображуваної інформації в цих документах визначається їх семантикою. Впровадження електронного документообігу, як всередині підприємства, так і між окремими підприємствами визначили особливу актуальність задач семантичного контролю документів. [94] Основою будь-якого семантичного аналізу є наступні фактори:
* наявність системи інтерпретації;
* наявність правил використання системи інтерпретації;
* гомоморфізм між правилами використання системи інтерпретації та правилами побудови документів, які передбачається інтерпретувати;
* семантична несуперечність системи документів і системи інтерпретації.
Перш за все зазначимо, що в даному випадку буде йти мова тільки про текстові документи і семантичний аналіз буде досліджуватися тільки по відношенню до текстів. Необхідність такого обмеження обумовлюється тим, що завдяки використанню комп'ютерних мереж, можна формувати документи в довільній формі, використовуючи всі мультимедійні можливості комп'ютерних систем і, в першу чергу, графічні образи та голосовий спосіб відтворення інформації, яка ґрунтується на використанні теорії графів [48,113]. Складовими частинами системи інтерпретації є наступні компоненти:
* семантичний словник системи документів ;
* семантичне середовище ;
* система правил використання середовища, яка формально записується у вигляді .
Семантичний словник представляє собою певним чином упорядковану множину слів і словосполучень, які використовуються в предметній області діяльності відповідної організації чи групи організацій. Кожне з слів чи словосполучень ідентифікується певним ідентифікатором, який в подальшому буде використовуватися для формального опису в якості значення певної змінної.
Кожний окремий документ може представляти собою наступне:
* документ може бути повністю текстовим;
* документ може вміщати текст і таблиці;
* текстову, числову і табличну інформацію.
Приймемо наступне, якщо таблиця представляє собою деяку структуру числових даних, то така таблиця повинна супроводжуватись текстовим коментарем. Оскільки, в даному випадку, передбачається досліджувати проблеми захисту інформації на семантичному рівні в системі документообігу (АСДО), то самі таблиці з числовими даними і просто числові дані аналізувати не будемо, а питання захисту інформації, яка буде знаходитись в таблицях, будемо розв'язувати на основі аналізу текстової частини документу і в першу чергу текстового коментарю до таблиць. У зв'язку з цим, приймемо, що документи з таблицями без текстових коментарів та їх назв в системі АСДО недопустимі.
Семантичний словник представляє собою більш складну структуру, ніж традиційний словник, оскільки він орієнтований на використання для розв'язку задач пов'язаних з семантичним аналізом текстового документу. Приймаючи до уваги, що предметна область до якої відноситься та, чи інша організація є, якщо не сталою, або стабільною, то, як мінімум, досить інертною, можна певною мірою структурувати відповідний словник. Наприклад, серед слів словника можна ввести певну ієрархічну залежність важливості слів при описі предметної області. Цей принцип досить давно використовується в аналізаторах природних мов і відомий, як принцип визначення ключових слів, або контрольних слів. [55,73] Таку структуризацію можна ускладнювати і розвивати. Мінімальний рівень структуризації словника представляє собою призначення ключових слів у словнику, а максимальний рівень структуризації словника представляє собою виродження семантичного словника в набір зразків документів, які визначають єдино-можливі форми і способи створення документів. Практично цей підхід також використовується, але при створенні документів для досить вузьких сфер застосування, або предметних областей інтерпретації. Прикладом використання такого підходу можуть служити комплекти форм документів, які використовуються при створенні пакету документів для запитів на одержання фінансування, якщо таке фінансування здійснюється на конкурентній основі державними органами. Тим не менше, і в першому, і в другому випадку можуть бути порушені вимоги безпеки інформації, яка передається через документи, оскільки практично не вживається система шаблонів документів, яка передбачала би, або могла передбачити можливість абсолютно однозначного заповнення таких шаблонів. Тому, максимальна ступінь структуризації семантичних словників, яка представляє собою систему зразків допустимих документів, або систему шаблонів для формування документів, не дозволяє повністю вирішити задачу безпеки інформації в АСДО.
Семантичний захист документів (СЗСДО) повинен ґрунтуватися на підходах, які коротко можна назвати наступним чином:
* семантичне завантаження самих носіїв семантики додатковими умовами;
* семантичне завантаження носіїв історії функціонування документообігу;
* семантичне завантаження зовнішнього середовища, для якого призначені документи;
* семантична генерація загроз;
* проектування документів, які вміщають засоби протидії можливим атакам, що формуються на основі загроз.
Можна проаналізувати кожний з наведених підходів, але це не означає, що не може бути створена система, яка об'єднує всі ці підходи в тій чи іншій мірі. Використання всіх підходів в певній мірі може привести до створення досить дорогих систем документообігу, що не виплачується в рамках кожної конкретної організації. [70,71] Тому, необхідно дослідити можливість створення системи оцінки необхідного реального рівня захисту системи документообігу на основі використання семантичних аналізаторів. В цьому випадку виникає задача створення і дослідження моделей оцінки оптимального рівня захисту для конкретної організації. Для створення таких моделей можна скористатися з наступних підходів, що надають можливіст