РОЗДІЛ 2. МАТЕМАТИЧНІ ЗАСОБИ ФОРМАЛІЗАЦІЇ
ЕКОЛОГІЧНОЇ ІНФОРМАЦІЇ В АІБС
2.1. Методологічні засади компараторної ідентифікації екологічних текстів
Процес вивчення екологічного тексту, виявлення його специфічних семантичних ознак і здійснення на їх основі висновку щодо належності даного тексту до певної смислової групи є досить складним процесом. Для його автоматизації необхідно досягти необхідного рівня формалізації опису у вигляді математичних виразів.
Формальна мова, придатна для опису інтелектуальної основи розумової діяльності людини представлений алгеброю скінчених предикатів, на базі якої була розвинута теорія компараторної ідентифікації лінгвістичних об'єктів [97; 98].
Головним методом компараторної ідентифікації є порівняння вхідних і вихідних сигналів (для певної системи) з метою здійснення формалізованого математичного опису механізму їх перетворення. Якщо у якості такої системи розглядається особа, що розумово аналізує інформацію, то у якості вхідних сигналів для неї відбирається сукупність сигналів (стимулів, ситуацій, текстів) x1, x2, ..., xn. Сигнали надходять до свідомості цієї особи по перцептивних каналах і піддаються інтелектуальній обробці. В результаті розумових процесів формуються відповідні суб'єктивні стани свідомості особи y1, y2, ... , yn. Дослідник припускає, що стани y1, y2, ... , yn однозначно залежать від стимулів, і відповідно, що існують функції y1=f1(x1), y2=f2(x2),..., yn=fn(xn), кожна з яких є сюр'єкцією (всюди визначеною функцією, у якої область значень співпадає з областю прибуття), що відображає множину Aj на множину Bj. Запис функцій f у такому вигляді є формальним виразом компараторних можливостей системи, що досліджується.
Обов'язковою умовою достовірності результатів експерименту є необхідність відбору стимулів із множин A1, A2,... An, таким чином, що завжди x1? A1, x2 ? A2, ... , xn? An. Множини A1, A2,... An формуються дослідником відповідно до цілей експерименту.
Суб'єкту, що є випробуваним, пояснюють характер деякого відношення L, яке зв'язує стани y1? B1, y2 ? B2, ... , yn? Bn і пред'являють стимули x1, x2, ... , xn. Стимули викликають відповідні стани свідомості випробуваного y1, y2, ... , yn і якщо для них виконується відношення L, то випробуваний фіксує це відповіддю ? = 1, а якщо не виконується, то відповіддю ? = 0. Таким чином він реалізує предикат ?= L(y1, y2, ... , yn), що відповідає відношенню L.
Поведінка випробуваного, яку можливо фізично спостерігати описується предикатом P(x1, x2, ... , xn) = L( f1(x1), f2(x2),..., fn(xn) ), де P(x1, x2, ... , xn) - це реакція останнього на стимули, що надходять до нього в процесі експерименту. Теорія компараторної ідентифікації дозволяє на основі властивостей предиката P з'ясовувати внутрішню структуру сигналів xj і yj; вигляд функції fj і вигляд предиката L. В загальному випадку випробуваний отримує r завдань, які виконує по черзі для різних наборів сигналів.
Закономірності поведінки випробуваного записуються у вигляді системи логічних рівнянь:
(2.1) що пов'язують між собою предикатні змінні X1, X2, ... , Xr. Символі P1,P2, ..., Pl позначають предикати від предикатів X1, X2, ... , Xr. Предикат Xj(x1, x2, ... , xn) (j?{1,2,..., r}) заданий на декартовому добутку A1j ? A2j ? ... ? Anj. Рішення Х1 = P1, Х2 = P2, ... , Хr = Pr задовольняє системі рівнянь (2.1) [98]
Визначення скінченного предиката надається наступним чином. Нехай А - скінчений алфавіт, що складається з k літер a1, a2, ... , ak, ? - множина, що складається з двох елементів, які позначаються символами 0, 1 і називаються відповідно неправдою та істиною. Змінна, яка задана на множині А називається літерною, змінна ?, яка задана на множині ? називається логічною. Скінченим n-місним предикатом над алфавітом А називається будь-яка функція від n літерних аргументів x1, x2, ... , xn, заданих на множині А, яка приймає логічні значення ?. Якщо скінчений предикат називається k-ічним, це означає, що його алфавіт складається з k літер.
Кожна алгебра скінчених предикатів повністю характеризується алфавітом літер A, що складається з a1, a2, ... , ak літер, і алфавітом змінних B, що складається з n символів x1, x2, ... , xn. Засобами алгебри скінчених предикатів з алфавітом літер A і алфавітом змінних B можна записати будь який n-місний k-ічний предикат f(), заданий над алфавітом A.
Формула ai(xj) розглядається як одномісний предикат, який залежить лише від змінної xj і визначаться наступним шляхом:
(2.2) Предикат xia реалізує "впізнавання" літери aі. Отже, на розгляданій алгебрі скінчених предикатів існує kn впізнавань, які разом з операціями диз'юнкції та кон'юнкції складають її базис [98].
Для повного визначення певної алгебри скінчених предикатів також необхідно позначити скінчену множину Un, яка складається з n об'єктів, із тих самих, із яких складаються і множини A1j, A2j, ... , Anj. Предикатами заданими на Un є функції, що відображають цей універсум на множину значень логічної змінної ?, істина або неправда.
Універсум Un в АІБС представлено всіма текстовими елементами, яки можуть знаходитись в електронному вигляді у якості одиниць збереження фонду (цифрової або цифрованої частини фонду будь якого сховища інформації). Будемо вважати, що універсум U постійно поповнюється за рахунок появи нових електронних документів і переведення у цифровий формат паперових копій існуючих джерел. [NEST1]Для спрощення викладення будемо розглядати весь фонд інформаційного сховища із притаманним йому розмаїттям тематичної спрямованості окремих джерел як універсум U.
На універсумі U можна виділити підмножини джерел різної тематичної спрямованості, зміст яких має відношення до різних предметних галузей. Це об'єктивно доводиться наявністю різних універсальних та спеціальних бібліотечно-бібліографічних класифікаційних систем, класифікацій наук і напрямків практичної діяльності, як результатів реалізації людиною розумової здібності до впорядкування інфо