Вы здесь

Комп'ютерний тезаурус дієслів української мови: лінгвістичні проблеми та методика конструювання

Автор: 
Сірук Олена Борисівна
Тип работы: 
Дис. канд. наук
Год: 
2006
Артикул:
0406U004675
129 грн
Добавить в корзину

Содержимое

РОЗДІЛ 2
БЛОК-СХЕМА ПОБУДОВИ КОМП’ЮТЕРНОГО ТЕЗАУРУСА. СПЕЦИФІКА ІДЕОГРАФІЧНОГО
ПРЕДСТАВЛЕННЯ ДІЄСЛІВНОЇ ЛЕКСИКИ
У розділі подано загальний огляд проекту укладання комп’ютерного тезауруса
української мови з акцентом на лінгвістичні проблеми опису дієслівної лексики.
Увагу зосереджено на особливостях представлення дієслів у комп’ютерному
тезаурусі, зокрема тих, що належать до семантичного поля мовленнєвої
діяльності. Розглядаються особливості семантики дієслова як підґрунтя для
побудови лексико-семантичного поля (ЛСП) дієслів мовленнєвої діяльності,
дієслівних словникових статей та їхньої організації у комп’ютерному тезаурусі
(КТ).
2.1. Укладання комп’ютерного тезауруса дієслів української мови як
формалізована процедура
Як показує досвід зарубіжних розробників [222; 219; 230; 235; 237] та
вітчизняні дослідження [2, 6 – 18; 3, 71 – 88; 8; 14, 110 – 117; 18; 22; 42,
119 – 125; 57, 107 – 118; 68; 119, 2 – 6; 160, 3 – 10; 167, 339 – 344; 188;
202; 208; 215, 14 – 16], проект створення комп’ютерного тезауруса (КТ) є досить
трудомістким. Після опрацювання масиву методологічних розробок і ознайомлення з
тезаурусними проектами мережі Інтернет для укладання комп’ютерного тезауруса
дієслів української мови визначилася певна послідовність таких взаємопов’язаних
завдань, як:
розроблення методики укладання КТ (вироблення загальної послідовності
опрацювання лінгвістичного матеріалу з метою перевірки теоретичних міркувань
застосуванням на практиці);
укладання КТ з можливим коригуванням методики у процесі роботи;
інтеграція КТ з іншими електронними продуктами (за потреби);
розробка представлення КТ (для компакт-диску та інтернет-версії);
апробація КТ як засобу лінгвістичних досліджень;
паперове представлення КТ (за потреби);
опис КТ та методики його укладання.
Кожне з цих завдань більшою чи меншою мірою потребує лінгвістичного
препарування, тому усі вони увійшли до поля нашого дослідження. Але з огляду на
мовознавчу спрямованість цієї роботи найбільшу увагу було приділено першим
трьом та п’ятому пунктам програми укладання КТ, хоча висвітлюються і
лінгвістичні аспекти четвертого, шостого та сьомого завдань.
Звертаємо увагу на те, що укладання КТ відбувається з коригуванням методики у
процесі роботи. Це означає, що ми маємо справу не з формальною, а з
формалізованою процедурою роботи. Формальна процедура – це сукупність дій, яка
породжує проективну (або рахункову) множину проектних рішень без участі
проектанта. У цьому випадку проектант тільки формулює завдання: призначає
вхідні дані й вказує критерій проектного рішення. Але оскільки об’єктом нашої
уваги є мовний матеріал, і зокрема – семантика, яка, як відомо, важко
піддається формалізації, то і процедура її аналізу буде на перших етапах
евристичною, тобто такою, яка не піддається жодному формальному опису, не може
бути описана ніяким алгоритмом і за певних умов не забезпечує ухвалення
проектного рішення, а на інших – формалізованою, тобто такою, яка може лише
частково формально описуватися у вигляді певного алгоритму. Вихідні дані для
процедури такого типу потребують опрацювання, а умови її перебігу, критерії
проектних рішень вимагають уточнення не тільки при переході від одного об'єкта
проектування до іншого, але й у процесі її виконання.
Формалізовані процедури є проміжними між формальними й евристичними. З одного
боку, вони послуговуються математичними або структурними моделями, з іншого
боку, характер їхнього використання є екстраполяційним. Формалізовані операції
не можна застосовувати в будь-якій послідовності й у будь-якому сполученні,
їхню взаємодію потрібно заздалегідь визначити (передбачити). Дослідник може
впливати на умови перебігу формалізованої й евристичної процедур, керуючись
лише досвідом, інтуїцією, здоровим глуздом, причому як своїм власним, так і
колективним.
З огляду на те, що тезаурус розробляється як комп’ютерна система, уся
послідовність роботи над його укладанням повинна бути максимально
формалізована. Формалізований підхід у роботі з семантикою на сучасному рівні
розвитку лінгвістики застосовується все частіше. Загалом вибір процедур та
послідовне їх застосування зумовлюється різними типами дослідницьких завдань. У
нашому випадку це комплекс лінгвістичних прийомів виявлення й систематизації
мовних ознак слова (морфемних, словотвірних, парадигматичних і синтаксичних) та
алгоритмічні процедури їхнього опису, які лежать в основі лексикографічного
процесора КТ. Оскільки метою нашої роботи є саме формалізований підхід до
аналізу дієслівної лексики, потрібно визначити його базові поняття. Це
лінгвістичний алгоритм, блок-схема алгоритму та лексикографічний лінгвістичний
процесор.
Людина може здійснювати певні операції як без заздалегідь чітко визначеної
послідовності своїх дій, так і виробивши їхню певну послідовність, аналізуючи
її та змінюючи в процесі виконання відповідно до своїх потреб. Таким чином
людина має змогу досягти бажаного результату завдяки певній кількості операцій.
А комп'ютер, не маючи людського інтелекту і здатності самостійно приймати
рішення, для виконання певного завдання потребує інструкції, яка описує
послідовність його дій, спрямованих на отримання потрібного результату. Таку
визначену послідовність правил розв'язання завдання називають алгоритмом [90,
49]. "Енциклопедія кібернетики" подає таку дефініцію алгоритму: "Алгоритм –
точно визначене правило дій (програма), для якого задано вказівку, як і в якій
послідовності це правило слід застосовувати до вихідних даних завдання, щоб
одержати його розв'язання" [220, 94].
Алгоритм може мати різні ступені деталіз