Ви є тут

Комп'ютерна технологія укладання словників та проектування словникових баз даних на основі інформаційних лексикографічних моделей.

Автор: 
Кульчицький Ігор Маркіянович
Тип роботи: 
Дис. канд. наук
Рік: 
2003
Артикул:
0403U000572
129 грн
Додати в кошик

Вміст

Розділ 2
Моделювання лексикографічних структур
2. 1 Технологічна лінія укладання словників
Укладання словників на основі словникових баз даних — це сучасний і
універсальний підхід комп’ютерної лексикографії, але він вимагає створення
достатньо об’ємного та складного програмного забезпечення. В принципі, можна
розглядати задачу розробки програмного комплексу для автоматизації
лексикографічних робіт у всіх її аспектах. Хоча така розробка і є теоретично
можливою, але на практиці — це важкорозв'язна та й недоцільна задача. Це
зумовлено цілою низкою факторів.
З точки зору лексикографа укладання словника можна розбити на ряд таких етапів
[6]:
обробка джерел інформації для словника;
підготовка початкової картотеки;
підготовка проекту словника (інструкції для укладачів);
написання та редагування словника;
набір, верстка та видання книжки;
внесення доповнень, виправлення помилок з метою підготовки наступних видань.
Кожен з цих етапів вимагає того чи іншого ступеня автоматизації, становлячи
самостійну, відносно незалежну і досить складну, задачу [26, 49], яка є
предметом розробки відповідного колективу висококваліфікованих фахівців. Тому
для кожного етапу розробки потрібне достатньо специфічне і складне прог­рамне
забезпечення.
Ряд функцій, які повинні входити у програмний комплекс автоматизації
лексикографічних робіт, забезпечуються існуючими програмними пакетами
(наприклад, поліграфічне оформлення тексту забезпечується серійними
видав­ничими системами). Дублювання таких функцій є недоцільним, як з точки
зору якості виконання і швидкості реалізації, так і з точки зору повноти
функ­ціонування, тим більше, що такі пакети є самі по собі складними у
використанні та вимагають відповідної кваліфікації у користувача.
З точки зору розробника програмного забезпечення словник у його комп'ютерному
вигляді — це база даних, тому створення програмного забезпе­чення для
автоматизації лексикографічних робіт повністю відповідає вимогам до створення
програмного забезпечення інформаційних систем, [27, 131]. З цієї точки зору у
лексикографічній діяльності можна виділити такі складові:
побудова інформаційної моделі словника;
реалізація інформаційної моделі засобами однієї з існуючих промислових СКБД;
створення відповідного програмного забезпечення;
наповнення та супровід бази даних словника;
підготовка до поліграфічного видання словника того чи іншого типу на основі
інформації з бази даних;
побудова на основі бази даних різних інформаційно-пошукових та
інформаційно-довідкових систем;
використання бази даних словника у лексикологічних дослідженнях;
використання бази даних словника як інформаційної бази у програмному
забезпеченні іншого призначення.
У відношенні забезпечення ефективності функціонування кожна така складова має
свої вимоги щодо оптимальної структури даних, об'ємів пам'яті, швидкості
реакції на запити користувача тощо. Ці вимоги сильно відрізняються для різних
складових, а часто й несумісні між собою. Якщо на етапі формування та супроводу
баз даних найважливішим є забезпечення цілісності бази даних і менш важливими є
час реакції системи та об'єм пам'яті, яку займає база даних, і практично немає
вимог до об'єму програмного коду, то при функціонуванні словника у вигляді
інформаційної системи на перший план виходять час реакції та об'єми пам'яті.
Якщо ж словник функціонуватиме як складова частина іншої системи, то в цьому
випадку накладатимуться додаткові вимоги до об'єму прог­рамного коду, що
забезпечує функціонування словника.
Специфічною особливістю словникових баз даних по відношенню до ін­ших є
відносно нечаста зміна інформації після початкового наповнення та вузьке коло
спеціалістів, які ці зміни вносять (словник є авторською працею, тому доз­віл
вносити у нього зміни іншим особам, крім авторів, виглядає пробле­ма­тич­ним.)
Наведені причини роблять комплекс програм, що автоматизує лексико­гра­фічні
роботи, складним програмним продуктом як з точки зору використання, так і
внутрішньої структури. Конкретний користувач для розв'язку своєї конк­ретної
задачі використовував би лише необхідну йому підмножину можливостей комплексу,
обов'язково узгоджуючи свої дії з умовами, що накладаються інши­ми, цілком йому
не потрібними, можливостями цього комплексу. Функціону­ван­ня ж такого
комплексу можливе лише у спеціалізованих організаціях з відповід­ним технічним
забезпеченням та відповідними кадрами, що, в свою чергу, утруд­нює доступ
широкого кола користувачів до сучасних інструментальних програмних засобів
такого типу.
Тому доцільно задачу автоматизації лексикографічних робіт розбити на ряд
незалежних підзадач. Для кожної підзадачі створюється своя концептуальна модель
бази даних та свій незалежний комплекс програм, функції та структура даних
якого найкраще відповідають підзадачі. Окремі програмні комплекси зв'язуються
між собою на рівні обміну даними: програмне забезпечення кожної підзадачі
повинно дозволяти експорт/імпорт даних згідно вимог безпосередньо зв'язаних з
нею підзадач. Такий підхід дозволить значно спростити структуру програмного
забезпечення, зменшити час його створення та збільшити надій­ність
функціонування [74]. Користувач зможе вибирати лише ті засоби, які
безпосередньо потрібні для його роботи. У спеціалізованих організаціях такі
програмні комплекси можна об'єднувати в один на рівні операційної системи
комп'ютера, [19], [152].
При такому підході стає можливим для всіх застосувань словника мати єдиний
початковий етап — етап створення та наповнення словникової бази даних, причому
дані для цього етапу можуть надходити різними способами: як результат