Розділ 2
Моделювання лексикографічних структур
2. 1 Технологічна лінія укладання словників
Укладання словників на основі словникових баз даних — це сучасний і
універсальний підхід комп’ютерної лексикографії, але він вимагає створення
достатньо об’ємного та складного програмного забезпечення. В принципі, можна
розглядати задачу розробки програмного комплексу для автоматизації
лексикографічних робіт у всіх її аспектах. Хоча така розробка і є теоретично
можливою, але на практиці — це важкорозв'язна та й недоцільна задача. Це
зумовлено цілою низкою факторів.
З точки зору лексикографа укладання словника можна розбити на ряд таких етапів
[6]:
обробка джерел інформації для словника;
підготовка початкової картотеки;
підготовка проекту словника (інструкції для укладачів);
написання та редагування словника;
набір, верстка та видання книжки;
внесення доповнень, виправлення помилок з метою підготовки наступних видань.
Кожен з цих етапів вимагає того чи іншого ступеня автоматизації, становлячи
самостійну, відносно незалежну і досить складну, задачу [26, 49], яка є
предметом розробки відповідного колективу висококваліфікованих фахівців. Тому
для кожного етапу розробки потрібне достатньо специфічне і складне програмне
забезпечення.
Ряд функцій, які повинні входити у програмний комплекс автоматизації
лексикографічних робіт, забезпечуються існуючими програмними пакетами
(наприклад, поліграфічне оформлення тексту забезпечується серійними
видавничими системами). Дублювання таких функцій є недоцільним, як з точки
зору якості виконання і швидкості реалізації, так і з точки зору повноти
функціонування, тим більше, що такі пакети є самі по собі складними у
використанні та вимагають відповідної кваліфікації у користувача.
З точки зору розробника програмного забезпечення словник у його комп'ютерному
вигляді — це база даних, тому створення програмного забезпечення для
автоматизації лексикографічних робіт повністю відповідає вимогам до створення
програмного забезпечення інформаційних систем, [27, 131]. З цієї точки зору у
лексикографічній діяльності можна виділити такі складові:
побудова інформаційної моделі словника;
реалізація інформаційної моделі засобами однієї з існуючих промислових СКБД;
створення відповідного програмного забезпечення;
наповнення та супровід бази даних словника;
підготовка до поліграфічного видання словника того чи іншого типу на основі
інформації з бази даних;
побудова на основі бази даних різних інформаційно-пошукових та
інформаційно-довідкових систем;
використання бази даних словника у лексикологічних дослідженнях;
використання бази даних словника як інформаційної бази у програмному
забезпеченні іншого призначення.
У відношенні забезпечення ефективності функціонування кожна така складова має
свої вимоги щодо оптимальної структури даних, об'ємів пам'яті, швидкості
реакції на запити користувача тощо. Ці вимоги сильно відрізняються для різних
складових, а часто й несумісні між собою. Якщо на етапі формування та супроводу
баз даних найважливішим є забезпечення цілісності бази даних і менш важливими є
час реакції системи та об'єм пам'яті, яку займає база даних, і практично немає
вимог до об'єму програмного коду, то при функціонуванні словника у вигляді
інформаційної системи на перший план виходять час реакції та об'єми пам'яті.
Якщо ж словник функціонуватиме як складова частина іншої системи, то в цьому
випадку накладатимуться додаткові вимоги до об'єму програмного коду, що
забезпечує функціонування словника.
Специфічною особливістю словникових баз даних по відношенню до інших є
відносно нечаста зміна інформації після початкового наповнення та вузьке коло
спеціалістів, які ці зміни вносять (словник є авторською працею, тому дозвіл
вносити у нього зміни іншим особам, крім авторів, виглядає проблематичним.)
Наведені причини роблять комплекс програм, що автоматизує лексикографічні
роботи, складним програмним продуктом як з точки зору використання, так і
внутрішньої структури. Конкретний користувач для розв'язку своєї конкретної
задачі використовував би лише необхідну йому підмножину можливостей комплексу,
обов'язково узгоджуючи свої дії з умовами, що накладаються іншими, цілком йому
не потрібними, можливостями цього комплексу. Функціонування ж такого
комплексу можливе лише у спеціалізованих організаціях з відповідним технічним
забезпеченням та відповідними кадрами, що, в свою чергу, утруднює доступ
широкого кола користувачів до сучасних інструментальних програмних засобів
такого типу.
Тому доцільно задачу автоматизації лексикографічних робіт розбити на ряд
незалежних підзадач. Для кожної підзадачі створюється своя концептуальна модель
бази даних та свій незалежний комплекс програм, функції та структура даних
якого найкраще відповідають підзадачі. Окремі програмні комплекси зв'язуються
між собою на рівні обміну даними: програмне забезпечення кожної підзадачі
повинно дозволяти експорт/імпорт даних згідно вимог безпосередньо зв'язаних з
нею підзадач. Такий підхід дозволить значно спростити структуру програмного
забезпечення, зменшити час його створення та збільшити надійність
функціонування [74]. Користувач зможе вибирати лише ті засоби, які
безпосередньо потрібні для його роботи. У спеціалізованих організаціях такі
програмні комплекси можна об'єднувати в один на рівні операційної системи
комп'ютера, [19], [152].
При такому підході стає можливим для всіх застосувань словника мати єдиний
початковий етап — етап створення та наповнення словникової бази даних, причому
дані для цього етапу можуть надходити різними способами: як результат
- Киев+380960830922