Ви є тут

Структурно-семантичні та функціональні характеристики міжчастиномовної морфологічної омонімії сучасної української мови

Автор: 
Шипнівська Ольга Олександрівна
Тип роботи: 
Дис. канд. наук
Рік: 
2007
Артикул:
0407U004327
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2
КІЛЬКІСНА ТА ЯКІСНА ХАРАКТЕРИСТИКА ТИПІВ ТА МОДЕЛЕЙ МІЖЧАСТИНОМОВНИХ
МОРФОЛОГІЧНИХ ОМОНІМІВ СУЧАСНОЇ УКРАЇНСЬКОЇ МОВИ
2.1. Формування лінгвістичної бази даних морфологічних омонімів сучасної
української мови
2.1.1. Формування реєстру омографів сучасної української мови
Моделювання процесу автоматичного усунення граматичної неоднозначності
передбачає класифікацію усіх морфологічних омонімів за їх структурними моделями
на основі попередньо визначеного списку омографів [245].
Як правило, у словниках української мови фіксуються передусім ті морфологічні
омоніми, які виражені початковою формою. О. О. Тараненко, розглядаючи принципи
подання таких лексичних одиниць у тлумачному словнику сучасної української
мови, говорить, що “лексико-граматичні омоніми, тобто спільнокореневі та
формально тотожні слова, що диференціюються за різними частинами мови,
подаються переважно в одній словниковій статті без констатації омонімії, за
винятком випадків, коли семантична структура в межах кожної з таких частин мови
дуже розгалужена, наприклад і (присл., спол., част.) [216, с. 32].
Так, у “Словнику сучасної української мови” (в 11 томах) графічно тотожні
одиниці подаються в окремих словникових статтях: ‘світло’ – іменник, ‘світло’ –
прислівник; ‘хоч’ – сполучник, частка; ‘як’ – сполучник, частка та в одній
словниковій статті як відтінок значення: ‘вартовий’ – прикметник, іменник.
На сьогодні існують суперечності в поданні таких омонімів. В одних випадках
вони представлені як окреме значення багатозначного слова, в інших – як
відтінок значення. Так, у словниковій статті прикметника ‘фазановий’ значення
‘родина птахів ряду курячих, до якої належить фазан, цесарка, перепел...’
подається як окреме значення, а у словниковій статті прикметника ‘росичковий’
значення ‘родина багаторічних болотних комахоїдних рослин’ подається з ремаркою
“у знач.” як відтінок.
Омографи, які репрезентують омонімію форм у межах парадигми, а також вихідної
форми лексеми з її парадигматичними формами та з формами інших лексем, що
становлять значну частку омографів, не фіксуються, та й не можуть фіксуватися у
словниках через те, що словники зорієнтовані на подання початкової форми. Про
складність виділення та повної фіксації таких форм говорять багато лінгвістів,
які були свідомі того, що процес укладання таких списків надзвичайно
трудомісткий і такий, що не може забезпечити достатньої повноти його реєстру
[17, с. 358; 153, с. 157-170].
Зважаючи на те, що, як зазначалося вище, лише з урахуванням повного списку
омографів можливе укладання алгоритмічних правил усунення граматичної омонімії
в тексті, й через те, що без такого повного списку неможливий системний опис
явища омонімії в мові, одним із першочергових завдань у межах цього дослідження
є розробка формальної методики укладання реєстру граматичних омонімів сучасної
української мови.
Уважаємо, що стосовно флективних мов один із способів розв’язання цього
завдання може бути знайдено в комп’ютерній лексикографії, а саме в звертанні до
граматичних словників словозміни відповідної мови, за умови репрезентативності
їх реєстру. Припускається, що такі словники з великою вірогідністю
репрезентують усі потенційно можливі структурні моделі граматичних омонімів
конкретної мови. Представлення граматичних словників в електронному вигляді – у
вигляді структурованої бази даних, у якій для кожної реєстрової одиниці
задається номер парадигматичного класу, граматична схема парадигми, – дає змогу
за допомогою програми автоматично представити кожну з реєстрових одиниць
граматичного словника множиною парадигматичних форм, тобто отримати словник
словоформ відповідної мови.
У нашому випадку базою побудови словника словоформ слугує розроблений в
Українському мовно-інформаційному фонді НАНУ граматичний словник української
мови. Реєстр словника обсягом 171 620 лексем (без урахування власних назв) за
допомогою програми синтезу парадигм [237, с. 99-100] було розгорнуто в список
обсягом 3 094 174 словоформи, який вважається достатньо репрезентативним для
розв’язання поставленої завдання.
Автоматичне визначення повного списку граматичних омонімів здійснювалося шляхом
використання розробленої в УМІФі програми автоматичного морфологічного аналізу
українського тексту.
Прийнята в системі автоматичного морфологічного аналізу граматична класифікація
частин мови, незважаючи на існування різних думок про їх природу та кількість
[44, с. 14-41; 135, с. 145], в основному збігається з традиційною
класифікацією, прийнятою в граматиці української мови [214, с. 23-27].
Класифікація, покладена в основу автоматичного морфологічного аналізу (АМА),
зорієнтована на те, що результати слугують вихідними даними для автоматичного
синтаксичного, лексичного та семантичного аналізів. Уведені нами зміни
стосуються класів дієслова, займенника та прикметника [6 Слід зауважити, що
аналогічні зміни були прийняті в розробленій системі автоматичного граматичного
аналізу, створеній співробітниками відділу стукрурно-математичної лінгвістики
Інституту мовознавства ім. О. О. Потебні НАН України для російськомовних та
україномовних реферативних наукових текстів [163, с.12; 66]]
. Так, безособові форми на -но, -то та дієприслівник у нашій роботі
визначаються як форми дієслова. Дієприкметник, порядкові числівники, з огляду
на специфіку їх словозміни, розглядаються нами як ад’єктив.
Для займенників ураховується як характер їх значень, так і специфіка словозміни
та функціонування в мові. Відповідно, розглядаються займенники, що мають
прикметниковий тип відмінювання (деякий, кожний, всякий) та займенники-іменники
(вона, він).
До списку граматичних клас