Ви є тут

Функціонування прийменників в українському тексті: морфологічний та семантико-синтаксичний аспекти

Автор: 
Бугаков Олег Віталійович
Тип роботи: 
Дис. канд. наук
Рік: 
2006
Артикул:
0406U004012
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2. ІДЕНТИФІКАЦІЯ ПРИЙМЕННИКІВ НА ЕТАПІ АВТОМАТИЧНОГО МОРФОЛОГІЧНОГО
АНАЛІЗУ ТЕКСТУ
Вивчення функціонування прийменників у тексті передбачає насамперед уточнення
лексичного складу прийменників, який постійно поповнюється, по-перше, за
рахунок препозиціоналізації, тобто переходу повнозначних частин мови в
прийменник, по-друге, шляхом утворення складених прийменників. Утворення нових
прийменників, з одного боку, викликає необхідність розробки правил усунення
граматичної омонімії в тексті через появу значної кількості граматичних
омонімів з прийменниковим компонентом, з другого – розробку правил
автоматичного розмежування складених прийменників від конструкцій прийменника з
повнозначним(и) словом(ами) в тексті.
У цьому розділі розглядатиметься функціонування в тексті прийменників саме цих
двох груп – прийменників-омографів та складених прийменників – з метою
створення алгоритмів їх ідентифікації в тексті.
2.1. Функціонування омографів із прийменниковим компонентом у мові та в тексті
2.1.1. Аналіз лексико-граматичної омонімії прийменників в українській мові
З точки зору омонімічності всі прості (однослівні) прийменники можна поділити
на 2 групи: 1) прийменники, які не мають співвідносної форми в іншому
граматичному класі (51) та 2) омографи – прийменники, які мають співвідносну
форму в іншому граматичному класі (142). Список омографів був сформований на
основі 11-томного «Словника української мови» [202], сучасних українських
академічних граматик [209, 210, 211] та наукових досліджень, присвячених
прийменнику [34, 68, 86, 106, 126].
Залучення наукових джерел на етапі формування реєстру граматичних омонімів
зумовлене тим, що словники фіксують лише повну омонімію прийменника з
незмінюваними частинами мови (прийменник/прислівник, прийменник/вигук,
прийменник/частка/вигук, прийменник/прислівник/ частка), а також окремі випадки
часткової омонімії, коли в омонімічний ряд прийменника входить форма
повнозначного слова, яка збігається з реєстровою одиницею словника, як,
наприклад, в омографа перед. Омографи типу шляхом (прийменник/іменник), подовж
(прийменник/дієслово) подаються в словниках як прийменники, а трикомпонентні
омонімічні ряди типу край (прийменник/іменник/дієслово), протягом (прислівник/
прийменник/іменник), раніше (прийменник/прислівник/прикметник) у словниках
зафіксовані як двокомпонентні з урахуванням у кожному ряді перших двох
граматичних класів.
Групу омографів, що репрезентують часткову омонімію прийменника з однією формою
змінюваного слова (серед – прийменник/родовий відмінок множини іменника
жіночого роду середа; попри – прийменник/форма наказового способу 2 особи
однини дієслова поперти) або кількома формами (ради – прийменник/родовий,
знахідний, кличний множини іменника чоловічого роду рад/ родовий, називний,
знахідний, кличний множини іменника жіночого роду рада), обчислено за допомогою
АМА, який було здійснено на списку прийменників, відібраних із СУМу та вказаних
наукових джерел.
Загальна кількість одержаних у такий спосіб омографів становила 169 одиниць,
серед яких 27 представлені графемними варіантами. Під останніми розуміємо такі
пари слів, які мають однакові омонімічні граматичні коди, близьке графічне
зображення і знаходяться у відношенні додаткової дистрибуції на рівні лексичної
сполучуваності. У нашому списку це: 11 пар слів з початковими в-/у-
(впоперек/упоперек тощо), пари варіантів віддалік/оддалік, довкола/довкіл,
ззаду/іззаду, зсередини/ізсередини, навздогін/ наздогін, навколо/навкіл,
навкруги/навкруг, назустріч/навстріч, напроти/ навпроти, насупроти/насупротив,
опостін/опостінь, опріче/опроче, поблизу/ поблиз, повздовж/поздовж, а також
потрійний ряд варіантів довкруги/ довкруг/довкруж. Таким чином, остаточний
список досліджуваних омонімів склав 142 одиниці.
З первинних прийменників до списку потрапили без, від, до, за, ід (діал.), меж
(діал.), на, од, перед, переді, під, піді, повз, поз (діал.), при, ради, серед,
середи (заст.), середу (заст.), у та п’ять, утворених поєднанням по з
первинними прийменниками за, між, над, перед, при (поза, поміж, понад, поперед,
попри відповідно). Більшість з них (крім без, до, за, на, перед, під, у) у
словниках подано лише як прийменники.
Для дослідження функціонування прийменникових омографів у текстах було створено
спеціальний лінгвістичний субкорпус – лінгвістичну базу граматичних омографів з
прийменниковим компонентом (ЛБОП). Вихідним матеріалом слугували морфологічно
розмічені тексти трьох стилів (науковий, художній, публіцистичний), кожний з
яких представлений вибіркою в 1 млн. слововживань. Структура бази містить поля
“Граматичний омограф”, “Морфологічно маркований контекст” – речення, що містить
конкретний омограф, “Функція омографа в даному контексті” – ознака бінарна –
містить одне з двох значень: „так” або „ні”. Загальний обсяг бази – 200.123
контексти, з яких 59.748 є реченнями з художніх текстів, 68.911 –
публіцистичних та 71.464 – наукових. Відношення кількості омографів до
кількості всіх прийменників у кожному з аналізованих стилів на прикладі наших
вибірок становить близько 57% (57,30% для художнього, 57,72% для
публіцистичного, 57,62% для наукового) [21, с.90] (див. табл. 2.1).
Таблиця 2.1
Фрагмент таблиці ЛБД граматичних омонімів
з прийменниковим компонентом
Граматичний омограф
Морфологічно маркований контекст
Функція прийменника
всередину
Залежно від мети дослідження
мазь вводили [[всередину<РBT0> ]] або наносили
місцево на<РDРFQ0Z0> шкіру .
Ні
всередину
В<РD