РОЗДІЛ 2
ДВОВИМІРНИЙ СПЛАЙН-НОРМАЛЬНИЙ РОЗПОДІЛ
Сучасне інформаційне забезпечення систем медичної діагностики пов’язане з
обробкою неоднорідних статистичних даних. Останнє обумовлено тим, що в наборах
для аналізу містяться дані про пацієнтів з різними діагнозами і на пацієнтів
мають вплив різні зовнішні фактори (стреси, умови середовища). Існуюча практика
постановки діагнозу, коли наявність захворювання та його стадії визначаються
згідно нормативним величинам, робить актуальним введення у якості моделі таких
даних функцію розподілу у вигляді сплайн-нормальної. У двовимірному випадку
прямі склеювання сплайн-розподілу, паралельні осям спостережень, можна
трактувати як межі, що відокремлюють різні стадії захворювання. Коли постановка
діагнозу здійснюється лише за одним показником, можливим є введення
сплайн-розподілу з однією прямою склеювання. При проведенні діагностики
одночасно за двома параметрами доцільним є введення сплайн-розподілу з двома
прямими склеювання, паралельними осям спостережень та взаємно
перпендикулярними. Пов’язана із цим задача відтворення розподілу за вхідним
масивом даних досі не знайшла свого повного розв’язку. Тому у розділі
поставлено за мету провести дослідження зазначених випадків двовимірного
сплайн-нормального розподілу, за результатами якого розробити обчислювальну
схему їх відтворення та алгоритмізувати процес обробки даних і класифікації на
основі даного розподілу.
При викладенні матеріалу розділу вважається, що задано двовимірну випадкову
величину , реалізацію якої є масив .
Дослідження часткових випадків двовимірного сплайн-нормального розподілу з
однією та двома прямими склеювання проведено у підрозд. 2.1, 2.2. На основі
проведеного дослідження запропоновано процедури відтворення розподілу, які
подано у цих же підрозділах. Задача алгоритмізації обробки неоднорідних даних
та розробки вирішальних правил класифікації на основі двовимірного
сплайн-нормального розподілу вирішується у підрозд. 2.3. Висновки по розділу
містяться у підрозд. 2.4.
2.1. Двовимірний сплайн-нормальний розподіл з однією прямою склеювання12
Розглядається двовимірна випадкова величина , для якої має місце двовимірний
сплайн-нормальний розподіл з однією прямою склеювання
де – вектор параметрів двовимірного сплайн-нормального розподілу з однією
прямою склеювання; – функція розподілу двовимірного нормального закону з
параметрами ; – пряма склеювання; при .
Зазначимо, що функція розподілу двовимірного нормального закону
, 233
де .
Зручним для обчислень є такий вигляд функції розподілу (2.1) [63]:
, 445
де ; ; – функція Лапласа.
Нижче розглянуто випадок, коли , де C – Const – параметр двовимірного
сплайн-нормального розподілу, визначення оцінки якого поряд з оцінками буде
подано в процедурі 2.1. Тоді функція розподілу має вигляд:
657
В подальшому викладенні надається дослідження двовимірного сплайн-нормального
розподілу з однією прямою склеювання (2.3).
З урахуванням маргінальної властивості функції розподілу визначені функції
розподілів окремих складових двовимірної випадкової величини , а саме
одновимірних випадкових величин та .
Функція розподілу випадкової величини
де .
В силу неперервності в точках прямої склеювання , має бути неперервною в точці
. Це означає, що повинно виконуватися
, або ,
звідки випливає, що
, де . 869
Отже, розподілена за сплайн-нормальним законом з одним вузлом, функція
розподілу якого має вигляд:
10711
де – вектор параметрів розподілу .
Аналогічно функція розподілу випадкової величини
З аналізу випливає, що
, .
Для зручності вводиться позначення:
12813
Тобто, розподілена за нормальним законом з функцією розподілу
де – вектор параметрів розподілу .
Що стосується функції розподілу (2.3), то використовуючи представлення функцій
, у вигляді (2.2), умова неперервності в точках прямої склеювання
набуває вигляду
14915
де , .
Враховуючи (2.4) та (2.6), виконується:
та .
Тоді умова (2.7) буде справедлива, якщо
. 161017
Таким чином, для двовимірного сплайн-нормального розподілу з однією прямою
склеювання функція розподілу
181119
де ; , ; визначається
згідно (2.4).
При виконується
тобто, випадкові величини , є незалежними.
Функція щільності двовимірного сплайн-нормального розподілу з однією прямою
склеювання має вигляд:
201221
де – функція щільності двовимірного нормального розподілу з параметрами , .
Розглянемо властивості функції (2.10).
Якщо , має місце двовимірний нормальний розподіл. При функція (2.10) не є
неперервною. Якщо , то
, ,
інакше ()
, .
Проведемо дослідження функції щільності (2.10) на модальність.
Знайдемо стаціонарні точки функції (2.10) (). Вони визначаються з розв’язку
системи рівнянь
яка в даному випадку має вигляд:
221323
З розв’язку системи (2.11) випливає, що якщо , то стаціонарною точкою є . Якщо
, то стаціонарною точкою є , де визначається згідно (2.4).
При для стаціонарної точки справедливо:
Отже, коли , є точкою максимуму (2.10).
Аналогічно для точки , що є стаціонарною при :
Отже, є точкою максимуму (2.10) при .
З аналізу (2.10) випливає, що слід також розглянути точки прямої . Неважко
переконатися, що, якщо , то (2.10) приймає максимальне значення при . Отже,
додатковому аналізу підлягає точка .
З аналізу (2.10) в точках , , випливає, що функція щільності двовимірного
сплайн-нормального розподілу з однією прямою склеювання (2.10) є одномодальною,
якщо виконується одна з умов:
, 241425
, 261527
та двомодальною при виконанні однієї з умов:
, 281629
. 301731
При виконанні умов (2.12), (2.13) мода співпадає з точкою або відповідно. Для
ум
- Київ+380960830922