Розділ 2. Розробка статистичних методів розпізнавання нелінійних процесів у
медичних дослідженнях
2.1. Метод кусково-лінійної сплайнової регресії з однією точкою переходу для
аналізу часових рядів
При дослідженні різних патологій травного тракту вивчають медико-біологічні
дані, представлених у вигляді часових рядів. Зокрема, до них відносяться криві
МЕ крові онкологічних хворих, криві базальної секреції, секреції підшлункового
залози та жовчного міхура тощо. Вони відображають нелінійну динаміку
медико-біологічних процесів у організмі людини. Одним з методів оцінки
нелінійних параметрів таких кривих є методи нелінійної регресії, зокрема методи
сплайнової регресії та метод кусково-лінійної сплайнової регресії. Останній
найбільш доцільно використовувати у випадках, коли закон протікання
досліджуваного процесу змінюється стрибкоподібно протягом часу спостереження.
Перейдемо до опису методу кусково-лінійної сплайнової регресії з однією точкою
переходу [86].
Розглянемо випадковий процес x(t), визначений на відрізку [0, T]. Будемо
вважати, що тренд m(t) = m(x(t)) (змінна детермінована компонента) є
кусково-лінійним сплайном, що має вигляд:
(2.1)
де t* – точка переходу (рис. 2.1).
Рис. 2.1. Модель кусково-лінійної сплайнової регресії
Необхідно за спостереженням реалізації (траєкторії) x(tk) процесу x(t) у точках
tk (t0 = 0, ј, tn = T) оцінити значення точки переходу t* та параметри a1, b1,
a2, b2 сплайну m(t). Розв’язування цієї задачі будемо здійснювати методом
мінімізації залишкової суми квадратів (МЗСК). Опишемо коротко суть цього
методу. Припустимо, що точка переходу t* нам відома та співпадає з однією з
точок спостереження траєкторії x(t): t* = ti, тоді задача оцінки параметрів a1,
b1, a2, b2 зводиться до проблеми оцінки параметрів у схемі лінійної регресії,
оскільки у цьому випадку m(t) можна подати у вигляді лінійної комбінації
фундаментальних сплайнів [29]. Використовуючи класичний метод найменших
квадратів (МНК) [88], можна отримати так звані оцінки МНК , , , для невідомих
параметрів a1, b1, a2, b2 (ці оцінки залежать від нашої гіпотези t* = ti, а
тому і від індекса i) та залишкову суму квадратів
(2.2)
Вибравши потім серед залишкових сум , , ј, найменшу суму та знаходячи її
порядковий номер i*, знайдемо оцінку для значення точки переходу ti* » t* та
оцінки , , , невідомих параметрів a1, b1, a2, b2 для сплайну m(t). Будемо
називати ці оцінки ti*, , , , оцінками, що одержані методом мінімізації
залишкових сум квадратів. Покажемо, що при виконанні деяких умов ці оцінки
збігаються по ймовірності до істинних значень параметрів t*, a1, b1, a2, b2.
Теорема 1. Якщо у моделі регресії
(2.3)
де k = 1, 2, ј, n; t1, t2, ј, tn – вузли рівномірного розбиття відрізку [0, T],
шум yk (k = 1, 2, ј, n) є послідовністю незалежних у сукупності однаково
розподілених випадкових величин та вектор параметрів a = (t*, a1, b1, a2, b2)
належить компактній множині Q, то оцінки параметрів ti*, , , , одержані методом
МЗСК є строго слушними.
Доведення. Доведення теореми 1 спирається на класичну теорему Дженріча про
строгу слушність параметрів a в схемі нелінійної регресії [25], коли тренд
ft(a) є неперервною функцією регресії на компакті Q. Якщо припустити, що для
довільних a, b О Q існує границя
(2.4)
причому збіжність в (2.4) рівномірна й j(a,b) = 0 тоді і тільки тоді, коли
a = b, то, як показано в роботі [25], оцінка методу МЗСК буде строго слушною,
тобто , де a – істинне значення вектора параметрів.
Перевіримо справедливість умов теореми Дженріча у випадку сплайнової регресії.
Для зручності введемо такі позначення
Без обмеження загальності можна вважати, що a1 Ј b1. Покладемо
де с1 = a3 - b3, с2 = a2 - b2, d1 = a3 - b5, d2 = a2 - b4, e1 = a5 - b5,
e2 = a4 - b4. Позначимо
де .
Покажемо, що послідовність jn(a,b) рівномірно збігається до функції j(a,b) на
декартовому добутку QґQ. Введемо наступні позначення: , , , (рис. 2.2).
Рис. 2.2. Різниця двох кусково?лінійних сплайнів
Легко бачити, що
де
,
.
Розглянемо перший доданок I1
Оскільки, 0 Ј ti-1 < ti Ј a1, , то
тому
Покладемо ; враховуючи, що і , маємо
аналогічно
Отже,
Провівши аналогічні обчислення, отримаємо
Оцінимо доданок
Маємо
так що
Поклавши та проводячи аналогічні обчислення, отримаємо
Отже,
Значить
Далі
аналогічно та , отже
Таким чином,
Отриманий вираз менший за будь-яке e > 0, якщо
Перевірка інших умов теореми Дженріча очевидна.
Теорема доведена.
Оцінка по методу МЗСК є зміщеною. Для оцінки значення точки переходу у випадку
n = 3 можна отримати зміщення цієї оцінки та її дисперсії. У роботі [89]
показано, що зміщення значення точки переходу залежить від двох змінних:
дисперсії шуму s2 та величини (b1 - b2)2.
Теорема 2. Якщо в моделі регресії (2.3) шум yk є послідовністю незалежних в
сукупності нормально розподілених випадкових величин з дисперсією s2 та
нульовим математичним сподіванням, то зміщення оцінки значення точки переходу
має вигляд
,
(2.4)
де , а дисперсія оцінки значення точки переходу визначається формулою
(2.5)
Як відомо, на підставі зміщення і дисперсії можна отримати середню квадратичну
похибку оцінки :
(2.6)
Спробуємо оцінити зміщення параметрів ti*, , , , , одержані методом МЗСК у
моделі (2.3). Для цього спочатку розглянемо загальну модель нелінійної
регресії:
yi = fi (a1, a2, ј, am) + ei, i = 1, ј, n,
(2.7)
де fi (a1, a2, ј, am) = y (xi1, ј, xik, a1, ј, am), yi – залежна змінна,
xi1, ј, xik – незалежні змінні, що відповідають i?му спостереженню, a = (a1,
a2, ј, am) – вектор невідомих параметрів, я
- Київ+380960830922