РОЗДІЛ 2
РОЗРОБКА АРХІТЕКТУРИ БЛОЧНОЇ НЕЙРОННОЇ МЕРЕЖІ
ДЛЯ ЗАДАЧІ ВІЗУАЛІЗАЦІЇ
2.1. Вирішення задачі візуалізації на основі нейронних мереж з неітераційним навчанням
Розглянемо основні особливості, які визначають підхід до вирішення задачі візуалізації на основі автоасоціативних нейронних мереж ФТФ.
Будемо розглядати множину вхідних даних, що характеризує об'єкт дослідження, як сукупність векторів (точок-реалізацій об'єкта) у n-вимірному просторі ознак. Геометричне місце всіх точок-реалізацій об'єкта утворює тіло об'єкта.
У нейропарадигмі ФТФ вважається, що тіло об'єкта може моделюватися за допомогою нейронної мережі для вирішення конкретного завдання дослідження об'єкта. Тоді навчальна множина нейромережі буде підмножиною загальної множини точок-реалізацій. Використовуючи дані навчальної множини, нейронна мережа може з достатньою точністю відтворити тіло об'єкта.
Метою навчання нейромережі ФТФ є розклад (декомпозиція) тіла об'єкта на складові частини в просторі невеликої розмірності (первинні елементи декомпозиції). Ці складові частини є носіями визначальної інформації про властивості об'єкта. Отже, такі складові частини можуть бути використані для візуального представлення даних про об'єкт. На основі наявних первинних елементів декомпозиції можна виконати зворотний процес відтворення тіла об'єкта в просторі початкової розмірності.
Для виконання процесів декомпозиції та композиції тіла об'єкта у різних задачах розроблені відповідні архітектури нейронних мереж [68]. Всі ці архітектури мають в основі класичну структури нейромережі прямого поширення, яка бере початок від перцептрона Розенблатта [70], з використанням додаткових впорядкованих бічних зв'язків між нейронами прихованих шарів.
Як було показано в розд. 1, для вирішення задачі візуалізації в цьому випадку доцільно використати структуру автоасоціативної нейронної мережі. Процес декомпозиції виконується під час руху даних від вхідного до прихованого шару АНМ. Координати первинних елементів декомпозиції в просторі малої вимірності формуються на виходах прихованого шару АНМ. Нейрони вихідного шару АНМ забезпечують представлення тіла об'єкта в початковому просторі, тобто зворотне перетворення (рис. 2.1).
Рис. 2.1. Базова структура автоасоціативної нейронної мережі
з одним прихованим шаром
Процес декомпозиції може здійснюватися різними шляхами, які визначаються на етапі проектування структури АНМ та вибору методу навчання. Одним з таких варіантів є послідовне проектування точок на гіперплощини, що проводяться через початок координат перпендикулярно до обраних векторів. Первинними елементами декомпозиції в цьому випадку будуть координати кінців вибраних векторів, що задають систему координат відображеного m-вимірного простору та віддалі точок до гіперплощини, що задають власне координати точок.
На етапі навчання нейромережі визначаються первинні елементи декомпозиції та формується візуальне представлення найважливіших особливостей тіла об'єкта у вигляді зручному для сприйняття людиною.
Відзначимо наступні визначні можливості, які надає нейропарадигма "функціонал на множині табличних функцій" для вирішення задач візуалізації багатовимірних даних.
1. Для побудови ефективних нейромереж достатньо використовувати один прихований шар. Встановлено [68], що додання прихованих шарів суттєво не впливає на якість навчання нейромережі.
2. Процес навчання є неітераційним на відміну від АНМ, що навчаються за правилом зворотного поширення похибки. Тому автоасоціативні нейронні мережі на основі нейропарадигми ФТФ можуть набути широкого застосування у системах візуалізації в реальному часі.
3. Наявні прості способи визначення характеру точок, що не входили до навчальної множини, з точки зору інтерполювання та екстраполювання. Інтерполяційна точка розглядається як така, що не впливає на визначальні характеристики тіла об'єкта. Тому немає потреби включати таку точку до навчальної множини для подальшого перенавчання мережі.
4. Нелінійність характеристик нейронів та синаптичних зв'язків дозволяє здійснювати гнучке налаштування мережі для конкретної практичної задачі та в залежності від особливостей множини вхідних даних.
Проведені дослідження виявили деякі недоліки та обмеження найпростішої (базової) структури АНМ, що представлена на рис. 2.1.
При перетворенні тіла об'єкта з первинного n-вимірного простору у відображений m-вимірний простір, де m
- побудоване відображення між елементами векторів навчальної множини на вході та виході нейромережі повинно бути взаємно однозначним та неперервним в обидві сторони, тобто векторам, що є близькими на вході мережі повинні відповідати близькі вектори на виході мережі і навпаки (умова гомеоморфізму [71]).
Показано [68], що приведені вище вимоги до певної міри суперечать одна одній. Для здіснення точного перетворення елементів вектора з простору великої вимірності в простір малої вимірності і далі знову в простір великої вимірності необхідно забезпечити значну нелінійність передатних функцій нейронів та синаптичних зв'язків у нейромережі, наприклад, задати достатньо високі степені поліномів синаптичних функцій. У цьому випадку забезпечення належної точності перетворень може вимагати великого обсягу навчальної множини. Крім того, як правило, важко забезпечити неперервність перетворень з одного простору в інший, яка найкраще реалізується