РОЗДІЛ 2. метод декодування інформації на основі нейромережевої класифікації
2.1. Нейромережева інтерпретація загальних підходів кластерного аналізу
В п.1.2 були розглянуті основні проблеми забезпечення надійної передачі
інформації, зокрема декодування, та існуючі підходи щодо їх вирішення. Оскільки
питання підвищення завадостійкості передачі інформації КЗ з адекватною
складністю подальшого декодування залишається відкритим, в даному розділі
розглядається можливість ефективного поєднання методів класифікації та
нейромережевих технологій для декодування. Приклади застосування НМ для задач
ЗІ наведені в п.1.4 та створюють підґрунтя для запропонованого методу,
дозволяючи оцінити переваги і недоліки існуючих нейромережевих засобів.
2.1.1. Принципи побудови класифікаторів в залежності від властивостей даних
Сучасні системи класифікації базуються на застосуванні наступних методів
аналізу [105]:
дискримінантний аналіз, при якому будуються функції, що залежать від ознак і
забезпечують оптимальний за певним критерієм поділ об’єктів класифікації;
виділення та вибір ознак, коли із деякого набору вибирається підмножина ознак
або їх комбінацій;
кластерний аналіз, при якому об’єкти розділяються на групи шляхом порівняння
внутрішньої структури.
Важливим поняттям дискримінантного аналізу є “відмова від розпізнавання”
(рис.2.1). В сумнівних випадках, коли об’єкт розташований близько до
розділяючої функції або при недостатній узгодженості (розташований далеко від
середніх значень класів), класифікація не може бути проведена [11]. Тобто,
об’єкт не належить до жодного класу та класифікація повинна здійснюватись
іншими методами.
а – розділяюча функція; б – область сумнівних випадків;
в – область поганої узгодженості;
Рис.2.1. Ілюстрація випадку відмови від класифікації
Проблема відмови від класифікації в деяких випадках при розв’язуванні
прикладних задач вирішується шляхом зміни розділяючої функції, та внесенням
певних змін в її параметри.
Аналіз об’єктів, що не підлягають класифікації, який проводиться з метою
виділення структур, класів, образів, множин подібних об’єктів називається
кластеризацією. Якість функціонування певного алгоритму залежить не лише від
характеру даних, але і в значній мірі визначається вибраною мірою подібності
образів і методом, що використовується для ідентифікації кластерів в системі
даних. Кластеризацію можна вважати процедурою, яка, обробляючи певні типи
даних, перетворює їх в дані про кластери. Зазначимо, що в кластерному аналізі
використовують три основні типи даних: багатомірні дані, дані про близькість та
дані про кластери [28].
В основі ідеї синтезу систем автоматичної класифікації лежать принципи, за
допомогою яких описуються і розділяються класи об’єктів (образів) [11].
Наведемо варіанти побудови класифікаторів у залежності від характеристик
класів:
якщо клас характеризується переліком членів, що входять до нього, побудована
система ґрунтується на принципі належності до цього переліку, реалізуючи
порівняння з еталоном цього класу;
коли клас характеризується деякими спільними властивостями, що притаманні всім
його членам, побудований класифікатор базується на даній спільності, виділяючи
подібні ознаки та опрацьовуючи їх;
якщо наявна тенденція до утворення кластерів в просторі даних, побудована
система може ґрунтуватися на принципі кластеризації.
У випадках, коли елементи деякого класу представляють собою дійсні вектори, цей
клас розглядається як кластер і виділяються лише його властивості в просторі
образів кластера. Система розпізнавання, що базується на реалізації даного
принципу, визначається взаємним просторовим розміщенням окремих кластерів.
Зазначимо, що надалі будемо розглядати класифікатор, який функціонує за
наведеним вище першим принципом визначення та розділення об’єктів на класи,
тобто порівняння з еталоном.
2.1.2. Метод класифікації за критерієм мінімуму віддалі як основа
функціонування класифікатора
Один з тривіальних підходів при класифікації базується на використанні поняття
віддалі. Оскільки близькість об’єкту, що класифікується, до образів певного
класу використовується в якості критерію, даний підхід називають класифікацією
образів за критерієм мінімуму віддалі [3,6].
Розглянемо класів образів і нехай вони допускають представлення з допомогою
еталонів (рис.2.2). Евклідова віддаль між довільним образом і -м еталоном
визначається як
Класифікатор, який побудований за принципом мінімуму віддалі, обчислює
відстань, що віддаляє некласифікований образ від еталону кожного класу і
відносить цей образ до найближчого класу за результатами обчислень. Тобто образ
відноситься до класу , якщо справедлива умова
. (2.1)
Зазначимо, що кожен клас іноді можна характеризувати не одним, а кількома
еталонними образами [11], тобто довільний образ, що належить класу , проявляє
тенденцію до групування навколо одного з еталонів , де – кількість еталонів, що
визначає -й клас. У цьому випадку функція, що визначає віддаль між довільним
образом і класом записується у вигляді
тобто – найменша з відстаней від до кожного еталону класу .
Рис.2.2. Представлення класів за допомогою еталонів
Визначають ще одне правило класифікації, що базується на принципі ближнього
сусіда [84]. Розглянемо вибірку образів з відомою класифікацією , причому кожен
елемент вибірки входить в один з класів . Правило ближнього сусіда відносить
елемент до того класу, до якого належить його найближчий сусід. Причому
називається найближчим сусідом до образу , якщо
де – відстань, визначення якої допустиме на даному просторі.
2.1.3. Специфіка процесу нейромережевої класифіка
- Киев+380960830922