Ви є тут

Удосконалення комплексної оцінки ефективності роботи вугільних шахт.

Автор: 
Варяніченко Олена Володимирівна
Тип роботи: 
Дис. канд. наук
Рік: 
2008
Артикул:
0408U001060
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2
МЕТОДИЧНІ ОСОБЛИВОСТІ ОЦІНКИ ЕФЕКТИВНОСТІ ПРОДОВЖЕННЯ ЕКСПЛУАТАЦІЇ АБО ЗАКРИТТЯ ШАХТ
2.1. Загальна методика аналізу поточних даних діяльності вугільних шахт
Як наголошувалося в розділі 1 і відповідно до мети даної дисертаційної роботи запропоновано проаналізувати роботу шахт Центрального району Донбасу з використанням апарату кластерного аналізу.
Задача кластерного аналізу полягає в тому, щоб на підставі даних, що містяться в множині Х, розбити множину об'єктів G на m (m - ціле) кластерів (підмножин) Q1, Q2, Qm так, щоб кожний об'єкт Gj належав одній і тільки одній підмножині розбиття і щоб об'єкти, які належать одному й тому ж кластерові, були подібними, тоді як об'єкти належні різним кластерам, були різнорідними [32,66,137].
Рішенням задачі кластерного аналізу є розбиття, що задовольняє деякому критерію оптимальності. Цей критерій може бути деяким функціоналом, що виражає рівні бажаності різного розбиття і угруповань, який називають цільовою функцією. Як цільова функція може бути узята внутрішньогрупова сума квадратів відхилення [32]:
, (2.1)
де xj - є вимірюваннями j-го об'єкту.
Для вирішення задачі кластерного аналізу необхідно визначити поняття схожості і різнорідності.
Об'єкти i-ий і j-ий потрапляли б в один кластер, коли відстань (віддаленість) між крапками Х? і Хj була б достатньо маленькою і потрапляли б в різні кластери, коли ця відстань була б достатньо великою. Отже, попадання в один або різні кластери об'єктів визначається поняттям відстані між Х? і Хj з Ер, де Ер - р - мірний евклідовий простір. Ненегативна функція d(Х?,Хj) називається функцією відстані (метрикою), якщо [32]:
а) d(Хi , Хj) ? 0, для всіх Х? і Хj з Ер
б) d(Хi, Хj) = 0, тільки тоді, коли Х? = Хj
в) d(Хi, Хj) = d(Хj, Х?)
г) d(Хi, Хj) ? d(Хi, Хk) + d(Хk, Хj), де Хj; Хi і Хk - будь-які три вектори з Ер.
Значення d(Хi, Хj) для Хi і Хj називається відстанню між Хi і Хj і еквівалентне відстані між Gi і Gj відповідно вибраним характеристикам (F1, F2, F3, ..., Fр).
Найбільш часто вживаються наступні функції відстаней:
1. Евклідова відстань d2(Хi , Хj) = (2.2)
2. l1 - норма d1(Хi , Хj) = (2.3)
3. Сюпремум - норма d? (Хi , Хj) = sup (2.4)
k = 1, 2, ..., р

4. lp - норма dр(Хi , Хj) = (2.5)
Евклідова метрика є найпопулярнішою. Метрика l1 - найлегша для обчислень. Сюпремум - норма легко розраховується і включає процедуру впорядкування, а lp - норма охоплює функції відстаней 1, 2, 3.
Хай n вимірювань Х1, Х2,..., Хn є представлений у вигляді матриці даних розміром p ? n [32]:
(2.6)

Тоді відстань між парами векторів d(Х?,Хj) може бути представлена у вигляді симетричної матриці відстаней [32]:
(2.7)

Поняттям, протилежним відстані, є поняття схожості між об'єктами G?. і Gj. Ненегативна речовинна функція S(Х? ; Хj) = S?j називається мірою схожості, якщо :
1) 0? S(Хi , Хj)?1 для Х? ? Хj
2) S(Хi , Хi) = 1
3) S(Хi , Хj) = S(Хj , Х?)
Пари значень заходів схожості можна об'єднати в матрицю схожості [32]:
(2.8)
Величину Sij називають коефіцієнтом схожості.
Сьогодні існують достатньо багато методів кластерного аналізу. Зупинимося на деяких з них (методи, що нижче приводяться, прийнято називати методами мінімальної дисперсії).
Хай Х - матриця спостережень: Х = (Х1, Х2,..., Хn), і квадрат евклідової відстані між Х? і Хj визначається по формулі [32]:
(2.9)
Суть методу повних зв'язків полягає в тому, що два об'єкти, котрі належать одній і тій же групі (кластеру), мають коефіцієнт схожості, який менше деякого граничного значення S. У термінах евклідової відстані d це означає, що відстань між двома точками (об'єктами) кластера не повинна перевищувати деякого граничного значення h. Отже, h визначає максимально допустимий діаметр підмножини, утворюючої кластер.
У методі максимальної локальної відстані кожний об'єкт розглядається як одноточковий кластер. Об'єкти групуються за наступним правилом: два кластери об'єднуються, якщо максимальна відстань між точками одного кластера і точками іншого мінімальна. Процедура складається з n - 1 кроків і результатом є розбиття, яке співпадає з будь-яким розбиттям в попередньому методі для будь-яких граничних значень.
У методі Варда як цільову функцію застосовують внутрішньогрупову суму квадратів відхилень, яка є ні що інше, як сума квадратів відстаней між кожною крапкою (об'єктом) і середній по кластеру, що містить цей об'єкт. На кожному кроці об'єднуються такі два кластери, які приводять до мінімального збільшення цільової функції, тобто внутрішньогрупової суми квадратів. Цей метод направлений на об'єднання близько розташованих кластерів.
У центроїдному методі відстань між двома кластерами визначається як евклідова відстань між центрами (середніми) цих кластерів [32]:
d2 ij = (?X -?Y)Т(?X -?Y) (2.10)
Кластеризація йде поетапно: на кожному з n-1 кроків об'єднують два кластери, що мають мінімальне значення d2ij. Якщо n1 багато більше n2, то центри об'єднання двох кластерів близькі один до одного і характеристики другого кластера при об'єднанні кластерів практично ігноруються. Іноді цей метод називають ще методом зважених груп.
Розглянемо ? = (?1, ?2, ... ?n)) як множину кластерів {?1}, {?2},...{?n }. Виберемо два з них, наприклад ? ? і ? j, які в деякому розумінні більш близькі один до одного і об'єднаємо їх в один кластер. Нова множина кластерів, що складається вже з n-1 кластерів, буде: {?1}, {?2}..., {? ? , ? j}, ..., {?n} [32].
Повтор