Ви є тут

Теоретичні основи, методи та засоби інтелектуального діагностування комп'ютерних систем

Автор: 
Поморова Оксана Вікторівна
Тип роботи: 
Дис. докт. наук
Рік: 
2007
Артикул:
0507U000568
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2
ТЕОРЕТИЧНІ ОСНОВИ ДІАГНОСТУВАННЯ КОМП'ЮТЕРНИХ СИСТЕМ НА ЕТАПІ ЕКСПЛУАТАЦІЇ

У розділі розроблено основи теорії граничних станів комп'ютерних систем, принципи формування векторів інформаційного опису та побудови діагностичної інформаційної якісно-орієнтованої моделі комп'ютерних систем, описано процес діагностування КС в умовах неповноти діагностичної інформації.

2.1. Теоретичні основи діагностування комп'ютерних систем

Сучасні методи та засоби діагностування КС опираються на основні положення теорії надійності та технічної діагностики [167-170].
Відповідно до Державних стандартів України [56, 171, 172] технічне діагностування передбачає визначення стану ОД з заданою точністю. Технічний стан ОД - це стан, який характеризується в певний момент часу, за певних умов зовнішнього середовища значеннями параметрів, установлених технічною документацією на ОД. При цьому ОД описується діагностичними моделями, що являють собою формалізовані описи ОД, необхідні для вирішення завдань діагностування (наприклад (1.1) - (1.6)).
Для діагностування використовуються діагностовані параметри ОД, для яких визначені допуски - різниці між верхнім і нижнім гранично допустимими значеннями параметрів. Вихід значення параметра ОД за допуски може призвести до переходу ОД в несправний стан, при якому ОД не здатний виконувати задані функції (одну або декілька). Контроль значень діагностованих параметрів здійснюється засобами моніторингу параметрів ОД [1, 26]. Такі засоби фіксують значення діагностованих параметрів, але вони не в змозі визначати стан ОД. Оцінка стану здійснюється засобами моніторингу стану ОД.
Принциповою відмінністю засобів моніторингу стану ОД від засобів моніторингу параметрів ОД є наявність у перших модулів оцінювання стану ОД, що можуть мати як алгоритмічну, так і інтелектуальну реалізацію. Такі модулі фактично приймають рішення про стан ОД на основі значень його діагностованих параметрів.
Основою діагностування апаратних компонентів КС є теорія надійності. Надійність визначається як властивість ОД зберігати в часі у встановлених межах значення всіх параметрів, які характеризують здатність виконувати потрібні функції в заданих режимах та умовах застосування, технічного обслуговування, зберігання та транспортування. Основною кількісною характеристикою надійності є функція надійності, що за визначенням дорівнює ймовірності того, що в заданому інтервалі часу або в межах заданого напрацювання при заданих режимах і умовах експлуатації відмов у системі не виникає [7]. Найбільш поширеними методами забезпечення надійності комп'ютерних систем є [7]:
* резервування, яке передбачає: наявність декількох центральних процесорів, що можуть виконувати функції один одного, наявність резервних модулів оперативної пам'яті та багатократне резервування пристроїв вводу-виводу з повною системою зв'язків між ними і іншими пристроями; наявність джерела безперебійного живлення;
* коригувальні коди, наприклад, для: виправлення однобітових та виявлення двобітових помилок в оперативній пам'яті; контролю за парністю при передачі інформації;
* часова надмірність, повторне виконання команд, що компенсують наслідки випадкових збоїв, котрі є наслідком короткочасних дестабілізуючих процесів;
* контроль і управління температурними режимами функціювання компонентів КС;
* самодіагностика та автоматизоване технічне обслуговування.
Вказані методи дозволяють підвищити такі показники надійності КС, як напрацювання на збій та кількість операцій, що виконуються між збоями.
Сучасні методи аналізу надійності КС базуються на математичній статистиці та теорії ймовірностей. Вони використовують також експериментальні дані про надійність КС та їх складових [7]. Підвищення якості та надійності КС ускладнює збір статистичних даних, тому все більшого поширення набуває такий метод одержання експериментальних даних як прискорені випробування ОД.
За певних умов ОД можуть переходити у граничний стан. Під граничним станом у теорії надійності розуміють стан, при якому використання ОД за призначенням є неприпустимим або недоцільним. Питання доцільності стають особливо актуальними при наявності часткової деградації компонентів КС та їх функційних можливостей. Задача ідентифікації стану КС суттєво ускладнюється, якщо враховувати наявність програмних компонентів та людський чинник у складі сучасних КС.
У процесі експлуатації КС можуть виникати відмови, які полягають у втраті здатності виконувати потрібні функції. Розрізняють раптові та поступові відмови. Раптові відмови виникають у результаті різкої зміни параметрів ОД, а поступові відмови є результатом повільної зміни параметрів і виходу їх з області допустимих значень [6].
Запобігти раптовим відмовам КС можливо лише шляхом заміни апаратних складових КС аналогічними до моменту вичерпання їх ресурсу, хоча це не є гарантом уникнення раптових відмов, оскільки їх причиною можуть бути відмови (помилки) програмного забезпечення. Розрахунки поступових відмов КС виконуються тільки для їх елементів на основі припущення, що поступові відмови в окремих елементах є незалежними подіями.
Відповідно, це означає, що на сьогодні у теорії надійності та технічній діагностиці не розрізняються стани ОД, що призводять до поступових відмов. При переході зі справного до несправного стану у результаті поступової відмови один або декілька параметрів ОД деякий період часу перебувають у близькості від значення його допуску (рис. 2.1.).
Рис.2.1. Приклад результатів
моніторингу параметру ОД
При цьому наближення до значення допуску можуть відбуватися неодноразово через різні інтервали часу, що у результаті може призвести до переходу ОД у граничний стан або до відмови.
На сьогодні не розроблено методів та засобів діагностування КС, які б враховували таку поведінку КС та їх компонентів на етапі експлуатації.

2.2. Загальні положення теорії граничних станів комп'ютерних сис