змістовного опису ІМ використовується сукупність базових
параметрів (табл. 2.), які доповнюють представлені в табл. 1. основні елементи
ІМ.
Таблиця 2.
Позначення параметра
Назва параметра
Інтенсивність інформаційного потоку
Запит на доступ до певних інформаційних ресурсів
фv
Час обслуговування запиту щодо доступу до інформаційних ресурсів
Очікуваний ефект від впровадження k-й функції
Метка виміру показника системи
Особисті якості користувачів
Кратність виконання функцій на заданому часовому інтервалі Т
Обсяг інформаційного ресурсу
Потужність засобів обробки і передачі даних
Наведені в табл. основні параметри утворюють множину , яку запишемо у
вигляді:
(2.)
Відображення конкретних параметрів із множини у відповідних рівнях дозволяє
здійснювати більш детальну формалізацію моделі КВД. Процес відображення в ІМ
значень всіх основних параметрів, що входять до складу множини , позначимо
через , а процедуру відображення визначених параметрів в межах рівня символом .
Тоді, подібно (2.), для можна записати
(2.)
Так як формується із сукупностей та , властивих тільки її компонентам, то . Цей
вираз відображає склад рівня , а його формальний опис в ІМ має вигляд
(2.)
Позначаючи опис множини рівнів символом одержуємо
(2.)
З урахуванням (2.) вираз (2.) запишемо у вигляді
(2.)
Таким чином, здійснюється процес формалізованого опису КВД (2.) за допомогою
компонентів, які представлені виразами (2.) і (2.). Тобто ІМ для КВД може
бути представлена трьома множинами: множиною рівнів множиною основних елементів
та множиною параметрів цих елементів. Компоненти цих множин утворюють структуру
інформаційної моделі:
Перевагою такого методу є можливість описати модель ПрО в термінах, більш
зрозумілих широкому колу експертів з питань КВД, не перевантажуючи модель
специфічними термінами ІТ.
На основі комбінаційного методу проведено дослідження предметної області КВД та
побудована інформаційна модель аналізу стану виконання державного бюджету.
Структура інформаційної моделі КВД складається із семи рівнів (Рис. 2.), кожен
із яких описується своєю множиною основних елементів та множиною параметрів .
Тобто кожний рівень має свою сукупність , яка саме його характеризує.
Типовими рівнями, які доцільно розглядати при побудові ІМ аналітичної системи
КВД, мають бути: - рівень джерел та потоків інформації, що надходять до
системі; - рівень, який охоплює процеси обробки і перетворення інформації, а
також інформаційні технології, що їх супроводжують; - рівень інформаційних
ресурсів, які накопичуються в системі (бази даних і знань); - рівень, який
розглядає задачі та функції, що вирішуються в системі; - рівень, елементами
якого є алгоритми обробки та аналізу даних; - рівень, який визначає
функціональну спеціалізацію користувачів системи; рівень, елементами якого є
спеціалізоване програмне забезпечення робочих місць фахівців КВД. Наведений
перелік рівнів не є вичерпним, а їх номерний знак не завжди може відповідати
порядковому номеру. Адже вибір рівнів залежить, насамперед, від кваліфікації
фахівців-аналітиків, ступеня попередніх знань, особливостей функціонування
системи тощо.
Запропонована інформаційна модель аналізу стану виконання державного бюджету
враховує національні особливості бюджетного устрою та, на відміну від
«детермінованих» моделей даних інформаційних систем EUROSAI або INTOSAI,
включає блок обробки неструктурованих даних -
Рис. 2. Інформаційна модель аналізу стану виконання державного бюджету
(даних громадських організацій), а також відображення багатовимірних даних в
зручному для осмислення виді.
Реалізація запропонованої моделі потребує запровадження широкого спектру
коштовних інформаційних технологій обробки даних, включаючи технологію
структуризації і систематизації семантично неузгоджених даних, приведення їх до
виду базових показників та інших.
Третій
розділ. Досліджено архітектуру та структурні компоненти систем,
орієнтованих на аналіз даних у розподіленому середовищі, застосовуючи які можна
створити аналітичне ядро системи для інформаційної підтримки технологічних
процесів та головних завдань ПрО. Показано, технологічна схема контролю
бюджетних процесів інтегрує різні технології обробки даних (іноді дуже
коштовні). З метою зменшення сумарних витрат на створення спеціалізованого
програмного забезпечення системи КВД (при ресурсних обмеженнях ) запропоновано
функціональну спеціалізацію користувачів.
Функціональна спеціалізація базується на інформаційної моделі, яка заснована на
сценарно-цільовому підході та враховує наступні фактори: властивості
особистості - , технологічні процеси обробки даних - , множину функцій - ,
різноманітні моделі даних - . Інформаційна модель функціональної спеціалізації
користувачів ІАС описується математичним виразом:
(3.)
де - властивості людини, які впливають на формування конфігурації
функціонального ПЗ, – функції, які здійснюються різними фахівцями в процесі
обробки даних; – технологічні процеси та типові сценарії обробки даних; – ІР,
які використовуються при здійсненні функції .
Властивості особистості визначаються як
, (3.)
де Z – лінгвістична підготовка; G – рівень комп’ютерної підготовки (знання
технологій обробки різних видів інформації); Y – професійні знання (предметної
області, актуальних тем аналізу, джерел інформації тощо).
Типові технологічні процеси обробки даних характеризуються математичним
виразом
, (3.)
де – процес прийому і верифікації первинних даних; – процес консолідації та
агрегації кількісних індикаторів, які визначають предметну область та надходять
з різних джерел (наприклад, ); – процес формування БЗ; – процес обробки
іншомовних ресурсів; – процес моніторингу і аналізу виконання базових
показників; – процес та прогнозування (наприклад, прогнозування
макропоказників).
Тоді інформаційну модель функціональної спеціалізації фахівців ІАС можна
представити у виді
(3.), де
- модель користувача з питань обробки та верифікації структурованих даних
де ;
модель користувача з питань агрегації базових індикаторів -
де ;
- модель користувача з питань обробки неструктурованих даних
, де ;
- модель користувача з питань обробки іншомовних матеріалів (включаючи ЗМІ)
, де ;
- модель користувача з обробки багатовимірних даних
, де ,
множина попередньо агрегованих в OLAP-куби показників для виконання аналізу за
різними вимірами ;
- модель користувача з питань аналізу та прогнозування
, де ; а – множина попередньо агрегованих в OLAP-куби показників, потрібних для
аналізу та прогнозуванню.
Модель функціональної спеціалізації користувачів дозволяє з достатнім рівнем
деталізації побудувати ядро складної ІАС і визначити розподіл функцій між
різними користувачами, що приводить до скорочення витрат на придбання
кошторисних ІТ.
Найважливішим показником систем з використанням кубічних сховищ та аналітичних
технологій OLAP є час відгуку, який бажано мати настільки малим, щоб не
встигали розмикатися асоціативні зв’язки, які виникають в аналітика в процесі
осмислення проблеми. У більшості OLAP-систем процеси формування запитів до
багатовимірних даних відокремлені від процедур відображення зрізів даних у
зручному для сприйняття виді, рознесені в часі і, в більшості систем,
виконуються різними за фахом користувачами системи. З метою зменшення часу
відгуку запропоновано комбінований алгоритм, який на відміну від існуючих
OLAP-засобів, об’єднує в одному алгоритмі процедури агрегації даних (формування
зрізів) з процедурами їх візуалізації для семантичного осмислення отриманих
даних.
Аналіз даних починається з генерації робочої гіпотези дослідження – вибору
групи функцій и визначенню напрямку дослідження – набору показників (рис. ).
Далі формуються умови перевірки гіпотези, тобто визначення основних вимірів ,
та позначок вимірів для змістовного дослідження. Наступним кроком є формування
запитів із визначеними параметрами з метою отримання конкретного зрізу даних та
їх подальшого відображення для семантичного осмислення. Якщо отриманих даних
недостатньо, формуються додаткові умови запиту .
Крок 1. У блоці A формуються умови робочої гіпотези - і перелік показників для
дослідження .
Крок 2. У блоці А встановлюються умови вибору гіперкубу , до якого належать
обрані показники .
Крок 3. У блоці А для кожного обраного показника визначається вимір , за яким
має виконуватися запит.
Крок 4. У блоці А встановлюються позначки виміру .
Крок 5. У блоці А формується запит для вибірки визначеного зрізу даних.
Крок 6. У блоці А безпосередньо виконується звернення до гіперкубу і
формується зріз даних .
Крок 7. У блоці А виконується оцінка чи вистачає даних для аналізу.
Крок 8. Формування додаткових умов, з метою отримання зрізу даних з іншою
позначкою виміру .
Кроки – виконуються в циклі, доки не отримаємо зріз з потрібними для
аналізу даними.
Крок 9. У блоці А обираються форми відображення даних у вигляді: таблиць,
гістограм, кругових діаграм, порівняльних діаграм, діаграм динаміки за кільками
вимірами, діаграм з прив’язкою до картографічної основи.
Крок . Виходом з алгоритму є вибір форми генерації звітних матеріалів :
доповідна записка, звіт, аналітична довідка, експертний висновок та інші.
Запропонований алгоритм дозволяє поєднати процедури формування OLAP-зрізів
даних за будь-якими вимірами з широким спектром процедур візуалізації даних
(включаючи картографічну основу). Відомо, що візуальне відображення вважається
більш ефективним для семантичного сприйняття багатовимірної інформації Таким
чином, поєднання в одному алгоритмі таких можливостей підвищує швидкість та
ефективність дослідження даних.
У четвертому
розділі розглянуто питання практичної реалізації запропонованої
семірівневої інформаційної моделі аналізу стану виконання державного бюджету і
визначені умови досягнення достатнього рівня ефективності при побудові ядра ІАС
Рахункової палати, яка входить до складу автоматизованої системи державного
контролю та моніторингу виконання держбюджету України.
На підставі запропонованої моделі визначено конкретну архітектуру аналітичного
ядра ІАС, склад інформаційних ресурсів, які зберігаються в системі, регламент
та технології їх обробки, специфікацію програмних застосувань (з урахуванням
вимог, які висуваються до фахівців різного профілю), типові сценарії та
алгоритми обробки і відображення багатовимірних даних. Результатом цих
досліджень є формування бібліотеки спеціалізованих програмних засобів,
сукупність яких реалізує різні аспекти аналізу бюджетних процесів (Рис. ).
Рис. 3. Приклади програмних реалізацій різних аспектів аналізу бюджетних
процесів.
Запропоновані інформаційні технології дають можливість фахівцям-аналітикам
звертатись до різних вимірів гіперкубів даних користуючись
інтуїтивно-зрозумілим інтерфейсом (без використання мови програмування) та
отримувати результати у зручному для прийняття рішень вигляді від звичайних
таблиць до відображення зрізів даних на картографічному фоні (Рис. ).
Використання картографічної форми подання результатів при дослідженні різних
вимірів бюджету забезпечує наочність і сприяє виникненню асоціативних зв’язків
між різними вимірами. Тобто, завдяки запропонованій технології увага
фахівця-аналітика зосереджується не на процедурах аналізу багатовимірних даних,
які, доречі, дуже складні і потребують певної фахової підготовки, а на
змістовному осмисленні проблеми, що підвищує якість досліджень і сприяє
прийняттю обґрунтованих управлінських рішень.
Рис. 4. Приклади відображення зрізів багатовимірних даних при дослідженні
різних вимірів бюджету.
Проаналізована продуктивність розв’язання задач обробки багатовимірних даних з
використанням комбінованого алгоритму налаштування гіперкубів, обробки запитів
і відображення даних. Результати випробувань ПЗ при аналізі бюджетів показали
підвищення швидкості обробки даних в - разів у порівнянні з
роздільним
методом обробки багатовимірних даних (OLAP) у середовищі СУБД Oracle i.
В заключній частині роботи сформульовано висновки та основні результати
досліджень.
ВИСНОВКИ
У результаті проведених у дисертаційній роботі досліджень розвинено теоретичні,
методологічні та прикладні засади побудови і впровадження інформаційних
технологій в області контролю виконання та оцінки ефективності використання
держбюджету.
У результаті дослідження отримані наступні наукові і практичні результати:
Удосконалено метод структурного аналізу предметної області на основі
комбінованого методу формалізованого опису інформаційних моделей, який поєднує
декомпозицію системи за рівнями з методом елементно-параметричної формалізації
характерних для цієї системи елементів, що дозволяє описати ПрО в термінах,
більш зрозумілих широкому колу експертів з питань КВД.
На підставі зазначеного методу розроблена інформаційна модель системи аналізу
стану виконання держбюджету, яка відрізняється від «детермінованих» моделей, що
розповсюджені в інформаційних системах EUROSAI та INTOSAI тим, що враховує
особливості національного устрою бюджетних процесів (змінюваність у часі
організаційної структури суб’єктів процесу, номенклатури і контенту
інформаційних ресурсів) та забезпечує порядок здійснення контролю на всіх
стадіях.
Запропоновано комбінований алгоритм оперативного аналізу і відображення
багатовимірних даних, який, на відміну від існуючих OLAP-алгоритмів, поєднує в
одному алгоритмі процедури формування умов OLAP-зрізів даних з процедурами
візуалізації даних, що підвищує якість сприйняття багатовимірної інформації в
процесі осмислення проблеми.
Розроблено удосконалені інформаційні моделі та технології комп’ютерного аналізу
стану виконання держбюджету на базі комбінованого алгоритму налаштування
гіперкубів, обробки запитів і відображення даних, що дозволяє фахівцю без
використання мови програмування досліджувати будь-яки виміри ПрО та отримувати
результати у зручному для прийняття рішень вигляді.
Розроблено ПЗ аналізу стану виконання держбюджету, яке реалізує отримані
моделі, алгоритми налаштування гіперкубів даних, сценарії обробки та процедури
візуалізації даних. Результати випробувань ПЗ на базі комбінованого алгоритму
показали підвищення швидкості обробки багатовимірних даних в - разів у
порівнянні з
роздільним методом обробки.
Впровадження результатів дисертаційної роботи показало практичну ефективність
розроблених інформаційних моделей, алгоритмів аналізу та візуалізації
багатовимірних даних при створенні ІАС Рахункової палати, яка входить до складу
автоматизованої системи державного контролю та моніторингу виконання
держбюджету України, а також при створенні макета інформаційної системи
Національного центру з питань євроатлантичної інтеграції України.
Список
- Київ+380960830922