Ви є тут

Інформаційна технологія підвищення продуктивності автоматизованих систем методами реструктуризації бази даних

Автор: 
Зіноватна Світлана Леонідівна
Тип роботи: 
Дис. канд. наук
Рік: 
2008
Артикул:
3408U004849
129 грн
Додати в кошик

Вміст

Раздел 2
Модели реляционной БД и запроса к БД
2.1. Математическая модель нормализованной и денормализованной реляционной БД
В основе большинства современных АС лежит реляционная БД. Структура БД
проектируется на основе концептуальной модели данных (КМД) предметной области.
Такая модель данных представляет собой совокупность взаимосвязанных объектов.
Переход от КМД к структуре реляционной БД выполняется на основе формальных
правил [14]. В частности, взаимосвязь «многие ко многим» между двумя объектами
А и В представляется тремя отношениями А, В и АВ. При этом между отношениями в
парах (А, АВ) и (В, АВ) существует иерархическая связь, что означает, что
порядок отношений в паре существенен – на первом месте находится родительское
отношение, на втором месте находится подчиненное отношение.
Традиционным подходом к проектированию реляционной структуры базы данных
является использование формальных правил нормализации для получения такой
структуры, в которой каждый элемент данных хранится только в одном месте [47].
Существуют различные представления схемы БД в зависимости от задач, для решения
которых предназначена модель.
В [77] схема реляционной БД рассматривается как набор пар , где Hr –
заголовок отношения r, VARr – именованный контейнер, который может содержать
любое допустимое значение Vr. Заголовком отношения называется конечное
множество упорядоченных пар вида , где A называется именем атрибута, а T
обозначает имя некоторого базового типа или ранее определенного домена.
Значением Vr отношения r называется пара множеств Hr и Br. Телом Br отношения r
называется произвольное множество кортежей tr. Кортежем tr, соответствующим
заголовку Hr, называется множество упорядоченных триплетов вида
, по
одному такому триплету для каждого атрибута в Hr, где v должен являться
допустимым значением типа данных или домена T. Данная модель не учитывает
различие между атрибутами отношения – первичный ключ, неключевой атрибут,
внешний ключ. Не учтены также связи между отношениями.
Для описания БД в [78] введены следующие отношения: Ent (Tn) – описание
отношений, Tn – название отношения, Attrib (A, D, Tn, FTn, FAt) - описание
атрибутов отношений, A – название атрибута, D – тип данных, Tn – название
отношения, которому принадлежит атрибут, FTn – название отношения, на которое
ссылается атрибут, FAt – название атрибута в отношении FTn. Описание
ограничений, накладываемых на отношения, – Constr (Cn, Tn, Tc, A, NA), Cn –
название ограничения, Tn – отношение, которому принадлежит ограничение, Tc –
тип ограничения (первичный ключ или ограничение на значение атрибута), А –
название атрибута в отношении, NA – порядковый номер атрибута в ограничении.
Такое представление позволяет определить тип атрибута и связи между
отношениями, но для получения такой информации необходимо выполнить набор
определенных операций над указанными отношениями.
Для описания процесса реструктуризации БД, который предполагает исследование
поведения АС для принятия решения о преобразовании схемы отношений,
предлагается рассматривать АС, в основе которой лежит нормализованная БД, как
пару:
I=,
M=, (1)
где M – кортеж, описывающий схему отношений БД;
} – множество запросов к базе данных.
представляет множество отношений БД, n – общее количество отношений.
D={dk=(R1, R2), } – множество иерархических связей между отношениями, где (R1,
R2) – упорядоченная пара, R1 – родительское отношение, R2 – подчиненное
отношение; d – общее количество иерархических связей.
– множество ключевых атрибутов. – множество неключевых атрибутов.  – множество
атрибутов отношений; Ai – множество атрибутов отношения , . – множество внешних
ключевых атрибутов, , – внешний ключ, обеспечивающий взаимосвязь между
отношениями R1 и R2, .
Описание запроса состоит из трех компонентов: s – текст k-го запроса;
– количество выполнений k-го запроса; TО{Sel, Ins, Del, Upd, Man}– тип k-го
запроса (выборка, вставка, удаление, обновление, управление соответственно).
Эксплуатация БД с полностью нормализованной структурой, которая включает
значительное число взаимосвязанных отношений с большим количеством кортежей,
может привести к тому, что из-за необходимости частого использования операции
соединения отношений запросы будут выполняться медленно [14]. Реструктуризация
с применением денормализации позволяет снизить время выполнения запросов за
счет уменьшения размеров отношений или устранения из запроса операции
соединения отношений.
Предлагается классифицировать виды реструктуризации по количеству
задействованных отношений и по изменению итогового количества отношений (см.
рис. 2.1) [5].
В результате реструктуризации один или несколько компонентов кортежа (1) могут
быть модифицированы или остаться без изменений в зависимости от применяемого
вида реструктуризации. Денормализованная структура базы данных представляется в
виде кортежа
Рис. 2.1. Классификация основных видов реструктуризации
Далее представлены правила модификации компонентов кортежа для каждого вида
реструктуризации.
1) Реструктуризации подлежат два отношения, находящиеся между собой в
иерархической взаимосвязи «один ко многим» или «один к одному».
1.1) В результате реструктуризации количество отношений остается неизменным, в
одно из исходных отношений добавляется дополнительный атрибут (атрибуты).
1.1.1) Восходящая денормализация
Суть восходящей денормализации состоит во включении в родительское отношение
дополнительного атрибута, значение которого определяется на основе агрегации
данных из дочернего отношения.
Схема базы данных после применения вос