Ви є тут

Моделі, методи й інформаційні технології агрегативного кодування і стиску мультимедійних даних

Автор: 
Іванов Володимир Георгійович
Тип роботи: 
Дис. докт. наук
Рік: 
2008
Артикул:
3508U000198
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
обобщенная модель технологической среды сжатия данных на основе методов
сокращения избыточности и методов распознавания образов
На основании анализа методов сжатия и построенной в первом разделе схемы их
классификации, на рис. 2.1. представлена обобщенная модель технологической
среды сжатия данных, которая отражает принятый в диссертации концептуальный
подход к кодированию изображений на основе объединения независимых методов
сокращения избыточности и методов распознавания образов и включает в себя
декомпозиционные составляющие моделей разложения сигналов в ряды Фурье,
вейвлет-анализа и контурно-текстурной модели на принципах группирования данных
(автоматической классификации), позволяя оставаться при этом в рамках
классических методов теории и практики JPEG-сжатия изображений. Модель
позволяет ослабить ограничения методов теории информации и теории кодирования,
которые в недостаточной степени учитывают свойства зрительной системы человека
и в общей схеме кодирования изображений, состоящей из этапа формирования
последовательности сообщений, а затем этапа формирования кодовых слов, основной
упор делают на втором этапе, состоящем в основном из методов устранения
межэлементной и кодовой избыточности сообщений [9, 14-20, 37, 49, 50, 51, 55].
Анализ результатов из области физиологии зрения
[23, 36, 60, 61, 75, 82, 129, 145] и последних достижений технологий сжатия
[40, 43, 44, 47] дает веские аргументы в пользу применения общей
контурно-текстурной модели для обработки и кодирования изображений, которая
акцентирована в первую очередь на отбор сообщений для кодирования, используя
методы распознавания образов [30, 31, 38, 74, 75], а само кодирование
производится классическими методами теории информации [48, 55, 102-104].
Предложенная обобщенная модель определила весь ход дальнейших исследований и
позволила оптимизировать и выявить резервы как действующих JPEG-форматов сжатия
изображений [29, 46, 116], так и предложить новые подходы на основе методов
автоматической классификации и выделения объектов с целью дальнейшего их
кодирования с различным визуальным качеством [45, 120, 122, 123, 211].
Рис. 2.1. Обобщенная модель технологической среды сжатия данных.
2.1. Особенности JPEG сжатия изображений посредством моделей разложения в
обобщенные ряды Фурье
Формально схема модели JPEG-кодирования (трансформационное кодирование,
рис. 2.1.) основывается на методах разложения сообщений в ортогональные ряды по
линейно независимой системе (базису) детерминированных функций {jk(t)}:
, (2.1)
которая в зависимости от вида базиса и величины "n" может носить точный или
приближенный характер [19, 57]. Это позволяет представить любую реализацию f(t)
непрерывного случайного процесса последовательностью случайных величин {yk},
которые адекватны в некотором смысле f(t). При этом система функций jk должна
удовлетворять условию ортогональности и полноты:

0 при k№j
. (2.2)
ak№0, при k=j
Разложение (2.1) по полной системе ортогональных функций называется обобщенным
рядом Фурье. Для него справедливо соотношение
, (2.3)
то есть средняя энергия Е процесса F(t) на интервале (0,Т) равна сумме
дисперсий (sk2) коэффициентов (координат) yk, , ряда Фурье. При этом процесс
F(t) и последовательность , информационно эквивалентны, то есть любое
ортогональное преобразование не изменяет энтропии сообщения.
Для дискретного процесса наличие корреляции между элементами и , , исходного
вектора , дисперсии , , которых, как правило, распределены равномерно, приводит
к существенно неравномерному распределению дисперсий по элементам вектора ,
который является результатом преобразований исходных данных по некоторой
системе базисных ортогональных функций [19, 51]. При этом, как показывают
экспериментальные и теоретические результаты, большие дисперсии сосредоточены в
малом числе элементов вектора , а дисперсии остальных его элементов
сравнительно малы [17, 18, 21, 48, 101]. Поэтому такие элементы часто можно
отбросить или отвести на их кодирование малое число двоичных единиц при
незначительной потере информации об исходном сообщении . С учетом сказанного
показателем эффективности использования для сжатия данных того или иного
преобразования может служить мера неравномерности дисперсий по элементам . В
качестве такой меры можно использовать теоретико-информационное понятие
энтропии [103, 104, 156, 191], но применительно уже не к распределению
вероятностей дискретного по значениям сообщения, а к распределению дисперсий ,
, по элементам вектора при условии, что . Если ортогональному преобразованию
подвергаются блоки по m отсчетов, то энтропия распределения дисперсий будет
равна [56]:
, (2.4)
где - дисперсии элементов , вычисленные по соотношению
, . (2.5)
В этой формуле , - элементы корреляционной матрицы вектора ; , - элементы
унитарной матрицы Р; * - символ комплексного сопряжения.
Из (2.4) следует, что чем неравномернее распределены дисперсии вектора , тем
меньше , а это означает большую эффективность того или иного ортогонального
преобразования. Оптимальным разложением является преобразование Карунена-Лоэва,
система базисных функций {jkопт}2 которого не фиксирована, а согласована с
корреляционными свойствами процесса . Это разложение обеспечивает максимальную
неравномерность дисперсий коэффициентов yk и максимальную сходимость
обобщенного ряда Фурье [18, 48, 229].
В случае обработки двумерных сообщений в модели (блок 3, рис. 2.1.)
используется разложение по орто