Ви є тут

Метод стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів дискретного перетворення Уолша

Автор: 
Данюк Юрій Володимирович
Тип роботи: 
Дис. канд. наук
Рік: 
2008
Артикул:
0408U003290
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
РАЗРАБОТКА МЕТОДА СЖАТИЯ И ВОССТАНОВЛЕНИЯ ЦИФРОВЫХ РЕЧЕВЫХ СИГНАЛОВ
В разделе проведено исследование свойств ДПУ. Разработан метод сжатия цифровых речевых сигналов, который включает в способ отбора коэффициентов трансформант и способ их сжатия с использованием массивов переменной разрядности. Предложенный метод сжатия базируется на статистической избыточности коэффициентов трансформант ДПУ, и позволяет уменьшить объём цифрового представления речевых сигналов. Разработан метод восстановления цифровых речевых сигналов, сжатых предлагаемым методом.
2.1. Метод сжатия и восстановления цифровых речевых сигналов на основе адптивного отбора коэффициентов трансформант дискретного преобразования Уолша
Для современных систем обработки речевых сигналов в цифровой форме характерно использовать для представления каждого отсчета сигнала 8 разрядов. Существует тенденция к увеличению данного значения [3, 4, 41]. Это позволяет исключить слышимую дискретность речевого сигнала [33]. При этом объемы памяти, используемые для представления речевых сигналов в цифровом виде могут достигать значительных объемов. Следовательно, передача цифровых речевых сигналов требует высоких скоростей передачи, что приводит к нерациональному использованию пропускной способности сетей передачи данных.
Для уменьшения объемов речевых сигналов используют методы сжатия. Они позволяют уменьшить исходный объем речевого сигнала в цифровом виде путем определенных преобразований и кодирования, т.е. за счет устранения избыточности сигнала. Современные методы сжатия цифровых речевых сигналов, как правило, включают в себя следующие составляющие:
- процедура определения пауз между словами с вычислением мощности сигнала на основе преобразования Фурье;
- процедура разбиения сигнала по частотным диапазонам согласно функции абсолютной слышимости;
- ортогональное преобразование участков сигнала, не являющихся паузами (как правило, преобразование Фурье);
- статистические алгоритмы сжатия с наборами словарей для сохранения отобранных коэффициентов.
Существенным недостатком методов сжатия, включающих в себя перечисленные составляющие, является высокая вычислительная сложность, что в свою очередь приводит к увеличению времени обработки на этапах подготовки сигнала к передаче и приема. Одними из наиболее трудоемких операций является комплексное преобразование Фурье, а также процедуры определения пауз между словами. Совокупное время доставки речевого сигнала при этом может превысить 120 мс [5,6,12], что в конечном итоге приведет к невозможности осуществления диалога между абонентами или частичной утере информации.
Кроме этого использование статистических алгоритмов сжатия с наборами словарей, которые необходимы для сжатия отобранных коэффициентов требует наличия запоминающего устройства.
С целью сокращения вычислительной сложности предлагается использовать структуру метода сжатия и восстановления цифровых речевых сигналов на основе дискретного преобразования Уолша представленную на рис. 2.1, которая имеет ряд отличий от методов, лежащих в основе стандартов сжатия [5,6,7]:
- в качестве основного ортогонального преобразования метода предлагается дискретное преобразование Уолша;
- фильтрацию и отбор коэффициентов предлагается производить процедурами на основе свойств трансформант преобразования ДПУ [57];
- сжатие отобранных коэффициентов производится с помощью процедуры, в которой отсутствуют словари.
Рис. 2.1. Структура метода сжатия и восстановления цифровых речевых сигналов на основе дискретного преобразования Уолша
Рассмотрим основные элементы приведённой обобщенной структуры.
1. Процедура определения типа текущего блока. Цифровой речевой сигнал разбивается на блоки установленной длины N. Затем для каждого из блоков определяется тип блока с помощью соответствующей процедуры. Данная процедура позволяет определить тип текущего блока, в зависимости от которого вычисляются необходимые коэффициенты. Суть процедуры состоит в том, то с ее помощью определяется характер речевого сигнала на заданном участке и в зависимости от типа блока определяются коэффициенты, подлежащие вычислению. В простейшем случае для определения характера сигнала на заданном участке сравниваются два значения сигнала - максимальное и минимальное, и если результат сравнения не превышает установленного порога, то текущий участок относится к соответствующему типу.
2. Процедура поблочного преобразования ЦРС ДПУ. Исходному набору мгновенных значений цифрового речевого сигнала, представленному последовательностью отсчётов во временном пространстве, ставится в однозначное соответствие набор данных в ином пространстве (частотном, частотно-временном).

Таким образом, формируются N коэффициентов трансформант. Например, первый коэффициент трансформанты формируется следующим образом:

3. Процедура фильтрации и отбора коэффициентов трансформант. На данном этапе, применяемом при построении методов сжатия с потерями, осуществляется необратимое изменение набора данных полученного в результате преобразования. Существуют три основных способа внесения потерь - пороговое кодирование, зональное кодирование, квантование с более грубой шкалой. При пороговом кодировании все значения данных меньшие некоторого уровня (порога) отбрасываются (приравниваются к нулю). При зональном кодировании отбрасываются значения данных лежащие в определённых областях. При ортогональных преобразованиях - в областях оказывающих наименьшее влияние на свойства речевого сигнала, как правило, в высокочастотных. В данном случае отбор коэффициентов производится в соответствии с ранее определенным типом блока.
4. Процедура сжатия трансформант ДПУ с помощью массивов переменной разрядности. На данном этапе кодируются отобранные коэффициенты трансформант с использованием статистических способов сжатия. В предлагаемом методе сжатия в качестве такого способа выбран способ сжатия коэффициентов трансфо