Ви є тут

Інтерпретація акустичних даних у задачах моніторингу виробничих шумів

Автор: 
Асланов Олексій Євгенович
Тип роботи: 
Дис. канд. наук
Рік: 
2005
Артикул:
3405U002857
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
МОДЕЛЬ ПРЕДСТАВЛЕНИЯ НЕЧЕТКОГО АУДИАЛЬНОГО ПРОТОТИПА

2.1. Общая схема интерпретации аудиальных данных

Задача интерпретации звуковых данных может быть расчленена на несколько фаз: 1) фаза предварительной обработки; 2) фаза представления в виде модели нечеткого аудиального прототипа; 3) фаза сравнения полученного прототипа с прототипами из базы знаний.
На рис. 2.1 приведена структурная схема процесса интерпретации.

Рис.2.1. Операции преобразования исходного сигнала

На рис.2.1 цифрой 1 обозначен источник звука (ИЗ). В диссертации рассматриваются источники, создающие колебания с частотами от 20 до 20000 Гц, воспринимаемыми органами слуха человека как звуковые волны, например: струна, камертон, пластинка, стержень, столб воздуха в трубе, мембрана, голосовые связки человека, колокольчик и др. [43,46-48,50,53,54,66-69,]. Как известно [16,18,43,46-48,53,], звуковые волны относятся к упругим волнам. Эти волны являются продольными. Они распространяются в твердых телах, жидкостях и газах в виде колебаний давления.
Цифрой 2 обозначено регистрирующее устройство (РУ), в качестве которого используется микрофон. В экспериментах использовался ненаправленный электретный микрофон HD-303 (multimedia microphone system) со следующими характеристиками: частотный диапазон - 50 - 13000 Hz; чувствительность - -58dB ? 3dB; разрешение "сигнал/шум" - 40dB или более.
Цифрой 3 обозначено устройство оцифровки (УО), преобразующее входной непрерывный сигнал в дискретную числовую последовательность, записываемую в файл компьютера. Это выполняет аналого-цифровой преобразователь (АЦП) встроенный в звуковую карту.
Цифрой 4 обозначена система спектрального преобразования и предварительной подготовки динамического спектра. Эмуляция набора полосовых фильтров происходит с помощью дискретного преобразования Фурье, а для построения динамического спектра используется оконный метод.
Для большинства производств схема преобразования звуковых данных ограничивается блоком №4. Поэтому в данной работе предлагается расширить, приведенную на рис.2.1 схему, путем добавления в нее двух дополнительных блоков: блока №5 для преобразования классического динамического спектра в динамический "клеточный" спектр (ДКС) и блока №6, отвечающего за репрезентацию входных данных в виде нечёткой модели аудиального прототипа и его нечёткой интерпретации.

2.2. Представление аудиальных данных

2.2.1. Амплитудно-временное представление. Квазистационарный сигнал

Исходные сигналы в диссертационной работе были представлены файлами, записанными звуковой картой компьютера в формате *.WAV, организованными как файлы структуры RIFF (Resource Interchange File Format), которая разработана для нужд мультимедиа [70]. Кроме того, для простоты расчета исходных сигналов, нами используются *.WAV файлы, записанные с помощью импульсно-кодовой модуляции (ИКМ) с частотами дискретизации 11025 Гц, 22050 Гц или 44100 Гц и оцифровкой 8 или 16 бит, принятые в компьютерной индустрии за стандарт [70].
Таким образом, непрерывная последовательность аналогового сигнала, приходящая из приемника звука (микрофона или другого регистрирующего прибора), преобразуется в дискретную последовательность отсчетов

, (2.1)

которая записывается в *.WAV файл.
В (2.1) обозначено: Pt - последовательность отсчетов за время t; Pt - значение отсчета в момент времени t; t-k??T - k-й дискретный момент времени; ?T - шаг дискретизации, равный 1/Fд; Fд - частота дискретизации; t - текущий момент времени.
Такая последовательность отсчетов в дальнейшем интерпретируется нами как последовательность значений звукового давления Pt (Н/м2) в отдельные моменты времени t.
Забегая вперед, оговоримся, что дальнейшее наше исследование исходных сигналов базируется на выявлении каких-либо характеристик или зависимостей не в амплитудно-временном, а в амплитудно-частотно-временном представлении, то есть в динамическом спектре (п.2.2.2). При этом данные характеристики или зависимости должны удовлетворять условию стационарности.
Классическое определение стационарности можно найти в литературе по теории вероятности и математической статистике, в которой рассматриваются случайные процессы [17,19,27,59,60]. То есть, сделав предположение, что входящий, заранее неизвестный, сигнал является реализацией какого-то случайного процесса, то только в этом случае его можно проверить на стационарность. Известны определения стационарности в узком смысле (или строгой стационарности), стационарности в широком смысле и эргодичности процессов [17,19,27,59,60].
Стационарность в узком смысле предполагает, что многомерная плотность вероятности произвольной размерности не изменяется при одновременном сдвиге всех временных сечений вдоль оси времени на одинаковую величину [17,19,27,59,60]:

(2.2)

где - n-мерная плотность вероятности; - значения случайных величин в моменты времени соответственно, а - значения случайных величин в моменты времени соответственно.
Стационарность в широком смысле допускает, чтобы от временного сдвига не зависели лишь одномерная и двумерная плотности вероятности.
Условием эргодичности является эквивалентность усреднения статистических характеристик по множеству (ансамблю) реализаций с усреднением по времени одной, теоретически бесконечно длинной, реализации [17,19,27,59,60].
В ходе изучения результатов экспериментов, приведенных в [19] и полученных автором при написании диссертационной работы, было выявлено следующее: не все исследуемые реальные физические аудиальные сигналы удовлетворяют условиям стационарности и эргодичности, например, если громкость сигнала изменяется с течением времени, или пики спектральной огибающей колеблются во времени в пределах определенной полосы частот. Поэтому, в диссертационной работе для обозначения таких сигналов использован термин квазистационарный сигнал. Кроме этого, для задачи интерпретации част