Вы здесь

Развитие методов обработки информации в масс-спектрометрии для изотопного и элементного анализа

Автор: 
Манойлов Владимир Владимирович
Тип работы: 
диссертация доктора технических наук
Год: 
2008
Артикул:
7607
179 грн
Добавить в корзину

Содержимое

I
Работа выполнена в Институте аналитического приборостроения
Российской Академии наук (ИАнП РАН)
Предложены и исследованы методы обработки масс-спекгрометрических
с
сигналов, которые позволяют повысить в несколько раз разрешающую способность и чувствительность приборов без изменения их физических частей. Методы дают возможность: отбраковывать ложные выбросы без искажения формы сигналов, снижать влияние шумов и помех на точность масс-спектрометрических измерений, производить обнаружение спектральных пиков в условиях дрейфа базовой линии, производить разделение «наложившихся» пиков в условиях недостаточного разрешения, учитывать влияние динамических свойств измерительного тракта, выполнять вычислительные процедуры, необходимые для решения задач геохронологии, технологического контроля на предприятиях ядерно-топливного цикла, идентифицировать вещества для аналитической химии. Новизной обладают как отдельные разработанные методы, так и совокупность методов, объединенных в комплексы. Предложенные в работе программные и алгоритмические позволили получить существенные научные результаты в области геохронологии, в частности информацию о полицикличности образования минералов платиновой группы из россыпных проявлений Урала и Тиммана, а также о происхождении новейших магматических образований.
© ИАНП РАН, 2007
2
Оглавление
Введение
Глава 1. Структура масс-спектрометрических сигналов и методы их обработки. Формулировка задач исследования
1.1 Структура масс-спектрометрического сигнала
1.2 Этапы обработки масс-спектрометрической информации
1.3 Основные теоретические предпосылки обработки масс-спектрометрической информации на отдельных этапах
1.4 Формулировка задач исследований Выводы по главе 1
Глава 2 Адаптивные методы отбраковки «выбросов» в масс-спектрометрических сигналах
2.1 Постановка задач
2.2 Метод минимума квадрата медианного отклонения
2.3 Оценка дисперсии
2.4 Оценка первой и второй производной
2.5 Нахождение минимума медианного отклонения
2.6 Алгоритм метода минимизации квадрата медианного отклонения, модифицированного для обработки масс-спектрометрического сигнала
2.7 Моделирование «загрязненного» сигнал и обработка данного сигнала с применением описанных выше методов
2.8 Анализ результатов моделирования
2.9 Алгоритмы отбраковки «выбросов» в масс-спектрометрическом анализе газов в статическом режиме
2.10 Метод отбраковки «выбросов» в масс-спектрометрическом анализе веществ в твердой фазе
Выводы по главе 2
ГлаваЗ Методы и алгоритмы цифровой фильтрации шумов и
помех в масс-спектрометрических сигналах
3.1 Введение и постановка задачи.
3.2 Цифровая фильтрация наводок и шумов методом прямого и обратного преобразований Фурье
3.3 Цифровая фильтрация наводок и шумов с помощью фильтров Чебышева
3.4 Предварительная очистка сигнала от шумов с помощью вейвлет-фильтров
3.5 Фильтрация масс-спектрометрических сигналов методом прямого и обратного дискретного вейвлет-преобразования
3.6 Многоуровневое вейвлет- преобразование
3.7 Вейвлет реконструкция
3.8 Реконструкционные фильтры
3.9 Выбор оптимального количества уровней декомпозиции
3.10 Алгоритм на основе свертки с функцией формы пика для фильтрация наводок от питающей сети в масс-спектрометрических сигналах
3.11 Сглаживание масс-спектрометрических сигналов методом наименьших квадратов на основе ортогональных полиномов 3.12. Алгоритм метода наименьших квадратов на основе ортогональных полиномов и скользящего окна
3.13 Сравнение алгоритмов сглаживания экспериментальных масс-спектрометрических данных в скользящем окне Выводы по главе 3
Глава 4 Методы и алгоритмы обнаружения масс-спектрометрических пиков на фоне шумов и дрейфа базовой линии
4.1 Метод максимального правдоподобия в задачах обработки масс-спектрометрических сигналов
4.2 Алгоритмы обнаружения пиков инвариантные к изменению
базовой линии, основанные на свертках с производными четных порядков функции формы пиков
4.3 Обнаружение спектральных линий в изотопном масс-спектрометре с непрерывной разверткой Выводы но главе 4
Глава 5 Оценка параметров масс-спектров в условиях недостаточного разрешения прибора и влияния инерционности измерительного канала с большой постоянной времени
5.1 Оценка параметров масс-спектрометрических пиков методом свертки экспериментальных данных с производными гауссовых функций
5.2 Примеры работы метода свертки экспериментальных данных спроизводными гауссовых функций
5.3 Оценивание параметров масс-спектрометрических пиков с учетом влияния инерционности измерительного канала с большой постоянной времени
5.4 Спектральные преобразования в приспособленном базисе для оценки параметров масс-спектров
5.5 Оценка амплитуд масс-спектрометрических пиков при известных положениях на оси масс и известных полуширинах
5.6 Признаки «наложения пиков для сигналов масс-спектрометрических приборов»
Выводы по главе 5.
Глава 6 Программное обеспечение обработки масс-спектров
6.1 Программное обеспечение системы регистрации масс-
си ектрометров МИ-1201 с непрерывной разверткой для контроля продукта на промышленном предприятии ядерно-топливного цикла (комплекс программ МАС-13).
6.2 Программное обеспечение для определения изотопного состава аргона в автоматизированном комплексе на базе масс-
спектрометра МИ1201 ИГ
6.3 Оценка групповых средних в задаче определения возраста платиносодержащих минералов масс-спектрометрическим методом
6.4 Программное обеспечение для оценки микро количеств гелия в геологических и археологических образцах в масс-спектрометре с постоянным магнитом и непрерывной разверткой по электрическому полю (комплекс программ Нс-4)
6.5 Аппаратно-программный комплекс транспортабельного хромато-масс-спектрометра
6.6 Программный комплекс обработки масс-спектров в технологическом контроле чистоты фуллеренов
6.7 Программные комплексы обработки масс-спектров модернизированных и разрабатываемых вновь отечественных масс-спектрометров
Выводы по главе 6
Глава 7 Принципы организации аппаратного обеспечения автоматизированных масс-спектрометрических приборов.
7.1 Организация интерфейсных подсистем
7.2 Измерительно-вычислительные комплексы для регистрации ионных токов и управления магнитным полем в специализированных масс-спектрометрах МТИ-350Г и МТИ-350Т
7.3 Измерительно-вычислительный комплекс для изотопного анализа веществ в газовой фазе на масс-спектрометре
МИ 1201В и в твердой фазе на масс-спектрометре МИ1201Т для задач геохронологии
7.4 Измерительно-вычислительный комплекс для оценки микро количеств гелия в геологических и археологических образцах
7.5 Измерительно-вычислительный комплекс для определения
194
199
202
208
213
215
217
217
224
227
228
230
6
возраста платиносодержащих минералов на масс-спектрометре МИ 1320, модифицированного для работы с электроотрицательными ионами
7.6 Измерительно-вычислительный комплекс для определения массовых долей изотопов урана и плутония в системе технологического контроля на предприятии ядерно-топливного цикла
Выводы по главе 7
Заключение
Литература
235
237
239
243
7
Введение
Масс-спектрометрия является универсальным аналитическим измерительным методом, а во многих случаях - единственным методом прецизионного контроля состава вещества в любых агрегатных состояниях: газообразном, твердом или жидком. Масс-спектрометрические методы позволяют анализировать как собственно состав образца, так и состав примесей в нем, причем чувствительность масс-спектрометрии к примесям превышает возможности любых других аналитических методов. В настоящее время масс-спектрометрия продолжает стремительно развиваться как в направлении создания новых методов и методик анализа, так и в создании современных приборов и приборных комплексов, отвечающих всем признакам и требованиям технического прогресса нашего времени. Масс-спектрометры являются основными измерительными средствами в высокоточных элементных и изотопных исследованиях и измерениях, в технологиях микроэлектроники, в производстве особо чистых веществ, в геохронологии (прогнозировании месторождений полезных ископаемых), производстве и контроле ядерного горючего в ядерно-топливном цикле и в большой номенклатуре научных исследований.
Современный масс-спектрометр для элементного и изотопного анализа является гибридным комплексным прибором, аналитические возможности которого определяются тем, насколько оптимально измерительные функции в нем разделены между его аналитической (физической) и аппаратно-программной частями. Функции аппаратно-программного комплекса масс-спектрометра состоят в сборе, обработке и идентификации информации, поступающей от его аналитической части. При этом задачи программных средств масс-спектрометров, предназначенных для обнаружения и оценки параметров полезных сигналов, выявленных из необработанных сигналов, содержащих шумы и наводки, а также для фильтрации сигналов, состоят в обеспечении требуемой точности анализа и в снижении нагрузки на
8
аналитическую часть масс-спектрометра, обеспечивающего решение прецизионных задач анализа.
Вопросам обработки сигналов различного типа посвящено множество теоретических исследований в области математической статистики и ее прикладных направлений. Как правило, это - общетеоретические исследования, они не привязаны к конкретным сигналам. Зачастую очень привлекательные в теоретическом плане подходы оказываются непригодными для определенных конкретных задач. Для разработки оптимальных методов, позволяющих наиболее точно и быстро оценить параметры реальных масс-спектрометрических сигналов, необходимо изучение существующих и вновь появляющихся подходов к обработке сигналов и ранжирование их возможностей по отношению именно к задачам масс-спектрометрического эксперимента.
Это связано, прежде всего, с тем, что ряд параметров масс-спектрометрических сигналов отличаются от параметров сигналов, изучаемых в других областях их обработки. К таким параметрам относятся: аппаратные функции, которыми описываются формы пиков, возникающих в масс-спектрометрах, а также параметры шумов, присутствующих в масс-снектрометрических сигналах, которые обусловлены не только шумами, возникающими в электронных трактах, но и шумами, связанными с физическими процессами, происходящими в масс-спектрометрах. Особо следует выделить такую характерную особенность масс-спектрометрических сигналов, как наложение друг на друга спектральных пиков близких масс, возникающее из-за недостаточной разрешающей способности аналитической части масс-спектрометра. Существующие методы обработки масс-спектрометрических данных в настоящее время имеют ряд недостатков, затрудняющих в достаточной мере использовать преимущества цифровой обработки информации для повышения основных параметров масс-спектрометрических приборов. Новые и полезные практические результаты при обработке масс-спектрометрических сигналов могут быть получены с
9
применением еще мало используемых в масс-спектрометрии перестраиваемых ортогональных и вейвлет преобразований, которые можно адаптировать к характеру анализируемых сигналов или к их информативным признакам.
В связи с этим, развитие и совершенствование алгоритмических методов, направленных на повышение разрешающей способности с одной стороны, а также на повышение точности оценок параметров масс-спектрометрических сигналов в условиях значительных специфических шумов и «выбросов» (повышение чувствительности) - с другой стороны, и позволяющих существенно улучшить важнейшие параметры масс-спектрометра без изменения его аналитической части, безусловно, является весьма актуальной задачей.
Цель работы. Целью данной работы, является развитие и совершенствование методов обработки масс-спектрометрической информации, которые должны позволить обеспечить требуемую точность, а также абсолютную и изотопическую чувствительность приборов в условиях шумов и дрейфа базовой линии, недостаточного разрешения «наложившихся» пиков близких масс и влияния динамических свойств измерительного канала. Развиваемые методы в первую очередь должны быть внедрены в масс-спектрометрические комплексы для геохронологии и автоматизации технологических процессов на предприятиях ядерно-топливного цикла.
Методика исследований. При проведении исследований использовались методы спектрального анализа, статистического оценивания и фильтрации, а также методы компьютерного моделирования и экспериментальные исследования.
Достоверность результатов подтверждена результатами математического моделирования и лабораторными исследованиями на предприятиях, использующих разработанное программное обеспечение для масс-спектрометрических приборов.
Научная новизна состоит в создании и исследовании новых методов,
алгоритмов и комплексов обработки масс-спектрометрической информации,
10
направленных на повышение точности и разрешающей способности масс-
спектрометрических приборов для изотопного и элементного анализа.
Созданы следующие новые методы и алгоритмы:
• Отбраковки выбросов составляющих до 40% от объема выборки данных без искажения формы сигналов;
• Фильтрации, позволившей впервые для масс-спектрометрических сигналов реализовать оптимальный поиск количества уровней дискретного вейвлет-преобразования и существенно сократить объем данных (более чем в 30 раз) для дальнейшей обработки.
• Обнаружения масс-спектрометрических и оценки параметров одиночных и наложивишихся пиков на основе сверток с производными четных порядков функции формы пика, обеспечивающих надежное обнаружение при отношении сигнала к шуму 4 и выше и значительном дрейфе базовой линии, а также повышение эффективной разрешающей способности в 4 и более раз при разрешающей способности аналитической части от 1.5 до 1000.
• Оценки наличия примесей с неизвестными массами в изотопном масс-спектре стандарта. Метод реализует впервые предложенный в масс-спектрометрии спектральный анализ в приспособленном базисе, который позволяет оценить факт наличия примеси, отличающейся по массе менее чем на 0.01%.
11
• Коррекции формы масс-спектрометрических пиков, искаженных инерционностью измерительной системы. Методы основаны на предложенных впервые формулах для математического описания формы пиков реальных сигналов в условиях инерционности регистрации, дало возможность выявить цикличность образования геологических образцов определенного вида.
Практическая ценность работы состоит в том, что созданные методы и алгоритмы использовались в разработках следующих серийно выпускаемых и модернизированных масс-спектрометров: МИ-1320, МИ-1321, МИ-3304, МИ-3306, МИ-350Г, МИ-350Т, МИ 1201 (модернизация для атомной
промышленности), М1201 ИГ и М1201АГ (модернизация для геохронологии). Работоспособность и эффективность работы комплексов подтвердили экспериментальные работы пользователей масс-спектрометрических приборов различных типов (имеются акты внедрения). Разработанные математические методы, алгоритмы и программные средства могут быть использованы также для разработки новых типов масс-спектрометров для ядерно-топливного цикла (примесного, сублиматного, анализатора легких газов) и геохронологии.
На защиту выносятся:
1. Новый алгоритм фильтрации масс-спектрометрических сигналов на основе прямого и обратного многоступенчатого дискретного вейвлет-преобразования с адаптивным определением частоты среза.
2. Математическое описание формы масс-спектрометрических пиков, искаженных инерционностью системы регистрации.
12
3. Алгоритмы обнаружения и оценки параметров одиночных и «наложившихся» пиков в масс-спектре на основе производных четных порядков функции описывающей форму пика.
4. Новые алгоритмы отбраковки до 40 % ложных выбросов в масс-спектрометрических сигналах на основе минимизации квадрата медианного отклонения в скользящем окне отсчетов масс-спектрометрического пика.
5. Методы оценки наличия «мультиплетности» в масс-спектрометрических сигналах.
6. Алгебраический метод определения амплитуд «наложившихся» пиков изотопного масс-спектра, в котором известны массы и разрешающая способность.
7. Метод оценки наличия примесей с неизвестными массами в изотопном масс-спектре стандарта, в котором существуют пики с известными массами.
8. Программные и автоматизированные измерительно-вычислительные комплексы масс-спектрометров различных типов, применяемые для изотопного и элементного анализов в лабораториях геохронологии и на предприятиях ядерно-топливного цикла.
АПРОБАЦИЯ И ПУБЛИКАЦИИ.
Материалы диссертации докладывались на: заседаниях Координационного
научно-технического совета по масс-спектрометрии (КНТС-М) Минатома РФ в
1999-2006 годах. The 2nd (1999) и 3nd (2000)Intemational Conference DIGITAL
SIGNAL PROCESSING AND ITS APLICATION Moscow. 12nd International
Symposium on Modular Information Computer Systems and Networks ICSNET’99
13
1999, June 29-30, Moscow. XVI симпозиуме по геохимии изотопов имени академика А.П. Виноградова, Москва, ноябрь, 2001г. Международной Школе-Семинаре по автоматизации и компьютеризации в науке и технике ACS’ 2002. Москва ноябрь 2002г. Первой (2002) и Второй (2005) Всероссийской конференции. Аналитические приборы. Санкт-Петербург. VII конференции АНАЛИТИКА СИБИРИ и ДАЛЬНЕГО ВОСТОКА-2004г. Новосибирск. На втором (2005 год) и на третьем (2007 год) Съездах Всероссийского масс-спектрометрического общества.
По теме диссертации опубликовано 25 статей, глава в монографии и одно учебное пособие.
14
Глава 1
Структура масс-спектрометрических сигналов и методы их обработки.
Формулировка задач исследования.
1.1 Структура масс-спектрометрическнх сигналов
Традиционно измерения масс-спектрометрического прибора
представляются рядом:
-ГМ = 2 ЛД<7 -1, )Д ] + ФО + 7| М + Ч: (0,
I
где А1 -амплитуда сигнала; Д - параметры, определяющие ник;
- аппаратная функция прибора, зависящая в общем случае от нескольких параметров;
$,(/)- медленно изменяющийся фактор, "базовая" или "нулевая" линия, которая может быть представлена полиномом невысокой степени,
77, (/) - стационарный аппаратный шум измерительного тракта с нулевым смещением или медленно меняющимся масштабом:
£{//,(0 }=0 - математическое ожидание,
Е{П\ (0^1 (* + г) = г(т) - корреляционная функция
/72(0- ложные измерения ("выбросы" в системе питания прибора и тому подобное). Это случайный процесс, который равен нулю почти всюду, кроме случайных точек времени и,...б, в которых он имеет произвольные значения. Принятая модель спектра имеет ряд очевидных дефектов. Во-первых, аппаратная функция на практике оказывается зависящей от монотонной переменной I. Во-вторых, 0,(0 может быть коррелированной с пиками. В-третьих, масштаб аппаратных шумов может изменяться в значительных пределах. Однако, для обработки сигналов необходимо считать их либо малыми, либо несущественными но сравнению с истинным сигналом.
1.2 Этапы обработки масс-снектрометрической информации Процесс обработки масс-спектрометрической информации может быть представлен последовательностью 6 этапов.
15
1. Этап - анализ данных, который предполагают анализ данных на "доброкачественность". Обычно фиксируются подозрительные места "выбросов", то есть ложной информации и предлагаются методы их исключения.
2.Этап — сглаживание и фильтрация масс-спектрометрических сигналов. При решении задач фильтрации и сглаживания могут возникнуть трудности, когда частоты наводок, шумов или помех совпадают с частотами, которые входят в спектральный состав полезных сигналов.
3 Этап -обнаружение полезного сигнала в однородной среде и исключением медленно меняющегося фактора (базовой линии). При разработке алгоритмов обнаружения масс-спектрометрических сигналов следует отдавать предпочтение таким алгоритмам, которые обладали бы одинаковыми качествами с другими алгоритмами, но для работы с помощью таких алгоритмов требовалось бы меньшее количество экспериментальных данных. Выбор и оценка возможностей таких алгоритмов, также являлось предметом исследований, выполненных в данной работе.
4. Этап - оценка параметров масс-спектрометрических сигналов.
Обработку сигналов на этом этапе требуется выполнять в условиях недостаточного разрешения масс-спектрометрического прибора и в условиях влияния динамических свойств измерительного тракта. Из-за недостаточного разрешения происходит наложение двух или более спектральных линий друг на друга, что существенно усложняет процедуру оценки параметров отдельных спектральных линий, входящих в состав сложного масс-спектрометрического пика.
Инерционность измерительного тракта изменяет функцию, с помощью которой описывается форма масс-спектрометрического пика. Для более точной оценки параметров масс-спектрометрических сигналов необходимо в функцию, описывающую форму пика ввести элементы, характеризующие инерционные свойства измерительного тракта. Такие элементы, а также алгоритмы,
16
позволяющие произвести оценку параметров отдельных наложившихся линий, будут рассмотрены в последующих главах данной работы.
5 Этап - Интерпретация данных масс-спектроме'грического эксперимента по результатам произведенной оценки параметров масс-спектрометрических пиков. Как правило, этот этап проводится после окончания масс-спектрометрического эксперимента или в промежутке времени между текущими развертками масс-спектра. В зависимости от поставленных перед масс-спектрометрическим экспериментом задач, алгоритмы обработки данных на этом этапе различны. В изотопном масс-спектрометрическом анализе в начальных стадиях алгоритмов, осуществляющих обработку данных, производится вычисление оценок изотопных отношений интенсивностей спектральных пиков. Поскольку требование к точности оценок изотопных отношений очень высоки, то при вычислении изотопных отношений следует по возможности внести поправки на влияние всех факторов, искажающих эти оценки. К таким факторам относятся, например, такие явления как изменение интенсивностей изотопных пиков вследствие выгорания пробы при анализе веществ в твердой фазе в масс-спектрометре с источником ионов на основе поверхностной ионизации. При анализе веществ в газовой фазе необходимо внести поправки на изменение интенсивностей изотопных пиков из-за явления скачивания газа в статическом режиме масс-спектрометричсского эксперимента. В масс-спектрометрии для химического анализа на этом этапе требуется так преобразовать информацию, полученную в результате масс-спектрометрического эксперимента, чтобы она была пригодна для использования в базе данных масс-спектров, с помощью которой производится идентификация веществ, анализируемых в масс-спектромстрическом приборе. В последующих главах данной работы рассмотрены алгоритмы обработки масс-спектрометрических данных на этом этапе.
В некоторых масс-спектрометрических экспериментах существует еще один этап обработки данных.
17
В настоящей работе в последующих главах рассматриваются алгоритмы обработки масс-спектрометрической информации на каждом из указанных выше этапов. Теоретические основы обработки информации на каждом из этапов с одной стороны имеют общие вероятностные элементы , но с другой стороны имеют ряд специфических для каждого этапа черт.
1.3 Основные теоретические предпосылки обработки масс-спектрометрической информации на отдельных этапах
1.3.1 Этап 1
Рассмотрим сначала подробнее первый этап - анализ данных. В качестве основы анализа данных может быть принят метод наименьших квадратов. Но оказалось, что этот метод имеет одну неприятную особенность: если хотя бы одно измерение будет "плохим", то погрешность метода выходит за разумные пределы. Таким образом, измерения должны быть однородными. Для оценки устойчивости метода к наличию ошибок наблюдений используется оценка BREAK DOWN POIN'l' (BDP), которая определяет процент ошибок, при которых алгоритм начинает хуже работать. В методе МНК этот параметр равен
0. Для предварительной обработки наиболее часто используется метод медианы [1,2,8], когда в заданном окне строится вариационный ряд у; - дискретных значений функции (данных), а в качестве "доброкачественного" значения берется медиана этого ряда - medyj, где у - случайная величина, равномерно распределенная на интервале [0,1]. Однако оценка BDP для медианы также равна 0, в то время, как для фильтрации сильно "зашумленного" сигнала в качестве "хорошей" оценки можно принять лишь оценки по методу с BDP>=20-30%.В последнее время основное внимание уделяется методам статистической обработки, которые лишены этого недостатка, а именно, так называемым робастным оценкам [3,8].
Таких методов появилось значительное множество. Одной из первых попыток в этом направлении была замена задачи отыскания минимума квадратов остатков
min ^rt2
i
18
на задачу отыскания минимума модулей остатков
min 2>,|
I
Однако, данная замена не принесла желаемых результатов, хотя и несколько улучшает робастность.
Хюбером [3] было разработано следующее предложение: заменить быстро растущие квадраты остатков г} на четные более медленно растущие функции р{Г')с единственных абсолютным минимумом при /‘=0,. а затем
решать экстремальную задачу на минимум вида :
и
£/>(/;) = min!,
ы I
которая сводится к решению системы уравнений:
2>w=о,
I-)
где у/(г,) = д/d6p(rt) , 0 -параметр функции, к которой производится подгонка экспериментальных данных.
В ряде работ по устойчивым к выбросам методам определения оценок неизвестных параметров по экспериментальным данным , было предложено несколько вариантов функций р{).. [4,6,8,9] Анализ этих работ показал, что самый хороший результат дает метод повторной медианы [7]. Асимптотически он допускает до 50 % выбросов. Руководствуясь тем, что самой высокой робастностью отличаются процедуры, основанные на порядковых статистиках[4,5] мы для своей задачи выбрали предложенный Roussew [8,122] метод отыскания минимума квадрата медианного отклонения
min mpdirf)
1.3.2 Этап 2
Второй этап-сглаживание и фильтрация основан на классической теории цифровой фильтрации сигналов. В последние десять лет перспективным методом сглаживания и фильтрации сигналов является вейвлет анализ. Дадим краткий обзор преимуществ этого метода.
19
В настоящее время вейвлет-анализ является одним из наиболее мощных и при этом гибких средств исследования данных. Вейвлет-анализ имеет большие возможности сжатия и фильтрации данных. [9,10]. Помимо возможностей сжатия и фильтрации данных, анализ в базисе вейвлет-функций [14,15,16] позволяет решать задачи идентификации, моделирования, аппроксимации стационарных и нестационарных процессов, исследовать вопросы наличия разрывов в производных, осуществлять поиск точек склеивания данных, удалять в данных тренд, отыскивать признаки фрактальности информации. Отметим, в основе подобных возможностей, обеспечивающих вейвлет-анализу весьма перспективное будущее, лежит природа его многомасштабности [11].
Действительно, недостаточная способность анализа Фурье локализовать сингулярности сигналов, необходимость введения во временной области окон данных и, как следствие, размывание спектра сигналов за счет появления ложных лепестков обусловливают естественное движение практики обработки сигналов к методам, обеспечивающим лучшее частотно-временное разрешение.
Вообще говоря, решение задачи шумоподавления независимо от природы обрабатываемой информации несет комплексный характер, поскольку подразумевает обращение к целому ряду подзадач. Среди таких подзадач можно отметить, например, проверку достоверности гипотезы о гауссовости статистик и спектральном составе шумовой компоненты, выбор типа функции пороговой обработки (трешолдинга) и вместе с этим критерия расчета самого порога, а также стандартные вопросы вейвлет-анализа, носящие общий характер: выбор наиболее подходящего вейвлет-базиса, установление
требуемой глубины разложения данных и т.п. Положим, материнская вейвлет-функция ЧК(0, образующая совместно с всевозможными трансляциями Т,(/)базис Рисса [11,12,33], обладает £+1 вырожденными моментами, т.е. является ортогональной полиномам степеней / = ОД
|//хР(/)Л
20
Потребуем также, чтобы некоторая осциллирующая функция /(0 имела по меньшей мере к производных, непрерывных в точке / = /'. Выполнение данного требования означает, что функция Д0 может быть разложена в ряд Тейлора
/о)-/«Ь+£=^
1! а
с остаточным членом Zk..
(/-о* ^*/(0
1=1'
к\ <10
1=1'
Найдем коэффициенты детализации данной функции, для чего воспользуемся формулой внутреннего произведения:
г, = \№Ч,№
Подставляя вместо функции Д0 её разложение в ряд и трансформируя
полученное выражение к
У1 = дои № + + •• •
виду
ск‘
1=1
отметим, что регулярная часть результирующего выражения, образуемая внутренними произведениями вейвлет-функции Т,(/) и полиномов-—-^-у равна нулю.
Таким образом, можно утверждать, что разложение функции/^ в ряд по базису функций вейвлет
Л0 = 1г,ч/,(0
/
свидетельствует в пользу того факта, что коэффициенты детализации, представляющие собой спектральные коэффициенты функции /(0, имеют высокочастотную природу: они локализуют осцилляции и сингулярности функции как во временной, так и частотной областях:
Г< = £*%(/)
21
Нетрудно догадаться, что дисперсия коэффициентов^, при этом убывает с увеличением уровня разложения функции.
Рассматривая осцилляции как некоторый аддитивный шум, обладающий гауссовыми статистиками и гипотетически плоским спектром, можно увидеть, что коэффициенты детализации таких осцилляций, взятые на различных уровнях разложения, также подчиняются гауссову закону. Правда, их спектральные образы имеют компактные носители и размещаются в различных полосах частот: это обстоятельство объясняется природой многомасштабного анализа [11,12]. Таким образом, окрашиванием шума в коэффициентах детализации и вместе с тем вариативность дисперсии коэффициентов, наблюдаемая от уровня к уровню, наводит на мысль о необходимости использования алгоритмов шумоподавления, которые позволяют осуществлять аддитивную обработку. Другими словами, в том случае если дисперсия коэффициентов у ы оказывается близкой к дисперсии масс-
спектрометрического фона или меньшей в сравнении с ней, предполагается, что такие коэффициенты содержат лишь регулярный масс-спектр и поэтому могут быть обращены в ноль. (Подобное предположение, высказываемое применительно к каждому коэффициенту детализации уровня у, лежит в основе процедуры определения пороговой функции коэффициентов разложения).
Между тем, определение порогового уровня фоновой составляющей масс-спектра является бескомпромиссной проблемой, поскольку качество шумоподавления сигнала оцениваемое, например, в виде отношения сигнал/шум, непосредственно зависит от оценки дисперсии шума. Так, задание малых значений порога сохраняет фоновый сигнал в коэффициентах детализации и поэтому приводит лишь к незначительному увеличению отношения сигнал/шум. В тоже время задание больших значений порога оказывается чреватым потерей коэффициентов, которые заключают в себе информацию, существенную для задач обнаружения и идентификации.
22
Среди существующих в настоящее время вейвлет-алгоритмов шумоподавления наибольшее распространение получил алгоритм Донохо-Джонстона [13,14,15,16]. Такой алгоритм является достаточно простым для реализации, экономичным в вычислительном отношении, поскольку подразумевает использование лишь быстрых алгоритмов вейвлет-преобразования, и содержит три шага, которые, будучи последовательно примененные к исходному сигналу, создают эффект шумоподавления. В частности, на первом шаге данного алгоритма отыскивается одно-, двухуровневое или более глубокое разложение сигнала, затем, на втором шаге, к каждому из коэффициентов детализации уровня у, а иногда коэффициентам аппроксимации того же уровня, применяется процедура сравнения с порогом , и, наконец, в заключении восстанавливается сигнал, характеризуемый, как ожидается, более высоким значением отношения сигнал/шум. В то время, как для разложения сигнала и его восстановления по коэффициентам аппроксимации и детализации, прошедшим пороговую обработку, в большинстве случаев используется алгоритм Малла и лифтинг [23,24], пороговая обработка как таковая может осуществляться на основании одно одной из нескольких функций сравнения с порогом.
Аппроксимация масс-спектров методами вейвлет-анализа. В большинстве случаев массивы масс-спектрометрических данных содержат значительное количество (сотни и тысячи) точек, поэтому методы интерполяции [25,26] не могут быть использованы для их обработки. Интерполяция более чем десяти значений, содержащих случайную составляющую, практически всегда приводит к потере устойчивости, и вместо часто ожидаемой гладкой, медленно меняющейся зависимости, получается сильно извивающаяся кривая. Примерно те же сложности могут возникнуть и при полиномиальной аппроксимации [25,48].
Если при аппроксимации закон (модельная зависимость) задан однозначно, то погрешность в приближении узлов может быть крайне мала. Однако, если такой закон неизвестен или слишком сложен, полиномиальная аппроксимация
23
не позволяет получить удовлетворительного результата, не внося в исследование излишний субъективизм. Аналогичные трудности возникают, если уровень шума достигает 50% от уровня сигнала и более - расчетная кривая неизбежно будет аппроксимировать не только сигнал, но и шум. В этих случаях более целесообразно использовать время-частотные [51] (например, оконное преобразование Фурье) или время-масштабные (вейвлет) преобразования [37,46].
В последние годы стало очевидным, что традиционный аппарат представления произвольных функций и сигналов в виде рядов Фурье [36,51] оказывается малоэффективным для функций с локальными особенностями. Это связано ограниченными возможностями базисной функции рядов Фурье -синусоиды, которая определена на всей числовой прямой и по своей природе является гладкой и строго периодической функцией.
Существенным недостатком, вызванным природой базисной функции рядов Фурье, является эффект Гиббса [34], который проявляется в виде характерных колебательных процессов, отсутствующих у исходной функции. Увеличение конечного числа гармоник не устраняет эффект Гиббса, а лишь повышает частоту колебательных процессов.
Способом борьбы с эффектом Гиббса является применение оконного преобразования. Локальное (или оконное) преобразование Фурье позволяет определить факт присутствия в сигнале любой частоты, и интервал ее присутствия, что значительно расширяет возможности метода по сравнению с классическим преобразованием Фурье. Однако и оконное преобразование Фурье имеет один существенный недостаток, связанный с соотношением неопределенности Гейзенберга: невозможно одновременно получить хорошее разрешение по частоте и координате. Этот недостаток успешно преодолевается вейвлет-преобразованием.
Разновидности вейвлет-анализа и свойства вейвлетов. Основные приложения вейвлет анализа: локализация и классификация особых точек сигнала, вычисление его различных фрактальных характеристик, частотно-
24