СОДЕРЖАНИЕ
Введение 5
Глава 1.Аналитический обзор методов обработки результатов
физического эксперимента и задачи исследования 9
1.1. Типы неопределенности физической информации 9
1.2. Статистические методы построения эмпирических зависимостей 11
1.3. Робастные методы оценивания параметров 15
1.4. Построение доверительных интервалов и областей
при обработке экспериментальных данных 17
1.5. Основы интервального подхода к оцениванию параметров экспериментальных зависимостей 21
1.6. Математические постановки задач оценивания параметров линейной функции методом центра неопределенности (МЦН).
Достоинства и недостатки метода 36
1.7. Обоснование и направления исследования 44 Глава 2. Оценивание параметров линейных аппроксимирующих
функции обобщенным методом центра неопределенности 46
2.1. Общая постановка задачи оценивания параметров аппроксимирующих функций обобщенным методом центра неопределенности 46
2.2. Алгоритмы решения задач оценивания параметров линейных функций прямоугольником в ОМЦН при абсолютно точном измерении входных
и интервальном значении выходных переменных 48
2.2.1. Постановка задач оценивания параметров однопараметрических функций 48
2.2.2. Решение задач 2.2.1 49
2.1.3. Постановка задач оценивания параметров линейных двухпараметрических функций 50
2.2.4. Решение задач 2.2.3 50
2.2.5. Рекуррентный алгоритм решения задач оценивания
параметров двухпараметрических функций 52
2.3. Алгоритм решения задач оценивания параметров линейных функций при интервальном задании входных и выходных переменных прямоугольником в ОМЦН 54
2.3.1. Постановка задач оценивания параметров однопараметрических функций 54
2.3.2. Решение задач 2.3.1 54
2.3.3. Постановка задач оценивания параметров двухпараметрических функций ОМЦН 56
2.3.4. Решение интервальных задач 2.3.3 56
2.3.5. Рекуррентный алгоритм решения задач оценивания
параметров двухпараметрических функций 58
2.4. Алгоритм решения задач оценивания параметров линейных
функций эллипсом неопределенности в ОМЦН 61
2.4.1. Определение параметров эллипса неопределенности при
двух измерениях 61
2
2.4.1.1. Определение параметров эллипса неопределенности
при двух измерениях методом хорд эллипса 62
2.4.1.2. Алгоритм построения параллелограмма неопределенности при двух измерениях и погружение
его в эллипс минимальной площади 66
2.4.2. Уточнение параметров эллипса неопределенности
при поступлении новой информации 71
2.5. Оценивание параметров эмпирических зависимостей
вида 2 - ах + Ъу ОМЦН 79
Глава 3. Применение алгоритмов ОМЦН для обработки
экспериментальных физических зависимостей 81
3.1. Оценивание параметров линейной функции
прямоугольником в ОМЦН 81
3.2. Оценивание параметров линейной функции
эллипсами неопределенности в ОМЦН 82
3.3. Сравнительный анализ оценок параметров
прямоугольника и эллипса в ОМЦН 83
3.4. Оценивание параметров зависимости вязкости глицерина от температуры прямоугольником в ОМЦН и МНК 84
3.4.1. Оценивание параметров линеаризованной зависимости
вязкости глицерина от температуры прямоугольником в ОМЦН 86
3.4.2. Оценивание параметров линеаризованной зависимости
вязкости глицерина от температуры МНК 88
3.4.3. Сравнительный анализ оценок параметров, полученных
по алгоритмам прямоугольника в ОМЦН и МНК 90
3.5. Оценивание параметров линеаризованной зависимости
вязкости нитробензола от температуры 93
3.5.1. Оценивание параметров линеаризованной зависимости вязкости нитробензола от температуры
эллипсом в ОМЦН и МНК 93
3.5.2. Точечные и интервальные оценки параметров линеаризованной зависимости вязкости нитробензола от температуры прямоугольником и рекуррентным прямоугольником в ОМЦН 96
3.5.3. Сравнительный анализ оценок параметров зависимости вязкости нитробензола от температуры прямоугольником, рекуррентным прямоугольником, эллипсом в ОМЦН и МНК 97
3.6. Определение энтальпии парообразования пропана по экспериментальной зависимости давления насыщенного
пара пропана от температуры 100
3.6.1. Оценивание параметров зависимости давления насыщенного
пара пропана от температуры прямоугольником в ОМЦН 101
3.6.2. Сравнительный анализ оценок параметров прямоугольника
в ОМЦН с оценками прямоугольника в МЦН 105
3
3.7. Определение по методикам ОМЦН энергии активации
при СВ-синтезе системы Ті -А1 107
3.7.1. Методика проведения эксперимента по СВ-синтезу
системы Ті - А1 107
3.7.2. Определение энергии активации СВ-синтеза
алюминидов титана прямоугольником в ОМЦН 108
Глава 4. Программное обеспечение алгоритмов прямоугольника
и эллипса в ОМЦН 113
4.1. Программное обеспечение алгоритмов прямоугольника в ОМЦН 113
4.1.1. Характеристика задачи 115
4.1.2. Выходная информация 115
4.1.3. Входная информация 116
4.2. Технология решения задачи 119
4.3. Руководство по эксплуатации программы 126
4.3.1. Руководство пользователя 126
4.3.2. Руководство системного программиста 129
4.4. Программное обеспечение алгоритмов эллипса в ОМЦН 134
4.4.1. Характеристика задачи 134
4.4.2. Выходная информация 135
4.4.3. Входная информация 136
4.4.4. Технология решения задачи 136
4.5. Руководство по эксплуатации программы 138
4.5.1. Руководство пользователя 138
4.5.2. Руководство системного программиста 142
Заключение 146
Список литературы 148
Приложения 160
4
ВВЕДЕНИЕ
Актуальность проблемы
Для установления закономерностей каких-либо явлений проводятся экспериментальные исследования, в ходе которых измеряют значение тех или иных физико-химических величин. При проведении любого физического эксперимента используются приборы различной степени точности. Поэтому результаты любого измерения всегда содержат ошибки и возникает необходимость оценить погрешности результатов проведенного эксперимента.
Обработка результатов измерений невозможна без использования математических методов, которые позволяют выбрать оптимальное направление исследований. При обработке физического эксперимента часто используются эмпирические модели или формулы, которые включают экспериментально неточно измеренные величины, как правило, неточность учитывается в выходных переменных. Однако, существующая реальность предполагает неточные измерения как выходных, так и входных переменных и соответствующих параметров эмпирических зависимостей. Ситуация, когда выходные переменные заданы интервально, а входная информация измеряется абсолютно точно, достаточно хорошо обсуждена в работах С.И. Спивака, А.Г1. Вощинина, В.М. Белова и других. Случай, когда выходные и входные переменные модели измеряются интервально, особенно в плане разработки конкретных методик анализа данных физического эксперимента, в литературе отражен недостаточно и является актуальным. Именно последний случай обработки экспериментальной информации дает возможность получать эффективные и надежные оценки, учитывать более полно весь массив измеряемых физических величин.
Целыо диссертационной работы является разработка интервальностатистических методик обобщенного метода центра неопределенности (ОМЦН) для анализа данных в экспериментальной физике.
5
Задачи исследования
1. Разработать методики ОМЦН для оценивания параметров экспериментальных зависимостей, включая постановку задачи ОМЦН, алгоритмы прямоугольника и эллипса в ОМЦН, программное обеспечение;
2. Используя методики в ОМЦН, оценить параметры модельных физических зависимостей: вязкости глицерина и нитробензола от температуры, определить энтальпию парообразования пропана по экспериментальной зависимости давления насыщенного пара пропана от температуры;
3. Используя методики в ОМЦН, выделить линейные участки на экспериментальных СВС-термограммах системы ТьА1 и определить энергию активации данного процесса;
4. Провести сравнительный анализ эффективности методик ОМЦН с методом наименьших квадратов (МНК).
На защиту выносятся
1. ОМЦН в виде алгоритмов прямоугольника и эллипса для определения параметров линейных функций при неточном измерении как входных, так и выходных величин; программное обеспечение ОМЦН для случаев, когда только выходные переменные измерены с некоторой погрешностью и когда входные и выходные переменные представлены в интервальном виде.
2. Методики определения параметров линейных зависимостей вязкости глицерина и нитробензола от температуры ОМЦН, энтальпии парообразования пропана по экспериментальной зависимости давления насыщенного пара пропана от температуры.
3. Методики обработки экспериментальных СВС-термограмм системы П-А1 ОМЦН.
4. Сравнительный анализ оценок параметров линейных функций в ОМЦН с оценками МНК.
6
Научная новизна диссертационной работы
Впервые разработан и обоснован приборно-ориентированный ОМЦН, который по своей сути является синтетическим интервально-статистическим методом обработки результатов физического эксперимента. На основе ОМЦН разработано оригинальное программное обеспечение. С помощью ОМЦН определены вид функции и параметры экспериментальных зависимостей вязкости глицерина и нитробензола от температуры; энтальпии парообразования пропана по экспериментальной зависимости насыщенного пара пропана от температуры. Впервые алгоритмы в ОМЦН применены для оценивания энергии активации СВ-синтеза бинарной системы Ti-Al.
Практическая значимость работы
Разработаны методики оценивания параметров экспериментальных физических зависимостей в ОМЦН. На основе ОМЦН созданы программные комплексы «1СМ1» и «1СМ2». Программный комплекс «1СМ1» позволяет при интервальном и точном задании входной и неточном задании выходной информации оценивать параметры экспериментальных физических зависимостей алгоритмами прямоугольника в ОМЦН, выделять линейные участки физических зависимостей с заданной точностью. «1СМ2» при тех же функциональных возможностях расширяет алгоритмическую базу программного комплекса: позволяет работать с алгоритмами прямоугольника, эллипса в ОМЦН и МИК одновременно. На данные программные комплексы получены свидетельства об официальной регистрации программ для ЭВМ.
Апробация работы
Материалы диссертации докладывались на конференциях:
8-я Международная конференция «Физико-химические процессы в неорганических материалах» (Кемерово, 2001); 7-я Международная научно-практическая конференция «Природные и интеллектуальные ресурсы Сибири (Сибресурс - 7 - 2001)» (Барнаул, 2001); Международная научно-практическая конференция «Валихановские чтения - 7» (Кокшетау, 2002); Региональная научная конференция студентов, аспирантов, молодых ученых. (Новосибирск,
7
2001); IV научно-техническая конференция студентов и аспирантов. (Рубцовск,
2002); 8-я Международная научно-практическая конференция «Природные и интеллектуальные ресурсы Сибири (Сибресурс - 8 - 2001)» (Кемерово, 2002); Труды 3-й Международной научно-технической конференции (Санкт-Петербург, 2002); V Всероссийский симпозиум «Математическое моделирование и компьютерные технологии» (Кисловодск, 2002).
Публикации по теме диссертационной работы
Основные результаты диссертационной работы изложены в 16 работах, опубликованных в научных журналах, препринтах РАН и сборниках материалов конференций.
8
ГЛАВА 1
АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ ОБРАБОТКИ РЕЗУЛЬТАТОВ ФИЗИЧЕСКОГО ЭКСПЕРИМЕНТА И ЗАДАЧИ ИССЛЕДОВАНИЯ
В обзоре приведены основные статистические и интервальные методы обработки эмпирической информации, так как именно эти методы, в основном, применяются для обработки экспериментальной физической информации.
1.1. Типы неопределенности исходной физической информации
По характеру проявления в эксперименте ошибки делятся на две категории: случайные и систематические [1 - 4, 10]. Случайными называются ошибки, которые при многократных повторениях опыта изменяются нерегулярным, непредсказуемым образом, приводя к разбросу измеренных значений. Систематическими называются ошибки, которые при повторении измерений тем же методом в неизменных условиях повторяются, не изменяясь ни по величине, ни по знаку, либо изменяются закономерно, в зависимости от тех или иных факторов.
Термин «неопределенность измерений» или «неопределенность результата измерений» получил широкое распространение после публикации Международной организацией по стандартизации в 1993 г. «Руководства по выражению неопределенности в измерениях» [5, 6].
Согласно [6, 7], неопределенность измерений - «параметр, связанный с результатом измерений и характеризующий разброс знаний, которые с достаточным основанием могут быть приписаны измеряемой величине». В [5] отмечено, что важно различать неопределенность и погрешность: последняя, как известно, представляет собой разность между результатом измерения и
9
истинным значением измеряемой величины. Приведенное выше определение не противоречит традиционному понятию неопределенности измерений («оценка, характеризирующая область значений, в пределах которой находится истинное значение измеряемой величины» [8]), но, как подчеркивается в [6], это определение ставит во главу угла результат измерений и его оцененную неопределенность, а не такие «непознаваемые» величины, как истинное значение и погрешность. Отмечено [5], что эти различия в интерпретации не влияют на методы оценивания неопределенности и получаемые при этом результаты.
Процесс оценивания неопределенности состоит из нескольких последовательных этапов [8]. Эти этапы показаны на рисунке 1.1. в виде схемы.
Рисунок ^.Последовательность этапов процесса оценивания неопределенностей измерений
В литературе по математической статистике детально обсуждается понятие случайной погрешности, методы ее вычисления и интерпретации получаемых при этом результатов. В то же время понятие возможной систематической ошибки не имеет достаточно разработанного
10
математического описания. В работе [9] предпринята попытка такого описания в рамках теории нечетких множеств [10, 11]. Предлагаемый в работе [9] подход применен для обработки результатов межлабораторного эксперимента [12,13].
1.2. Статистические методы построения эмпирических зависимостей
Метод наименьших квадратов
Задачи регрессии чаще всего решаются методом наименьших квадратов (МНК), который применяется для обработки экспериментальных данных в различных областях [1, 3, 10, 14-27].
Если в результате п независимых опытов получены п пар чисел у, и то для зависимости вида у = а + Ьх подбирают параметры а и Ь таким образом, чтобы сумма квадратов отклонений аппроксимирующей зависимости во всех экспериментальных точках была минимальной. Параметры линейной зависимости определяются соотношениями:
а=(Е*2 • Е у - Ех • Е*у\А" Е- (ЕхУ2); ь=(п’£ху-'£х-'£у)/(пТ, *2-(Е*)2)- О-1)
Взвешенный метод наименьших квадратов (МВНК) учитывает весовой фактор (стержень доверия) каждой точки [1, 23, 29, 30]. Наибольшую точность и эффективность оценок МНК дает в случае нормально распределенных случайных величин.
Следует отметить, что МНК можно применять и для случаев с большим числом параметров [10, 14, 15, 23, 29]. Для этого выбирают подходящую
функцию, зависящую от некоторых параметров, (р(х\ Сь ..., Си) и подбирают параметры С\, ..., си так, чтобы сумма квадратов ошибок приближенной зависимости у = (р (х; См) во всех экспериментальных точках была
минимальной:
п
Е^*........................са/)]2 -»тт. (1.2)
А=I
11
Метод максимального правдоподобия (ММП)
Этот метод основан на принятии за оценку неизвестного параметра такого его значения, при котором функция правдоподобия достигает максимального значения. Значение параметра в этом случае называется оценкой максимального правдоподобия параметра. Метод максимального правдоподобия можно использовать, если известен вид закона распределения случайной величины [15, 19, 28, 32]. Оценки максимального правдоподобия при достаточно общих условиях состоятельны, асимптотически нормальны и асимптотически эффективны [10, 18, 33]. Оценки ММП могут быть
смещенными, тогда смещение можно устранить введением поправок или увеличением объема выборки [21,32].
Недостаток метода состоит в том, что он часто требует слишком сложных вычислений [28].
Метод моментов, который основан на определении неизвестных параметров из уравнений, получаемых приравниванием экспериментально найденных оценок моментов теоретическим значениям соответствующих моментов, зависящим от неизвестных параметров [10, 20, 28, 32, 33, 34]. Для оценок неизвестных параметров можно приравнивать не только сами моменты, но и функции от моментов.
Метод моментов часто оказывается проще, чем метод максимального правдоподобия, но его оценки, как правило, смещенные, малоэффективные и менее точные, чем полученные ММП [23, 32].
Метод моментов дает в качестве оценки математического ожидания выборочное среднее для любого закона распределения случайной величины. Таким образом, метод моментов можно применять, не зная вид закона распределения изучаемой случайной величины [19].
Метод наименьших модулей (МНМ)
Согласно МНМ параметры С|, ..., сц функции <р(х\ сь ..., См) подбираются таким образом, чтобы сумма абсолютных ошибок во всех экспериментальных точках была минимальной, т.е.:
-<ф:;с,,-,слг)->т1П (1.3)
к=]
Также как и в МНК, для отыскания минимума приравнивают нулю частные производные по неизвестным параметрам, а затем, решая полученные системы уравнений, определяют искомые параметры сь с^.
Вероятные ошибки оценки параметров, полученные методом наименьших квадратов и методом наименьших модулей, имеют одинаковый порядок [35]. МНМ возник как частный случай ММП, когда случайная величина распределена по закону распределения Лапласа [29].
В работе [36] отмечено, что в вероятностной теории статистических методов выборка обычно моделируется как конечная последовательность независимых одинаково распределенных случайных величин или векторов. Часто предполагается, что эти величины (векторы) имеют нормальное распределение.
Однако независимость результатов измерений обычно применяется «из общих предположений», тогда как во многих случаях очевидна их коррелированность [37]. Их одинаковая распределенность также вызывает сомнения из-за изменения во времени свойств образцов, средств измерения и психофизического состояния специалиста, проводящего измерения (испытания, анализы, опыты). Применение вероятностных моделей также не всегда обосновано, например, при моделировании уникальных измерений (теорию вероятностей обычно привлекают при изучении явлений). И уж совсем редко распределения результатов измерений можно считать нормальными.
В [36] указано, что широко распространено ложное мнение о необходимости поиска оптимальных методов, решений и т.д. Дело в том, что оптимальность обычно исчезает при отклонении от исходных предпосылок. Так, среднее арифметическое является оптимальной оценкой математического ожидания только тогда, когда исходное распределение - нормальное, в то время как состоятельной оценкой - всегда, лишь бы математическое ожидание существовало. С другой стороны, для любого произвольно взятого метода
13
оценивания или проверки гипотез обычно можно так сформировать понятия оптимальности, чтобы рассматриваемый метод стал оптимальным.
Гипотеза о нормальном распределении шума на практике выполняется далеко не всегда, ее проверка или не проводится вообще, или выполняется на незначительных выборках [38].
Метод средних
Метод средних - самый известный в среде физиков-экспериментаторов вариант байесовского подхода к определению параметров экспериментальных зависимостей. Суть метода заключается в следующем [1, 20, 39]: за наилучшую эмпирическую зависимость принимается такая зависимость, которая обеспечивает нулевое значение суммы отклонений по всем экспериментальным точкам:
1>,=о,
/=1
то есть параметры зависимости =/(хь а»...,а,) выбирают таким образом,
что отклонения, имеющие различные знаки, в сумме компенсируются.
Поскольку система уравнений {е1 =Дх» - у,} - переобусловлена
(число неизвестных меньше числа уравнений), то ее следует привести к нормальному виду (число уравнений равно числу неизвестных).
В методе средних система
£п =/(*т аЬ”;вз) -Уп
обычно разбивается на б групп, каждая из которых содержит примерно одинаковое число уравнений. Уравнения нормальной системы получают суммированием исходных уравнений в каждой группе и приравниванием суммарного отклонения нулю. Результаты решения по методу средних зависят от способа группирования исходных уравнений. Если уравнения сгруппированы в порядке монотонного изменения одной из переменных, то результаты - наилучшие.
14
Метод выбранных точек
Метод решает задачу минимизации е1 =Дхь ао,~..,ап) - у, для / = 1,л.По заданным экспериментальным значениям на координатной плоскости ОХУ наносится система точек [20]. После чего проводится плавная линия, которая наиболее близко примыкает к данным точкам. На линии выбираются точки, число которых должно быть равно количеству искомых параметров эмпирической зависимости. Координаты точек ( тщательно измеряются
и используются для записи условия прохождения графика эмпирической функции у=(р(хь ао, ,ап1) через выбранные точки:
<р(х°, а0у ,ап1)=у°, у = 0ут.
Из последнего соотношения находим значения параметров ао,...ат. Решение этой же задачи методом наименьших квадратов приводит к наиболее точным результатам, так как можно выбрать гораздо большее число уравнений, чем определяемых коэффициентов. Метод наименьших квадратов позволяет оценить еще значимость найденных коэффициентов, адекватность уравнения исходной кривой.
1.3. Робастные методы оценивания параметров
Под робастностью [20, 29, 33, 40-44] понимают устойчивость статистических характеристик по отношению к тем или иным, обычно немногочисленным, но грубым ошибкам и к резко выделяющимся неблагонадежным. Таким образом, робастные оценки нечувствительны к малым отклонениям от предположений [40]. В [45] показано, что прежде чем переходить к оцениванию, приходится использовать процедуры исключения грубых ошибок измерений, что выливается в непростую задачу. В работе [46] показана устойчивость к аномальным изменениям оценок максимального правдоподобия параметров распределения при использовании предварительного группирования данных.
15
Оценки МНК очень чувствительны к грубым ошибкам наблюдений и теряют оптимальность при незначительных отклонениях от нормального распределения случайной величины, поэтому робастные методы можно рассматривать как альтернативные МНК [47].
В [48] рассмотрен непараметрический аналог нормального
распределения, которое обеспечивает устойчивое (робастное) описание данных, позволяя при этом учесть возможную асимметрию распределения. В качестве меры «простоты» распределения выбрана так называемая информация Фишера [33,40], которая задается функционалом:
где р(х) - плотность вероятности распределения, р'(х) - производная от функции плотности вероятности. Наименьшей информацией Фишера из всех распределений с заданными средним и дисперсией обладает распределение Гаусса [40]. В [49] используются так называемые ненараметрические статистические характеристики: в качестве характеристики сдвига
распределения взята медиана, а в качестве характеристики масштаба распределения - межквартильное расстояние. Нижняя квартиль, медиана и верхняя квартиль разбивают вещественную ось на четыре области, содержащие равное количество точек.
Авторами [9] показано, что применение теории нечетких множеств дает возможность разрабатывать алгоритмы обработки экспериментальных данных различного вида, как устойчивые (робастные) к единичным отклонениям, так и с повышенной чувствительностью к ним.
Один из методов восстановления плотности распределения основан на сглаживании локальных колебаний эмпирической функции распределения путем построения регрессионной зависимости в координатах Вейбулла.
Другие методы определения плотности распределения: ядерные оценки [50 - 52] и метод ортогональных разложений [52 - 55]. Ядерные оценки основаны на «размазывании» каждой точки выборки внутри некоторой
(1.4)
16
- Київ+380960830922