Ви є тут

Математическое моделирование некоторых методов проверки статистических гипотез, основанных на теории больших уклонений

Автор: 
Романова Татьяна Анатольевна
Тип роботи: 
Кандидатская
Рік: 
2001
Артикул:
322904
179 грн
Додати в кошик

Вміст

ОГЛАВЛЕНИЕ
1 Оценка мультипликативной константы. 19
1.1 Состоятельность оценки мультипликативной
константы............................................................... 19
1.2 Численный анализ мультипликативной
константы............................................................... 25
2 Анализ точности аппроксимаций. 31
(
2.1 11роверка гипотезы однородности двух
многомерных выборок..................................................... 31
2.2 Проверка гипотезы независимости......................................... 34
2.3 Численный анализ асимптотик............................................. 37
3 Оценивание мощности критерия однородности. 44
3.1 Асимптотическое поведение статистики Питербарга-Тюрина при альтернативе сдвига 44
3.2 Численный анализ статистики Питербарга-Тюрина при альтернативе сдвига. 46
3.3 Оценивание мощности критерия однородности............................... 48
3.4 Доказательство теоремы С. . . ......................................... 50
Введение
Классическая теория математической статистики включает методы обработки данных, основанные на предположении, что закон распределения наблюдений принадлежит к тому или иному параметрическому семейству. Одним из наиболее важных распределений является гауссовское семейство. Отчасти это объясняется тем, что основными потребителями математической статистики в прошлом были дисциплины, для которых характерно было высокое качество измерений, например астрономия и геодезия, а ошибки в измерениях близки к нормальному распределению. Поэтому методы обработки наблюдений, имеющих нормальное распределение, разработаны достаточно полно как для одномерного случая, так и для многомерного. Например, в гауссовском случае проверка гипотезы о независимости признаков сводится к проверке гипотез о равенстве нулю коэффициентов корреляции (см., например [2, Глава. 4 и 9], [19, Глава 29]), а проверка однородности заключается в проверке гипотез о равенстве одновременно ковариационных матриц и векторов средних значений (см., например, [2, Глава 10], [19, Глава 42]).
Разработанные для нормального распределения методы иногда приходится применять и в тех случаях, когда имеются какие-либо отклонения от нормальности. Применение гауссовских методов для негауссовских наблюдений превращает точные выводы в приближенные. Ыа практике упомяну-
4
тые отклонения бывает трудно обнаружить, поскольку статистик располагает лишь ограниченным числом наблюдений. Между тем даже малые отклонения от нормальности могут сильно искажать статистические свойства гауссовских правил.
Один из способов решения этой проблемы — разработка таких статистических методов в рамках гауссовской модели, результаты применения которых были бы устойчивы, малочувствительны к тем или иным отступлениям от пормальности. Это важное направление, известное как робастая статистика, очень интенсивно разрабатывается в последние десятиления.
Если же имеется явное отклонение распределения от гауссовского, проверка корректности выводов, полученных в рамках нормальной модели, может перерасти в сложную проблему. Специально для этих случаев были разработаны непараметрические методы анализа данных. Непараметрические методы — это методы не предназначенные специально для какого-либо параметрического семейства распределений и не использующие свойства этого семейства. Обычно, непараметрические методы проще в применении, чем их конкзфенты из нормальной теории. Кроме того, они применимы в ситуациях, в которых методы нормальной теории не ”работают”. Например, для многих непараметрических методов требуются не действительные значения наблюдений, а только их ранги. Как правило, иепара-метрические методы лишь немного менее эффективны, чем их конкуренты из нормальной теории, если рассматриваемые генеральные совокупности нормальны. Эти методы могут оказаться значительно эффективнее, чем их соперники из нормальной теории, если распределения генеральных совокупностей отличны от нормального.
В одномерном случае разработано большое количество непараметри-
5
ческих методов проверки статистических гипотез. Для этих методов характерно то, что соответствующий им статистики при выполнении гипотезы распределены свободно, то есть их распределения не зависят от исходного распределения выборок. Поэтому законы распределения этих статистик можно вычислить, что и позволяет эффективно применять эти методы для проверки гипотез. Наиболее известными из нснараметрических методов являются методы, основанные на статистиках Колмогорова-Смирнова [37], Уилкса [42], Хефдинга [15], Крамера-фон Мизеса [32], Лемана [20].
Рассмотрим подробнее открытые Ф. Уилкоксоном [41] ранговые методы. Они возникли как замена традиционной корреляционной теории, основанной на двумерном распределении. В непараметрическом случае тоже можно использовать коэффициенты корреляции, но уже ранговые, то есть основанные на рангах наблюдений. Чаще всего используются коэффициенты ранговой корреляции предложенные Спирменом (см. [17]) и Кендэлом [17]. Важной задачей является разработка свободных от распределения методов обработки многомерных данных. Во-первых, это связано с потребностями таких наук, как биология, медицина, экономика и социальные исследования, психология и политология. Для этих наук характерно то, что изучаемые в них данные обладают большой совокупностью признаков, которые не являются независимыми и имеют сложные, малоизученные законы распределения, препятствующие применению классической теории.
Во-вторых, в многомерном случае последствия применения гауссовских методов для негауссовских наблюдений мало изучены.
В-третьих, уровень развития вычислительной техники позволяет осуществить анализ многомерных данных на практике.
Неиараметрические методы анализа многомерных данных существуют и
6
развиваются отнюдь не механическим обобщением многомерных результатов. Имеется несколько подходов к построению многомерных непараметри-ческих критериев.
Некоторые авторы для анализа многомерных данных используют перестановочные критерии. Так Бикел [3] построил свободный от распределения критерий, являющийся многомерным обобщением критерия Колмогорова-Смирнова. Хенз [13] предложил критерий, основанный на методе ближайших соседей. Позже Хэнз и Пенроуз [14] развили предложенный Фридманом и Рафски [9] многомерный критерий серий, основанный на минимальном дереве элементарных событий, как многомерном обобщении одномерного классификационного списка. Эти критерии являются свободными от распределения и их тестовые статистики являются асимптотически нормальными.
Для анализа многомерных данных ряд авторов использовали ранговые методы [29], [24], [31]. В одномерном случае ранговые критерии позволяют построить свободные от распределения статистические процедуры принятия решения. Но для векторных наблюдений неизвестно такое обобщение операции ранжирования, которое бы приводило к свободным от распределения статистическим правилам.
Рой [33] предложил метод перехода от многомерной задачи к одномерной задаче. Для этого он рассматривает всевозможные линейные комбинации наблюдаемых признаков. По этому мето;*у критическое множество составляется как объединение критических множеств для проверки тех гипотез об одномерных распределениях, из которых состоит проверяемая гипотеза. Следуя принципу Роя, проверяемая гипотеза отвергается, если отвергается хотя бы одна из составляющих гипотез.