Вы здесь

Алгебраические методы оптимального статистического оценивания

Автор: 
Сапожников Павел Николаевич
Тип работы: 
Докторская
Год: 
1998
Артикул:
1000252941
179 грн
Добавить в корзину

Содержимое

2
Оглавление
Введение _____________________________________________________
Глава 1. Семейства вероятностных распределений, порождение: группами преобразований
1. Семейства сдвигов 1 °
X с.
2. Примеры нахождения инвариантных мер для некоторых хорошо известных групп и общий вид семейств сдвига па однородных пространствах этих групп._________________________________________ 21
3. Вспомогательные сведения и утверждения алгебраического характера ______________________________________________________
4. Структура экспонентных семейств сдвигов_____________________ Я \
5. О характеризации экспонентного семейства сдвигов достаточной статистикой____________________________________________63
6. Примеры экспонентных семейств сдвигов, не допускающих характеризации с точностью до выбора начала отсчета----------------80
7. Семейства сдвигов на множествах матриц______________________93
8. О концепции достаточности в математической статистике 102
Глава 2. Алгебраический метод получения распределений
достаточных статистик
1. Методы нахождения распределений функций случайных величин___________________________________________________________114
2. Распределение достаточных статистик для семейств сдвигов общего вида. Алгебраические условия полноты достаточных статистик -------------------------------------------------------128
3
3. Иллюстрация алгебраического подхода получения плотностей распределения достаточных статистик для семейств сдвига___________138
4. Распределение достаточных статистик для семейств сдвига
при нарушении условий регулярности--------------------------------151
5. Универсальные формулы получения НОРМД произведения плотностей________________________________________________________167
6. Некоторые приложения. Иллюстрация алгебраического метода получения НОРМД произведения плотностей семейства сдвигов 180
7. Алгебраический подход к оцениванию и характеризации линейной регрессии------------------------------------------------189
Глава 3. Прогностические оценки плотностей
1. Эквивариантные обобщенно байесовские оценки произведения плотностей семейства сдвигов--------------------------------------200
2. Унификация процедур оптимального оценивания плотностей экспонентного семейства сдвигов-----------------------------------214
3. Распределения некоторых инвариантов и их роль в задачах оптимального оценивания плотностей_______________________________ 228
4. Примеры нахождения плотностей распределения инвариантов
и оптимальных оценок----------------------------------------------240
5. О характеризации распределений распределением инвариантов-------------------------------------------------------250
6. Примеры характеризаций распределением инвариантов 262
Библиографический список-----------------------------------
огго
I ^
4
Введение
Диссертация посвящена разработке методов статистического оценивания и характеризации инвариантных семейств распределений некоторыми свойствами статистик. Предполагается, что значения наблюдаемых случайных элементов могут быть не только числами (или числовыми векторами), но и точками поверхности (многообразия) достаточно общего вида. Ограничение, которому должна удовлетворять область значений случайного элемента, состоит в том, что при воздействии любого преобразования из некоторого множества С точки этой области переходят в точки той же области (многообразия), а само множество преобразований содержит тождественное преобразование, обратное преобразование для каждого элемента и любое преобразование, являющееся результатом последовательного выполнения двух преобразований. Множество преобразований с указанными свойствами называют группой, а многообразие Л', точки которого преобразуются в точки того же многообразия под воздействием любого преобразования из группы С, - се инвариантным пространством или ^-пространством [34]. Если любая точка многообразия X может быть переведена в любую другую с помощью некоторого преобразования из £, его называют однородным пространством этой группы преобразований. Распределение случайного элемента со значениями на С-пространстве также преобразуется определенным образом, если сам случайный элемент подвергается воздействию какого-либо преобразования из (7. В результате данному случайному элементу можно поставить в соответствие семейство, элементами которого являются распределения случайных элементов, полученных всевозможными преобразованиями из
5
С исходного случайного элемента. О таком семействе говорят, что оно порождено сдвигами фиксированного распределения или является семейством сдвигов. Случайный элемент, распределение которого принадлежит семейству сдвигов, будем называть совокупностью сдвигов.
Прообразами совокупностей сдвигов являются случайные величины со значениями на вещественной прямой, плотности распределения которых принадлежат одному из следующих параметрических семейств:
/1 (х - а), 1/2 (|) , ^/з (~У~) > а € Д1, Ь > О,
где /*(ж) - заданные плотности распределения. Если £* - случайная величине! с плотностью распределения /*(я) относительно меры Лебега, то плотности распределения случайных величин £1 + а, Ь • Ь • £3 + а принадлежат указанным семействам, соответственно. Исследованию указанных семейств (совокупностей), называемых в отечественной литературе семействами сдвига и (или) масштаба, посвящено значительное число работ. Рассмотрение таких семейств началась с работы Е.Питмсна (1939,[126]), в работе Е.Б.Дынкина (1951, [15]) было получено описание экспонентных семейств сдвига, допускающих нетривиальные достаточные статистики на основе повторной выборки. Задачи оценивания параметров, функций параметров и характеризации этих семейств рассматривались в работах [144, 98, 97, 100, 24, 51, 29, 22] и др. Так как в /диссертации термин "сдвиг'’ служит синонимом термина ’’преобразование посредством некоторого элемента из группы преобразований достаточно общего вида ”, то все указанные семейства плотностей являются частными примерами семейств сдвига.
6
Проблема характеризации семейств сдвига, допускающих нетривиальные достаточные статистики на основе повторной выборки, вновь появилась и была решена в работе В.М.Максимова (1967, [44]) уже для случайных совокупностей, заданных на бикомпактной топологической группе. В ранних работах П.Сапожникова [56, 58] показано, что при условиях регулярности Дынкина-Брауна (1964, [86]) инвариантное семейство, заданные на однородном пространстве связной группы Ли G, тогда и только тогда допускает нетривиальную достаточную статистику, на основе повторной выборки, когда оно является экспонентным и линейное пространство порожденное логарифмами плотностей семейства и константы является инвариантным пространством представления группы G.
Однако ни в одной из указанных работ не рассматривался вопрос о структуре параметрических функций экспонентного семейства сдвигов, играющих решающую роль в характеризации семейств задан]юй достаточной статистикой. В первой главе диссертации получены алгебраические уравнения для параметрических функций экспонентного семейства сдвигов, коэффициентами которых являются элементы матрицы представления группы преобразований в базисе инвариантного пространства, порожденного направляющей функцией семейства и константой. Указаны необходимые и достаточные условия характеризации регулярных семейств сдвига достаточной статистикой с точностью до инвариантных параметров без привлечения аппарата характеристических функций. Дело в том, что обобщение классического подхода к характеризации распределений свойствами статистик, разработанного в книге А.М.Кагана, Ю.В.Линника, С.Р.Рао (1972, [25]) и основанного на использовании ана-
7
логических свойств характеристических функций случайных величии и (или) векторов, на инвариантные статистические модели общего вида сопряжено со значительными принципиальными трудностями [51]. Кстати, на возможность характеризации достаточностью, реализованным в диссертации методом, указывают сами авторы книги [25].
Нерегулярный случай представлен семействами сдвигов, порожденных распределениями прямоугольных матриц и векторов, элементами которых являются такие матрицы. Распределения из этих семейств непосредственно, или после незначительной модификации, служат основой получения оптимальных оценок произведения плотностей в смысле различных критериев, которые будут получены в 3-ей главе, см. также [3].
Одно из центральных мест в теории оценивания на основе инвариантных статистических моделей занимают эквивариантные оценки параметра сдвига. Методы получения и свойства этих оценок рассматривал А.Л.Рухин на абелевой группе (1970, [51]) и многомерной сфере (1972, [53]). Инвариантные статистические модели общего вида отношения между ними и свойства эквивариантных решающих правил (частным случаем которых являются эквивариантные оценки) изучены в работе Г.П.Климова и А.Д.Кузьмина (1975, [34]). Эквивариантные оценки параметра сдвига для ряда избранных статистических моделей, статистические свойства этих оценок, задачи характеризации мизесовских семейств и устойчивости характеризации получены в работах В.Н.Никулина (1985, [46, 47] и др.). В диссертации эквивариантные оценки параметра сдвига также играют ключевую роль во всех построениях, поэтому в первой главе указан новый метод получения этих оценок. Несмотря на отмеченную
сложность решения проблемы построения оптимальных эквивариантных оценок, предложенный метод легко реализуется, так как здесь находится просто эквивариантная оценка в весьма узком классе статистик. Результаты первой главы отражены в публикациях [63, 64, 66, 136] и докладывались на международных конференциях Перми 1992, Казани 1994, Эгере 1996, Минске 1995.
Известно, что при наличии полных достаточных статистик оптимальные решения обычно являются функциями этих статистик. Поэтому нахождение распределений достаточных статистик обычно является составной частью практической реализации статистических методов. Принципиально простой подход к ее решению основан на идее замены переменных в факторизационном тождестве Халмоша-Сэвиджа (1949, [106]), что позволяет представить плотность распределения достаточной статистики в виде произведения двух множителей, один из которых не зависит от параметра. Непосредственное нахождение этого множителя, как правило, представляет собой технически сложную задачу. Возможность обойти эту трудность в статистических моделях, наделенных структурой сдвигов, была указана в работе Раша (1948,[131]) для нахождения распределения Уишарта. Суть его подхода в том, что свободный от параметров функциональный множитель не вычисляется непосредственно, а рассматривается как функция, удовлетворяющая определенному набору уравнений. Позднее, этот подход, называемый методом функциональных уравнений, применяли Г.П.Климов для вычисления фидуциальных распределений (1973, [33]), В.Л.Гирко в задачах нахождения распределений собственных зпачений случайных матриц (1988, [13]) и другие. Новизна, рассма-
9
триваемых в главе 2 результатов, заключается в том, что здесь получены условия существования решений функциональных уравнений, возникающих при нахождении распределения достаточной статистики и найден общий вид решения этих уравнений. Это позволило указать универсальные формулы для плотности распределения эквивариантных достаточных статистик с точностью до нормирующей константы, нейтральные по отношению к высокой размерности пространства достаточных статистик, как для регулярных, так и для нерегулярных семейств сдвига. Условие применимости формул является алгебраическим и заключается в однородности внутренности пространства значений достаточной статистики относительно группы аффинных преобразований, порожденной выбран ной статистикой. Показано, чаю для экспонентного случая это условие однородности эквивалентно полноте достаточной статистики и является необходимым условием полноты в общем случае. При отсутствии полноты указана модификация формулы, которая позволяет найти распределение эквивариантной части достаточной статистики. Однако во многих задачах необходимо иметь именно распределение инвариантной части достаточной статистики, так называемой дополнительной (или вспомогательной) статистики. Метод функциональных уравнений, к сожалению, здесь бессилен, и задача остается чрезвычайно сложной. Некоторые примеры нахождения распределений дополнительных статистик указаны в параграфе 4. В качестве приложения полученных формул в пятом параграфе этой главы указан новый метод получения несмещенных оценок равномерно минимальной дисперсии. Основные результаты главы содержатся в статьях [67, 68, 69, 70] и докладывались на семинарах ”По
10
проблемам устойчивости стохастических моделей” [132, 134].
Третья глава посвящена проблеме получения оптимальных оценок плотности распределения исходной совокупности, рассматривавшейся в работах [37, 31, 36, 90, 96, 121, 122, 125, 148, 149, 150] и ряде других. Термин ” оптимальная оценка” в рамках диссертации означает оценку принадлежащую одному из следующих классов: несмещенных оценок равномерно минимальной дисперсии и оценок минимизирующих априорный риск в классе эквивариантных прогностических оценок для ряда популярных типов функций потерь: Кульбака-Лейблера, интегральной квадратичной функции потерь, функции потерь Хеллингера, хи-квадрат и др. Эти оценки, будучи оценками плотности ненаблюдаемых случайных элементов, принципиально отличаются от несмещенных оценок равномерно минимальной дисперсии, которые являются оценками плотности части выборки по всей выборке [40]. Несмотря на это, существуют такие семейства плотностей, для которых оба типа оценок могут быть получены из одной и той же формулы (генератора оптимальных оценок) посредством алгебраических преобразований [66, 67, 69, 133, 135, 137, 139, 70]. В гл. 3 показано, что генератор оптимальных оценок существует для всякого экспонентного семейства сдвигов, заданного на однородном пространстве связной группы Ли и допускающего полную достаточную статистику. Получены универсальные формулы для построения генератора оптимальных оценок произведениия плотностей на основе повторной выборки из экспонентной совокупности сдвигов.
Установлена глубокая связь между максимальными инвариантами в избранных классах статистик и оптимальными оценками плотностей,
11
а также получены общие формулы для распределения соответствующих инвариантов [68, 135]. Два последних параграфа третьей главы посвящены приложению алгебраических методов к проблеме характеризации семейств сдвига распределением подходящих инвариантов, постановка которой содержится в работе Ю.В.Прохорова ([50], 1965). Получено достаточно общее и конструктивное решение проблемы характеризации регулярных в смысле Дынкина-Брау па семейств сдвига распределением избранных максимальных инвариантов. В этих методах не используется аппарат характеристических функций, поэтому они существенно отличаются от результатов работ [25, 92] и в значительной мере нейтральны к высокой размерности многообразия элементарных исходов. Одна из первоначальных попыток реализации этой идеи отражена в тезисах [61]. Новые результаты докладывались на международных конференциях в Дебрецене 1997 и Вологде 1998 и опубликованы в [138, 136]. В последнем параграфе наряду с известными характеризациями одномерных распределений приведен ряд примеров характеризации распределений много мерного статистического анализа и указаны подходы к получению иных идейно близких результатов. Значительная часть результатов диссертации содержится в монографии [70].
12
Глава 1. СЕМЕЙСТВА ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ, ПОРОЖДЕННЫЕ ГРУППАМИ ПРЕОБРАЗОВАНИЙ
1. Семейства сдвигов
Пусть X - абстрактное множество и С - группа преобразований, действующих в X таким образом, что результат дх воздействия преобразования д Е О на элемент х Е X принадлежит исходному множеству X. Если такая группа преобразований существует, то говорят, что X - инвариантное пространство относительно 6*. Наряду с термином ”преобразование” будем использовать также термин ” преобразование сдвига’’ или просто ”сдвиг”. Если х - вектор, принадлежащий т.-мерному евклидовому пространству Я™, а С - некая группа (га х га) матриц, то последовательное воздействие матриц д\, д2 на х принято записывать в виде д2 • д\х, подразумевая, что вначале выполняется умножение на матрицу д\, а затем умножение на матрицу д2. Тот лее результат получится при воздействии на х произведения матриц д2 • д\. В связи с этим условимся говорить, что С действует на X посредством левых сдвигов, применяя обозначение (д, х) —> дх, если последовательное воздействие двух преобразований 01, 02 эквивалентно воздействию преобразования д2 • д\. При этом преобразование (д, х) —> д~1х следует считать правым сдвигом, поскольку теперь порядок последовательного воздействия на х произведения двух преобразований меняется на обратный. Эти соглашения не носят принципиального характера, но позволяют иридерл^иваться единых позиций и избежать неточностей в выкладках. Например, согласно им преобразования вида (0, х) —» Ь(д) о х = дхдт, д. х Е Су следует считать левыми
13
сдвигами элемента х.
Если всякая точка X может быть сдвинута в любую другую некоторым преобразованием из С, то множество X называют однородным пространством группы С. В общем случае каждой точке хр 6 X соответствует подмножество Хо = {дхо, д £ С} С X, называемое орбитой группы, проходящей через точку хо- Гак что множество X будет объединением всевозможных орбит. Ясно, что любые две орбиты либо не имеют общих точек, либо совпадают, если найдется хотя бы одпа точка, принадлежащая обеим орбитам.
Краткий анализ ограничений
Для того, чтобы, наряду с алгебраической структурой на X или на прямом произведении Хп этих пространств, могла быть корректно введена еще и вероятностная структура, инвариантная относительно группы преобразований, индуцированной группой С, необходимо потребовать выполнения определенных дополнительных ограничений. Ниже указан типичный перечень этих ограничений, краткий анализ их и необходимые вспомогательные понятия [14, 33, 149, 74].
Щ. С - непрерывная (иначе, топологическая) группа. Обычно однородное пространство реализуется в виде фактор-пространства базовой группы С по какой-либо ее замкнутой подгруппе Со С (7. При этой реализации элементами множества X будут левые смежные классы С относительно Со: х = д • С0. Всякий элемент подмножества д • Со исходной группы называют представителем этого подмножества (или смежного класса). Ясно, что подмножества д\ • Со и дч • Со совпадают для любого
14
92 £ 91 ‘Оо, поэтому смежный класс однозначно определяется любым своим элементом. Левый сдвиг элемента х посредством элемента д\ € £ преобразует смежный класс х = дСо в смежный класс д\х = д\д • Со. Далее, множество X наделяется сильнейшей из топологий, относительно которой отображение 7г(#), ставящее в соответствие элементу д 6 С смежный класс, содержащий этот элемент, непрерывно. Эту топологию принято называть фактор-топологией. В дальнейшем под однородным пространством топологической группы (2 будет пониматься фактор-пространство левых смежных классов по какой-либо замкнутой подгруппе, наделенное фактор-топологией. Отображения (левые сдвиги) на однородном по-странстве (д, х) —> дх> д 6 <2,.т 6 X являются непрерывными по совокупности переменных в силу общего предложения б книги [7]. Отсюда следует, что для любой непрерывной функции /(.т) на X функция /(д~1х) непрерывна по совокупности переменных.
П-2- Топологическое пространство группы <7 является локально компактным и обладает счетным топологическим базисом. Первое предположение гарантирует существование инвариантных мер (правой и левой)
на <7, иначе, функционалов Щ) = ! 1{д)<1и1{д), /г(/) = И{д)сЬт{д),
С с
определенных на множестве С'(0)(6Г) всех неотрицательных непрерывных функций на С с компактными носителями. Левоинвариантность меры (функционала) означает, что I !(д\д\(Ь'1(д) = I КдММу) для любой
с с
функции из С^((7) и любого д\ Е (7. Аналогичный смысл имеет правоинвариантная мера. Обе инвариантные меры единственны с точностью до константы и определяют друг друга. Теорию инвариантного интегрирования можно найти в [76], а конкретные примеры построения инвари-
15
антных мер имеются в книгах [5, 10]. Правоинвариантная мера (функционал) связана с левоинвариантной уравнением /г(7) = 1о /(<7_1)^/(<?) = к 1(9)щМ(д), ИЛИ йиг(д) = (Щд)/6(д), где 6(д) называется модулярной функцией группы <2. Эта функция непрерывна, положительна и удовлетворяет условию 6(д\ • д?) = Ь(д\) * 6(02) для всех дь дч € С. Группа С называется унимодулярной, если ее модулярная функция тождественно равна единице. Например, компактная и абелева группы унимодулярны, следовательно, на этих группах левоинвариантная мера пропорциональна правоинвариантной. Кроме того, на компактной группе инвариантная мера конечна и ее можно выбрать нормированной. Доказательство этого факта весьма просто: если 8(д) ^ 1 тождественно, то существует элемент д такой, что 6(д) > 1. А так как 6(д”) = 6(д)п при любом натуральном га, то непрерывная функция на компактном множестве неограничена, что невозможно. В следующем параграфе будет приведен пример унимодулярной, неабелевой локально компактной группы.
На однородном пространстве локально компактной группы инвариантная мера существует не всегда. Пусть 6(д) и 8о(д) - модулярные функции локально компактной группы £ и ее замкнутой подгруппы С о, тогда, если существует непрерывный гомоморфизм Д(#):£—» (0, +оо) такой, что А(д) = ^ при д е £0, то существует мера щ на X = <2/Со, то есть фуикциопал, определенный на множестве всех неотрицательных непрерывных функций с компактным носителем, такой, что для всех д в С имеет место /х }\дх)(1щ(х) = А(д) /х [76]. Такую меру
называют левой квазиинвариаитной мерой на X, а &(д) - ее модулярной функцией или мультипликатором (такое определение модулярной
16
функции вместо Л_1(<?) [70] принимается для упрощения обозначений). Если Д(д) = 1 на (7о, то на однородном пространстве С/Со также существует левоинвариантная мера. В дальнейшем будем использовать только левую квазиинвариантную меру, поэтому прилагательное левая и соответствующий индекс опускаются. Аналитические методы построения инвариантных и квазиинвариантных мер содержатся в книге [75], здесь же доказано утверждение об унимодулярности широкого класса групп, включающего связные нильпотентные и полупростые группы Ли (предл.
1.4, с. 401). Полупростые группы, а также не пересекающийся с ними класс разрешимых групп, включающий нильпотентные группы, играют важную роль в теории представлений благодаря фундаментальной теореме Леви-Мальцева, которая гласит, что каждая связная группа Ли изоморфна иолу прямому произведению связной максимальной разрешимой инвариантной подгруппы и связной нолупростой подгруппы [16].
П3. Всюду под термином ст-алгебра подмножеств X, Хп или 6* понимается борелевская сг-алгебра, т.е. наименьшая сг-алгебра, содержащая открытые подмножества соответствующего пространства. Наличие счетного топологического базиса в (7 позволяет распространить инвариантные и квазиинвариантные меры на сг-алгебры борелевских подмножеств Вс и Вх, а соответствующие функционалы - на подмножества Вс и Вх измеримых функций. Меру, определенную на а-алгебре борелевских подмножеств, еще называют борелевской [9]. Кроме того, лишь при наличии счетного топологического базиса наименьшая сг-алгебра В\, содержащая прямое произведение п экземпляров сг-алгебр борелевских подмножеств Вх, совпадает с сг-алгеброй 3% борелевских подмножеств
17
Хп [55]. Иными словами, это означает, что тождественное отображение (^1(хп)> &(х*) = Х{ Е X является -измеримым лишь при
наличии счетного топологического базиса в X, так как при отсутствии этого ограничения В\ Э В^. Здесь и всюду далее принимается обозначение х„ = (а?ь х2, .... хп).
П4. Группа <7 является связной, т.е. топологическое пространство С не может быть представлено в виде объединения двух непересекающихся непустых открытых множеств. Если С связна и Со - ее замкнутая подгруппа, то фактор-пространство X = С/Со также является связным [7], а, следовательно, однородное пространство всякой связной топологической группы связно. Это ограничение существенно при характеризации семейств распределений, допускающих нетривиальные достаточные статистики (см. теор.8.1). Более того, в случае несвязного X нетривиальной достаточной статистики может не существовать, как показывает простейший пример: если X есть объединение непересекающихся борелевских подмножеств вещественной прямой, ненулевых вероятностей, то всякая достаточная статистика должна включать множество порядковых статистик, которое эквивалентно выборке. Несвязная группа утрачивает также ряд важных в теории представлений свойств, например нарушается справедливость теоремы Леви-Мальцева.
П5. Группа С является локально эвклидовой. Это ограничение необходимо для определения координатной системы на группе, так как оно означает, что для каждой точки д Е С существует пара (II, ф), называемая локальной картой, где и - некоторая окрестность точки д, а ф -гомеоморфизм и на открытое подмножество п-мерного (вещественного)
18
евклидова пространства Лп. В работе [120] показано, что всякая локально евклидова топологическая группа изоморфна группе Ли. Поэтому далее предполагается, что (7 есть группа Ли. Всякий элемент группы Ли является аналитической функцией конечного числа параметров, точно также групповая операция между любой парой элементов группы является аналитической функцией от параметров элементов.
Так как локально компактная группа Ли но определению является топологической, то весь список ограничений П1 — П5 можно объединить одной фразой: X является однородным пространством связной локально компактной группы Ли со счетным топологическим базисом.
Пе- При решении вопроса о существовании плотности распределения случайных векторов Т(Х„) со значениями в конечномерном эвклидовом пространстве Кт потребуются дополнительные ограничения к борелев-ским мерам, а именно: регулярности и гладкости. Ворелсвская мера называется регулярной, если С}(В) = 8ир{<2(А) : А С В, Л —замкнуто} для любого борелевского множества В. Для вероятностных мер это ограничение выполняется автоматически, если рассматриваемое пространство является метрическим. Ворелсвская мера ф называется топологически гладкой, если С) = \'ппС}(Вх) для каждой возрастающей последо-
вательности открытых множеств В\. Каждая борелевская мера в сепарабельном метрическом пространстве является топологически гладкой [9]. Поскольку группа Ли всегда метризуема и по предположению имеет счетный топологический базис, то условие По можно считать автоматически выполненным.
19
Семейство сдвигов и его параметризация
Пусть (У, Ву) - некоторое пространство событий. Отображение £(*/) множества У в X будем называть случайным элементом на У, если полный прообраз любого борелевского множества В С Вх принадлежит Ву.
Определение 1.1. Будем называть £ совокупностью сдвигов относительно С, если существует такой фиксированный случайный элемент & со значениями на Х> что £ = д£о при некотором неизвестном д Е С.
Таким образом, £ можно рассматривать как случайный элемент, распределение которого зависит от неизвестного параметра д,д Е С. Будем говорить, что случайный элемент £о имеет' плотность /(х) относительно квазиинвариантной меры д на (.X, Вх), если мера Р{£,о Е В}, В Е Вх, абсолютно непрерывна относительно меры ц. В этом случае вероятность события {£о € В) в силу теоремы Радона-Никодима может быть представлена в виде интеграла /я $(х)(1д(х) для любого В Е Вх- При этом случайный элемент £ = д£о при всяком д Е С также имеет плотность }{х | д) и эта плотность равна /(д~1х)А(д), где А(д) -модулярная функция д.
Определение 1.2. Семейство вероятностных мер V = {Рд,д Е С} на (Т-алгебре Вх, образованное сдвигами Рд(В) = Р(д~1В) фиксированной вероятностной меры, а также семейство плотностей на (X, В\, ц)
? = {/(* I 9) = /О?-1*) ' Д(?)> 9 6 б},
связанное с V соотношением Р(#_1Б) = //(х | #)с///(х), будем называть
в
семействами сдвигов.
На первый взгляд, естественный выбор элементов группы С в каче-
20
стве параметров семейства сдвигов, а самой группы в качестве параметрического пространства на самом деле не является таковым, так как не обеспечивает взаимно однозначного соответствия между элементами д 6 С? и вероятностными мерами (плотностями). Действительно, пусть С(Р) = {д : Р{д~1£ € В) = Р(£ € В) для всех В € Вх}, тогда С(Р) есть подгруппа <2, так как при д\, дч 6 Ст(Р) вероятность *= Щ
равна Р(ду ^ € 02Я) = Д</2 Ч € В) = Р(£ € В) для
любого Б € Вх. Эта подгруппа компактна и называется стационарной подгруппой распределения Р. Замкнутость <7(Р) очевидна, покажем, что она ограничена. Согласно пункту П<* на группе С можно ввести метрику, пусть ||д|| норма элемента д в этой метрике и В - ограниченная окрестность единицы группы с Р{В} — р ф 0. Если существует такая последовательность элементов дп £ С?(Р), что ||#п|| —> ос- при п —► ос, то пе-
реходя, если нужно, к подпоследовательности дПк, можно добиться того, чтобы подмножества ВПк = дПкВ были бы попарно несовместны. Так что предположение о неограниченности подгруппы О(Р) приводит к абсурду:
+оо Г + СО 1
значение £ р = Р < и ВПк > принадлежит (0, 1].
к=1 и=1 )
Для устранения неоднозначности параметром семейства сдвигов разумно считать не сдвиг д Е (?, а левый смежный класс £ по стационарной подгруппе С(Р) [51, 149]. При этом параметрическим пространством семейства Т будет то же самое множество смежных классов, так как стационарные подгруппы <?(/) = [д : }{д~1х) • Л(д) = /(х), х € X} и <2(Р) совпадают. Тот факт, что такой способ параметризации позволяет установить взаимно однозначное соответствие между элементами параметрического множества и семейством мер (плотностей), проверяется
21
непосредственно. Если #2 = 91'сг для некоторого а Е <2(Р), то для любого В Е Вх выполняется
Р[92^0 е В] = Р[д1а{о е В] = 1/(а~1д^х)А(а)А(д1)с1д(х) =
В
= /= р[р1?о 6 в].
В
Одновременно из сравнения начала и конца этой цепочки равенств имеем /(д21х)А(д2) = /{д^1х)А(д1) д-почти всюду при д2 = дхо, а € <?(/). Са-ми случайные элементы д^о и ф£о могут быть существенно различными функциями элементарных исходов.
Примем обозначения: 0 - для факторпространства <7/(7(/) и 0 - для его элементов. Когда появится необходимость подчеркнуть, что именно в является параметром семейства, будем писать его вместо д в обозначении }(х | д) семейства плотностей. Однако в подавляющей части построений и рассуждений будет использована (^-параметризация семейства сдвигов, более удобная для аналитических выкладок. Отметим еще, что в силу критерия факторизации свойство достаточности статистики (или а-подаягебры) не зависит от выбора пространства параметров: статистика достаточная для параметра д Е С? является достаточной и для параметра в Е С/0(/) и наоборот.
2. Примеры нахождения инвариантых мер для некоторых хорошо известных групп и общий вид семейств сдвига на однородных пространствах этих групп
В этом пункте, носящем в основном реферативный характер, описаны некоторые часто встречающиеся в прикладных задачах группы пре-
22
образований и соответствующие однородные пространства. Более детальное и полное изложение вопросов содержится в книгах [10, 16, 5]. Техника построения инвариантных и квазиинвариантных мер на рассматриваемых многообразиях базируется на общем утверждении, содержащемся в лемме 2.1, и методе функциональных уравнений, что позволило избежать применения аппарата внешних дифференциальных форм.
Лемма 2.1. Мера Лебега тез в пространстве параметров Л группы Ли С и левоинвариантная мера на С эквивалентны в том смысле, что *//{(/(А) € В} = 0 для любого В е Вс тогда и только тогда, когда теб{А 6 д~1(В)} = 0, где д~1(В) - полный прообраз множества В.
Доказательство следует из возможности представления элемента объема в фиксированной точке гладкого многообразия размерности г в виде определителя от г линейно независимых касательных векторов 15 этой точке, что приводит к формуле ф(А)б/А1 ... с!\г, где ф(А) € С’(г-1^(А).
Следствие. Если £ = Л, то плотность распределения левоиивари-антноЙ меры в О относительно меры Лебега удовлетворяет уравнению ф\{д) = Фl(g\g)J{g\), где J{g\) - якобиан преобразования д —» д\д. Из уравнения следует, что ффд) = J(g~l) с точностью до константы.
Доказательство. Пусть В 6 Вс, в силу леммы и теоремы Радона-
Никодима, существует борелевская функция ф\ на группе такая, что
рфВ) = 1ф1(д)<1д, и потому в
В
Отсюда следует, что плотность распределения меры относительно меры Лебега, ввиду инвариантности ///, удовлетворяет уравнению ффдх) =
де матриц вида д(а, 6) =
, то преобразование прямой ’’левый
23
^1(991)43 (я) для любых д, 9] € С, т.е. ф^д) ос /(с;-1).
Пример 1. Группа линейных преобразований прямой
Простейшим примером группы, у которой право- и левоинвариантные меры различны, является группа линейных преобразований прямой, сохраняющих ориентацию, ее параметрами являются пары чисел
(а, 6), а Е Я1, 6 Е Я+. Если элементы группы представить в ви-
6 а
О 1
сдвиг', соответствующее двум последовательным левым сдвигам, определяется матрицей д(а2, 62)0(01, 61), а преобразование, соответствующее двум последовательным правым преобразованиям, определяется матрицей д{аи 61)0(02, 62). Отсюда следует, что два последовательных левых сдвига определяются парой («2 + 0162, 6162), так что само преобразование левого сдвига имеет вид х —» Ъх + а, х Е В}. Аналогично, результат двух последовательных правых преобразований определяется параметрами (о1 + 6102, 6162), и, следовательно, сами преобразования действуют по формуле х —»
Далее, множество Со всех левых преобразований, оставляющих точку х = 0 на месте (стационарная подгруппа точки 0), есть подмножество пар вида (0, 6); стационарная подгруппа точки х = 0 относительно правых преобразований определяется тем же самым подмножеством пар (О, 6). Элементами факторпространства левых смежных классов группы линейных преобразований по стационарной подгруппе точки 0 являются подмножества пар (а\, Ь\Ь), где (аь Ь\) - фиксированный элемент С, а 6 - произвольный элемент из Я\.. Пару («1,61) принято называть продета-
24
вителем смежного класса. Таким образом, между точками вещественной прямой и смежными классами по подгруппе <7о можно установить взаимно однозначное соответствие, при котором точке х 6 В1 сопоставляется
смежный класс {(/(х, Ь), Ъ > 0}, представителем этого смежного клас-
1 х
са можно считать пару (#, 1) или матрицу д(х, 1) = , т.е. веще-
0 1
ствснную прямую можно рассматривать как фактор пространство С/С о-При этом преобразование левого сдвига можно реализовать посредством умножения матрицы д{х, 1) • д{0, Ь) на матрицу д(ар Ь\) слева. Аналогичным образом вещественная прямая может быть представлена в виде факторнространства п])авых смежных классов группы по стационарной подгруппе точки 0. Мера Лебега всякого ограниченного измеримого множества на прямой умножается на коэффициент | д(а, Ь) |= 6-1 при правом сдвиге с помощью элемента следовательно, эта мера является квази-инвариантной и модулярная функция ее равна Д(г2, Ь) = 1 /Ь.
При реализации группы в виде пар (а, Ь) параметрическое пространство и сама группа совпадают. Из определения левого сдвига следует, что ./(</) = Ь2 при д = (а. 6), так что плотность распределения меры щ относительно меры Лебега равна ^/(а, Ь) = С-Ь~2, где С - константа, которую, не нарушая общности, можно считать равной единице. Аналогичные рассуждения для правоиивариантой меры приводят к уравнению для плотности распределения правоинвариантной меры относительно меры Лебега ■фг(а, Ь) = грг(а-\-Ьа\, ЬЬ\)-Ь\ для любых а, а\ е В1 и />, Ь\ е В1+. Теперь, полагая 61 = 6“1, а\ = —а/Ь, получим фг(а, Ь) = СЬ~1. Сопоставляя эти две инвариантные меры, получим модулярную функцию группы 6(д) = Ь~[.
25
Группа линейных преобразований содержит в качестве подгрупп аддитивную группу вещественных чисел, пространство которой отождествляется с вещественной прямой, а групповой операцией является обычное сложение, и группу положительных вещественных чисел относительно операции умножения. В аддитивном случае плотность распределения инвариантной меры относительно меры Лебега удовлетворяет уравнению гр(а) = гр(а — ai) для любых вещественных чисел а, а\. Так что tp(a) = const и инвариантной мерой можно считать меру Лебега. В мультипликативном случае искомая плотность Лебега удовлетворяет уравнению гр(Ь) = следовательно гр(Ь) ос Ь“1.
Согласно предыдущему случайная совокупность на вещественной прямой, порожденная левыми сдвигами случайного элемента £о> имеет вид +а, а плотность распределения ее относительно меры Лебега равна где /(гг) - плотность распределения £о- Аналогично случайная
совокупность на вещественной прямой, полученная правыми сдвигами имеет вид а ее плотность относительно меры Лебега равна bf(bx+a).
Пример 2. Группа невырожденных линейных преобразований р-мерного евклидова пространства Rp (полная линейная группа)
Общепринятое обозначение для этой группы - GL(p), а поскольку всякое линейное преобразование Rp может быть задано с помощью подходящей матрицы в каком-либо ортонормированном базисе, то будем сразу считать элементами GL(p) невырожденные матрицы. Эта группа содержит связную подгруппу: множество матриц с положительным определителем, которую мы и будем рассматривать, сохраняя для нее обозначение GL(p). Преобразование левого сдвига в RP имеет вид х —► дху так что
‘26
если в качестве квазиинвариантной меры в RP принята мера Лебега, то модулярная функция этой меры равна якобиану линейного преобразования в Rp или | д |. Плотность распределения левоинвариантной меры в GL(p) относительно меры Лебега равна гр(д) = J(g~l) с точностью до константы. Для вычисления J(g) воспользуемся очевидным свойством этого якобиана: </(<71(72) = </(<7i)</(</2), из которого в силу разложения д = zDz~l следует, что J(g) = </(£*)> где D - диагональная матрица. Легко видеть, что умножение произвольной матрицы на диагональную матрицу слева эквивалентно умножению р2-мерного вектора-столбца, составленного из последовательно расположенных столбцов матрицы дт на диагональную матрицу, причем диагональ ее образована р раз повторенной диагональю исходной матрицы. Таким образом, J{g) =| D |р=| д \р. В этом примере правоинвариантная мера имеет в точности тот же самый вид, так что группа GL(p) унимодулярна и является нетривиальным примером локально компактной некоммутативной группы, у которой лево-и правоинвариантная меры совпадают. Изложенный метод вычисления якобиана указан в книге [33].
Непосредственно проверяется, что RP с выколотой точкой 0 является однородным пространством группы GL(p). Действительно, стационарной подгруппой точки ei = (1, 0, ...) является подгруппа Go матриц, у которых первый столбец равен <д, а в качестве предствителя смежного класса G по подгруппе Go, отождествляемого с точкой х € /2Р, представляющей собой вертикальный вектор с координатами (ад, ад, •••, хр), может быть взята любая матрица из GL(p), первый столбец которой равен х. Теперь, если £ = дЕ,о - совокупность сдвигов в RP, то плотность распределения