Содержание
Введение
5
1 Свойства медианных модификаций алгоритмов ЕМ-типа 29
1.1 Свойства медианных модификаций ЕМ-алгоритма............. 29
1.1.1 Задача разделения смесей вероятностных
распределений ................................... 30
1.1.2 ЕМ-алгоритм для разделения конечных смесей
нормальных законов............................... 32
1.1.3 Относительная эффективность выборочного
среднего и выборочной медианы при оценивании параметров положения компонент конечных смесей нормальных законов............................... 34
1.1.4 Медианные модификации ЕМ-алгоритма............... 37
1.1.5 Обоснование целесообразности применения
медианной модификации ЕМ-алгоритма для решения задачи разделения конечных смесей нормальных законов............................... 41
1.2 Свойства стохастических медианных модификаций
ЕМ-алгоритма........................................... 45
1.2.1 БЕМ-алгоритм..................................... 45
1.2.2 Медианная модификация БЕМ-алгоритма.............. 49
1.2.3 Свойства. БЕМ-алгоритмов, получаемые па
основании интерпретации последовательности оценок как марковской цепи ...................... 50
2 Асимптотически наиболее мощные критерии проверки гипотез о числе компонент смеси вероятностных распределений 57
2.1 Устойчивость масштабных смесей нормальных законов
относительно смешивающего распределения ............... 58
2
2.1.1 Постановка задачи................................ 59
2.1.2 Модель добавления компоненты..................... 60
2.1.3 Модель расщепления компоненты ............................ 65
2.1.4 Выводы........................................... 69
2.2 Асимптотически оптимальный критерий проверки гипотез о числе компонент смеси вероятностных распределений в модели добавления компоненты................................. 70
2.2.1 Постановка задачи................................ 72
2.2.2 Асимптотически наиболее мощный критерий
проверки гипотез о числе компонент смеси......... 73
2.2.3 Асимптотическое поведение разности мощностей . . 79
2.2.4 Условия конечности моментных характеристик '3/5 . 81
2.2.5 Примеры конкретных смесей вероятностных
распределений ............................................ 88
2.3 Асимптотически оптимальный критерий проверки гипотез о числе компонент смеси вероятностных распределений в модели расщепления компоненты.................................. 94
2.3.1 Постановка задачи................................ 95
2.3.2 Асимптотически наиболее мощный критерий
проверки гипотез о числе компонент смеси......... 97
2.3.3 Асимптотическое поведение разности мощностей . . 100
2.3.4 Условия конечности моментных характеристик . 102
2.3.5 Примеры конкретных смесей вероятностных
распределений ............................................106
2.4 Тестирование критериев..........................................110
Практическое применение методой разделения смесей вероятностных распределений 117
3.1 Декомпозиция волатильности с помощью метода скользящего разделения смесей.............................117
3.2 Применение медианных модификаций алгоритмов ЕМ-типа для декомпозиции волатильности финансовых индексов . . 122
3.3 Эволюция вероятностных характеристик низкочастотной турбулентности плазмы.....................................141
3.3.1 Описание установки и метода измерения ....................141
3.3.2 Структурная ионно-звуковая турбулентность в
установке ТАУ-1..................................143
3.3.3 Применение ЕМ- и БЕМ-алгоритмов для анализа временных выборок флуктуаций потенциала ионно-звуковой структурной турбулентности .... 144
3.3.4 Экспериментальные результаты .....................146
3.3.5 Выводы............................................154
3.4 Анализ тонкой стохастической структуры хаотических
процессов с помощью ядерных оценок......................159
3.4.1 Исследование тонкой структуры доплеровских спектров флуктуаций плотности в краевой плазме
в тороидальных установках.........................161
3.4.2 Метод анализа структуры процесса, основанный на ядерных оценках плотности................................162
3.4.3 Применение метода к реальным данным...............163
3.4.4 Выводы............................................165
Список литературы 167
4
Введение
Во многих ситуациях удобными математическими моделями стохастических хаотических процессов являются подчиненные винеровские процессы, по сути представляющие собой процессы броуновского движения со случайным временем (или со случайными параметрами сноса и диффузии). Математическим обоснованием такого подхода являются предельные теоремы для обобщенных дважды стохастических пуассо-новских процессов (обобщенных процессов Кокса). Обобщенные процессы Кокса являются в некотором смысле наилучшими моделями нестационарных хаотических случайных блужданий и демонстрируют высокую адекватность при их использовании для описания динамики биржевых цен или характеристик турбулентной плазмы на временных микромасштабах. С помотцыо соответствующих предельных теорем такие модели распространяются на временные макромасштабы и трансформируются в упоминавшиеся выше подчиненные винеровские процессы (см., например, книгу [10]). В рамках таких моделей распределения приращений рассматриваемых процессов в общем случае имеют вид сдвиг-масштабньтх смесей нормальных законов.
Как уже отмечалось, подчиненные винеровские процессы широко применяются для моделирования таких хаотических процессов как поведение биржевых цен, финансовых индексов, характеристик турбулентной плазмы. Столь разные по своей природе процессы объединяют некоторые общие черты, которые и служат обоснованием возможности применения схожих моделей для моделирования как финансовых рынков, так и плазменной турбулентности. Так, для обеих областей характерны непредсказуемость, неоднородность по времени (например, интенсивность торгов может быть различной в течение торгового дня; в плазме наблюдается структурная турбулентность), наличие более-менее устойчивых внутренних структур, оказывающих существенное влияние на функционирование всей системы (например, солитоны в плазме, группировки участников финансовых рынков). При проведении анализа в
5
обеих областях внутренняя структура процесса, чаще всего, исследователю неизвестна.
При изучении тонкой стохастической структуры подобных процессов наибольший интерес представляет скорость изменения процесса (то есть его волатильность). При этом, в отличие от многих стандартных определений термина «волатильность», в данной работе будет использоваться понятие многомерной волатильности (см., например, книгу [10]), которое основано на возможности аппроксимации произвольной сдвиг-масшабной смеси нормальных законов конечной смесыо вида
I-“ 1
где
х
Ф(х) = J <p(y)dy, ч>{х) = —= exp
— ОС
- соответственно функция распределения и плотность стандартного нор-
к
мального закона, к ^ 1 - известное натуральное число, р\ ^ 0, YVi = 1»
- г—1
a.i € R, Gi > 0, г = 1,..., к. В рамках такой модели распределений приращений хаотических стохастических процессов волатильность трактуется (10] как дисперсия приращения, которая равна
к к
d = Y^Piai + - “)2’
г—1 г=1
где
к
a = Y^Ptai'
Z—1
Здесь первое слагаемое, не зависящее от параметров сдвига компонент, описывает диффузионную компоненту волатильности, тогда как второе слагаемое, не зависящее от параметров диффузии компонент, описывает динамическую компоненту волатильности. Следует отметить, что параметры а,- являются средними значениями приращений рассматриваемого процесса за единицу времени, поэтому векторы а = (ai,..., а*) и р = (j) 1,..., pi:) описывают распределение средних скоростей в рассматриваемой системе.
Поясним сказанное. В процессе могут присутствовать некоторые (локальные) тренды, происходить их взаимодействия. Данные факторы
б
формируют динамическую компоненту волатильности. Одновременно в моделируемых системах (и в плазме, и на финансовых рынках) присутствует большое число факторов, оказывающих существенное влияние на функционирование системы (частицы среды, участники рынка), но поведение каждого из которых в отдельности не поддается предсказанию. Суммарное случайное воздействие данных факторов определяет диффузионную составляющую волатильности. Только с учетом факторов обоих типов можно получить корректный портрет волатильности хаотического процесса.
С целью анализа стохастической структуры рассматриваемой системы, в рамках которой развивается изучаемый процесс, необходимо осуществить декомпозицию волатильности на динамическую и диффузионную составлякнцую. В рамках указанной выше модели типа конечной смеси распределений вероятности эта задача сводится к задаче статистического разделения конечных смесей, то есть задаче отыскания статистических оценок параметров смеси.
Данная задача является весьма важной в целом ряде отраслей:
1. Финансовые рынки (изучение скрытых тенденций эволюции различных секторов рынка или различных финансовых инструментов, основанное на применении понятия многомерной волатильности.
2. Физика турбулентной плазмы (анализ распределения энергии между процессами или структурами, исследование корреляционной структуры хаотических процессов).
3. Информационные системы (исследование стохастической структуры информационных потоков в вычислительных или телекоммуникационных системах).
Для решения задачи статистического разделения смесей используются различные методы, наиболее популярным из которых является ЕМ-алгоритм. ЕМ-алгоритм представляет собой итеративный метод для нахождения оценок максимального правдоподобия в задаче с неполным набором данных. На каждой итерации проводятся:
Е-шаг (от expectation), на котором вычисляется условное математическое ожидание логарифма функции правдоподобия по имеющимся данным и текущим оценкам параметра.
7
М-шаг (от maximization), на котором находится следующая оценка параметра максимизацией функции, полученной на Е-шаге.
Термин «неполные данные» подразумевает существование двух выборочных пространств X и У, при этом отображение X —> У не единственно. Наблюдаемые данные - из У, а соответствующие х не наблюдаются непосредственно, а только через у. Именно множество X является полным набором данных.
Данный метод был описан и систематически исследован в работе [39] в 1977 году, хотя сам метод использовался со значительно более раннего времени (например, работа [44] датирована 1958 годом). В дальнейшем исследование свойств ЕМ-алгоритма продолжалось в работах многих исследователей (см., например, работы [30, 41, 72]).
Существует два основных применения ЕМ-алгоритма. Во-первьгх, в случае, когда действительно есть пропущенные значения в данных в связи с ограничениями их процесса получения. Во-вторых, в ситуации, когда задача оптимизации функции правдоподобия аналитически неразрешима, но функция правдоподобия может быть значительно упрощена предположениями о существовании и значениях дополнительных (неизвестных) параметров. Такая задача часто встречается в задачах разделения смесей вероятностных распределений, распознавания образов, реконструкции изображений. При этом математическую основу данных прикладных задач составляют задачи кластерного анализа, классификация и разделение смесей вероятностных распределений.
Приведем примеры практического применения ЕМ-алгоритма:
1. Интеллектуальный анализ данных (Data Mining), связанный с задачами кластеризации, распознавания образов, выделения закономерностей в данных в информационных потоках.
2. Заполнение пропусков в данных для дальнейшего анализа методами, ориентированными на работу с данными без пропусков (например, при анализе временных рядов).
3. Обработка изображений (восстановление и анализ изображений, компьютерная томография), распознавание естественных языков (например, часто используемый алгоритм Баума-Велча представляет собой модификацию ЕМ-алгоритма).
Несмотря на свою популярность и относительную эффективность, ЕМ-алгоритм не лишен недостатков, оказывающихся весьма существен-
8
ными в ряде ситуаций. Например, как показывают модельные примеры, в задачах разделения смесей нормальных законов на основе выборок конечного объема ЕМ-алгоритм выдаст не наиболее близкие к правильным оценки параметров, а наиболее «правдоподобные» (с точки зрения максимизации соответствующей функции правдободобия), что, естественно, способно привести к ошибочным выводам на основе неправильных оценок. Известны проблемы неустойчивости по отношению к исходным данным (оценки могут радикально измениться при замене всего лишь одного наблюдения в выборке из 200 — 300 наблюдений) и неустойчивости по отношению к выбору начального приближения (от этого может зависеть скорость сходимости, причем весьма существенно) [10). К тому же алгоритм работает с заранее заданным числом компонент, которое может не соответствовать реальному распределению выборки. Известен ряд практических примеров (см., например, [23]), когда классический ЕМ-алгоритм оказывается неприменимым.
Существуют и другие методы отыскания оценок максимального правдоподобия, например, метод сопряженного градиента, модификации метода Гаусса-Ньютона. Однако в отличие от ЕМ-алгоритма, такие методы, как правило, требуют оценки первой и/или второй производных функции правдоподобия. На практике также возникают сложности с вычислением интегралов на Е-шаге. Например, далеко не всегда возможно получить данный интеграл в терминах элементарных функций. Для преодоления данной проблемы был предложен МСЕМ-алгоритм (Monte Carlo ЕМ-алгоритм) [71], основанный на принципе имитационного моделирования. Однако за упрощение вычислений на Е-шаге приходится платить дополнительной погрешностью (из-за приближения интеграла суммой).
Для борьбы с недостатками классического ЕМ-алгоритма применяют различные модификации классического алгоритма. При этом изменения не затрагивают принципиальную суть ЕМ-алгоритма, изменяя лишь подходы к вычислению параметров на Е- и М-шагах (как, например, уже упомянутый МСЕМ-алгоритм, описываемый далее SEM-алгоритм).
В силу неустойчивости ЕМ-алгоритма по отношению к исходным данным возникает необходимость использования робастных оценок на шагах ЕМ-алгоритма, то есть оценок, обладающих нечувствительностью к малым отклонениям от предположений. В качестве робастных оценок П. Хьюбером [22] предложено использовать так называемые М-оценки. М-оценка - всякая оценка Тп, определяемая как решение экстремальной
задачи на минимум вида
тг
^2р{хг,Тп) -> min,
:=1
где /э(-) - произвольная функция. Заметим, что если в качестве р(х\ в) взять функцию — log/(x;0), где f{x;0) - плотность распределения наблюдений, в - неизвестный параметр, то можно получить оценки максимального правдоподобия. Данные оценки допускают обобщение на многопараметрический случай, что позволяет одновременно выписывать оценки данного типа для сдвига и масштаба.
В книге [22] развиваются результаты Ф.Р. Хэмпела [43], на основании которых показано, что медиана является робастной М-оценкой параметра сдвига. Более того, известно, что медиана является единственной М-оценкой, инвариантной относительно масштаба. Поэтому в данной работе значительное внимание уделяется построению и применению медианных модификаций алгоритмов ЕМ-тииа.
Одним из важнейших недостатков классического EM-алгоритма является то, что он в ряде ситуаций выбирает первый попавшийся локальный максимум (см., например, [9]). То есть, являясь методом локальной оптимизации, он приводит не к глобальному максимуму функции правдоподобия, а к тому локальному максимуму, который является ближайшим к начальному приближению.
Самый простой способ противодействия этому свойству заключается в том, чтобы, не ограничиваясь единственным начальным приближением и, соответственно, единственной траекторией ЕМ-алгоритма, реализовать несколько траекторий, задавая (например, случайно) несколько различных начальных приближений, а затем выбрать тот из результатов, для которого правдоподобие является наибольшим среди всех реализованных траекторий ЕМ-алгоритма. Однако при таком подходе остается неясным ответ на вопрос о том, каким механизмом разумнее всего пользоваться при переходе от одного начального приближения к другому. В частности, когда начальное приближение задается случайно, без дополнительной информации нельзя исчерпывающим образом определить распределение вероятностей, в соответствии с которым следует генерировать очередное начальное приближение.
Другой, оказавшийся весьма эффективным, способ заключается как бы в случайном «встряхивании» наблюдений (выборки) на каждой итерации. Этот способ лежит в основе семейства SEM-алгоритмов
(от З^сЬазПс ЕМ-а^огШип, стохастический (или случайный) ЕМ-алго-ритм [11, 31]). Отличие заключается в добавлении еще одного (помимо Е- и М-шагов) так называемого »9-шага, который и реализует указанное встряхивание «выборки».
Основная идея данной модификации заключается в некотором разделении исходных данных по кластерам и максимизации соответствующих функций с учетом принадлежности данных тому или иному кластеру. Одним из важных достоинств практического применения БЕМ-алгоритма является то, что он, чаще всего, находит именно глобальный максимум функции правдоподобия.
Далее будет подробно описана теоретическая модель БЕМ-алгоритма для задачи декомпозиции конечных смесей вероятностных распределений, а также доказаны важные свойства сходимости данного алгоритма и его новой версии - медианного 8ЕМ-алгоритма для смесей нормальных распределений, не исследовавшиеся или мало исследовавшиеся в литературе. На основе интерпретации последовательности ЭЕМ-оцспок как марковской цепи будут получены важные результаты, проливающие свет на функционирование 8ЕМ-алгоритмов, из которых можно сделать выводы об особенностях практического использования ЭЕМ-алго-ритмов в задаче декомпозиции смесей. При этом доказательство свойств 8ЕМ-алгоритмов проводится без дополнительных предположений о параметрах метода и для произвольного конечного числа компонент в смеси.
Некоторые свойства классического БЕМ-алгоритма изучались в работах [32, 33. 40, 49, 57]. Так, в работе |32] для классического БЕМ-алго-ритма рассмотрен случай смеси только двух законов /\(х) и Пусть
1 *
(т+1) _ У*
1=1
где - независимые случайные величины с распределением Бернулли с параметром
Лт) _ , , («Ь _
Величина р(т+1) в принятых авторами работы [32] обозначениях соответствует оценке параметров на (т + 1)-м итерационном шаге. При этом на моделируемые на Б-шаге случайные величины накладывается до-
11
полнительное ограничение
^с(ЛГ,сг), (1)
і= 1
справедливое для всех компонент от 1 до к (даже в случае к ^ 3, см., например, [33]). Здесь, в принятых авторами указанных работ обозначениях N - объем выборки, а с(Лг, сГ) - пороговая функция. Причем О < с(іУ, сі) < 1, с(Дг, (Г) —> 0 при АГ —> оо. Предлагается с(іУ, с/) выбирать из соотношения
с(лг1Йг) = ^±1 і < а ^ і.
Величину АГс(А^, б/) можно интерпретировать как минимальное число элементов, которое должно содержаться в непустом кластере (при этом величину сі нужно считать одним из параметров метода; попятно, что необходимо требовать, как минимум, выполнение условия сі ^ 0). Если же соотношение (1) не выполняется, то выбираются из некоторого заранее заданного распределения, а алгоритм возвращается к Е-шагу (то есть, фактически, реализуется принцип перезапуска алгоритма с начальными значениями из некоторого заранее выбранного семейства).
Фактически данные ограничения предназначены для того, чтобы исключить случай пустых кластеров (речь об этом пойдет ниже, в главе 1), а также учесть возможность считать пустым не только кластер, не содержащий элементов выборки, но и содержащий некоторое их число. Очевидным недостатком данного подхода является тот факт, что приходится принудительно задавать число компонент в подгоняемой смеси, которое на практике обычно неизвестно. Способам преодоления указанного недостатка посвящена глава 2.
В указанных предположениях в работе [32] для классического БЕМ-алгоритма в случае смеси двух законов приводится теорема о свойствах ЭЕМ-оценок, однако в той же работе отмечено, что уже для трех-компонентиой смеси подобная техника доказательства не подходит (а значит, нельзя перенести результаты с двухкомпоиеитиой смеси на смесь с произвольным конечным числом компонент). В главе 1 будет доказана теорема о свойствах оценок ЭЕМ-алгоритма (в том числе и для медианной модификации для смесей нормальных законов) для случая произвольного числа компонент в смеси и без дополнительных ограничений на параметры метода.
12
Алгоритмы ЕМ-типа могут применяться как важная составная часть некоторой более сложной процедуры, называемой методом скользящего разделения смесей (СРС-метод, см. [10]). Данный метод позволяет учесть изменения, происходящие в функционировании процесса в течении времени. Такой подход позволяет решить задачу декомпозиции волатильности во времени, отследить появление и исчезновение факторов, формирующих структуру процесса в каждый момент времени.
Важным параметром в модели типа смесей вероятностных распределений является число компонент. Алгоритмы ЕМ-типа обычно подразумевают явное задание этой величины. При этом включение в модель дополнительных параметров увеличивает ее согласие с данными. Однако в данной ситуации возникают две существенные сложности. Во-первых, увеличение числа параметров приводит к повышению вычислительной сложности алгоритма, причем порой к довольно существенному. Во-вторых, в ряде ситуаций (см , например, книгу [10]) использование максимального числа компонент может не приводить к увеличению согласия. К примеру, для масштабных смесей известен эффект насыщения, когда согласие не увеличивается уже со значений числа компонент, равного 4 — 5. Для сдвиг-масштабных смесей известен эффект перетекания волатильности, когда при небольшом числе компонент (около 2 — 3) большее влияние имеет диффузионная компонента, а при увеличении числа компонент - динамическая. Таким образом, задание слишком большого числа компонент может критически влиять на соответствие модели исходным данным или на интерпретацию получаемых результатов. Поэтому задача исследования подходов к определению точного числа компонент является исключительно важной и во многом определяющей для успешного применения указанных моделей и методов на практике.
Многие существующие подходы к определению числа компонент смеси основываются на понятии расстояния Кульбака-Лейблера [45] и носят название информационных (так как данную величину также называют энтропией по Кульбаку). В качестве примеров можно привести критерий Акаике [25], байесовский информационный критерий [62|, критерий Ло [55]. Первые два критерия позволяют учесть увеличение согласия с данными при увеличении числа параметров, однако они подразумевают использование некоторой штрафной функции за включение в модель новых параметров. О критерии Ло более подробно речь пойдет в главе 2, где будет дано его формальное описание. Здесь же отметим, что этот критерий не требует штрафных функций, однако его статистика
обладает весьма сложным распределением при выполнении нулевой гипотезы1, а именно взвешенным ^-распределением. Причем определение параметров данного распределения представляет собой достаточно серьезную вычислительную задачу даже на небольших объемах выборки и малом числе компонент в смеси (например, уже при к\ =3).
Общим недостатком подобных критериев является то, что для корректности их применения требуется выполнение достаточно жестких условий регулярности, которые для реальных ситуаций могут не быть справедливыми. Так, например, для смесей нормальных законов нарушается предположение о конечности функции правдоподобия, поэтому формальное применение данных критериев может приводить к ошибочным результатам.
Чтобы минимизировать возможные ошибки, возникающие из-за необходимости задавать в явном виде точное число компонент алгоритмам ЕМ-типа, в диссертации предложено использовать статистический подход для определения числа компонент по выборке. Исходя из особенностей применения предлагаемых алгоритмов, были выделены две практически значимые модели смесей вероятностных распределений, в которых необходимо правильно оценивать число компонент (названные моделью добавления компоненты и моделью растепления компоненты). При этом ключевым моментом является переход от проверки гипотез о значении натуралънозиачного дискретного параметра (равного числу компонент смеси) к проверке гипотез о значении непрерывного параметра (соответствующего весу компоненты, значимость которой проверяется). При таком переходе естественно возникает задача проверки простой гипотезы против сложной альтернативы. Для построения критерия и исследования его свойств при решении данной задачи используется асимптотический подход.
В рамках такого подхода, также называемого подходом Питмэна |60], размер и мощность критерия одновременно отделены от нуля, при этом важную роль играют асимптотический дефект (48] и потеря мощности. Особенностью асимптотического подхода является тот факт, что распре-
1Предпо.,южим> что есть две плотности: А'о-компонентная н /сх-компонентная, к\ > к$. Рассматриваются две возможности. Первая: обе плотности одинаково хорошо приближают в смысле расстояния Кульбака-Лейблера исходную выборку. Значит, можно выбрать смесь с меньшим числом компонент. Именно дапный вариант (к = ко) и будем считать нулевой гипотезой. Вторая: к[-компонентная плотность лучше (точнее). Каждая из альтернатив отдает предпочтение одной из плотностей. Поэтому в качестве альтернативы в нашей исходной задаче можно рассмотреть тог случай, что /гх-компонентшш смесь лучше приближает смесь
14
деление статистики и мощность критерия зависят от некоторого неизвестного параметра £, 0 < £ ^ С, С > 0. При этом величина, определяющая потерю мощности, позволяет сравнить мощность некоторого критерия, не зависящего от неизвестного параметра t: с мощностью наиболее мощного критерия, зависящего от I. Таким образом, можно гарантировать, что полученный критерий будет асимптотически наиболее мощным и в тоже время возможно его корректное применение на практике. Величина же дефекта критерия говорит о том, сколько дополнительных наблюдений необходимо для того, чтобы мощность данного критерия совпала с мощностью наиболее мощного критерия. Исследованиям данной проблематики посвящены работы Дж.Л. Ходжеса и Э.Л. Лемана [46, 47], Г. Е. Ноэзера [58], В. Элберса [26, 27]. Важную роль в методологии доказательств результатов в данной области сыграли работы Л. ЛеКама [51, 52, 53, 54], которые позволили получать выражения для потери мощности без построения асимптотических разложений (см. работы Д. М. Чибисова [35, 36, 37, 38]). Наконец, в книге В.Е. Бе-нинга [29] были получены выражения для асимптотического дефекта и потери мощности, использование которых позволило в данной работе в явном виде получить потерю мощности и асимптотический дефект предложенных асимптотически наиболее мощных критериев.
Основные результаты диссертации являются новыми и состоят в следующем:
1. Получено обоснование возможности использования медианных модификаций алгоритмов ЕМ-типа для смесей нормальных законов.
2. Установлены свойства получаемой на итерационных шагах ЭЕМ-алгоритма последовательности оценок параметров идентифицируемых сдвиг-масштабных смесей вероятностных распределений с произвольным конечным числом компонент. Доказано, что последовательность 8ЕМ-оценок параметров смеси представляет собой конечную однородную апериодическую эргодическую марковскую цепь. Данный результат означает корректность использования стохастических алгоритмов ЕМ-типа для получения оценок компонент смеси: доказан факт сходимости распределения итерационной последовательности оценок к стационарному распределению, а также установлена независимость от начального приближения. В частности, эти результаты справедливы для конечных сдвиг-масштабных смесей нормальных законов.
- Київ+380960830922