РАЗДЕЛ 2
ОЦЕНИВАНИЕ СТАЦИОНАРНЫХ ПАРАМЕТРОВ НЕЛИНЕЙНОЙ МОДЕЛИ ГАММЕРШТЕЙНА
2.1. Оцениваемость параметров модели Гаммерштейна
Пусть в дискретные моменты времени k=0,1,2,… наблюдаемые значения
YT=(y1,y2,..,yk) выхода системы можно представить в виде
Y=F(q)x+x, (2.1)
где F(q) - параметрический оператор, действующий на входную последовательность
х = (х1,х2,...,хs)T;
q* = (q1, q2,...,qm)T – неизвестный векторный параметр, x= (x(1), x(2),…,
x(k))T – случайная последовательность помехи.
Информация о параметре q заключена в фишеровской информационной матрице
Jq=M{[ Сq log p(u, q) ][ Сq log p(u, q) ]T}, (2.2)
где p(u, q) - плотность совместного распределения величин UT= (хт,Yт) и q; M{}
и Сq – символы математического ожидания и первых частных производных
соответственно.
Из неравенства Рао- Крамера
Vq>[I+ Сqb(c)]J[I+b(q)]T (2.3)
следует, что фишеровская информационная матрица определяет нижнюю грань для
ковариационной матрицы оценки V, которая не зависит от определенного метода
оценивания. В последнем выражении b(q)=M()-q смещение оценки (для несмещенных
оценок b(q) = 0), I - единичная матрица. Из неравенства (2.3) следует, что
ковариационная матрица V будет неограниченной (в смысле любой нормы матрицы),
если матрица Jq - вырождена. А это указывает на то, что о некоторых компонентах
вектора q нет информации.
В связи с этим вводится понятие оцениваемости, при котором векторный параметр q
называется оцениваемым, если его фишеровская информационная матрица Jq является
невырожденной.
Несложно видеть, что информационная матрица Jq содержит как априорную
информацию, так и информацию, имеющуюся в наблюдениях входа и выхода системы.
Так как
p(u, q)=p(u|q) p(q), (2.4)
то в соответствии с (2.2) матрица Jq представляется в виде
Jq =Ja +Ju , (2.5)
где Jа=M{ [ Сq log p(q)][Сq log p(q)]T} (2.6)
дает априорную информацию о параметре q, а
Ju=M{Сq log p(u, q)[Сq log p(u, q)]T} (2.7)
определяет информацию, которая содержится в наблюдениях u=(xT,YT); Y-
наблюдаемая реализация случайной величины Y; p(q) - плотность априорного
распределения вероятности параметра q; p(u, q) - плотность условного
распределения величины U относительно q. Если в наблюдениях u не имеется
информации о параметре q, то Ju = 0, где 0 - нулевая матрица, и проведение
наблюдений за входом и выходом системы не позволяет уменьшить априорной
неопределенности (ее будем представлять матрицей J) относительно параметра q. В
связи с этим вводится понятие оцениваемости векторного параметра q по
наблюдениям.
Параметр q называется оцениваемым по наблюдениям u, если наблюдения входа и
выхода системы позволяют уменьшить априорную неопределенность относительно q,
т.е. J< J.
Рассмотрим модель Гаммерштейна типа (1.16), предположив, что нелинейность F(t)
разлагается в конечный ряд с неизвестными коэффициентами ai:
F(t)=, (2.8)
где ji - линейно -независимые функции на интервале (-Ґ,Ґ).
Тогда уравнение (1.16) удобно записать в виде
Yk=aTjkq+xk, (2.9)
где jk =||jI(xk-j)|| (i=, j=) - матрица размерности n(m+1);
а = (а1,а2,...,an) T - n - мерный вектор.
Определим требования, которым должен удовлетворять класс входных
последовательностей для модели Гаммерштейна, чтобы весовые коэффициенты q и
коэффициенты a нелинейности были бы оцениваемыми в среднем при отсутствии
априорной информации о параметрах (Jaq,= 0).
В работе [47] доказано, что если входной сигнал системы является стационарной
последовательностью, двумерная плотность p(xk-m,xk-u) распределения вероятности
которой положительная для всех фиксированных моментов времени (k-m) и (k-u), то
параметры aОA и qОq являются оцениваемыми в среднем (соответствующие области А
и q допустимых значений параметров совпадают с евклидовым пространством без
начала координат).
Действительно, в данном случае плотность условного распределения выходной
последовательности
p(z|x,a,q)=constexp. (2.10)
Тогда матрица
(2.11)
будет положительно определенной, если каждая из матриц
(2.12)
(2.13)
является положительно определенной.
Из (2.12) и (2.13) видно, что параметры a и q не могут быть нулевыми.
Следовательно, соответствующие области А и q допустимых значений параметров a и
q совпадают с евклидовыми пространствами Еn и Em+1 за исключением начала
координат a = 0, q = 0, где 0 - нулевой вектор. Тогда матрицы (2.12) и (2.13)
для всех aОA и qОq будут положительно определенными, если матрица
(2.14)
является положительно определенной. В работе доказана положительная
определенность матрицы при условии положительности двумерной плотности
распределения p(xk-m,xk-n). Следовательно, информационная матрица вида (2.11)
положительно определенная и параметры модели Гаммерштейна aОA и qОq являются
оцениваемыми в среднем по наблюдениям входа и выхода системы (2.1).
2.2. Нерекуррентное оценивание параметров модели Гаммерштейна
Среди нерекуррентных методов оценивания параметров модели Гаммерштейна
различают:
графо-аналитические;
введение дополнительного возмущения;
корреляционные;
частотные;
метод предсказания ошибки;
метод наименьших квадратов и различные его модфикации.
Если графо-аналитические методы использовались в основном в самых ранних
исследованиях модели Гаммерштейна [48] и в дальнейшем не получили своего
развития, то все остальные методы широко используются в настоящее время. Так
как наличие нелинейной части в модели существенно затрудняет ее исследование,
наибол