Вырожденные задачи оптимального управления и оценивания в робототехнике, навигации и аэрогравиметрии

Автор:

Болотин Юрий Владимирович

Тип работы:

докторская

Год:

2002

Количество страниц:

287

Артикул:

181111

179 грн

Содержимое

Оглавление
Введение 6
1 Инвариантная стабилизация статически неуправляемых систем 26
1.1 Реализация движения с заданной синергией...................... 26
1.1.1 Определение статической управляемости ...................... 27
1.1.2 Определение синергии........................................ 28
1.1.3 Алгоритм реализации синергии................................ 29
1.1.4 Требование инвариантности условий устойчивости........ 36
1.1.5 Примеры условий инвариантности ............................. 39
1.1.6 Инвариантный алгоритм реализации синергии .................. 10
1.2 Стабилизация статически неустойчивых походок шагающих роботов
методом заданной синергии ......................................... 43
1.2.1 Уравнения движения.......................................... 44
1.2.2 Индекс статической неуправляемости походки............ 46
1.2.3 Походки с индексом статической неуправляемости, равным
единице................................................ 48
1.2.4 Определение синергии по программной траектории ............. 49
1.2.5 Условия геометрической устойчивости синергии ............... 51
1.2.6 Примеры геометрически устойчивых походок.............. 52
1.2.7 Построение периодической походки с заданной синергией . . 53
1.2.8 Реализация движения с заданной синергией ................... 53
1.3 Обсуждение результатов........................................ 56
2 Оптимальная стабилизация статически управляемых систем 57
2.1 Задача инвариантной оптимальной стабилизации статически управляемых систем с переменными связями .................................... 58
2.1.1 Постановка задачи инвариантной стабилизации ................ 58
2.1.2 Условия оптимальности распределения усилий............ 63
2.1.3 Условия инвариантности................................ 64
2.1.4 Условия асимптотически оптимальной инвариантной стабилизации: случай быстрого выхода на синергию 64
2.1.5 Условия асимптотически оптимальной инвариантной стабилизации: случай медленного выхода на синергию 68
2.1.6 Замечания .................................................. 71
2.2 Задача управления многоногим шатающим аппаратом............... 74
2.2.1 Общий критерий оптимального распределения усилий ... 74
2
2.2.2 Минимизация квадратичного критерия качества распределения опорных реакций................................................ 77
2.2.3 Минимизация максимального значения опорных реакций . . 77
2.2.4 Реализация условий непроскальзывания Кулона в точках
опоры........................................................ 78
2.3 Гипотеза инвариантности Фельдмана в биомеханике..................... 80
2.3.1 Постановка задачи оптимального инвариантного распределения усилий......................................................... 80
2.3.2 Решение задачи оптимального распределения усилий .... 82
2.3.3 Стретч-функция Ф&пьдмана..................................... 82
2.4 Обсуждение результатов.............................................. 83
3 Оптимизация робототехнических систем по критерию минимума биомеханической работы 84
3.1 Общие свойства задачи минимизации энергозатрат....................... 85
3.1.1 Определение функционала биомеханической работы............... 85
3.1.2 Оценки энергозатрат снизу.................................... 86
3.1.3 Энергетически оптимальные траектории статически управляемых систем...................................................... 89
3.2 Оптимизация конструкции и траекторий движения манипулятора . 92
3.2.1 Задача минимизации энергозатрат при перемещении грузов 93
3.2.2 Оптимальные траектории движения манипулятора ................ 94
3.2.3 Условия оптимальности конструкции манипулятора............... 96
3.2.4 О корректности предельного перехода к модели манипулятора с невесомыми звеньями........................................... 99
3.2.5 Оптимизация конструкции манипулятора с невесомыми звеньями .............................................................103
3.3 Энергетически оптимальное управление двуногой ходьбой ..............108
3.3.1 Постановка задачи оптимизации ходьбы и бега..................108
3.3.2 Необходимые условия экстремума...............................111
3.3.3 Классификация участков траекторий............................113
3.3.4 Случай жестких траекторий....................................115
3.3.5 Классификация типов походок..................................116
3.3.6 Результаты численных расчетов................................117
3.4 Модельные оценки энергетики двуногой ходьбы и бега..................120
3.4.1 Энергетика бега . 120
3.4.2 Энергетика ходьбы с заданной высотой центра масс.............121
3.4.3 Маятниковый способ ходьбы....................................122
3.4.4 Сравнение энергетики ходьбы и баа..........................123
3.4.5 Учет энергетики переносимой ноги.............................124
3.4.6 Некоторые численные оценки ..................................125
3.4.7 О точности построенной оценки энергозатрат...................126
3.4.8 Об учете ударных эффектов....................................128
3.5 Обсуждение результатов..............................................129
3
4 Статистические критерии и алгоритмы оценивания по угловым
измерениям 131
4.1 Сравнение некоторых подходов......................................131
4.1.1 Анализ наблюдаемости цели но угловым измерениям..........131
4.1.2 Методы оценивания по угловым измерениям....................133
4.2 Систематические ошибки оценивания координат по данным угловых
измерений.........................................................137
4.2.1 Модель измерений при наличии погрешностей..................138
4.2.2 Оценивание в декартовых координатах........................138
4.2.3 Оценивание в угловых переменных............................140
4.3 Алгоритмы решения вырожденных задач оценивания по угловым
измерениям........................................................141
4.3.1 Уравнения динамики и измерений.............................142
4.3.2 Анализ наблюдаемости.......................................143
4.3.3 Оценивание траекторий......................................145
4.3.4 Редуцированная задача оценивания ..........................147
4.3.5 Результаты моделирования...................................149
4.4 Обсуждение результатов............................................152
5 Условия вырожденности задачи оценивания по угловым измерениям 153
5.1 Наблюдаемость механических систем по угловым измерениям ... 153
5.1.1 Проективная наблюдаемость механических систем..............154
5.1.2 Условия проективной наблюдаемости общей линейной системы.................................................................157
5.1.3 Обобщение на случай нескольких проективных измерений . 159
5.2 Сферическая наблюдаемость и гладкость границы области достижимости ...............................................................161
5.2.1 Связь геометрии области достижимости и сферической наблюдаемости .......................................................161
5.2.2 Связь сферической и проективной наблюдаемости..............165
5.2.3 Структура оптимальною управления...........................166
5.3 Обсуждение результатов ............................................168
6 Методы решения задачи авиационной гравиметрии 170
6.1 Задача аэрогравиметрии.............................................171
6.1.1 Современное состояние аэрогравиметрии .....................171
6.1.2 Описание задачи аэрогравиметрии ...........................176
6.2 Модели гравитационного поля.......................................181
6.2.1 Определение гравитационной аномалии........................181
6.2.2 Задача редукции аномалии...................................181
6.3 Стохастическое оценивание аномалии................................187
6.3.1 Стохастическая модель аномалий.............................187
6.3.2 Стохастическая редукция аномалии...........................188
6.4 Задача оценивания аномалии на галсе полета........................192
6.4.1 Спектральная плотность аномалии на гаасе...................192
4
0.4.2 Идеализированное уравнение измерений........................193
6.4.3 Покомпонентное оценивание поля .............................194
0.4.4 Совместное оценивание компонент поля........................194
6.5 Некоторые стохастические модели аномалии..........................195
0.5.1 Гауссова модель.............................................195
0.5.2 Модель Шварца...............................................196
6.5.3 Многослойная массовая модель................................196
6.5.4 Марковская модель...........................................198
6.6 Основное уравнение аэрогравиметрии................................200
6.6.1 Вывод основного уравнения аэрогравиметрии...................200
6.6.2 Основное уравнение скалярной аэрогравимерии.................203
6.6.3 Решение основного уравнения аэрогравиметрии.................205
6.7 Идентификация динамической модели гравиметра......................213
6.7.1 Задача определения механических параметров..................214
6.7.2 Алгоритм адаптивной идентификации...........................215
6.7.3 Передаточная функция гравиметра.............................217
6.8 Построение карт аномалий..........................................218
6.8.1 Построение карт аномалий в частотной области................219
6.8/2 Согласование галсов в пространственной области..............222
6.8.3 Построение карт аномалий в пространственной области . . . 226
6.9 Обсуждение результатов............................................228
Литература 228
Приложения 241
А Результаты моделирования локомоционных систем 241
А.1 Математическое моделирование антропоморфного шагающего аппарата с электродвигателями постоянного тока ........................... 241
АЛЛ Параметры модели ...........................................241
А.1.2 Построение синергии.........................................241
А.1.3 Структура системы управления................................245
АЛ .4 Результаты моделирования ...................................248
А/2 Моделирование стояния человека с децентрализованным алгоритмом управления.........................................................249
А.2.1 Уравнения движения..........................................249
А.2.2 Модель кинематики мышц......................................250
А.2.3 Результаты моделирования....................................252
А.З Оптимизация двуногой ходьбы: доказательство вспомогательных результатов .............................................................254
А.3.1 Свойства участков оптимальных траекторий ...................254
А.3.2 Условия склейки участков траекторий.........................257
А.3.3 У’словия оптимальности траекторий...........................259
5
В Результаты обработки экспериментальных данных аэрогравиметрии 265
В.1 Аэрогравиметрическая система АГК.....................................265
В.1.1 Испытания 1998.05.15, 1998.05.17 иод Вологдой.................266
В. 1.2 Испытания 1999.07.02 в Чехии .................................267
В.1.3 Испытания 2000.05.31-2000.06.02 на Ладоге ....................269
В. 1.4 Оценка работы системы.........................................272
В.2 Аэрогравиметрическая система ГРАВИТОН................................276
В.2.1 Идентификация параметров струнного гравиметра..................276
В.2.2 Ошибка сходимости гравиметров.................................278
В.2.3 Построение карт гравитационного ноля но полетам в августе
1999 ........................................................ 278
В.2.4 Оценка работы системы.........................................279
В.З Инерциально - гравиметрический комплекс МАГ-1........................283
В.3.1 Устройство и программное обеспечение комплекса................283
В.3.2 Условия полетов...............................................284
В.3.3 Оценка работы системы....................................... 285
В.4 Пути дальнейшего повышения точности аэрогравиметрии..................287
6
Введение
В диссертации изучаются вырожденные задачи оптимального управления и оценивания траекторий движения механических систем, возникающие в робототехнике, навигации и аэрогравиметрии. Под вырожденностью здесь понимается свойство либо неединственности решения, либо его плохой обусловленности (высокой чувствительности к изменению параметров или начальных условий). Вырожденные задачи называются также некорректно поставленными. Вырожденные задачи естественно возникают в различных приложениях теории управления, в частности в робототехнике, где естественно формулируемые критерии оптимальности оставляют свободу при проектировании алгоритмов управления. Вырожденные задачи оценивания часто называются не(пполне) наблюдаемыми. Среди вырожденных задач оценивания можно упомянуть, например, различные задачи оценивания сил по движению, включающие операцию дифференцирования. Одной из таких задач является задача авиационной гравиметрии. Многие задачи инерциальной и корректируемой навигации также являются не вполне наблюдаемыми.
Для решения вырожденных задач не применимы стандартные методы оптимального управления и оценивания, и само понятие решения нуждается в уточнении. Обычно при решении вырожденных (некорректно поставленных) задач используют методы, основанные на теории регуляризации задач A.II. Тихонова, то есть возмущения функционала качества и приближенного приведения задачи к невырожденной. При этом построенное решение определяется вводимым возмущением, что не всегда удобно. Математически близким к методу регуляризации подходом является постановка задачи минимизация на области неединственности решения некоторого дополнительного критерия качества. Если последний критерий не является атрибутом задачи, его минимизация может привести к построению решения с нежелательными свойствами. Поэтому актуальной является проблема разработки методов решения вырожденных задач, не связанных с изменением критерия качества.
Вырожденные задачи оптимального управления и оценивания рассматривались многими авторами. Упомянем в этой связи имена А.Н. Тихонова, H.A. Па-русникова, Е.А. Мудрецовой, K.P. Schwarz, A.N. Payne.
Как и всякие системы с особенностями, вырожденные системы трудно поддаются обобщению. В диссертации выделено и исследовано несколько достаточно общих классов вырожденных задач, относящихся к робототехнике, навигации и аэрогравиметрии.
К числу рассмотренных практических задач относятся задача стабилизации статически неустойчивых локомоционных роботов, задача обеспечения непро-скальзывания в точках контакта конечностей робота с опорой, задача энергети-
7
ческой оптимизации конструкции и траекторий движения манипулятора с гидроприводом, задача оценивания траекторий движущихся объектов по угловым измерениям, задача определения аномального гравитационного поля Земли по измерениям удельной силы с борта летательного аппарата.
Методы решения вырожденных задач, предлагаемые в диссертации, основаны на включении задачи в некоторое семейство задач, и поиске алгоритма управления, оптимальность которою обеспечивается одновременно для всех задач семейства. Указанные алгоритмы называются в диссертации инвариантными. Достоинства инвариантных алгоритмов проявляются как в расширении области их применимости в сравнении с алгоритмами, оптимальными для одной задачи. В качестве параметризации семейства задач могут рассматриваться, например, параметры системы, начальные условия, или внешние возмущения.
Понятие вырожденной задачи оптимального управления можно ввести формально как задачи f(u) -4 min, и € U с неединственным решением. Инвариантным оптимальным алгоритмом управления является алгоритм, обеспечивающего оптимальность для всех задач из некоторого семейства. А именно, предлагается вместо вырожденной задачи решать задачу поиска такого иж € Ы, что
Vy 6 У : /(ti„y) = min/(t£,y) (1)
и ей
Множество У выбирается настолько большим, чтобы сформулированная задача имела единственное решение.
Здесь следует отметить, что понятие инвариантного алгоритма управления было введено в середине 20 века Б.Н. Петровым в связи с задачей построения систем управления летательными аппаратами, как закона обратной связи, приводящего управляемую систему к системе, определенные свойства которой не зависят от действующих на систему возмущений, и в таком понимании в дальнейшем изучалось (и изучается) многими авторами. Это направление также рассматривается в диссертации.
Целесообразность предлагаемой постановки задачи связана с наличием естественного семейства задач, на котором существует инвариантный оптимальный алгоритм управления. В диссертации показано, что такие семейства существуют для ряда важных вырожденных прикладных задач управления. В качестве приложений рассмотрены задачи стабилизации статически неустойчивых локомо-ционных роботов, оптимального распределения усилий роботов - манипуляторов, локомоционных роботов и мышц биомеханических систем, оптимизации энергозатрат биомеханических систем.
Вырожденные задачи оптимального оценивания в теории навигации называются также ненаблюдаемыми. В диссертации показано, что в некоторых вырожденных задачах оптимального оценивания, в которых траектория определяется по измерениям неоднозначно, целесообразно рассматривать задачу описания всею множества траекторий с имеющимся набором измерений. Подобное описание несет больше информации, чем выделение единственной оптимальной траектории.
Заметим, что в теории оценивания известны методы, основанные на декомпозиции - явном выделении переменных, по которым задача регулярна, и решение задачи в этих переменных. К таким методам относятся, например, методы деком-
8
позиции линейных задач оценивания на наблюдаемую и ненаблюдаемую подсистемы по мерам оцениваемости, разработанные H.A. Парусниковым. Результаты диссертации, посвященные вырожденной задаче оценивания по угловым измерениям, сводятся к постановке (1) и распостраняют результаты H.A. Парусникова на специальный нелинейный случай.
В диссертации рассмотрена также задача аэрогравиметрии, то есть оценивания аномалии гравитационного поля Земли по измерениям ускорения летательного аппарата. Эта задача является вырожденной. Специфика задачи состоит в том, что она имеет бесконечное число степеней свободы. Задача решена методом регуляризации А.Н. Тихонова, в его стохастической интерпретации.
В полученных результатах автор опирался на работы следующих авторов.
В области теории жесткого управления: А.Н. Тихонов, A.B. Васильева,
В.Ф. Бутузов, И.В. Новожилов, К).Г. Мартыненко, А.И. Кобрин, Е.С. Пятницкий.
В области робототехники: H.A. Бернштейн, Д.Е. Охоцимский, А.К. Платонов, И.В. Новожилов. В.В. Белецкий, В.В. Лапшин, А.М. Формальский, Д.Е. Девянин,
A.B. Ленский.
В области теории оценивания: H.A. Парусников, А.И. Овсиевич, В. De Moor, vS. Van Haffel, V.J. Aidala, A.N. Payne, F.D. Gorecki, J.L. Speyer.
В области аэрогравиметрии: А.Ю. Ишлинский, H.A. Парусников, Е.А. Мудре-цова, K.P. Schwarz, М.E. Halliday, В. Торге.
Диссертация состоит из шести глав и двух приложений.
В первых трех главах рассматривается задача управления механическими системами
Здесь х — n-мерный вектор координат, L(t, i) = Т(х, x)~U(x) — функция Лагранжа, Т(х,х) — квадратичная по скоростям кинетическая энергия, U(x) — потенциальная энергия (включающая энергию пассивных управляющих сил), Qi,...,Qm — активные управляющие силы, ft (я),.. . ,<7т(#) - координаты управляющих приводов.
В первой главе рассматриваются т.н. статически неуправляемые системы, для которых число тп' = rank (dq/dx) независимых управлений меньше числа п степеней свободы (в противном случае система называется статически управляемой). Для статически неуправляемых систем не всякое программное движение является реализуемым. Поэтому задача построения программного движения, удовлетворяющего заданным условиям периодичности или выхода на требуемое терминальное многообразие, включает в себя решение краевой задачи. Для систем, функционирующих в изменяющихся внешних условиях (например, для мобильных роботов), это приводит к необходимости решать краевые задачи в режиме реального времени, что не всегда осуществимо на практике. Предлагаемый в первой главе подход к решению подобных задач основан на асимптотической декомпозиции системы
(2) на статически управляемую и неуправляемую подсистемы.
Данный подход основан на понятии синергии, введенном Н.А. Бернштейном применительно к биомеханике человека понятии синергии как некоторый клас-
(2)
9
са движений. Бернштейн предположил, что множество движений человека представляет собой некую иерархическую структуру, где различные классы движений являются подмножествами некоторых более широких классов.
Математический аппарат управления, позволяющий реализовать движение с заданной синергией, предложен И.В.Новожиловым. Аппарат основан на методах жесткого управления, введенных И.В.Новожиловым применительно к управлению гироскопическими системами, и основанных на теории сингулярно возмущенных задач А.Н.Тихонова и А.Б. Васильевой. Этот аппарат получил название метод заданной синергии. Дальнейшее развитие методы жесткого управления и заданной синергии получил в работах И.В. Новожилова, Ю.Г. Мартыненко, А.И. Кобрина,
В.В. Калинина, С.М. Геращенко и др.
В первой главе ставится и решается задача построения т.н. инвариантных алгоритмов реализации синергии. Инвариантность здесь означает применимость алгоритма к задаче реализации любой наперед заданной синергии из определенного класса.
Движение рассматривается в ограниченной области В конфигурационною пространства. Вводится определение синергии как многообразия Q размерности 1>п-т! в В, по которому предписано (и возможно) движение. Алгоритм управления строится в виде жесткой нелинейной обратной связи но отклонениям от синергии. Установлены достаточные условия на характер обратной связи, при которых алгоритм асимптотически обеспечивает реализацию заданной синергии. Эти условия доказаны методами теории сингулярно возмущенных дифференциальных уравнений А.Н. Тихонова и A.B. Васильевой. Формулировка и доказательство указанных результатов потребовало анализа движения в трех разных масш табах фазовых переменных, что является новым подходом в теории сингулярно возмущенных дифференциальных уравнений.
Далее рассмотрен вопрос о том, когда существует инвариантный алгоритм реализации синергии, для которого указанные условия выполнены независимо от выбора синергии. Показано, что для существования инвариантного алгоритма необходимо наличие в системе так называемых инвариантных координат Si(t), ... удовлетворяющих дифференциальному уравнению
двг (х) \д2ь] -і dq
дх дх2 дх
Кроме того, необходима возможность параметризации синергии £ инвариантными координатами, то есть задания синергии уравнением <?(:г) = qd(s(x)), где да(з) -некоторые гладкие функции переменных б-(т) = ($і(т),..., 5|(х)). Функции q(i(s) называются программными значениями координат приводов. Заметим, что эта параметризация является избыточной.
Использование термина ’’инвариантные координаты” связано с тем, что при выполнении условий (3) производные функций а* (а;) в силу системы (2) не зависит явно от управлений. Показано, что условия существования инвариантных координат определяются условиями интегрируемости Фробениуса специальной дифференциальной формы на фазовом пространстве. Приведены примеры задач робототехники, для которых эти условия выполнены.
10
Инвариантный алгоритм реализации синергии построен в виде градиент некоторой строго выпуклой по 0 € Еш силовой функции \У (0, х)
я1 = ^ в = -ц~1 [п(х)(ч - Чл) + г2(х)й - 9<()] (4)
Здесь т^х), т2(х) - весовые функции, р~1 - ’большой” коэффициент жесткости управления. Предполагается, что функция \У(9,х) для некоторых констант * > со > 0 удовлетворяет при /1 0 асимптотическому соотношению
||/2х+1М/Г(д-10,х) _ \Уоо(0,х)|| < Со//х41, где ТУ«,[9,х) - непрерывно дифференцируемая строго выпуклая функция, однородная по 9 степени х + 1.
Теорема 1 Пусть И7(в,х), И/О0((9, х) - непрерывно дифференцируемые строго выпуклые функции 0, и пусть для некоторых констант С\ > О, > 0 в области В выполнены неравенства Т\(х) > С\, т2(х) > с2. Тогда алгоритм (4) является инвариантным алгоритмом реализации синергии, то есть обеспечивает для любой синергии экспоненциальный выход на многообразие 0 с характерным временем. с2/с! и с точностью порядка р.
Результаты теоремы 1 справедливы и в случае, если в (4) добавить иепотенци-альные силы, ограниченные вместе со своими вторыми производными.
В результате декомпозиции, проведенной описанным способом, система (4) сводится к системе меньшей размерности, описывающей движение вдоль синергии, и к задаче стабилизации этой системы. Указанная задача рассмотрена в диссертации в применении к задаче управления статически неустойчивыми походками шагающих аппаратов. В этом случае синергия задается как кусочно - гладкая кривая или поверхность 0 = где поверхность соответствует движению в фиксиро-
ванной опорной фазе. Показано, что при использовании инвариантного алгоритма реализации синергии 0Р при смене опорной фазы в системе возникают переходные процессы, заканчивающиеся выходом системы на новую синергию Яр+\. В асимптотическом при р -> 0 приближении переход с многообразия £р на многообразие 9Р+1 описывается методом точечных отображений как динамическая система в дискретном времени р = 1,2,.... Введено понятие геометрической устойчивости синергии ходьбы, как требования устойчивости соответствующего смене опорной фазы точечного отображения. При выполнении условия устойчивости синергии движение шагающего аппарата вдоль синергии стремится к периодическому.
В случае так называемых походок с индексом статической неуправляемости 1 = п- га', равным единице (ходьба двуногих роботов, рысь, иноходь четырех-ногогих роботов), получены необходимые и достаточные условия геометрической устойчивости синергии. Показано, что ходьба человека удовлетворяет этим условиям. Заметим, что условия устойчивости ходьбы, близкие к установленным в диссертации, получены также А.М. Формальским при исследовании некоторых специальных систем с ударами.
В приложении АЛ рассмотрены результаты численного моделирования электромеханического двуногого шагающего аппарата с электродвигателями постоянного тока, сконструированного в Институте механики МГУ, и алгоритмом управления, основанном на описанной методике.
11
Во второй главе рассматривается задача оптимального распределения усилий при движении статически управляемых систем. Эта задача возникает при управлении роботами-манипуляторами с пальцевыми схватами, многоногими шагающими аппаратами. Интерес к этой задаче связан также с применениями в биомеханике.
Задача распределения усилий применительно к роботам-манипуляторам рассматривалась в работах F. Pheiffer, Y. Chen, М. Raibert, Д.М. Гориневского,
А.Ю. Шнейдера и др. Применительно к управлению движением шагающих аппаратов эта задача рассматривалась в работах Е.А. Девянина, A.B. Ленского, Ю.Ф. Голубева, И.Г. Колпаковой, Д.Е. Охоцимского, А.К. Платонова, В.В. Лапшина.
В большинстве работ по задаче распределения усилий задача решается или с использованием датчиков усилий в точках контакта, или вычислительными методами, при использовании которых качество работы алгоритма во многом зависит от быстродействия управляющего компьютера.
Предлагаемый в данной главе подход к задаче оптимального распределения усилий основан на требовании инвариантности алгоритма оптимального распределения усилий к изменению условий контакта с внешними телами и выбору программного движения. Существование такого алгоритма доказано в асимптотическом смысле, при стремлении параметра жесткости управления к бесконечности.
Математической основой подхода является принцип двойственности выпуклых задач оптимизации. Показано, что вместо решения задачи минимизации функционала качества распределения усилий можно сформировать управляющие воздействия как градиент специальной силовой функции. Тогда оптимальное распределение усилий обеспечивается автоматически, за счет свойств уравнений Лагранжа, описывающих движение.
Рассматривается движение статически управляемых (в смысле определения из главы 1) механических систем (4) при движении в некоторой ограниченной области В конфигурационного пространства. Предполагается, что на систему наложены голономные связи ri(#) = 0. ...,гк(х) = 0. Функции г(х) = (ri(z),. ..,г*(х)) произвольны в ограниченном подмножестве 7t пространства дважды непрерывно дифференцируемых функций х. Предполагается, что задано семейство синергий движения, определяемых соотношениями Ti(x,*) = о, = 0,
U<t<t\. Функции Г(х,*) = (ri(x,t),...rn_fc(x,t)) произвольны в ограниченном подмножестве V пространства дважды непрерывно дифференцируемых функций x,t. Предполагается также, что синергии согласованы со связями, то есть для любой связи г(-) € 71 и синергии Г(-) G V система уравнений Г(х,£) = 0, г(х) = О однозначно разрешима относительно х.
Уравнения синергии записываются в виде системы уравнений х - xd(x,t) = 0, где величины Xd(x,t) называются программными значениями координат. Заметим, что уравнения последней системы функционально зависимы.
Ставится задача построения алгоритма реализации синергии из V, явно не зависящего от наложенной на систему связи из 71 и для любой такой связи обеспечивающего при движении х(£) оптимальное распределение усилий приводов по заданному выпуклому по Q критерию F(Q, х):
F(Q(t),x(t)) = mmF(Q,x{t)), t0 < t < t[
12
Такой закон управления называется инвариантным (к наложенной связи и выбору программного режима) оптимальным алгоритмом стабилизации. Задача решена методами выпуклого анализа и теории сингулярно возмущенных систем. При этом используются результаты, доказанные в главе 1 (теорема 1). Показано, что инвариантный алгоритм стабилизации существует в асимптотическом смысле (при большой жесткости ц~1 управления) и может быть сформирован в виде
9 = в=4«1 + ч(х)6) (5)
Здесь £1 = рГи(д ~ 4(1), 62 = У~1(ц ~ 4(1) ~ рассогласования координат и скоростей приводов, яа = я(хс1(х,<)) - программные значения координат приводов, У (в, х)
- функция сопряженных к С} = ((21}.... фт) переменных 9 = (0Ь ... ,0т), двойственная по Лежандру к Г((3,х) по (}: У(0,х) = тахд {0^0 - Т\С},я)}, и > 0 -параметр, характеризующий скорость выхода па программное движение, тг(т) > О
- скалярная функция, /?. > 0 - скалярный множитель. Рассмотрены случаи V = 1,2. При V = 1 основной результат формируется следующим образом.
Теорема 2 Пусть функция И(С2, х) выпукла по функция У {9.x) непрерывно дифференцируема и строго выпукла по в на подпространстве
а ?Г\ - о-
в~дхХ’ дхХ-°'
существуют такие константы С\ > 0,с2 > 0, что т2(х) > С\, Н{х) > с^ при х (= В. Пусть, кроме того, для каждой связи из П и синергии из V существует хотя бы один закон управления, обеспечивающий движение вдоль синергии, при котором критерий качества F конечен для всех и < t < и. Тогда формулы (5) при малых р. определяют в В асимптотически оптимальный инвариантный алгоритм стабилизации.
Построенный алгоритм обладает свойствами децентрализованности, то есть если критерий качества представим в виде /'’(ф, х) = И^^х) + Г’(С}2,..., фт, :г), то управление приводами 41 н 42,-->,Ят может осуществляться независимо.
Приведены применения к задаче управления статически устойчивыми походками шагающих аппаратов (в частности, для предотвращения проскальзывания конечностей при кулоновом трении). Заметим, что другой подход к задаче распределения усилий в условиях кулонова трения, основанный на сведении задачи к задаче линейного программирования, рассмотрен Ю.Ф. Голубевым.
В приложении А.2 приведена интерпретация гипотезы А.Г. Фельдмана и И.В. Новожилова, описывающей систему управления мышцами человека, как алгоритма оптимального инвариантного распределения усилий по некоторому специальному критерию.
В третьей главе для системы (2) рассматривается задача минимизации т.н. биомеханического функционала
т
д= \у(г)с11, и '(*) = $>№*) (6)
13
Здесь a(w) — кусочно-гладкая функция, определенная формулами a(w) = a+w,w > 0; <*(w) = ot-W,w < 0. Предполагается, что функция a(w) выпукла, т.е. ог+ > 0, а+ > Величина W(t) называется биомеханической мощностью. На максимальную мощность наложены ограничения W- < W(t) < W+, где W- < W+ - некоторые константы.
Функционал (б) приближенно описывает энергозатраты как человека и животных (R. Alexander), так и робототехнических систем с объемно - дроссельным гидроприводом (Э. Льюис).
Задача минимизации функционала биомеханических энергозатрат была поставлена биомеханиками (С.Ю. Алешинский, В.М. Зациорский, R. Alexander). Как задача теоретической механики, задача была впервые поставлена в работах
В.В.Белецкого. В дальнейшем задача исследовалась применительно к двуногим и многоногим шагающим аппаратам многими авторами (В.В. Белецкий, В.Е. Бер-бюк, В.А. Самсонов, Д.Е. Охоцимский, А.К. Платонов, В.В. Лапшин). Отметим, что в работах указанных авторов использовался метод численной параметрической оптимизации. Причина - трудность рассматриваемой задачи, связанная с несладкостью и невынуклостыо функционала биомеханических энергозатрат.
В данной главе проводится теоретическое исследование задачи минимизации функционала биомеханических энергозатрат. Показано, что этот функционал обладает рядом интересных свойств вырожденности, позволяющих, в частности, поставить и решить задачу оптимизации конструкции для целого класса программных движений. Приводятся применения к задаче управления роботом - манипулятором и при управлении динамическими походками шагающих механизмов.
Подинтегральная функция в (6) является нелинейной, негладкой в точках, где Qi(/i = 0, и невыпуклой, гак что задача оптимизации (6) является весьма нетривиальной даже для простейших механических систем. Первые результаты по оптимизации этого функционала (в случае а- = -а+) получены В.В. Белецким методом параметрической численной оптимизации.
В диссертации впервые найдено теоретическое решение задачи. Для этого наряду с задачей минимизации функционала (6) рассматривается задача минимизации вспомогательного функционала
при ограничениях W- < a(N(t)) < W+. Траектории, минимизирующие J', названы квазиоптимальными.
Введено следующее определение. Траекториями наибыстрейшего разгона и торможения называются траектории, состоящие из трех участков: разгона /+, где q(JV(£)) = W+, движения Р, где N(t) = 0, и торможения /”, где a(N(t)) = W_. Траекториям, состоящим из указанных участков, сопоставлена символическая последовательность ... Т+Р1~ ..., называемая типом траектории.
Полное решение задачи получено для случая статически управляемых систем, в которых число m независимых приводов не меньше числа п степеней свободы. Показано, для таких систем квазноптимальная траектория является или траекторией наибыстрейшего разгона и торможения типов /+Р/~, /_Р/+, или неедин-
14
ственной. В последнем случае функционал Лг обладает свойством вырожденности - его величина локально не зависит от траектории движения.
Следующее утверждение устанавливает связь квазиоптимальных траекторий с траекториями экстремального быстродействия для статически управляемых систем. Пусть N*(0 - зависимость мощности от времени на квазиоптимальной траектории.
Теорема 3 Если максимум и минимум энергии на квазиоптимальной траектории достигается во внутренней точке отрезка Ц < t < то траектория является траекторией наибыстрейшего разгона - торможения типа 1+Р1~ или 1~Р1+, причем управляющие силы па ней определяются формулами
№(«) А. ди
о / ;3'1с а
2 дх*
эт аи . л
^--2-, . = 1..т (7)
На участке движения с постоянной энергией квазиоптималъпая траектория совпадает с отрезком брахистохроны. Если же этот участок полностью отсутствует, то квазиоптимальная траектория совпадает с траекторией максимального быстродействия с ограничениями И7- < а(Лг) < И7+.
Затем исследуется задача энергетической оптимизации конструкции приводов и траекторий движения гидравлического манипулятора, для которого число степеней свободы п совпадает с числом управляющих приводов т. Под конструкцией приводов при этом понимается зависимость координат приводов 71 (я),..., Ят(х) от обобщенных координат х. Возможность решения поставленной задачи напрямую связана со свойством вырожденности биомеханического функционала, благодаря которому одна и та же конструкция оказывается оптимальна для многих траекторий.
Теорема 4 Энергетически оптимальными траекториями движения манипулятора являются траектории наибыстрейшего разгона и торможения РУР а оптимальными схемами подключения приводов - такие схемы, что на траектории наибыстрейшего разгона и торможения в каждый момент времени механические мощности приводов 1 < » < п имеют одинаковые знаки.
Рассмотрена задача оптимизации траекторий и конструкции сборочного манипулятора, переносящего различные предметы внутри некоторой рабочей зоны В из начальной точки х+ в конечную точку хТаким образом, семейство задач У представляет собой множество пар точек рабочей зоны В. Используя свойство вырожденности функционала энергозатрат, показано, что в определенных предположениях задача оптимизации конструкции имеет решение, общее для всех пар точек (£_,£+) Е В.
Заметим, что одно из найденных условий оптимальности конструкции манипулятора - активность при движениях лишь части приводов - для биомеханических систем согласуется с предложенным И.В. Новожиловым описанием кинематики мышц человека в рамках так называемой глобальной сгибательной синергии.
15
В качестве примера решены задачи оптимизации конструкции манипулятора, действующего в невесомости, и с малоинерционными звеньями. Описан предельный переход при стремлении массы звеньев к нулю. Приведена полная классификация конструкций манипуляторов с малоинерционными звеньями.
Далее в третьей главе рассмотрена модельная задача оптимизации биомеханического функционала для статически неуправляемых и статически неустойчивых систем при построении энергетически оптимальных одноопорных походок двуногого шагающего аппарата с точечными стопами. Задача решена с использованием методов принципа максимума JI.C. Понтрягина при наличии фазовых ограничений, разработанных А.Я. Дубовицким и A.A. Милютиным. Из-за особенности по-динтегральной функции в точках, где ф = 0, применение этих методов потребовало разбиения траектории на отрезки, где <& сохраняют знак для всех 1 < i < m, и исследования условий оптимальности отдельно на этих отрезках и в точках стыка этих отрезков. Доказано, что для шагающего аппарата, в отличие от манипулятора, помимо участков типов 1+,1~,Р, возможен еще участок типа S - движения на выпрямленной опорной конечности (по фазовому ограничению). Получена следующая классификация оптимальных одноопорных походок (участки траектории нумеруются от середины к концу опорной фазы)
Теорема 5 Возможны следующие типы энергетически оптимальных походок
5/ ь - ходьба
SI+P — медленный бег
SPI+P} SPI~I+P, PI+P — медленный бег с разгрузкой 1+Р — быстрый бег
Тем самым подтверждена гипотеза В.В. Белецкого, что ’’естественные” походки человека являются энергетически оптимальными. Технически громоздкая часть доказательства теоремы вынесена в приложение А.З.
Приведенная теорема сводит задачу оптимизации энергетики ходьбы к задаче минимизации функции четырех переменных. Методом численной минимизации показано, что один из типов походок, приведенных в теореме, а именно SPI~I+P — является неоптимальным. Описана бифуркация при переходе от одного типа походок к другому с увеличением средней скорости движения. Эта бифуркация относится к типу сборки Уитни. Методом численного моделирования построена зависимость энергозатрат от параметров движения — скорости и длины шага.
С учетом полученной классификации оптимальных походок предложена методика приближенной оценки энергозатрат и выбора типа оптимальной походки, основанные на анализе безразмерных характеристик движения - числа Фруда 7 — V/y/Lg (V - средняя скорость движения, L - длина шага) и относительной массы конечностей. Проведено сравнение величины энергозатрат для походок, рассмотренных разными авторами. Последний результат получен совместно с В.В. Белецким.
В четвертой и пятой главах рассмотрены задачи оценивания траекторий по угловым измерениям.
Необходимость оценивания параметров движения объекта по результатам угловых измерений возникает в различных областях астрономии и навигации. Угловые
16
измерения широко применяются в задачах самонаведения. Они имеют два важных преимущества - простота аппаратной реализации и пассивность, позволяющая осуществлять скрытое наблюдение. Кроме того, многие эффективные алгоритмы самонаведения, например пропорциональная навигация, естественно формулируются как линейная обратная связь по данным угловых измерений (R. Stansfield, R. Singer). Начиная с 1960-х годов, разнообразные задачи оценивания но угловым измерениям возникли в связи со спутниковой навигацией.
Оценивание по угловым измерениям сталкивается с трудностями, обусловленными нелинейностью, а также плохой наблюдаемостью ряда практически важных задач. Причем часто ненаблюдаемость является скрытой, т.е. может быть выявлена только после тщательного анализа структуры системы. Теории оценивания по угловым измерениям посвящена обширная литература (Л. Speyer, А. Payne, F. Gorocki, V. Aidala).
В диссертации задача оценивания по угловым измерениям рассматривается как вырожденная задача оптимального оценивания. Для этого проводится строгий анализ наблюдаемости задачи, выделяется наблюдаемое подпространство, а затем проводится оценивание в наблюдаемом подпространстве. Этот подход отличается от наиболее распостраненного подхода, основанного на модификациях расширенного фильтра Калмана (J. Speyer, V. Aidala), при котором делается попытка оценить составляющие движения вне наблюдаемого подпространства. Последняя задача является математически некорректной, и приводит к высокой чувствительности алгоритмов к ошибкам измерений. Алгоритмы, предлагаемые в диссертации, лишены указанного недостатка.
В четвертой главе исследуется задача оценивания траекторий rv(t) G R3 движущихся объектов в трехмерном пространстве но угловым измерениям с борта наблюдателя, движущегося но траектории rQ(t) . Угловые измерения обычно записываются в следующем виде (Л. Speyer)
Здесь гьг2,г3 — компоненты вектора г = г„ - г0 относительных координат, <р — азимут цели, $ — ее возвышение, 6(р, 8д — ошибки измерений. Отличительной особенностью угловых измерений является их существенная нелинейность и особенность при г = 0.
Приведен обзор различных известных подходов к задаче. Получены асимптотические формулы, позволяющие оценить смещение и дисперсию ошибки оценки для широкого класса рекурсивных алгоритмов оценивания. Показано, в ситуации вырождения, то есть в ненаблюдаемых и плохо наблюдаемых случаях, традиционные алгоритмы оценивания, в частности основанные на расширенном фильтре Калмана, оказываются неработоспособными.
Проведен анализ наблюдаемости задачи. В известных в литературе критериях наблюдаемости (A.N. Payne, F.D. Goreeki) предполагается, что наблюдаемый объект движется по инерции или с постоянным ускорением. В диссертации рассмотрен более общий случай, когда траектории движения объекта и наблюдателя описываются общими уравнениями авторегрессии. При этом предполагается, что
(В)
17
измерения проводятся в дискретные моменты времени.
Поясним используемую модель движения и ее связь с моделями движения A.N. Payne, F.D. Gorecki. Движение объекта с постоянной скоростью или ускорением описывается дифференциальным уравнением = 0. где п = 2,3. В дискретном времени t — t\, • • • Дл’, в котором проводятся наблюдения с постоянным интервалом дискретизации i*+1 - tk = At., это дифференциальное уравнение можно записать в виде специапыюго уравнения авторегрессии вида (1 - q)nrv(tk) = 0. Здесь q - оператор ’’сдвига назад”, действующий по закону qTv(tk) — rv{tk-i)- В диссертации предполагается, что движение объекта и наблюдателя описывается общим уравнением авторегрессии вида
Здесь а(<?) = а.0 4- ад + Н апдп - полином п-го порядка со скалярными коэффициентами относительно оператора ’’сдвига назад” аи(<) - известное управление наблюдателя. Эго обобщение позволяет применять полученные результаты к задаче оценивания траекторий маневрирующей цели.
Угловые измерения записываются в эквивалентном (8) виде
Здесь п € §2 - единичный вектор направления на объект, <5а(2) - погрешность измерений.
Следуя ІІ.С. БіапзГіеІб, Б.С. Иагсіопе, модель угловых измерений (10) изменяется следующим образом: не различаются измерения, отличающиеся знаком а. Такие измерения называются модифицированными угловыми измерениями.
Чтобы сформулировать полученные в диссертации условия наблюдаемости, запишем систему в пространстве состояния. Состояние объекта определяется последовательностью п относительных координат Я(1к) = (г(£*+1),..., г(£*+п)). Множество траекторий объекта отождествляется с Зп-мерным пространством начальных условий Л(Ьі). Пусть Я, //, Є - соответствующая авторегрессии переходная матрица от Я(к) к Л(г*+і), матрица при управлении и матрица при измерении соответственно. Тогда относительное движение объекта и наблюдателя описывается формулами г(**) = Щк+і) = ЯЯ(к) - Ни(к).
Определение 1 Матрица псевдонаблюдаемости Ф размера. ЗАГ х 3п есть Ф = (Фі,...,Ф^), где блок Ф* размера 3 х 3п определен формулой Ф*і?(£і) = п(гк) х GFAг-1Л(^l), к = Сингулярные числа ф\ > ... > Фзп матрицы Ф (т.е.
квадратные корни из собственных чисел матрицы ФФТ^ называются мерами наблюдаемости траектории объекта. Ненаблюдаемым подпространством называется ядро матрицы Ф.
Траектория объекта ненаблюдаема, если и только если столбцы Ф линейно зависимы. Размерность совпадает с числом нулевых мер наблюдаемости.
Теорема 6 Траектория объекта ненаблюдаема по модифицированным угловым измерениям, если и только если его относительные координаты в движении
О)
a{t) = п(і) - Sa{t), n(t) = pHij
(10)
18
могут быть записаны в виде г(£*) = SkGFk~l(S © 0)-1Л(^), где Sk, к = 1,..., N — произвольная• скалярная последовательность, S — (si,...sn) — ее начальная
ненаблюдаемого подпространства удовлетворяет неравенству 0 < сИтПя < п.
Здесь символ О обозначает тензорное (Кронекеровское) произведение матриц. Траектории, принадлежащие ненаблюдаемому подпространству и отличные от истинной траектории, называются псевдорешениями задачи оценивания.
Далее рассмотрена задача оптимального оценивания траекторий при наличии погрешностей угловых измерений (5а но методу максимума правдоподобия (ММП) в предположении нормальности и равиоточности ошибок измерений, то есть задача максимизации плотности распределения ошибок ..., 5е*(г^)) при
ограничениях (10), (9). Показано, что если траектория объекта ненаблюдаема по угловым измерениям, то функция плотности имеет вырожденный максимум. Степень вырождения совпадает с размерностью ненаблюдаемого подпространства П#. В плохо наблюдаемом случае, когда наименьшие меры наблюдаемости ф, малы, свойства решений задачи ММП зависят от интенсивности шума а. При малых о < трзп функция р(да) имеет единственный максимум вблизи истинной траектории. При увеличении о происходит бифуркация, и максимум смещается в сторону псевдорешения (ложного локального максимума). Чем хуже наблюдаемость, тем быстрее скачок от истинного решения к псевдорешению. Отсюда видно, что применение для решения задачи ММП прямых численных методов оптимизации градиентного или ньютоновского типа, таких как фильтр Калмана, вызывает определенные трудности, поскольку в процессе оптимизации возникают трудно прогнозируемые скачки от решения к псевдорешению.
Основываясь на приведенных результатах, предложен новый алгоритм оценивания, сохраняющий работоспособность в ненаблюдаемых случаях. Показано, что задача ММП эквивалентна задаче обобщенных расширенных наименьших квадратов (ОРИК) вида
относительно ЗМг-мерного вектора X = (Я(*1),..., ЩЬ^)) и специальной ЗЛГ х 3-мерной матрицы Д. Здесь матрицы А, В, С, Б формируются по известным матрицам Е, (?, II.
Задача называется невырожденной, если ее решение X, Д существует и единственно. Для вырожденной задачи размерность пространства решений X называется степенью вырождения. В случае, когда С имеет максимальный ранг по строкам, а О —по столбцам, проблема сводится к обычной задаче расширенных наименьших квадратов (Van Loan).
Предложение 1 В рассматриваемом случае задача (11) всегда имеет, по крайней мере, одно решение. Если траектория объекта наблюдаема по угловым измерениям, то при а 0 решение задачи (11) дает состоятельные и эффективные оценки траектории. Если траектория объекта ненаблюдаема, то задача ММП
серия, а матрица О определена формулой Or = (G ••• GEn~l)r. Размерность
(П)
Задача (11) общего вида впервые решена в работах S. Van Haffel и В. DeMoor.
19
ьмеетп вырожденный максимум, а задача (11) вырождена. Степень вырождения совпадает с размерностью ненаблюдаемого подпространства
Здесь под состоятельностью понимается стремление ошибок оценки к нулю при о 0. Эффективность понимается в смысле Крамера - Рао, как стремление дисперсии ошибки оценки к ее теоретической нижней границе.
В ненаблюдаемом случае в диссертации ставится задача оценивания всего ненаблюдаемого подпространства Формулируется модифицированная задача ОРНК степени (I как задача определении возмущения Д минимальной нормы, для которого уравнения (11) имеют д +1 линейно независимых решений.
Теорема 7 Если размерность ненаблюдаемого под-пространства Пя равна (I, то решение модифицированной задачи ОРНК степени с1 при о —> 0 дает состоятельные оценки ненаблюдаемого подпространства Пя-
Таким образом, в случае ненаблюдаемости траектории решение модифицированной задачи обобщенных расширенных наименьших квадратов позволяет корректно определить то, что наблюдаемо, а именно ненаблюдаемое подпространство.
Размерность рассмотренной задачи ОРНК в приложениях очень велика. В диссертации введена также редуцированная задача ОРНК, где размерность вектора X снижена до Згг. Эта задача также дает состоятельные (но не эффективные) оценки. Рассмотрен алгоритм решения редуцированной задачи ОРНК, основанный на методе обобщенного сингулярного разложения матриц с ограничениями, принадлежащем В. ОеМоог, и требующий умеренного объема вычислений.
Приведен пример оценивания траектории баллистической ракеты на активном участке. Численными расчетами показано, что в определенных условиях эффективность редуцированного алгоритма сравнима с нижней границей Крамера - Рао.
В пятой главе задача оценивания по угловым измерениям обобщается на случай общих линейных систем с непрерывным временем и наблюдениями вида
х = Ах, г = Сх (12)
Здесь вектор состояния х принадлежит тг-мерному векторному пространству, вектор измерений 2 принадлежит т-мерному векторному пространству. Изложенные в пятой главе результаты получены совместно с С.Н. Моргуновой. Эти результаты обобщают результаты А.М. Овсиевича [77]. Понятие угловых измерений и наблюдаемости по угловым измерениям обобщается для случая системы (12) следующим образом.
Определение 2 Измерения г'(£), 0 < £ < <ь называются проактивно (сфе-
рически) эквивалентными, если г'(1) = Х(£)г(1) для некоторой ненулевой (положительной) функции А(£). Траектория х(£) называется проективпо (сферически) наблюдаемой, если для любой траектории х’(1) с проективпо (сферически) эквивалентными измерениями выполняется равенство х'{Ь) = /х(£)х(£) для некоторой ненулевой (положительной) функции /г(£). Система (12) называется проективпо (сферически) наблюдаемой, если у нее нет. проективпо (сферически) ненаблюдаемых траекторий.
20
Можно считать, что сферические измерения принадлежат сфере §та-1, а проективные измерения принадлежат проективному пространству Р"*'1. Р1з сферической ненаблюдаемости следует проективная. Из проективной ненаблюдаемости следует сферическая ненаблюдаемоегь при достаточно малых 1у > 0. Заметим также, что имеет смысл также понятие комплексной проективной наблюдаемости, где яМ» МО принимают комплексные значения. Вещественная и комплексная проективная наблюдаемость не всегда эквивалентны.
Пусть А, 2 - пространства кососимметрических матриц размера п х п, тхт соответственно. Введем линейную систему с вектором состояния П є X и вектором измерения Ф Є 2, заданную формулами
й = АП, Ъ = СП (13)
Здесь операторы Л, С на пространстве кососимметрических матриц заданы формулами АП = АО + ПАТ, СО = СПС1. Система (12) называется Л - наблюдаемой, если система (13) является линейно вполне наблюдаемой. Если система (12) является Л - наблюдаемой, то она проективно наблюдаема.
В диссертации исследуется более сложная проблема нахождения необходимых условий проективной наблюдаемости (невырожденности) задачи. Показано, что эти условия тесно связаны с наличием у системы механической (гамильтоновой) структуры.
Сначала рассматривается частный случай консервативной механической системы с фазовыми переменными х = (д, д), где д = (д\к = п/2 -обобщенные координаты, и мерным вектором измерений г = д
4 + 2Гд + Кд = 0, г—д (14)
Здесь Г - кососимметрическая матрица гироскопических сил, а К - симметрическая матрица жесткостей. Показано, что для механических систем критерий Л -наблюдаемости не работает: любая механическая система вида (14) Л - ненаблю-даема.
Теорема 8 Механическая система (14) проективно непаблюдаема, если и только если существует собственное подпространство Сх матрицы К - Г2, на котором все собственные значения указанной матрицы совпадают (и равны некоторому х Є С), инвариантное относительно группы ортогональных преобразований схр(П).
Изложенные выше результаты справедливы как в вещественном, так и в комплексном случае. Следующее определение ограничивает рассмотрения комплексным случаем. Две системы вида (12) называются проективно эквивалентными, если одна получается из другой заменой переменных х' = ц(і)х, где р(і) = ехр(-И), а V — комплексная константа.
Теорема 9 Если система (12) является А - ненаблюдаемой, то существует такая система координат д^ ..., дь, ц>х,..., У)п~2к в пространстве X,
что подпространство V = {гс» = 0.1 < г < п — 2/с} инвариантно относительно
21
систелш (12), причел* па V эта система проективно эквивалентна гамильтоновой системе
дії дН
р = _^’ 2 = С9'
Теорема показывает, что в комплексном случае в определенном смысле вопрос о проективной наблюдаемости общих линейных систем сводится к вопросу о проективной наблюдаемости гамильтоновых систем.
Приведен ряд примеров, относящихся к задачам самонаведения и орбитальной навигации. Приведены также некоторые обобщения результатов на случай, когда в системе имеется несколько угловых измерений:
х = Ах, = С\х,..., = Сьх (15)
Здесь 2, принадлежит -мерному векторному пространству. Для системы (15) в определении 2 проективной или сферической наблюдаемости функция А(£) заменяется на набор функций А і (і), • • •, АДг).
Далее исследуется связь вещественной проективной и сферической наблюдаемости системы (15) и геометрии множества достижимости в сопряженной задаче управления
ь
У = '-АГУ + X! ^Пі> Пі € ^ <16)
і—1
Здесь П* - замкнутые строго выпуклые множества в Нт‘ с гладкой границей. Для заданного интервала движения 0 < £ < областью достижимости Х>Єі системы (16) называется множество точек, достижимых из хо при ц*(£) Є на этом интервале |47|.
Теорема 10 В условиях нормальности задачи оптимального управления (по Л. С. Понтрягипу) граница области достижимости дТ>т гладкая, если и только если система (15) сферически наблюдаема на отрезке 0 < і < Т.
В шестой главе рассмотрена задача аэрогравиметрии, то есть определения аномального гравитационного поля Земли по съемкам с борта летательного аппарата (ЛА). Исследования по аэрогравиметрии проводились в рамках работ Лаборатории управления и навигации МГУ под руководством Н.А. Парусникова. Излагаемые в шестой главе результаты принадлежат в основном автору. Часть результатов получены совместно с В.В. Тихомировым и М.Ю. Попеленским.
Задача аэрогравиметрии является сравнительно новой (первые положительные результаты получены в 1990-х годах). В основе аппаратного решения задачи аэрогравиметрии лежит установленная на борту летательного аппарата (ЛА) аэрогравиметрическая система, в рассматриваемом в диссертации случае состоящая из горизонтируемой гироплатформы с установленным на ней высокоточным акселерометром - гравиметром. Система использует дополнительную позиционную информацию, получаемую от приемников спутниковой навигационной системы (СНС), работающих в фазовом дифференциальном режиме. Информация гироплатформы, гравиметра и СНС записывается на борту летательного аппарата
22
для последующей постобработки с целью определения аномального гравитационного поля.
Задача аэрогравиметрии относится к классу задач обратных задач механики - оценивания силы по траектории движения. Эта задача является математически некорректной (вырожденной) — малые ошибки измерений могут привести к сколь угодно большим ошибкам определения аномалии. Причем вырожденность задачи проявляется дважды - при дифференцировании и редукции ноля на поверхность геоида. Вырожденность задачи в терминах теории оценивания эквивалентна ненаг блюдаемости. Теоретическим и практическим вопросам аэрогравиметрии посвящена обширная литература (К.Р Schwarz, O.S. Salychev, Y. Hammada, В. Торге).
Обычно задача аэрогравиметрии решается чисто информационными методами, в рамках теории фильтрации шумов (К.Р Schwarz). В диссертации задача рассмотрена с точки зрения теории оценивания траекторий механических систем. Показано, что вырожденность задачи в терминах теории оценивания эквивалентна ненаблюдаемости. Рассмотрены как математическое содержание задачи аэрогравиметрии, так и практические методы и алгоритмы обработки информации. Для выделения наблюдаемых переменных используются методы регуляризации при решении некорректных задач, основанные на стохастической гипотезе и ММ П. С практической точки зрения новым является интегральный подход, основанный на сквозной оптимизации решения, начиная от задачи определения аномалии на галсе полета и заканчивая задачей построения карт аномалий, и потенциально позволяющий повысить точность.
Новым также является подход к задаче определения аномалии на галсе, основанный на идентификации параметров системы в полете и определении возмущений с учетом нелинейных, мультипликативных моделей погрешностей. Показано, что основное уравнение аэрогравиметрии на галсе в проекции на географическую вертикаль может быть записано в виде
v{t) = f(t) + fE(t) + XTc(t) + Go(t) + Ag(t)
v' = v + öv, r/' + /' = / + <>7
d = c + 6c (17)
Здесь Ад - искомая аномалия, / — вертикальная удельная сила, действующая на чувствительный элемент гравиметра, fE — известные инерциальиые поправки, связанные с кривизной референц - геоида и вращением Земли, G0 — нормальное значение ускорения силы тяжести, v - вертикальная составляющая скорости гравиметра, с — возмущающие факторы, X — вектор неизвестных коэффициенты
влияния возмущающих факторов, т — постоянная времени гравиметра. Штрихом обозначены измеряемые величины, символом 5 — ошибки измерений.
Мультипликативные погрешности возникают из-за включения погрешностей 5с в модель измерения возмущающих факторов (17). При традиционном подходе (K.P. Schwarz, О.С. Салычев) эти погрешности либо не учитываются, и задача решается обычным методом наименьших квадратов, либо коэффициенты X определяются путем калибровки в лабораторных условиях. Определение X методом наименьших квадратов приводит к смещенности в оценке X, и, как следствие, к смещенности оценки Ад. Лабораторная калибровка в условиях базирование ЛА -носителя не всегда возможна.
23
В диссертации задача оптимального оценивания аномалии ставится с учетом погрешностей 6с но методу максимума правдоподобия
р(Ад, 6су 6у,6/, Х\{\ с') -* шах
Показано, что в предположении, что искомая аномалия и погрешности измерений являются стационарными гауссовскими случайными процессами, задача ММП сводится к последовательному решению задачи обобщенных расширенных наименьших квадратов типа (11) по определению X и задачи наименьших квадратов по определению аномалии Ад. Рассмотрены как оптимальные алгоритмы решения задачи, так и субоптимальные алгоритмы, основанные на сглаживании Калмана, обладающие свойством несмещенности.
Рассмотрен также более общий случай, когда X является не постоянным вектором, а описывается неизвестными линейными дифференциальными уравнениями с постоянными коэффициентами. В этом случае задача определения X решается методами теории идентификации в пространстве состояний.
После того, как оптимальная несмещенная оценка аномалии на галсе получена, задачи согласования галсов и построения карт аномалий в редакции Фая (т.н. редукция в свободном воздухе, т.е. без учета топографических поправок) решаются итерационным (по номеру добавляемого галса) методом наименьших квадратов.
Решение задачи построения карты определено следующим образом. Пусть г"(1),... ,г"(п) - координаты узлов карты, г(1),..., г(т) - координаты
точек, в которых получена оценка аномалии на галсе. Пусть Ад = (Д</(г(1)),..., Д#(г(т))) - неизвестные истинные значения аномалии на галсе, Ад” = (Др(г"(1)),..., Д(/(г"(п))) - неизвестные истинные значения аномалии в узлах карты. Предполагается известной оценка аномалии на галсе Ад = (Д#(г(1),.. .,Ад(т(тп))). Ставится задача оценка значений аномалии в узлах кар-тыД/ = (Дг(г"(1)),...,Д?(г>))).
Показано, что добавление галса к набору данных аэрогравиметрии приводит к
-— а
следующему изменению оптимальной в среднеквадратичном карты Ад :
Рдд = НПггЙ* + Рбдбд + Рдх.9±
^9" 9" = &9"9" ~ Вд"д"Н^ Р^НОдЧд"
Ад[ = Ад + Од^НТР^{Ад - НАд)
Н = РРдднР^'у Рдхдх = Рд9 ~ НРд"дгНТ
Здесь - ковариационная матрица оценок значений аномалии в точках галса, II - матрица оператора стохастической проекции истинных значениям аномалии в узлах карты на значения аномалии в точках оценки аномалии на галсе, ^ -матрица оператора сглаживания на галсе, Р$дбд - ковариационная матрица ошибок оценки аномалии на галсе. Матрица II определена формулой И = 1гРдд»Рд, Матрица Рд^31 есть ковариационная матрица невязки указанного оператора проекции Н, определенная формулой Р9±д± = Р99 - НР^дпН7.
Ковариационная матрица Р^дп значений аномалии в узлах карты и ковариационная матрица Рдд значений аномалии в точках галса определяется но известной априорной спектральной плотности аномалии.
24
Заметим, что новизна этого утверждения связана с тем, что в нем через матрицу- Р явно учтены характеристики метода сглаживания, использованного при оценке аномалии на гапсе полета. В традиционных методах построения карт, ориентированных на задачи наземной и морской гравиметрии, влияние методов сглаживания на галсе мало и не учитывается (Е.А. Мудрецова).
В приложении В приведены примеры применения разработанных методов решения задачи аэрогравиметрии при обработке результатов летных испытаний нескольких аэрогравиметрических систем. Оценка точности определения аномалии проводилась как по сравнению с известными наземными данными, так и по повторяемости при линейной съемке и расхождению в точках пересечения галсов при площадной съемке.
В диссертации используются следующие обозначения. Жирными буквами обозначаются векторы в трехмерном пространстве. Длина (|г|| вектора г обозначается г. Знак х обозначает векторное; произведение, знак • - скалярное произведение векторов. Знак хт обозначает операцию транспонирования вектора или матрицы. Знак О обозначает покомпонентное (кронекеровское) умножение матриц. Символ I обозначает единичную матрицу.
25
Глава 1
Инвариантная стабилизация статически неуправляемых систем
С прикладной точки зрения управляемые механические системы можно разделить на два класса - статически управляемые, где число независимых управлений (приводов) не меньше числа степеней свободы системы, и статически неуправляемые. Среди робототехнических систем к первому классу относятся манипуляторы, ко второму - различные мобильные роботы, в частности шагающие аппараты. В данной главе рассматриваются методы построения и реализации программных движений статически неуправляемых систем.
В основу подхода к построению алгоритмов управления в данной главе положено понятие синергии, введенное Н.А.Бернштейном [18) применительно к биомеханике человека понятии синергии как некоторый класса движений. Бернштейн предположил, что множество движений человека представляет собой некую иерархическую структуру, где различные классы движений являются подмножествами некоторых более широких классов.
Математический аппарат управления, позволяющий реализовать движение с заданной синергией, предложен И.В.Новожиловым [73] и автором [20]. Аппарат основан на методах жесткого управления, введенных И.В.Новожиловым применительно к управлению гироскопическими системами [72]. Этот аппарат получил название метод заданной синергии. Дальнейшее развитие метод заданной синергии получил в работах [59], [21], [22].
В данной главе ставится и решается задача построения т.н. инвариантных алгоритмов реализации синергии. Инвариантность здесь означает применимость алгоритма к задаче реализации любой наперед заданной синергии из определенного класса.
Приведены применения разработанных методов к задаче стабилизации статически неустойчивых походок шагающих роботов.
1.1 Реализация движения с заданной синергией
Для статически управляемых механических систем реализуемо любое не слишком быстрое программное движение, согласованное с фазовыми ограничениями.
26

Вы здесь

Вырожденные задачи оптимального управления и оценивания в робототехнике, навигации и аэрогравиметрии

Содержимое