Оглавление
1 Вспомогательные теоремы 11
1.1 Принцип максимума Понтрягина для задач с фазовыми ограничениями .......................................................И
1.2 Теорема об инвариантном многообразии диффеоморфизма ... 13
2 Задача с интегральным ограничением на управление 15
2.1 Автомодельные решения в задаче с симметрией.................15
2.1.1 Постановка задачи.....................................15
2.1.2 Выход на границу фазового ограничения со счетным числом касаний.................................................18
2.1.3 Отображение последования Пуанкаре Г —» Г..............23
2.1.4 Построение оптимального синтеза.......................26
2.1.5 Гамильтонов формализм. Инвариантный интеграл Гильберта.......................................................30
2.2 Возмущенная задача .........................................33
2.3 Лагранжевы многообразия в возмущенной задаче................40
3 Задача с локальным ограничением на управление 45
3.1 Автомодельные решения в задаче с симметрией............... 45
3.1.1 Постановка задачи.....................................45
3.1.2 Выход на границу фазового ограничения со счетным числом переключений............................................47
3.1.3 Отображение последования Пуанкаре Г —> Г..............52
3.1.4 Построение оптимального синтеза.......................59
3.1.5 Гамильтонов формализм. Инвариантный интеграл Гиль-берта.......................................................64
3.2 Возмущенная задача .........................................67
3.3 Лагранжевы многообразия в возмущенной задаче................75
4 Слоение Риба в задаче с фазовыми ограничениями 81
4.1 Накопление точек контакта с границей........................81
4.2 Оптимальный синтез, определяющий слоение Риба ..............86
2
Введение
Современная теория оптимального управления берет свое начало от работ Л.С. Понтрягина и его учеников 11—4]. Одной из основных задач данной теории Л.С. Понтрягин считал задачу построения синтеза оптимальных траекторий, т. е. описание топологической структуры фазового портрета всех оптимальных траекторий, отвечающих заданным начальным условиям. Этой фундаментальной задаче посвящены работы целой плеяды математиков (5-14|.
Одним из направлений развития оптимального управления является теория оптимальных задач с фазовыми ограничениями [15-22]. Данная работа посвящена изучению оптимального синтеза для двух классов задач с фазовыми ограничениями.
Рассмотрим простой пример. А именно, на плоскости заданы две точки, которые нужно соединить нерастяжимой нитью минимальной длины. Очевидно, что ответом служит отрезок соединяющий эти точки. Предположим на плоскости есть препятствие, внутрь которого нить не может заходить. Для простоты возьмем препятствие в форме круга. Пели отрезок соединяющий точки не пересекает круг, то решение останется прежним. В противном случае, решение, очевидно, будет состоять из отрезка, дуги окружности и еще одного отрезка. Причем прямые на которых лежат отрезки должны касаться окружности.
Формализуем эту задачу и попробуем получить уже известное решение исходя из принцип максимума Понтрягина [4].
Т —> т/, х = и. |гг| < 1, гб(О) = аго, х(1) = где х, и £ Ж2. Согласно принципу максимума составляем Гамильтониан
Я(р, х, и) = -А0 + ри и выписываем необходимые условия оптимальности
дН / \
V — и = агдтах^^г (рь).
То есть
Это означает, что движение происходит с единичной, постоянной по направлению скоростью. И, следовательно, чтобы попасть из заданной точки в заданную нужно двигаться по отрезку их соединяющему. Получили ответ, который ожидали.
Теперь добавим фазовое ограничение
|х| > Я.
Классический принцип максимума Понтрягина к данной задаче уже не применим. Однако оказывается, что его можно уточнить следующим образом [19]. В тех точках оптимальной траектории, в которых она выходит на границу фазового ограничения, сопряженные уравнения нужно изменить следующим образом
г)Н
Ф = - -^-ф - КОФ. (О-1)
здесь 1/(Ь) — вектор, ортогональный фазовому ограничению, и направленный внутрь ’разрешенной5 области, а с1£ — неотрицательная мера Радона. То есть в нашем случае
ф = = 0 при |ж(*)| > Я.
Исходное дифференциальное уравнение на сопряженную переменную р существенно изменилось. Оно стало уравнением связывающим моры на отрезке [О, Т]. Это типичная ситуация для задач с фазовыми ограничениями. Для широкого класса задач можно доказать [19], что мера не имеет сингулярной составляющей, то есть может быть представлена в виде суммы двух мер: непрерывной и дискретной Используя этот факт и проведя
несложные выкладки можно получить искомый ответ в виде двух отрезков и дуги окружности.
Таким образом, несмотря на то, что рассмотренная задача очень проста в своей формулировке, для ее решения уже недостаточно классического принципа максимума. Необходимо его усиление для класса задач с фазовыми ограничениями.
Первые результаты по данной тематике [4, Гл. 6], 115,16] были получены Л.С. Понтрягиным и Р.В. Гамкрелидзе одновременно с открытием принципа максимума. Рассмотрен частный, но важный случай задач оптимального управления в которых на оптимальную траекторию накладывается следующее ограничение. Предполагается, что число участков оптимальной траектории на которых движение происходит но границе и строго внутри фазового ограничения конечно. В данных предположениях получены необходимые условия оптимальности для участков траектории, проходящих по границе
I
4
фазового ограничения [4, Th. 22]. Вне границы, очевидно, выполнен классический принцип максимума. Также получены важные условия склейки участков оптимальной траектории лежащих на границе и внутри фазового ограничения [4, Th. 24]. Л именно, показано, что вектор функция сопряженных переменных может иметь разрыв первого рода в точках склейки, а направление разрыва должно быть ортогонально границе фазового ограничения. Рассмотренный выше пример, очевидно, удовлетворяв!' указанным предположениям.
Дальнейшее развитие теория принципа максимума при наличии фазовых ограничений получила в работах [17,18] А.Я. Дубовицкого, A.A. Милютина и работах [19,20] A.A. Милютина. Данными авторами были получены необходимые условия оптимальности для достаточно широкого класса задач. Ограничения на оптимальную траекторию, которые предполагались в предыдущих работах уже не накладываются. Основным изменением в принципе максимума Поитрягина для задач с фазовыми ограничениями в форме Дубовицкого-Милютина является форма сопряженных уравнений. А именно, из разряда обыкновенных дифференциальных уравнений они перешли в разряд уравнений связывающих меры на отрезке [£o>£i]« Необходимость использования уравнений более общего характера связана с тем, что в качестве множителей Лагранжа для задач с фазовыми ограничениями в принципе максимума выступают не функции, а меры с носителем в точках выхода оптимальной траектории на границу фазового ограничения. Примером уравнения связывающего меры является уравнение (0.1).
Необходимые условия оптимальности для задач с фазовыми ограничениями полученные Л.С. Понтрягиным и Р.В. Гамкрелидзе являются частным случаем принципа максимума Понтрягина в форме Дубовицкого-Милютина. Чтобы осуществить необходимое сведение в принципе максимума в форме Дубовицкого-Милютина нужно взять меру, непрерывную по мере Лебега па интервалах времени, где оптимальная траектория проходит по границе фазового ограничения, и имеющую дискретную составляющую в точках выхода оптимальной траектории на границу.
Согласно теореме Лебега о разложении мер [23] произвольную меру Лебега-Отилтьеса можно представить в виде суммы трех мер — непрерывной, дискретной и сингулярной. Большое значение с практической точки зрения имеют условия при которых мера, фигурирующая в принципе максимума, не будет содержать сингулярной составляющей. В этом случае уравнения принципа максимума существенно упрощаются. Такие условия были получены в работе [19, Гл. 3] A.A. Милютина. В практических задачах условия отсутствия сингулярной составляющей меры выполняются. Дискретная же со-
ставляющая часто не равна нулю. Возникает вопрос: как устроен носитель дискретной составляющей меры?
Наличие и свойства дискретной составляющей тесно связаны с понятием глубины фазового ограничения. В соответствии с определением A.A. Милютина глубина фазового ограничения — это число дифференцирований функции, задающей фазовое ограничение, необходимое, чтобы получить функцию явно зависящую от управления. В задачах с фазовым ограничением глубины 1 дискретная составляющая меры, как правило, отсутствует (19]. В примере, который был приведен вначале, фазовое ограничение имеет глубину 1, а мера, ему соответствующая, не имеет дискретной составляющей. В задачах с фазовым ограничением глубины 2 дискретная составляющая меры, как правило, появляется, но на каждом конечном интервале времени имеет не более конечного числа скачков [25, Разд. 2.1). Если фазовое ограничение имеет глубину 3 и болсс возникают ситуации, когда существуют конечные отрезки времени на которых дискретная составляющая меры имеет счетное число скачков и, следовательно, есть точки их накопления.
Данная работа посвящена изучению задач с фазовыми ограничениями глубины 3. Отправной точкой исследования послужили работы Г. Роббинса |24]* и A.A. Милютина [25,26]. В работе Г. Роббинса была рассмотрена следующая задача
и, ?/(*,)> У&)> * = 1,2 —фиксированы.
Она имеет замечательное свойство — группу симметрий. А именно, если рассмотреть замену переменных
то задача, за исключением граничных условий, перейдет в себя. С использованием данного свойства задачи и ее выпуклости в работе (24] были найдены автомодельные решения, которые выходят на границу фазового ограничения посредством счетного числа учащающихся касаний границы. В точках касания дискретная составляющая меры отлична от нуля, а сопряженные переменные претерпевают разрыв. Таким образом мера в данной задаче имеет дискретную составляющую с предельной точкой.
В работе А.А. Милютина [25] исследуется некоторое обобщение задачи (0.2). Вводятся дополнительные переменные
(0.2)
(t,y,y,y,u) -> (t/\,\6y,\5y,\4y,\3u),
6
которые позволяют записать минимизируемый функционал в терминальной форме x(t{) 4- £(ti) —> inf. И далее исследуются экстремали, решения уравнений принципа максимума Понтрягина в форме Дубовицкого-Мшпотина, без учета граничных условий. То есть, в дополнение к функционалу задачи (0.2), результаты полученные A.A. Милютиным применимы и к другим функционалам зависящим только от граничных условий.
Одним из результатов работы A.A. Милютина является описание всех возможных экстремалей в данной системе уравнений принципа максимума. Доказано, что кроме автомодельных экстремалей, найденных Г. Роббинсом, только одна экстремаль может выйти на фазовую границу, причем в отличие от автомодельных экстремалей она не имеет накопления точек касания с границей при подходе к точке выхода.
В работе [25] также рассмотрена следующая задача
Примечательно, что качественные свойства экстремалей этой задачи аналогичны свойствам экстремалей задачи (0.2). Отличия заключаются в форме ограничения на управление. В задаче (0.2) ограничение на управление носит интегральный характер, а в задаче (0.3) локальный.
В диссертации для изучения задач (0.2), (0.3) используется новый подход. Приведем основные результаты полученные для задачи (0.2) и изложенные в Главе 2. Для второй задачи результаты аналогичны (см. Главу 3).
Во-первых, для задачи (0.2) построен полный синтез оптимальных траекторий в полупространстве у > 0. Качественно он заключается в следующем. Существует семейство автомодельных траекторий, которые прежде чем попасть в начало координат совершают счетное число касаний фазовой границы. Они заполняют в полупространстве у > 0 поверхность гомеоморф-ную конусу. Кроме автомодельных траекторий в начало координат приходит еще одна траектория, которая, в отличие от автомодельных, но имеет других точек касания с границей кроме начала координат. Оптимальные траектории общего положения, прежде чем попасть в начало координат, выходят на указанный конус автомодельных траекторий и далее продолжаются подходящей траекторией из этого конуса. Таким образом, в точках сопряжения автомодельных и не автомодельных траекторий нарушается левосторонняя еди нственность.
/(ля доказательства оптимальности построенного синтеза использована техника лагранжевых многообразий. В точке выхода на фазовое ограничение
(0.3)
tu y{ti)i y(ti), y{U)j г = 1,2 — фиксированы.
7
лагранжевое многообразие имеет особенность, так что при подходе к ней каждая индивидуальная траектория претерпевает скачок. Это не мешает, однако, использовать технику инвариантного интеграла Гильберта для доказательства лаграпжевости многообразия, заполненного траекториями построенного семейства.
Во-вторых, в работе выделен класс возмущенных задач близких к задаче (0.2). Близость понимается в том смысле, что главная часть, относительно группы симметрий, уравнений принципа максимума Понтрягина для возмущенной задачи должна совпадать с уравнениями принципа максимума для задачи (0.2).
Для построения оптимального синтеза возмущенной задачи и доказательства того факта, что качественно он совпадает с таковым у невозму! цепной задачи, использована следующая техника. Рассматривается отображение последования Пуанкаре границы фазового ограничения в расширенном фазовом пространстве на себя. Оно строится следующим образом. Из точек границы выпускаются траектории принципа максимума Понтрягина, причем из каждой точки выпускается одноиараметрическое семейство траекторий в зависимости от величины скачка дискретной составляющей меры. Часть таких траекторий никогда больше не пересекается с границей, часть ’пробивает’ границу в некоторый момент времени и выходит из допустимой области и существует одна единственная траектория, которая лишь касается границы в некоторый момент, а затем вновь возвращается в допустимую область. Отображение последования Пуанкаре исходной точке границы ставит в соответствие указанную точку повторного касания границы.
Отображение последования для невозму щепной задачи (0.2) имеет особенность в нуле. Автомодельным траекториям отвечает инвариантная кривая приходящая в начало координат. А поскольку задача симметрична относительно замены £ —> —имеется аналогичная кривая отвечающая автомодельным траекториям выходящим из начала координат. В возмущенной задаче в общем случае автомодельность нарушается. Поэтому, чтобы доказать существование траекторий, имеющих счетное число точек касания с границей, накапливающихся к нулю, нужно доказать существование инвариантной кривой у отображения последования Пуанкаре.
Поступаем следующим образом. Делаем замену переменных, которая разрешает особенность отображения последования Пуанкаре в нуле. У модельной задачи в новых переменных снова будет две инвариантные кривые. Однако теперь они будут выходить не из одной точки начала координат, а из двух разных точек. Обозначим их А±. Такая замена переменных обычно называется сг-раздутием. В качестве примера с-раздутия можно привести переход
8
- Київ+380960830922