Исследование анормальных и вырожденных задач оптимального управления и нелинейного анализа

Автор:

Карамзин Дмитрий Юрьевич

Тип роботи:

Докторская

Рік:

2012

Артикул:

321634

179 грн

Вміст

ВВЕДЕНИЕ
Диссертационная работа посвящена исследованию анормальных и вырожденных задач, возникающих в различных областях оптимизации и нелинейною анализа. Работа состоит из пяти глав, содержание которых соответствует следующим направлениям исследования:
1. Расширение классического вариационного исчисления на задачи с разрывными траекториями. Оптимальное импульсное управление.
2. Оптимальное управление. Принцип максимума Л.С. Понтрягина для задачи с фазовыми ограничениями.
3. Теория вещественных квадратичных отображений. Условия существования регулярных нулей квадратичных отображений.
4. Исследование гладких отображений в окрестности анормальной точки. Теоремы об обратной функции и необходимые условия экстремума второго порядка в анормальных задачах оптимизации.
5. Необходимые условия локального минимума второго порядка в анормальных задачах оптимального управления.
Содержание всех пяти глав тесно связано между собой. Так, например, результаты гл. 3 существенно используются в гл. 4, а гл. 1, 2 и 5 посвящены теории оптимального управления. Результаты гл. 2, 5 могут быть с легкостью перенесены на задачи импульсного управления, исследуемые в гл. 1. В гл. 5 же показывается как результаты гл. 4 могут быть применены к исследованию анормальных (локально неуправляемых) задач оптимального управления (см. [43]).
Работа организована следующим образом. Во введении последовательно разъясняется специфика каждого из направлений, указанных выше. Приводятся краткая история и “философия” этих вопросов. Формулируются некоторые основные результаты. В самих же главах 1-5 приведены все строгие формулировки и доказательства.
0.1 Расширение классического вариационного исчисления на задачи с разрывными траекториями.
Теория оптимального импульсного управления
По всей видимости, Карл Вейсрштрасс был одним из первых математиков, кто придал значение тому факту, что не все задачи вариационного исчисления имеют классическое гладкое или хотя бы непрерывное решение. Причем, не имея классических решений, такие задачи могут оставаться вполне физически значимыми. Хорошо известный пример такой ситуации иллюстрируется следующей задачей вариационного исчисления.
Это есть задача о нахождении поверхности вращения, задаваемой контуром х(£), площадь которой была бы наименьшей из всех возможных; а физически - просто мембраны, натянутой на два параллельных диска радиусов Ях и Я2 соответственно. Применение условий Эйлера-Лагранжа приводит к дифференциальному уравнению второго порядка и краевой задаче, которая для некоторых значений параметров Ях, Я2 решения иметь не будет. И в этом есть очевидный геометрический и физический смысл, который прямо соотносится с тем, что наблюдается на практике: когда числа Ях, Я2 достаточно велики (или же когда расстояние между дисками достаточно мало) мембрана существует, а поверхность вращения гладкая. Но как только мы начнем увеличивать расстояние между дисками, мембрана будет растягиваться и в какой-то момент времени разорвется (лопнет). Математически же в этот самый момент времени гладкое и непрерывное решение задачи перестает существовать. Однако это не означает, что минимальной поверхности вращения не существует вообще. Очевидно, что в этом вырожденном случае она будет просто объединением двух
Найти минимум
(0.1)
при ограничениях х(0) = Я1} х(1) = Яг-
3
дисков и отрезка [0,1], их соединяющего. Это означает, что решение x(t) будет R\ при t = 0, #2 ПРИ t = 1 и 0 при t £ (0,1) и, таким образом, будет претерпевать разрывы. Другими словами, решение будет импульсным.
Давид Гильберт, в рамках своей известной программы (|14), 20-ая задача), предложил расширить классическое вариационное исчисление с целыо покрыть и формализовать подобного рода вырожденные ситуации и, тем самым, придать строгий математический смысл разрывным решениям. Он выразил уверенность в том, что “каждая задача вариационного исчисления имеет решение, если только термин “решение55 интерпретируется правильным образом55.
В 1920-х годах грузинским математиком А. Размадзе была предложена некоторая теория, в которой допускались разрывные решения задач вариационного исчисления, [24]. С появлением теории оптимального управления и принципа максимума Л.С. Понтрягина, [95], в 1950-х, теория разрывных решений задач вариационного исчисления значительно обогатилась и плавно влилась в теорию оптимального импульсного управления. Больше об истории расширений вариационного исчисления можно прочитать в обзорной статье [20]. Здесь лишь отметим, что свой вклад в эту теорию внесли Lebesgue, Tonelli, Warga, Young, Боголюбов, Гамкрелидзе, Кротов, Тихомиров и др.
Что изучает теория импульсного управления? Задачи импульсного управления покрывают собой широкий класс вырожденных задач классического вариационного исчисления и оптимального управления, в которых традиционных непрерывных решений не существует. Теория импульсного управления, предлагает, во-первых, тот способ, как интерпретировать понятие решения для таких задач, и во-вторых, тот путь, как обобщенное решение найти, представляя для этого какие-нибудь условия оптимальности. Основная идея здесь лежит в расширении самих понятий управления и траектории. Обычное измеримое
ограниченное управление можно заменить, например, на борелевскую меру. Действительно, с одной стороны, любая абсолютно непрерывная борелевская мера порождает интегрируемую функцию - ее производную. С другой стороны, есть меры которые нельзя связать ни с одной функцией из 1,1, например мера Дирака д'('г): мера множества А есть ноль, если т ф А и единица в противном случае. Это есть простейшее расширение класса управлений, которое, однако, уже достаточно богато и способно включить в себя много актуальных приложений.
Приведем простой пример, чтобы проиллюстрировать сказанное и показать, как возникают импульсные управления. Рассмотрим следующую задачу.
Таким образом, мы хотим минимизировать площадь под кривой#(£), которой не разрешается расти слишком быстро. Решение здесь, очевидно, существует при любом с > 1. Принцип максимума дает следующее оптимальное управление:
Однако легко увидеть, что в пределе при с +оо, минимум перестает существовать в классе непрерывных траекторий. В самом деле, достаточно рассмотреть последовательность управлений {^(4,п)} и отвечающую им последовательность траекторий хп и увидеть, что 11^«|к, —> 0 при п —» оо. Поэтому минимизирующая последовательность траекторий хп сходится поточечно к разрывной функции х(£), равной нулю при £ £ [0,1) и единице при 4 = 1.
Как определить решение задачи (0.2) при с = +оо?
Найти минимум при ограничениях х = V,
(0.2)
х(0) = 0, х(1) = 1 г;(4) Є [0,с].
если Ь < —
— с
если I >
о
Решение может быть найдено с помощью расширения множества допустимых управлений и введения импульсных управлений. Для задачи (0.2) борелевские меры оказываются подходящими на роль импульсных управлений. Например, любому обычному управлениюг>(£) можно поставить в соответствие абсолютно непрерывную меру/х с производной Радона-Никодим а V, т.е. (1ц = и{Ь)(И. Но, как уже было сказано, будут и другие импульсные управления, которые уже не могут быть сведены к обычным, например, мера Дирака 5(т).
Таким образом, обычная задача управления (0.2) расширяется и теперь уже по-новому, в рамках теории импульсных управлений, записывается следующим образом:
Найти минимум / х(Ь)сИ
•МОД]
при ограничениях йх = <1ц,
х(0) = 0, х(1) = 1,
М > о.
Здесь траектория х(Ь) принадлежит уже классу функций с ограниченным изменением и может претерпевать разрывы. При этом запись с1х = (1^1 следует понимать в интегральном смысле или на языке мер, что означает: мера, порожденная траекторией х(£), абсолютно непрерывна относительно меры /1, а ее производная относительно \х в данном случае равна единице (т.е. меры совпадают).
Основной шаг сейчас - это убедиться в существовании решения у новой задачи. Действительно, легко видеть, что оптимальная траектория в расширенной задаче существует и это: х(г) = 0 при Ь < 1, и х(1) = 1, что есть, с одной стороны, простое следствие неотрицательности функционала в задаче (0.2). С другой же стороны, и указывая на значительно более общую технику доказательства, можно сказать,
6
что существование решения будет вытекать из слабой-* секвенциальной компактности единичного шара в пространстве С*([0,1]).
Замечание 0.1 Было рассмотрено простейшее расширение задачи оптимального управления. Однако, заменив в задаче (0.2) под интегралом x(t) на x2(t) и рассмотрев ограничение на управление v €
[—с, с], при с —> ОС; легко прийти и к простейшему примеру расширения задачи классического вариационного исчисления.
В силу отмеченного свойства компактности процедура расширения для линейных динамических систем тривиальна. Сложность расширения, однако, возрастет, как скоро мы начнем рассматривать более общие управляемые динамические системы, например, вида
х = f(x,u) + g(x)v, veK, (0.3)
здесь и - обычное (классическое) ограниченное управление, функция / определяет обычную динамику,1 но v - неограниченный по евклидовой норме управляющий вектор, принадлежащий некоторому выпуклому замкнутому конусу К, и g - некоторая матричная функция.
Как описать решение в таком случае? Процедура расширения, описанная выше, уже не применима, поскольку слабые-* предельные переходы в нелинейных системах некорректны, и это демонстрируется простейшими примерами. Например, динамической системой с двумерным неограниченным управлением v — (vi, V2):
X = XV\ -I- X2V2, я(0) = 1.
Если мы постараемся расширить эту систему в класс борелевских мер, предполагая, что ||г>||л, < const (полная вариация траектории должна быть, конечно, ограниченной), то мы увидим, что каждому управлению, то есть каждой векторной мере, будет соответствовать уже целая
1 Эту функцию нам необходимо рассматривать, чтобы включить и наши рассмотрения классическую теорию оптимального управления.
7
интегральная воронка траекторий, получающихся при аппроксимации этой векторной меры абсолютно непрерывными мерами. И поэтому каждая из таких траекторий будет претендовать на звание решения динамической системы, отвечающего векторной мере.
Случай динамических систем вида (0.3) и задач управления, с ними связанных, был подробно изучен в кандидатской диссертации автора [53, 77]. Как выяснилось, борелевских мер в этом случае уже недостаточно для того, чтобы описать все возможные достижимые управления. Тогда импульсное управление оказывается чем-то большим, чем просто борелевская мера, и теперь оно - это пара (д;{г>г})> где р, борелевская мера, а {ит} - некоторое семейство обычных измеримых и существенно ограниченных функций, которое называется присоеди-пелтым семейством (его точное определение см. в п. 1.3). По своему смыслу присоединенные управления действуют на разрыве системы, т.е. в тот момент, когда происходит импульс. В работе [77] было показано, что интегральная воронка, возникающая при аппроксимации меры р абсолютно непрерывными мерами, исчерпывается траекториями, построенными по присоединенным к р семействам, и обратно, по любому присоединенному семейству можно указать на соответствующую аппроксимацию абсолютно непрерывными. Таким образом, интегральная воронка параметризуется присоединенными семействами, а с их помощью из нее удается выбрать одпу-единственную траекторию, которая и становится решением, отвечающим данному присоединенному семейству. Другими словами, присоединенное семейство есть не что иное, как способ аппроксимации векторной меры абсолютно непрерывными, или (выражаясь образным, нестрогим языком) есть “схема взаимодействия компонент векторной меры в момент импульса55.
Для системы вида (0.3) следует также отметить случай условия Фробениуса, т.е. когда векторные поля д3 - столбцы матрицы д - попарно коммутируют: дід* = д1хд3 Оказывается, что в таком слу-
8
час введение присоединенного семейства уже излишне, а интегральная воронка, о которой говорилось выше, вырождается в одну траекторию (см. в [9, 66|).
Более трудным в изучении становится тот случай, когда функция д зависит не только от фазовой переменной, но и от управления и: д = д(х,и)\ при этом динамическая система имеет вид
х = /(.т, и) 4- д(х} и)ь\ у € К. (0.4)
Легко догадаться, что в этом случае введение дополнительных управлений, действующих на разрывах, нужно даже и тогда, когда условие Фробениуса выполняется. Первая глава посвящена разбору процедуры расширения именно для системы такого общего вида, как (0.4).
Несмотря на растущую сложность процедуры расширения, появление обычного управления и при управляющей мере не является лишь чисто математическим обобщением. А именно, такие системы управления общего вида (0.4) могут оказаться полезными и в инженерных приложениях, что показывает пример из параграфа 1.2.
Приведем сейчас упрощенную версию этого примера с целью описать суть явления. Предположим, что имеется управляемый диск в К2 заданного положительного радиуса, и пусть его движение между двумя заданными точками на плоскости определяется работой четырех ракетных двигателей, как на Рис. 1. При этом мы хотим управлять диском, избегая его вращения. Поэтому линия силы тяги каждого из двигателей должна пересекать центр масс диска, см. Рис. 2. Таким образом, угол наклона каждого из двигателей 9г определяется положением центра масс.
В каждый момент времени £ мы управляем относительной тягой каждого из двигателей р, = р,(£) > 0, г = 1, 2, 3,4 и скоростью расхода топлива V = у{Ь) > 0 (которое общее для всех двигателей). При этом
Р\ + Р2 + Рз + Р4 = 1-9
Рис. 2: Угол в определяется положением центра масс
Поскольку расход топлива уменьшает массу диска т и, значит, влияет на распределение масс, естественно предположить, что положение центра масс диска не фиксировано и является некоторой функцией от га (которую мы не уточняем). Поэтому углы наклона двигателей суть тоже функции массы, т.е. 0* = 0г{т). Положим
ki(m, р) = pi cos 0] (га) — р2 sin 02(m) - p3 cos 0з(га) 4- p4 sin 04(m), Mm, p) = -pj sin 0i(m) - p2 cos02(m) + Рз sin 0з(т) 4- p4 cos 04(m).
10
Уравнения движения диска в поле тяготения Земли имеют вид:
X1 = Ь) 1,
±2 = ^2,
Здесь, (х]}Х2) и (ги^од) есть, соответственно, позиция и скорость, т - масса, которая уменьшается со временем из-за расхода топлива, ид- ускорение силы тяжести.
Предположим, что скорость расхода топлива г» сможет принимать неограниченные значения, что, понятно, является некоторой математической идеализацией физического процесса.
Роль нелинейной функции
здесь заключается в том, чтобы убедиться, что диск летит не вращаясь. Ясно, что эта функция может быть устроена весьма сложным образом и уж точно неоднородна.
Поиск управляющего режима, который бы минимизировал функционал
на множестве всех допустимых решений указанной динамической системы, приводит нас к формулировке так называемой задачи о минимальном расходе топлива, которая может возникнуть, например, в космическом маневрировании. Решения этой задачи в классе обычных измеримых управлений не существует, но его можно попытаться найти в классе импульсных управлений.
XVI
Мш»р)
т
к2(т,р) ----------V — д
т = —V.
11
Это обстоятельство указывает на необходимость корректного расширения для нелинейных систем вида (0.4). В параграфе 1.3 будет сформулирована общая задача импульсного управления как результат такого расширения. Как было уже отмечено, в силу нелинейности системы оказывается невозможным корректно пополнить пространство управлений, ограничившись лишь классом борелевских мер. Таким образом, как и в случае g = д(х), импульсное управление становится чем-то большим, чем просто мера. Импульсное управление, получаемое с помощью процедуры пополнения, - это мера плюс присоединенное семейство функций, прикрепленных к атомам меры. Эти дополнительные управляющие функции ведут траекторию системы в тот малый момент, когда происходит импульс. Таким образом расширяется понятие управления. Эта новая концепция управления получила название управления па разрывах системы.
Итак, в первой главе мы будем изучать вырожденные ситуации в оптимальном управлении, когда решение x(t) становится разрывным, а управляющая система имеет вид (0.4). Мы расширим понятие задачи оптимального управления, предложив новый тип импульсных управлений и доказав принцип максимума Понтрягина [95] для задачи импульсного управления с ограничениями. Вводимые импульсные управления содержат дополнительные (обычные ограниченные) управления, действующие на разрывах импульсной системы. Такой тип импульсных управлений можно найти в различных инженерных приложениях, в которых необходимо учитывать быстрые вариации в распределении масс механической системы за тот малый момент времени, когда происходит импульсное воздействие.
Отметим, что важный вклад в исследование импульсных управлений и смежных вопросов внесли (в нашей стране): A.B. Арутюнов,
В.И. Гурман, В.А. Дыхта, С.Т. Завалищин, H.H. Красовский, В.Ф. Кротов, А.Б. Куржанский, Д.Е. Охоцимский, Б.Т. Поляк, А.Н. Сесе-
12
кин, А.Г. Ченцов и многие другие. За рубежом это: A. Bressan, D.F. Lawden, F.L. Pereira, F. Rampazzo, R.W. Rishel, G. Silva, R.B. Vinter, J. Warga и другие. По вопросам оптимального импульсного управления существует очень обширная литература (см. наш библиографический список, который в данном случае на исчерпывающую полноту не претендует). Отдельно отметим работу [26| как важную для предлагаемого далее исследования.
Ниже, в формулировке нашей задачи также присутствуют так называемые смешанные ограничения. Это ограничения, которые имеют вид R(x,u) £ С, где х - фазовая переменная, и - управление, а С заданное замкнутое множество. Хотя существует большое количество работ по обычным задачам управления со смешанными ограничениями (см., например, [30, 44, 90] и литературу, приведенную там), импульсные задачи со смешанными ограничениями, насколько это известно автору, пока еще не были изучены. Поэтому в главе мы получаем результаты, которые заполняют этот пробел.
Приведем один из результатов главы 1. Это принцип максимума JI.C. Понтрягина в классе импульсных управлений нового типа.
Рассмотрим задачу:
' <р[р) -> min, dx = f (х, и, t)d,t -f g(x. a, t)dd, t £ T,
« p=(xo,Xj)€5, (0.5)
R(x.u, t) £ C,
. d = (д, {uT:vT}), range(^) С K.
Здесь T = [i0,*i] - фиксированный отрезок времени; p = (xoj^i)» где
Xq = z(*o), zi = z(*i); S,C - замкнутые множества; К - выпуклый
замкнутый конус в Rfc; d = (д, {uT,vT}) - импульсное управление.
Приведем точные определения импульсного управления и решения х( ), удовлетворяющего дифференциальной связи
dx — f(x, и, t)dt -h д(х, и, t)dd, t £ T, x(to) = <то, (0.6)
13
фигурирующей в (0.5). Эти определения отвечают той концепции расширения с управлениями на разрывал, о которой шла речь выше. В классе таких импульсных управлений будут справедливы теоремы существования решения филипповского типа (см. § 1.7).
Рассмотрим борелевскую векторную меру д, принимающую значения в конусе К. Через |д| обозначим ее вариацию (напомним, что вариация векторной меры д - это сумма вариаций всех ее компонент, т.е.
Обозначим через У (її) множество скалярных неотрицательных бо-релевских мер и таких, что существуют борелевские векторные меры
дината меры д* и мера |д*| сходятся слабо* в С*(Т). Пусть и Е У(ц) и т е Т. Рассмотрим измеримую функцию ут : [0,1] -> К такую, что
Здесь, д(т) := /і({т}) Е К - это значение д на одноточечном множестве {т}. Семейство вектор-функций {г/г,г>г}. которое зависит от вещественного параметра г 6 Т, назовем присоединенным к векторной мере д, если существует скалярная борелевская мера и Е У(ц) такая, что для каждого т выполняются условия (0.7), а вектор-функции ит : [0.1] —> являются измеримыми и существенно ограниченными равномерно по т.
Определение 1.2 Элемент д = (щ {ит,ут}) назовем импульсным управлением в задаче (0.5), если д - это т.акая борелевская векторная мера, принимающая значения в конусе К, что семейство вектор-функций {иг,уТ} является присоединенным к д.
д*, принимающие значения в конусе К, для которых (д,-, |дг-|) А (д, м). Здесь А означает сходимость в слабой* топологии, т.е. каждая коор-
к
(0.7)
Возьмем произвольные импульсное управление-# = (ц,{иТ,УТ}). число т Є Т и вектор а Е Ета. Обозначим через х(-) = х(‘, т> а) решение
14
следующей динамической системы (если оно существует)
{ хОО = дМ^),ит(з),т)Уг(з), в е [о, 1],
I х(0) = а.
Функцию ограниченной вариации х(£), заданную на отрезке времени Т, назовем решением дифференциапьного уравнения (0.6), отвечающим управлению (и,д) и начальному значению хо, если я(*о) = £'о и для каждого £ Е ^оЛ\] имеет место:
х(0 = х0+ [ Дх, и,<:)с1с + [ д(х, и,<;)(1цс +
^о А (0.8)
т<1
где хг(-) := х('-. Т1Х{Т~)) и означает непрерывную компоненту меры //. Заметим, что сумма в (0.8) определена корректно, поскольку, согласно (0.7), существует не более чем счетное множество точек т, где функция ут отлична от нуля.
Такое определение оказывается корректным с точки зрения пополнения задачи, и в его силу можно описать интегральную воронку решений, возникающую при аппроксимации борелевской меры // абсолютно непрерывными мерами (см. лемму 1.1).
Сформулируем принцип максимума. Положим
Ц{х,1) := {11 Е ЯГ : Я(х,гМ) Е С}.
Рассмотрим функцию Понтрягина
Н(х,и,ф,1) ■- {}(х,и,(),ф),
а через С) обозначим следующую вектор-функцию
<Э(х.г£,^, I) := д*(х, и, £)"0.
В предположении ограниченности множества С/(х, £) и регулярности смешанных ограничений, вводимой в главе 1, а также при довольно
15
общих предположениях относительно функций, входящих в постановку задачи (см. главу 1), получена следующая
л
Теорема 1.1 Пусть процесс (х,й,д) является оптимальным в задаче (0.5).
Тогда существуют число А > 0, вектор-функция с ограниченным изменением ф(б), измеримая вектор-функция г] Є ІЦ(Т), т?(£) Є
V А А
^с(Я(г)) п.вЛ, а. для каждой точки т є Оз(|#|) существуют свои собственные, і/же абсолютно непрерывная вектор-функция фТ{$) п существенно ограниченная вектор-функция г)Т є Ь^([0,1]), г]т($) € Дс’(Ят(б1)) п.в. в, определенные на отрезке [0,1], такие, что
л+ |^(0І / о, V/ є т,
А + |^т(в)|^0, Ув€[0,1], Уг€1)8(|^|),
/( яи Г с)
—ку-т-^ — <0(?),сгАс) +
+ I 51 №г(1) - ^г(о)], уіє(і0,*і],
тЄ05(|т?|):т<Є
Лх
' *(.) —|«}.(.)Л(.)) + ^(.ыо,
жг(0) = х{т ), 0Т(О) = ^(т ),
5 Є [0,1], Угє05(|!?|),
(0(<о). -^(*і)) е А|^(р) + Л^(р).
шах Я(и, £) = Я(/), п.в. і, Є Т, иє£(*)
шах шах (0(ц, ДгЛ = 0 V* Є Т,
«€^ибС/(і)\ і
шах шах (ОЛщ з),гЛ =
= (<Эг(«),г>т(5)) = 0, п.0.5 Є [0,1] Ут є Г>8(|^|),
/ (<ЗМ,^с)=0 Vі Є Т,
^(М
16
тЬ іг) -”"‘6Г’
/ ^Аяс) = 0 V < є т,
11(0,*] ди
|;<$г(*),М«)} = ^(«Ы«). П.в. в 6 [0, 1], УгеОьй),
где /іас, /}.ас естпъ абсолютно непрерывная и сингулярная компоненты меры /}с.
Здесь “крышка” над функцией или многозначным отображением от переменных (х, и,ір) означает, что вместо опущенных аргументов подставляются оптимальные значения, а индекс т при функции означает, что подставляются оптимальные значения на разрыве в точке т. Здесь также ії3{у) - нормальный конус Мордуховича, а Й3{у) - его овыпук-леиие или нормальный конус Кларка.
Подобною рода принцип максимума, но без смешанных ограничений и при дополнительных предположениях выпуклости векторграм-мы и гладкости, был получен Б.М. Миллером в [88]. Однако автор не привел точного определения импульсного управления, а решение системы (0.6) определил в приближенном смысле на языке сходящихся на Т (и только на Т) последовательностей (определения траектории и управления, данные выше, в работе [88] отсутствуют).
0.2 Принцип максимума Л.С. Понтрягина для задачи
оптимального управления с фазовыми ограничениями
В главе 2 изучаются необходимые условия оптимальности в задачах оптимального управления с фазовыми ограничениями в форме Принципа максимума Л.С. Понтрягина [95]. Для задач с фазовыми ограничениями такие условия впервые были получены Р.В. Гамкрелидзе в 1959 году (см. [59, 60]) и затем опубликованы в классической монографии [95] (глава 6). Принцип максимума Р.В. Гамкрелидзе был получен
17
в известных предположениях регулярности оптимальной траектории. Несколько позднее, в 1963 году, А.Я. Дубовицкий и A.A. Милютин доказали для задач с фазовыми ограничениями другой принцип максимума, |64]. Несмотря на то, что он, в отличие от принципа максимума Р.В. Гамкрелидзе, был получен без априорного предположения регулярности траектории, во многих интересных случаях принцип максимума в форме А.Я. Дубовицкого и A.A. Милютина вырождается (см. [40, 44j). поэтому в последующих работах (см. [40,41, 63, 42, 44, 50, 28]) были предложены другие варианты этого принципа максимума, которые при дополнительном предположении управляемости траектории уже не вырождаются.
В главе получен принцип максимума в новой форме, являющейся дальнейшим развитием той формы, предложенной Р.В. Гамкрелидзе, но без априорных предположений регулярности оптимальной траектории. Такой принцип максимума получается непосредственно из невы-рождающегося варианта принципа максимума в форме А.Я. Дубовицкого и A.A. Милютина, доказанного A.B. Арутюновым, за счет перехода к новым сопряженным переменным. При этом и условия Р.В. Гамкрелидзе, и условия А.Я. Дубовицкого и A.A. Милютина оказываются несложными следствиями из нового принципа максимума. Раскрывая кратко содержание главы 2, можно сказать, что все известные ранее принципы максимума для задач с фазовыми ограничениями на самом деле оказались тесно связанными друг с другом, и осуществимы переходы от одних условий к другим с помощью специального вида замены сопряженной переменной.
Исследованием задач с фазовыми ограничениями и смежными вопросами занимались (в нашей стране) A.B. Арутюнов. Р.В. Гамкрелидзе. А.Я. Дубовицкий, В.А. Дубовицкий, М.И. Зеликин, А.Б. Куржан-ский, A.A. Милютин, В.М. Тихомиров; (за рубежом) М.М.A. Ferreira, F.L. Pereira, R.B. Vinter и многие другие.
18
Приведем один из результатов главы 2. Это принцип максимума в форме Р.В. Гамкрелидзе без априорных предположений регулярности оптимальной траектории.
Рассмотрим задачу
Здесь моменты времени 2о и априори не предполагаются фиксированными, х - фазовая переменная, принимающая значения в п-мерном арифметическом пространстве Еп, а гг 6 Мт - управляющий параметр. В качестве класса допустимых управлений рассматриваются измеримые существенно ограниченные функции и( ).
Пусть (р“,х+,гг*) - допустимый процесс в задаче (0.9). Здесь р* = Положим Т = [«5,^].
Введем функцию
которую впервые предложил рассматривать Р.В. Гамкрелидзе (в его обозначениях, функция р(.т,гг), см. [59]).
Рассмотрим расширенную функцию Понтрягина
х = /(х, и, £), £ 6 [*о, *о < к
< С(х, £) < 0,
1{(х,и, I) < 0,
Кг(р) = 0, К2(р) < 0, Р= (яо^ьМО-
(0.9)
Н(х, и, ф, р, А0,1) = <ф, Дх. и, *)) - {р, М(х, и, г)) - А°/0(х. и, I),
и малый лагранжиан
1(р, А) = А°/<о(р) + (А1,1Ш) + (А2.1<2{р))
где А = (А0, А1, А2).
19
Определение 2.3 Будем говорить, что процесс (р*, х*, и*) удовлетворяет принципу максимума Поитрягипа, если существуют вектор А = (Л°, Л1, Л2) : А0 Є М, А1 € Л2 є Л° > О, А2 > О,
(А2, ^(р*)) = 0; абсолютно непрерывная функцияф : Т ->■ Шп, функция р : Т —> и измеримая существенно ограниченная функция
г : Т -> №d(R\ такие, что \°,ф,р одновременно не равны пулю и
ф = — -f r(t)^J^-(t) п.в. t.
Ох ' ' 4 ' Ох 4 '
Ж) = (-1)в+1^(Р*. А) + /*(*;)Щ«), <=1,2,
max H(u,t) = #(£) n.e.t,
UÇ:U(t)
h = ^(*)-г(0^(0 п-вЛ>
МО = (-i)^(p'.А) - М0^(0. ^ = 1.2,
эя,, ,,эя,,
ÂTW =
(г(г), #(£)) = о, г(г) > о 71.6. ^
acte
Л(0 := rriax //(и, О.
Кроме того, функция /г абсолютно непрерывна на отрезке Т, а вектор-функция р удовлетворяет следующим свойствам.:
а) каждая из функций /і-7 постоянна па любом сегменте времени Б = [51,62], «о котором оптимальная траектория целиком лежит во внутренности множества, задаваемого у-ым фазовым ограничением, т.е. когда С^(б) < 0 Уя Є -9;
б) вектор-функция р непрерывна слева на интервале и, кро-
ме того, р{Ь\) = 0;
каждая из функций р3 (нестрого) монотонно убывает.
20
При определенных предположениях регулярности и согласованности ограничений, вводимых в главе 2, была получена следующая
Теорема 2.1 Пусть процесс (р*,х*, и*) является оптимальным, в за-даче (0.9). Предположим, что конг^евые ограничения о точке р* регулярны, фазовые и смешанные ограничения регулярны и в точке р* фазовые ограничения согласованы с концевыми.
Тогда процесс удовлетворяет принципу максимума.
0.3 Теория вещественных квадратичных отображений. Условия существования регулярных нулей квадратичных отображений
В главе 3 изучаются вещественные квадратичные отображения и достаточные условия существования их регулярных нулей. Доказывается критерий существования регулярного нуля у квадратичного отображения (это теорема 3.1; она приводится ниже), который изначально был сформулирован A.B. Арутюновым как гипотеза. Теорема 3.1 находит свое применение в теории анормальных задач, где она проливает свет на ту связь, существующую между различными теоремами об обратной функции в окрестности анормальной точки отображения, а это теоремы Е.Р. Авакова и A.B. Арутюнова, см. в [37], [47]. (Эти теоремы будут приведены в следующем параграфе, посвященном этому вопросу; это теоремы 0.1 и 0.2).
Сформулируем главный результат главы 3. Приведем здесь его более простую версию для конечномерных пространств. Пусть задано квадратичное отображение Q : X —> Y, где X = Rn, Y = Rk. Иными словами, Q - это набор из к квадратичных форм на X. Вектор х: Q{x) = 0 называется регулярным нулем квадратичного отображения Q, если Q'(x)X = Y. Здесь Q'(x) обозначает обычную производную или якобиан отображения Q в точке х.
21
Введем необходимые обозначения. Для произвольного вектора Л = (А1,..,А*1) € У положим
к
\<2 = ^
7=1
где С^ обозначает ^-ую координату отображения С}. Через т<1 д будем обозначать индекс квадратичной формы ц. Для целого числа г через Лг обозначим множество таких векторов А 6 У, А Ф 0, что 1пс1 АО < г.
Введем в рассмотрение условие:
А) ЗН € X: (\,у) < О V А € Л*-1, где у = С2[И, И].
Если Лл;-1 = 0, то условие А) считается выполненным автоматически.
Теорема 3.1 Пусть квадратичное отображение С} удовлетворяет условию Л). Тогда у него существует регулярный нуль.
Впервые условие А) было введено в работе [47], в которой было доказано (см. лемму 2), что если условие А) выполняется, то квадратичное отображение С) сюръективно (т.е. (д(Х) = У).
При к = 1 утверждение теоремы очевидно. При к = 2 оно относительно несложно доказывается (см. |79|). Усилить утверждение теоремы 3.1 при к > 2, заменив в условии А) множество меньшим множеством Л*.2, нельзя. Это показывает пример квадратичного отображения С}(х) = (х\Х2, х\ - х2), действующего из К2 в К2, у которого нет нетривиальных нулей.
Впервые достаточные условия существования регулярного нуля у квадратичного отображения, заключающиеся в том, что = 0, были получены в [1|. Затем в [46] было доказано, что если Л^-_1 = 0. то множество регулярных нулей всюду плотно во множестве N. Наконец, в |47| был доказан ослабленный вариант теоремы 3.1, а именно, что если 3/г 6 X: (А,у) < О V А £ Л*, где у = С2[И.,1г], и конус сопу Лг
22
(сопу - выпуклая оболочка) при г = \к(к 4- 3) является острым, т.е. не содержит ни одной прямой, то у <3 существует регулярный нуль. Отметим, что если X = 1&7\ и п к (например, п > 2(к - 2), и {п - к — 1 )(п — к) > 2{к. - 1)), то последнее предположение является условием общего положения, так как в этом случае множество квадратичных отображений (3, ДЛЯ которых конус СОПУ Л*;_1 является острым, всюду плотно в пространстве всех квадратичных отображений из Еп в К* (см. [44}, §1.9).
Доказательство теоремы 3.1 потребовало определенных усилий и обращения к методам вещественной алгебраической геометрии, [7]. Были использованы такие теоремы и понятия, как полуалгебраиче-ская триангуляция полуалгебраического компакта, леммы об отборе кривых, размерность полуалгебраического множества и т.д.
Теорема 3.1 и разработанный для ее доказательства аппарат играют существенную роль в следующей главе 4 при выводе необходимых условий экстремума. Таким образом, результаты главы 3 имеют как самостоятельный интерес, так и востребованы в качестве вспомогательных лемм в главе 4.
0.4 Исследование гладких отображений в окрестности анормальной точки. Теоремы об обратной функции и необходимые условия экстремума второго порядка
Пусть заданы линейное пространство Ху конечномерное евклидово пространство У = К*, отображение Р : X —> У и точка х¥ е X. При исследовании отображения Р одним из важнейших вопросов является следующий: при каких условиях на Р для любого у, достаточно близкого к точке у, = к\х*), уравнение
Р(х) = у имеет решение ф(у) : ф(у¥) = х*?
23
Вначале для простоты будем предполагать, что X - банахово пространство. Пусть отображение Б : X У непрерывно дифференцируемо в окрестности точки х, Є X. Если точка х* нормальна, т.е. іт Б'(хч) = У, то ответ дает классическая теорема об обратной функции. А именно, тогда в некоторой окрестности у¥ существует такое решение ф(у) искомого уравнения, ЧТО ф{у*) = хш и функция ф непрерывно дифференцируема.
Пусть точка х* анормальна, т.е. іт Б'(х¥) ф У. Тогда классическая теорема об обратной функции не выполняется. (Например, уравнение Б(х) = х\ + х\ = у при х* = 0, у* = 0 имеет решения лишь при у > О, а для уравнения F(x) = х\ — х\ = у существует бесконечное число непрерывных функций ф(у), у Є К, каждая из которых дает решение этого уравнения, однако ни одна из этих функций не является даже липшицевой в нуле.)
Приведем теорему об обратной функции, которая справедлива без априорных предположений нормальности точки х*. Предположим, что отображение Б дважды непрерывно дифференцируемо в некоторой окрестности точки х*, а его вторая производная удовлетворяет условию Липшица этой окрестности. Введем необходимые понятия.
Определение 0.1 Пусть
НекетБ'(х,), ^"(®*)[М]Є їтҐ{х,). (0.10)
Будем говорить, что в точке х¥ отобраоїсение Б 2-регулярно по направлению Н, если
Б"(х.)[к, кег Б'(х*)] + іт Ґ(хт) = У
Обозначим через Р оператор ортогонального проектирования У на ортогональное дополнение к подпространству іп^'(х*).
Справедлива следующая теорема об обратной функции.
24
Теорема 0.1 Предположим, что существует к £ X, для которого имеет место (0.10) и в точке х+ отображение И 2-регулярно но направлению к. Тогда существуют окрестность О точки у*, число с > 0 и определенная на О непрерывная функция ф такие, что для всех у £ О имеет место
Р{Ф{у)) = У. №(у)-z.il <с(|2/ —!/.| + 1^(г/-У.)11/2)- (О-11)
Существование решения искомого уравнения ф(у) для у е О с указанной оценкой было доказано в [37), а возможность выбора функции ф непрерывной была доказана в [48].
Отметим, что если точка х% нормальна, то предположение теоремы 0.1 выполняется автоматически при К = 0 и, следовательно, теорема 0.1 превращается в классическую теорему об обратной функции. Кроме того, когда X, У бесконечномерные банаховы пространства, эта теорема была доказана в [37], [48] в предположении, что подпространство 1ш Т\хТ) замкнуто и топологически дополняемо. Случай, когда подпространство не замкнуто, был изучен в [38].
В связи с имеющейся теоремой 0.1 возникает проблема получения достаточных условий существования вектора к, для которого имеет место (0.10), и в точке х„ отображение F 2-регулярно по направлению к. Эта проблема была подробно освещена в главе 3, где такое достаточное условие было уже получено, см. теорему 3.1.
Для произвольного целого г > 0 через Аг(х*) обозначим множество всех векторов А : F/(a;<)*A = 0, |А| = 1, для каждого из которых существует подпространство ПСА такое, что
1) сосНт П < г,
2) П С кегГ(х.),
3) <А^(*.)К.*]>>0^€П.
25
Теорема 0.2 Пусть точка х* анормальна и
ЗЬ Є ксг іг'(д;,) : (А, Ґ\хя)[Н, Л]) < О V А Є (0.12)
Тогда существуют конечномерное подпространство М С X, окрестность О точки у*, число с > 0 и непрерывная функция ф : О М такие, что для всех у Є О имеет место (0.11).
Это утверждение вытекает из теорем 0.1. 3.1 и лемм 1, 2 из [47]. Впервые утверждение такого типа было доказано (без использования теорем 0.1 и 3.1) в [47], где в условии (0.12) вместо Л*_і(х,) рассматривалось, вообще говоря, большее множество Л*(ж,), а непрерывность обратной функции ф вообще не рассматривалась. При этом в работе [47] было доказано, что в предположении выполнения вводимого там условия 2-нормальности условие (0.12) необходимо для существования решения ф, удовлетворяющего оценке (0.11).
Итак, если точка х* нормальна, то положительный ответ на вопрос о существовании решения уравнения Р(х) = у с линейной оценкой дает классическая теорема об обратной функции. А более общо: если существует направление Н, вдоль которою отображение 2-регулярно в точке х*, то решение уравнения Р(х) = у существует в силу теоремы
0.1. и оценка на решение (0.11) является уже линейно-корневой.
Когда точка х* анормальна, но сосіітіт Р'(х.) = 1, то ответ на поставленный вопрос дает теорема 0.2. Действительно, в этом случае существует единственный (с точностью до знака) единичный вектор А Є кегР'(х*)*. В силу теоремы 0.2, если квадратичная форма АР"(х*) не является знакоонределенной на кетГ'(хж), то исходное уравнение имеет непрерывное решение ф, удовлетворяющее оценке (0.11). Если же форма АР"(х*) либо неотрицательно, либо неположительно определена на подпространстве кег Р'(х*), то исходное уравнение хотя и может иметь решение, но, как это несложно доказать, ни одно из этих решений не будет удовлетворять оценке (0.11).
26

Ви є тут

Исследование анормальных и вырожденных задач оптимального управления и нелинейного анализа

Вміст