Ви є тут

Математическая теория субоптимального управления распределенными системами

Автор: 
Сумин Михаил Иосифович
Тип роботи: 
Докторская
Рік: 
2000
Артикул:
1000344873
179 грн
Додати в кошик

Вміст

Содержание
0 Введение 6
0.1 Сокращения, обозначения, нумерация......................................... 6
0.2 Общая характеристика диссертации .......................................... 8
0.3 Краткий обзор содержания диссертации...................................... 22
0.4 Основные результаты диссертации........................................... 52
1 Абстрактная параметрическая задача минимизации с операторным ограничением в равномерно выпуклом пространстве 55
1.1 Правило множителей для субоптимальных элементов в метрическом пространстве ........................................................................ 55
1.2 Абстрактная задача минимизации с параметром в ограничении................. 59
1.2.1 Постановка абстрактной параметрической задачи минимизации, минимизирующее приближенное решение (м.п.р.)................................... 59
1.2.2 Аксиоматика......................................................... 60
1.3 Абстрактный принции максимума для м.п.р. в случае ” богатого” целевого
множества................................................................. 64
1.4 Абстрактный принцип максимума для м.п.р. в случае ’’бедного” целевого множества. Субдифферепциалы функции значений...................................... 69
1.4.1 Полунепрерывность снизу функции значений в параметрической задаче
минимизации......................................................... 69
1.4.2 Нормали Фреше, субдифференциалы и сингулярные субдифферендиалы
полунепрерывных снизу функций....................................... 70
1.4.3 Абстрактный принцип максимума для м.п.р............................. 72
1.4.4 Субдифферснцналы функции значений................................... 81
1.5 Регулярность, нормальность, чувствительность в параметрической задаче с
операторным ограничением в равномерно выпуклом пространстве............... 85
1.6 Экстремальные последовательности.......................................... 91
2 Субоитимальное управление параболическими уравнениями 95
2.1 Задача с нефиксированным временем без его варьирования и с ограничением
типа включения в конечномерное множество.................................. 95
2.1.1 Постановка задачи................................................... 95
2.1.2 Проверка выполнимости абстрактной аксиоматики....................... 96
2.1.3 Задача с фиксированным временем.................................... 106
2.1.4 Принцип максимума для м.п.р. в задаче с фиксированным временем . . 106
2
2.1.5 Достаточность принципа максимума для м.и.р. в задаче с фиксированным временем............................................................... 107
2.1.6 Свойства регулярности, нормальности в задаче с ограничением типа
включения с фиксированным временем.................................. 109
2.1.7 Принцип максимума для м.п.р. в задаче с ограничениями типа равенства и неравенства......................................................... 113
2.1.8 Достаточность принципа максимума в задаче с равенствами и неравенствами .................................................................... 115
2.1.9 Свойства регулярности и пормальности в задаче с равенствами и неравенствами, типичность регулярности......................................... 116
2.1.10 Особые минимизирующие последовательности, сходимость минимизирующих последовательностей в задаче с фиксированным временем . . . 122
2.1.11 Иллюстративные примеры............................................. 125
2.1.12 Задача с нефиксированным временем.................................. 127
2.1.13 Принцип максимума для м.п.р. в задаче с нефиксированным временем 127
2.1.14 Нормальность, регулярность в задаче с нефиксированным временем . . 128
2.1.15 Экстремальные последовательности................................... 129
2.2 Задача с нефиксированным временем с его варьированием и с ограничением типа включения в конечномерное множество....................................... 131
2.2.1 Постановка задачи................................................... 131
2.2.2 Проверка выполнимости абстрактной аксиоматики....................... 133
2.2.3 Принцип максимума для м.п.р......................................... 140
2.3 Задача с граничным управлением и с ограничением типа включения в функциональное множество общего вида в гильбертовом пространстве................... 142
2.3.1 Постановка задачи.................................................. 142
2.3.2 Проверка выполнимости абстрактпой аксиоматики...................... 144
2.3.3 Принципы максимума для м.п.р., свойства регулярности и нормальности в задаче с операторным ограничением.................................... 156
2.3.4 Регулярность, нормальность, условная нормальность в задаче с операторным ограничением ....................................................... 159
2.3.5 Иллюстративные примеры............................................. 164
3 Субоптималыюе управление эллиптическими уравнениями 168
3.1 Субоптимальное управление квазилинейным эллиптическим уравнением с поточечным фазовым ограничением общего вида в равномерно выпуклом пространстве ..................................................................... 168
3.1.1 Постановка задачи.................................................. 168
3.1.2 Проверка выполнимости абстрактной аксиоматики...................... 171
3.1.3 Принципы максимума для м.п.р., принципы максимума.................. 186
3.2 Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением в пространстве непрерывных функций..................... 187
3.2.1 Постановка задачи.................................................. 188
3.2.2 Вспомогательные результаты......................................... 189
3.2.3 Аппроксимация задачи с фазовым ограничением задача.ми с конечным
числом функциональных ограничений .................................. 190
3
3.2.4 Проверка выполнимости абстрактной аксиоматики в аппроксимирующей задаче................................................................ 191
3.2.5 Принцип максимума дпя м.п.р. в задаче с фазовым ограничением . . . 197
3.2.6 Регулярность, нормальность, условие Слейтера, условие линейности . . 200
3.2.7 Лишшщевость функции значений, чувствительность.......................203
3.2.8 Типичность регулярности .............................................207
3.2.9 Переформулировка исходной задачи как задачи с равномерно выпуклым
целевым пространством.................................................208
3.2.10 Расширение исходной задачи с фазовыми ограничениями..................210
3.2.11 Иллюстративные примеры...............................................213
3.3 Принцип максимума в задаче оптимального управления полулинейным эллиптическим уравнением со смешанным ограничением..................................214
3.3.1 Постановка задачи со смешанным ограничением......................... 214
3.3.2 ”Эквивалентная” задача с равномерно выпуклым целевым пространством215
3.3.3 Проверка выполнимости абстрактной аксиоматики........................215
3.3.4 Принцип максимума в исходной задаче со смешанным ограничением . 219
3.4 Субоитимальное управление полулинейным эллиптическим уравнением с. фазовым ограничением в пространстве непрерывных функций и граничным управлением .....................................................................224
3.4.1 Постановка задачи....................................................225
3.4.2 Вспомогательные результаты...........................................226
3.4.3 Аппроксимация задачи с фазовым ограничением задачами с конечным
числом функциональных ограничений ....................................229
3.4.4 Проверка выполнимости абстрактной аксиоматики в аппроксимирующей задаче.................................................................231
3.4.5 Принцип максимума для м.и.р. в задаче с фазовым ограничением и
граничным управлением ................................................235
3.4.6 Регулярность, нормалыюсть............................................240
3.4.7 Липшицевость функции значений, чувствительность......................243
.3.4.8 Иллюстративные примеры...............................................251
4 Субоитимальное управление гиперболическими уравнениями 253
4.1 Задача параметрического субоптимального управления системой Гурса-Дарбу 253
4.1.1 Постановка задачи....................................................253
4.1.2 Задача с фазовым ограничением в (П)................................. 254
4.1.3 Принципы максимума в задаче с фазовым ограничением в П) .... 262
4.1.4 Иллюстративные примеры к задаче с фазовым ограничением в Ь2(П) . 262
4.1.5 Задача с фазовым ограничением в С(Г1)................................264
4.1.6 Иллюстративные примеры к задаче с фазовым ограничением в С(П) . 270
5 Субоптимяльное управление в негладких задачах оптимизации распределенных систем 272
5.1 Параметрическая негладкая задача оптимального управления для параболического уравпепия............................................................... 272
5.1.1 Постановка негладкой задачи .........................................272
4
5.1.2 Связь между обобщенным градиентом Кларка и обобщенной производной в смысле С.Л.Соболева................................................. 273
5.1.3 Вспомогательные задачи, сглаживание................................ 276
5.1.4 Проверка выполнимости абстрактной аксиоматики в сглаженных вспомогательных задачах........................................................279
5.1.5 Условия субоптимальпости в сглаженной вспомогательной задаче . . . 280
5.1.6 Предельный переход во вспомогательных необходимых условиях при
стремлении к нулю параметра сглаживания, принципы максимума для м.п.р.............................................................. 281
5.1.7 Регулярность, нормальность, чувствительность в негладкой задаче . . 289
6 Двойственные численные методы в задачах оптимального управления 293
6.1 Численный метод для нахождения минимизирующей последовательности в случае существования вектора Куна-Таккера.........................................293
6.1.1 Постановка задачи.................................................. 293
6.1.2 Модифицированный функционал Лагранжа................................294
6.1.3 Функция значений м.ф.Л. и ее субдифференциал .......................296
6.1.4 Максимизация функции значений м.ф.Л., сходимость двойственного метода ..................................................................... 301
6.1.5 Функционал певязки принципа максимума.............................. 303
6.2 Метод точного недифференцируемого штрафа для регулярной задачи оптимального управления .......................................................... 307
6.2.1 Постановка задачи.................................................. 307
6.2.2 Расширение исходной задачи..........................................308
6.2.3 Нормаль Фреше и точный штрафной недифференцируемый функционал 311
7 Субоитимальное управление для задач с приближенно известными исходными данными, регуляризация 314
7.1 Субоитимальное управление для задач с приближенно известными исходными данными .......................................................................314
7.1.1 Постановка задачи...................................................314
7.1.2 Принцип максимума для м.п.р. как необходимое условие в задачах с
приближенными данными ............................................. 316
7.1.3 Принцип максимума для м.п.р. как достаточное условие в задачах с
приближенными данными, регуляризирующее свойство м.п.р..............323
7.2 Численные методы нахождепия нормального решения обратной задачи, регуляризация .................................................................... 327
7.2.1 Постановка задачи.................................................. 327
7.2.2 Метод певязки для решения обратной задачи ......................... 328
7.2.3 Алгоритм Удзавы для решения обратной задачи........................ 331
Введение
0.1 Сокращения, обозначения, нумерация
Список сокращений
т.к. - так как; т.е. - то есть;
п.в. - почти все, почти всюду;
о.о. - ограничение общности;
м.п. - минимизирующая последовательность;
м.п.р. - минимизирующее приближенное решение;
э.п. - экстремальная последовательность.
Список основных обозначений
= - ”равно по определению” или "тождественно равно”;
V - "для всех”;
3 - ” существует”;
0 - пустое множество;
{О}* - нуль линейного пространства X;
{х £ X совокупность элементов множества X, обладающих свойством ”..
X х Y - декартово произведение множеств X и У;
о
X - внутренность множества X; тгХ - относительная внутренность X;
X - замыкание множестваХ;
дХ - граница множества X;
meas X - лебегова мера множества X;
d* - знак слабого со звездой замыкания;
conv - выпуклая оболочка;
dom / - эффективное мпожество функции (функционала) /;
Ргх(а) - проекция точки а на мпожество X;
/)(-, X) - функция (функционал) расстояния до множества X; др(•, X) - производная Фреше (градиент) функции расстояния;
PNq(x) - совокупность всех проксимальных нормалей к множеству О в точке х;
Nc(x; П) - нормальный конус Кларка в х к ß;
äcf(x) - обобщенный градиент Кларка функции / в точке х;
д™ j(x) - сингулярный обобщенный градиент Кларка функции / в точке х\
Лг(дг;П) - нормальный конус Фреше к П в х\
ЛГ(а:;П) - нормальный конус ко множеству в х\
дЦх) - субдифференциал (по Мордуховичу) функции / в точке х\
д°°/(х) - сингулярный субдифференциал (по Мордуховичу) функции / в точке х\
(х*,х) - значение линейного функционала х* £ X* на элементе х £ X;
б
Rm - m-мерное пространство векторов-столбцов х — (ц, ...,хт) с евклидовой нормой
м = {Е
t=l
Ятхп - тп - мерное пространство (т х л)-матриц А = {а,^} с евклидовой нормой \А\ =
т п
{ее;
«=ij=i
£(Дтх") - метрическое пространство всех компактных множеств в Rmxn с метрикой Хаус-дорфа;
$м = {# € Яп : |т| < М};
£(Л,е) = {х £ Rn : 3?у Е >4, |.т - у\ < е}\
£™(ft) - лебегово пространство m-вектор-функций z(x) = (гДх),..., zm(x)), х £ ft, с нормой
\\z\\p,0 = {/|ф)Р<*г}^ 1<р<оо, ЦгЦоо.0 =vra*sup |г(^г)|, £j(ft) = £p(ft);
'ft rçO
L^xrl(Q) - лебегово пространство m х n-матриц-функций z(x) = {^(т)}, iÇfi, с нормой
IMIp.n = {I 1Ф)|р<Мр, 1<р<оо, ||^||оо,0 =ï/rmsup |2г(гг)|;
'О *60
ys°n(II) - банахово пространство абсолютно непрерывных функций v : ГГ П =
[О, a] xJO, Ь] С R2, ф,0) = v(0,у) = 0, с конечной нормой |М|уР1„(п) = 1Ку||Р,гт
C(ft) - банахово пространство непрерывных в ft функций z( ) с конечной нормой
Ип0) = maux |г(л:)|;
«со
Со(П) - пространство всех непрерывных па ft функций, зануляющихся на dft;
M(ft) - множество всех регулярных радоновских мер на ft, М(ft) = C*o(ft);
M(ft) - множество всех регулярпых радоновских мер на ft, М(П) = O’*(О);
Дальнейшие обозначения в этом пункте заимствованы из [67], [69]: ft - область в Rn, т.е. открытое связное множество точек в Rn\
Qt - цилиндр ft х (0,7’); $т - боковая поверхность цилиндра фт, т.е. множество {(x,t) £ Яп+1 : xedù,t£[0,Г]};
Ь?|г(<5т) - банахово пространство, состоящее из всех измеримых но Лебегу на Qt функций г(-, •) с конечной нормой
IMLrtfr s (Jo dx)i<U)'r-,
C*a(ft), a £ (0,1) - банахово пространство непрерывных в области ft (с липшицевой границей) функций г( ) с конечной нормой
M<f> = s«PH*)i + <4a), <4e)* sup wg-ff)',
x€ft x,x'€ft |T-Æ|a
aÇ (0,1) - бапахово пространство непрерывных в цилиндре Qt (с липшицевой границей области ft) функций г(-,-) с конечной нормой
ИЙ - sup + <-ï>i0<?T- + <-гг>«л?г.
(x,î)€Qt
7
Ы<“> = 5ип И*. <)-*(*'■<)! /А(°) = .ив I
\2)х,<1т - 8ЦР _________________ I /|а » \2/1,<5т - 5иР____________
(*,<).(х',£)Є<?т (х,<),(г,Є')6<гг
ф,*) -ф,01
\t-f\o
И^Х(П), <? > 1 - банахово пространство, состоящее из функций г(-) € Ья(&), имеющих все первые обобщенные производные с конечной нормой
1<^11«* + Х>*,1и;
!=1
1^?2,1(<5т)» Я > 1 ■ банахово пространство, состоящее из функций .*(•, ■) £ Ьу^г), имеющих обобщенные производные 2ГГ;> ги гх,х,, *>3 — • • >П1 с конечной нормой
\\4Х = 1М1«.<?г + 1Ык<?г + ЕК1и- + ЕЕ II**<*>11«»?*;
«=1 »=1 >=1
^21,0(<3г) “ гильбертово пространство со скалярным произведением
(г\г2) = [ (г1(*,()22(х,0 + £ ** (*, ф2>,«)) ЛгЛ;
•'Зг »=1
И^з,1(<?г) - гильбертово пространство со скалярным произведением
(г1,г2) = [ + + г?(*|0*?(М))«&Ж;
,=1
1^(дт) - банахово пространство, состоящее из всех элементов И'’21,0(^т) с конечной нормой
\г\Яг =^гштсы: ||*(-,*)1кп + |М|а,дт;
^(От) - банахово пространство, состоящее из всех элементов У2(<2т). непрерывных по t В норме //2(П), с конечной нормой
\х\ят г<^1И*»*)1ко+|И|аЛг;
Нуль сверху над Ж21,°, Ж21’1, К2((?т), ^1,0(фт) означает, что берутся лишь те элементы этих пространств, которые обращаются в нуль на $т-
Нумерация
Нумерация пунктов в каждой главе, а также формул, теорем, лемм, следствий, замечаний в каждом пункте своя. Поэтому при ссылке на формулу (3) из п.2 главы 1 пишем ’’формула
(1.2.3)”.
0.2 Общая характеристика диссертации
Диссертация посвящена развитию математической теории субоптимального управления распределенными системами (т.е. системами, описываемыми уравнениями с частными производными) или. другими словами, математической теории оптимального управления распределенными системами, в которой ”базовым элементом” теории является не оптимальное управление (обычное, т.е. измеримое по Лебегу, или обобщенное), а минимизирующая последовательность обычных управлений.
8
Актуальность темы. Центральный результат современной математической теории оптимального управления - принцип максимума Л.С.Понтрягина [127]. Прошло уже более сорока лет как он был высказан в качестве гипотезы Л.С.Понтрягиным, а затем доказан учениками (Р.В.Гамкрелидзе, Б.Г.Болтянский) для достаточно общих задач оптимального управления системами обыкновенных дифференциальных уравнений.
После открытия припцнпа максимума последовали его всевозможные обобщения. Во первых, были созданы различпые общие схемы получения необходимых условий экстремума в абстрактных задачах с ограничениями (А.Я.Дубовицкий и А. А.Милютин, Р.В.Гамкрелидзе и Г.Л.Харатишвили, L.W.Neustadt и др., см., например, [28, 30, 41, 82, 95, 129, 241]). В дальнейшем эти схемы постояпно развивались и с их помощью решались все более сложные задачи оптимального управления (А.В.Дмитрук, А.Я.Дубовицкий, А.А.Милютин, Н.П.Осмоловский и др., см., например, [3, 8, 38, 39, 42, 43, 70, 83, 84, 104, 243]).
Одповремепно с созданием абстрактных схем исследования задач оптимальпого управления интенсивно развивается также и теория "собственно задач” оптимального управления различными системами с сосредоточенными и распределенными параметрами (А.В.Арутюнов, В И. Благодатских, В.Г.Болтянский, А.Г.Бутковский, Ф.П.Васильев, Р.Габасов, В.Ф.Демьянов, А.И.Егоров, Ю.В.Егоров, М.И.Зеликин, А.Д.Иоффе, Ф.М.Кириллова, Н.Н.Красов-ский, А.В.Кряжимский, А.Б.Куржанский, К.А.Лурье, В.Ш.Мордухович, М.С.Никольский, Ю.С.Осипов, В.И.Плотников, Л.И.Розоноэр, С.Н.Слугип, Т.К.Сираэетдинов, В.М.Тихомиров, Е.Л.Топков. В.А.Троицкий, А.Ф.Филиппов, А.В.Фурсиков, F.H.Clarke, J.L.Lions, J.War-ga, L. J.Young, и др., см., например, [2, 4, 5, 6, 7, 12, 14, 15, 16, 17, 18, 20, 23, 25, 37, 40, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 72, 74, 86, 92, 99, 100, 101, 105, 106, 107, 108, 121, 130, 133, 178, 179, 180, 182, 183, 185, 186, 187, 196, 199, 212, 213, 214, 215]).
В то же время появляются и различные общие подходы к получению принципа максимума для распределенных систем (Ю.В.Егоров. В.И.Плотников, В.А.Якубович, А.С.Матвеев, H.O.Fattorini и др., см., например, [48, 51, 52, 53, 77, 78, 79, 80, 81, 109, 110, 111, 112, 113, 114, 115, 191, 192, 193, 194, 195, 219]).
Теория оптимального управления системами с распределенными параметрами интенсивно развивается в различных направлениях (С.А.Авдонин, Л.Т.Ащепков, О.В.Васильев, Ф.П.Васильев, А.И.Егоров, С.А.Иванов, А.З.Ишмухаметов, А.В.Кряжимский, А.И.Короткий, В.И.Максимов, А.С.Матвеев, С.Ф.Морозов, Ю.В.Орлов, Ю.С.Осипов, М.М.Потапов, С.Н.Слугип, В.А.Срочко, В.И.Сумин, А.В.Фурсиков, В.А.Якубович, V.Barbu, H.O.Fattori-iii, H. Fr an ko ws ka, B.S.Mordukhovich, J.L.Lions и др., см., например, [1, 10, 19, 20, 21, 22, 54, 56, 57, 62, 63, 73, 75, 76, 93, 98, 102, 103, 116, 117, 118, 119, 128, 138, 139, 141, 142, 143, 144,
145, 146, 147, 148, 149, 150, 185, 186, 187, 188, 197, 201, 202, 203, 204, 220, 221, 222, 223, 225,
226, 232, 234, 235, 236, 242]).
Диссертация посвящена различным аспектам теории субоптимального управления распределенными системами, связанным так или иначе с принципом максимума Л.С.Понтрягина, который для краткости мы будем называть ниже просто принципом максимума.
Как уже отмечено выше, в теории оптимального управления сосредоточенными и распределенными системами существуют песколько абстрактных схем получения условий оптимальности. Эти схемы позволяют эффективно получать в различных сложных задачах оптимального управления с ограничениями условия оптимальности как первого, так и более высоких порядков [3, 8, 28, 30, 38, 39, 41, 43, 48, 51, 52, 53, 70, 77, 78, 79, 80, 81, 82, 83, 84,
95, 104, 109, 110, 111, 1.12, 113, 114, 115, 129, 191, 192, 193, 194, 195, 219, 241, 243], а также
9
результаты так или иначе связанные с условиями оптимальности (принципом максимума). Важно отметить, что все эти абстрактные подходы предполагают наличие по крайней мере одного очень существенного обстоятельства:
(I) Существование оптимального элемента. В теории оптимальною управления таковыми являются обычные (измеримые по Лебегу) или обобщенные [18, 27, 29, 183, 196, 224] оптимальные управления.
Отмеченное обстоятельство обеспечивается в случае обычного оптимального управлепия во всех упомянутых выше схемах посредством постулирования факта существования (как известно [196], именно это привело к возникновению словосочетания ” наивная теория оптимального управления”), если на задачу не наложены дополнительные и, как правило, весьма жесткие условия существования оптимального элемента. При этом, как известно, для задач оптимального управления обыкновенными уравнениями, а также для весьма широкого класса так называемых полулинейных уравнений в частных производных существование оптимальных обобщенных элементов дается ’’практически даром”.
В то же время, в теории оптимального управления распределенными системами несуществование обычного оптимального управления и одновременно невозможность расширения задачи в том или ином смысле [18, 27, 29, 183, 196, 224] не является каким либо редким и патологическим событием. Рассмотрим для иллюстрации следующий простой пример.
Пример 0.2.1. Рассмотрим простейшую задачу оптимального управления для одномерной задачи Гурса-Дарбу
нижняя грань I* > — 1. В то же время, легко заметить, что эта нижняя грань не достигается ни па каком, обычном управлении. Принцип максимума для м.п. [122] здесь имеет вид
где у1 > 0, 7* —> О, I —> оо, х\иг\ - решение граничной задачи, соответствующее управлению и\ ' решение при и — и1 сопряженной задачи
Элементарный анализ принципа максимума (0.2.1) показывает, что любая по след о -
V = {и е МП) : и(х, у) е V = [-1,1] п.в. на И}, П = [0,1] х [0,1],
*хУ = и(х,у)гх + и(х,у), г(х,0) = г(0.у) = 0.
Специфика такой хорошо известной конструкции функционала такова, что в этой задаче
ватеаьность управлений и\ » = 1,2,..., будет ему удовлетворять, если |«*(:г,з/)| 1,
*х[и'](х,у) -» —1, г -> со, по мере на П. Т.к.
*М(*,У) = [о (еХР(/ «(?1»Ь)<2) “ 1)^1,
то можно заметить, что последовательность
10
■удовлетворяет принципу максимума (0.2.1), в то время как для последовательности vl{x у) = ( * Х ^ ’ 2«)> У ^ У = 1,3,... ,2t — 1,
1-ї *Є(^,£), У Є [о, 1], і = 2,4,, 2», і = 1,2,...
не выполняется предельное соотношение ф'К^уЛ^^К^у) + 1) -> О по .«ере на П и принцип максимума (0.2.1) и, стало быт.ь, она не яв.чяется минимизирующей. В то же время, обе эти последовательности управлений, как нетрудно заметить, сходятся (в слабой норме |- |а,, см. [18]) к одному и тому же обобщенному управлению 1/(х, у) = + §Ац.
Аналогичный пример с выпуклым по фазовой переменной и независящим от управления ин-тегрантом интегрального функционала для двумерной системы Гурса-Дарбу можно найти в [34]. Более того, как показано в [34], гарантированное существование обычного оптимального управления для управляемой системы Гурса-Дарбу в задаче минимизации (без ограничений) интегрального функционала указанного выше вида жестко связано со специальной структурой нелинейной правой части системы и предполагает наряду с другими весьма жесткими условиями обязательную аддитивную разделенность производных от решения и управления
f(x,y,Z,Zz,Zy,u) = -I- f2(x,y,z,u).
Подобные примеры говорят о том, что в теории оптимизации распределенных систем в общей ситуации единственным выходом для получения ” каких либо” условии оптимальности является рассмотрение именно м.п. в качестве ’базового элемента” теории.
Представляется важным здесь также отметить и еще одно обстоятельство, с которым приходится неизбежно сталкиваться в теории оптимального управления системами с операторными ограничениями. При этом здесь и ниже под операторными ограничениями мы понимаем ограничения, задаваемые оператором с бесконечномерным образом; в противном же случае ограничения называем функциональными. Это обстоятельство связано с возможной невыполнимостью принципа, максимума. Оговоримся особо, что мы подразумеваем под невыполнимостью принципа максимума. Хорошо известно, что в задаче оптимального управления с функциональными ограничениями (для дростоты рассматриваем лишь случаи ограни чений-равенств)
/о(д) -4 min, 1\(и) = 0, и Є V,
где /о : V —► R1 - минимизируемый функционал, І\ : V -4 В - оператор, задающий ограничение, V - множество допустимых управлений, В - конечномерное банахово пространство, оптимальное управление и° Є V удовлетворяет принципу максимума в задаче ’’безусловной минимизации” функционала Лагранжа
\qIo(u) + (Лі, Л(и)) —► min, и Є V, Ао > ü. Ai € В*, (Ао, Аі) ф 0.
В случае же бесконечномерного целевого пространства В указанная импликация, вообще говоря, не верна, если на исходные данные задачи не накладываются некоторые существенные дополнительные условия.
В теории оптимального управления обыкновенными системами, как известно [8, 43], такие условия на исходные данные являются совокупности условий, объединяемых терминами общая канопическая задача [43] или регулярная каноническая задача [8]. В ряде других подходов (см., например, [219]) выполнимость принципа максимума обеспечивается за счет
11
достаточно жестких условий на множество допустимых управлений (оно должно быть достаточно ’’богатым”, что ”не соответствует” классическим постановкам задач оптимального управления с существенно ограниченными управлениями), функционал и ’’правую часть” управляемой системы, обеспечивающих в процессе доказательства принципа максимума слабую сходимость последовательности функциональных множителей Лагранжа к неравному нулю предельному множителю. К числу типичных условий, ’’способствующих” выполнимости принципа максимума в задачах с операторными ограничениями относится также и стандартное условие пепустоты внутренности целевого множества задачи, т.е. того множества. которому должны принадлежать значения оператора, задающего ограничение, а также условия регулярности смешанных ограничений r задачах оптимального управления со смешанными ограничениями.
Многие примеры задач оптимального управления с операторными ограничениями, в которых не справедлив принцип максимума, достаточно хорошо известны [23, 48] (см. также [2, с.261]). Напомним два из них. Первым из примеров, которые мы здесь приведем, является ставший уже классическим пример Ю.В.Егорова [23, 48], ’’снабженный” нами дополнительно параметром в ограничении.
Пример 0.2.2.
Id(v,T) = Т -у inf, Ii(v,T) = x[v,T](T) = q, q £ 12 — параметр (0.2.2)
X = v(t), z(0) = 0, x(() = (1г(г), s2(0, ■ • ■), v(<) ü (vl(f), V2(t),...), x(t) ehVt> 0,
u = (v,T)eV, Vs {(v,T) :veVT, T > 0},
VT = {v : 6 Loc{0,T), И01 < 1 /< + l/*2, » = 1,2,...}.
Как известно (см., например, [23, с.^3]), в этой задаче при q = (1,1/2,...,1 /»,...) оптимальное вре.ня равно 1 и достигается, например, при v(t) = г/(г) = (1,1/2, -.., 1 /*,...). Однако, ни это, а также никакое другое допустимое управление, приводящее в точку q за время 1, не удовлетворяет принципу максимума. В силу простоты примера, легко показать, что данный факт обусловлен тем обстоятельством, что точка q не является опорной ко множеству достижимости При этом она является граничной для
множества Д(2>1,1), т.е. управление v(t) является экстремальным (см., например, [71]) на отрезке [0,1]. Подобные ситуации, когда экстремальные управления для задач в бесконечномерных пространствах не удовлетворяют принципу максимума, хорошо известны (см., например, [11, с.310])). Более того, в силу простоты примера, можно также утверждать, что во множестве достижимости I\(Vr ,Т) всюду плотно лежат точки q, для которых любое оптимальное управление в задаче (0.2.2) удовлетворяет принципу максимума. Таковыми заведомо являются, например, все точки из этого множества с конечным числом ненулевых компонент.
В качестве второго примера рассмотрим простейшую задачу оптимального управления для уравнения теплойроводности с фазовым (полуфазовым) ограничением типа равенства, в котором в качестве целевого пространства выступает пространство Ьъ(0,1) [155].
Пример 0.2.3. Рассмотрим задачу с фиксированным временем •1
I.
ü*(æ)v(:t) dx -> inf, z[v](x,T) = q £ £з(0,1), q — параметр, v(x) £ V = [—1,1], о
12
dz/di - d2z/dx2 = 0, z(x, 0) = v(x), x Є Cl = (0,1),
dz(0,t)/dx - *(0, t) = 0, dz(l,t)/dx + z(l,t) = 0, t Є [0,T],
где v* ф 0 - измеримая ограниченная функция, удовлетворяющая условию v* £ Im I*, где 14 : L2(0,1) -» L2(0,1) - оператор, задаваемый равенством /*[р](-) = *?[p](’»0)j р Є Ь2(0,1), являющийся, очевидно, сопряженным к оператору I : L2(0,1) -> /у2(0,1), задаваемому равенством /[у]() = z[u](-, Т), а р[р] - решение сопряженной задачи
drj/dt + д2г)/дх2 = 0, г)(х, 1) = р(х), х Є (0,1),
dr](0,t)/dx -rj(0,t) = 0, дг)(1,1)/дх + r)(l,t) = 0, і Є [О, Г].
Указанный выбор функции Vя возможен, т.к. решения Т) сопряженной задачи, как хорошо известно (см., например, [67, гл.111]), являются достаточно гладкими функциями. В силу простоты примера (и, в частности, в силу инъективности оператора I, которая легко может быть установлена, например, на основе результатов [108], [121]), очевидно, в этом примере npuq = О существует единственное допустимое, а, значит, одновременно и оптимальное управление ио(х, t) = 0.
Покажем, что оно не удовлетворяет принципу максимума. Действительно, если бы это было не так, то существовала бы пара (ро,у) Є R1 х Ь2(ГІ),
/і0 > 0, (/іо, у) ф 0, (0.2.3)
такая, что
.'1
/ ((i0v*(x) + *?[«/] (:r,0))v (s) dx >0 V v G V = {« G Loo(0,l) : u(æ) G V п.в. на (0,1)},
J о
т.е. элемент poV*() + р[у](>0) является опорным к выпуклому множеству V в точке v — 0. Но это означает в данном случае, что pov*(-) + р[р](-,0) = 0, т.к. конус нормалей к множеству V в точке v = 0 состоит лишь из нулевого элемента При этом в последнем равенстве ро — 0, т.к., по предположению, Vя І Im Iя. Таким образом, можно утверждать, что (ро,р[у]) = 0, что, в свою очередь, на основании инъективности оператора Iя, влечет равенство (р0,у) — противоречащее условию невырожденности пары множителей Лагранжа (0.2.3). Итак, мы показали, что оптимальное управление о данном примере при q — 0 не может удовлетворять принципу максимума.
Покажем одновременно, что конус нормалей Кларка Nç ((0,0); ер» fi) к надграфику функции значений fi в этой задаче при q = 0 содержит лишь пулевой элемент (/9(0) = 0).
В силу инъективности оператора I, оператор /“1 : Im I -> L2(0,1) является линейным. Поэтому функция значений fi(q), задаваемая, очевидно, равенством
fi(q) = I v*(x)r\q)(x)dx, q£lml,
j о
является линейной на Im I и, значит, можно утверждать, что функция fi (q) является выпуклой на 1/2(0,1). Предположим, что конус нормалей Nc((0,0); ері р) содержит ненулевой элемент, т.е. существует ненулевая нормаль ((, -а) G 0); epi fi), а > 0; являющаяся
в данном случае и нормалью в смысле выпуклого анализа, т.е. {(£, — а), (q, 7)) < О V(q.'y) G ері fi, или (£,<?} — ау < 0 V(ç, 7) G ері fi, откуда, в свою очередь, следует, что
((, q) - а / 1/*(я)/-1[д](я) dx < 0 Vq G Iml.
./о
13
Из последнего неравенст.ва получаем (С, z[v](-y Т)) — a(v*}v) < 0 Vv € V2, т.е. (77[£] — av*,v) < О Vv £ V2 и, стало быть, т?[<] - av* = 0. Из последнего равенства, па основании опять же условия v* $ Im Г и инъективности оператора Г, получаем, наконец, (£, — <•*) = 0. Очевидно, те же самые рассуждения можно провести для любого элемента q = *[*/](•,Т), если только управление v(or) £ (— 1,1) п.в. на (0,1). В то же время легко показать, что точки q = z[v](',T), при v £ V таких, что v(x) £ {—1,1} на множестве положительной меры, всюду плотно лежат в dom ft и для каждой такой точки принцип максимума выполняется для оптимального управления задачи.
Эти, а также другие подобные примеры (естественно, число подобных разнообразных примеров можно неограниченно увеличивать) объединяет одно очень важное обстоятельство: выполнимость принципа максимума в них и, более того, регулярного принципа максимума (т.е. с ненулевым множителем, соответствующим фупкпиопалу качества) жестко связано с дифференциальными свойствами функций значений задач как функций параметра, аддитивно входящего в ограничение - наличие нормали в каком-либо естественном смысле к надграфику функции значений при некотором выбрапном значении параметра гарантирует выполнимость в соответствующей задаче регулярного принципа максимума.
Сказанное выше служит мотивацией отказа в настоящей работе от традиционного требования выполнимости в задачах оптимального управления отмеченного выше обстоятельства (I) и рассмотрения, в контексте общей идеологии метода возмущений (см., например, [2, с.263]) задачи оптимального управления как элемента семейства задач, зависящих от параметра, аддитивно входящего в ограничение. Говоря конкретнее, мы рассматриваем задачу минимизации
(Aq) /0(и) ->■ inf, A(tt) £ М + q, и £ V, q £ В - параметр,
где V - полное метрическое пространство. В - равномерно выпуклое банахово пространство с дифференцируемой по Фреше нормой, /о : V -> R} - непрерывный ограниченный снизу функционал, I\ : V -4 В - непрерывный оператор, М С В - выпуклое замкнутое (вообще говоря, без внутренних точек) множество. В соответствии со сказанным основным ’'объектом", подлежащим ”нахождению” является минимизирующая последовательность - минимизирующее приближенное решение в смысле Дж.Варги [18], т.е. последовательность элемептов (будем называть их также управлениями) и1 £ V, г = 1,2,..такая, что
/о(«') < т+6 vi'
для некоторых последовательностей неотрицательных чисел 6\ с*, s = 1,2,..., 6\ б‘ -> 0, t -* 00, где
P(q) = Mg) 5 lira Mq), &(q) = inf /„(u), P<(q) = +00, если V( = 0,
V\ = {u£V: p(h{u)-q,M)<t}, i> 0,
p(-} M) - функция расстояния. Возникающая здесь функция (функционал) ft : В -» Rl U {-Гсо} называется функцией значений задачи (Л9) и для иее справедливо перавепство ft(q) < fto(q) Vq £ В, где ft0 : В -У R1 - классическая функция значений. В связи с задачей (Aq), которая имеет вид абстрактной задачи минимизации с ограничением в банаховом пространстве, но аксиоматика которой нацелена лишь на задачи оптимального управления, и в связи с введенным понятием м.п.р. отметим следующие обстоятельства:
14
(a) м.п.р. всегда существует;
(b) функция значений ”согласованная” именно с понятием м.п.р. (а не с понятием классического оптимального управления) является всегда полунепрерывной снизу;
(c) использование понятия м.и.р. позволяет записывать все результаты для задачи ( А^ в терминах расширенной [18] задачи, если такое расширение возможно;
((1) именно понятие м.п.р. существенно используется в теории численных методов оптимального управления, а также в теории задач оптимального управления с приближенно известными исходными данными;
(е) понятие м.п.р. несет в себе регуляризирующее начало;
(1) понятие м.п.р. является очень удобным с прикладной (инженерной) точки зрения [18], т.к. позволяет ” приближаться” сколь угодно близко к нижней грани задачи без ’'обязательного” требования строгой выполнимости ее ограничений и, вообще говоря, использовать при этом лишь ’’релейные” управления.
Следует отметить, что различные аспекты теории оптимального управления, связанные с субоптимальностью и м.п., постоянно привлекали внимание исследователей [18, 86, 201, 202, 218, 220, 223, 225, 244]. Однако практически до последнего времени все результаты работ по минимизирующим последовательностям группировались лишь вокруг получения необходимых условий. Первыми работами, в которых для задач оптимального управлепия сосредоточенными и распределенными системами необходимые условия формулировались в терминах м.п., были, по-видимому, работы [122, 124, 126]. В них для ряда задач оптимального управления (без ограничений, с ограничениями типа равенства и неравенства) как обыкновенными системами [124, 126], так и уравнениями в частных производных (задача Гурса-Дарбу) [122] были получены необходимые условия на м.п. в форме так называемого возмущенного принципа максимума. Далее, вторым из авторов этих работ последовательно были получены необходимые и достаточные условия на м.п. и для других задач оптимального управления (в частности для задач с поточечными фазовыми ограничениями) сосредоточенными и распределенными системами [156, 163, 164]. В работе [26] на основе дискретных аппроксимаций непрерывных процессов были получены необходимые условия субоптимальности в форме так называемого принципа с-максимума (см. также [86]). В цикле работ (см., например, [220, 223]) изучались необходимые условия на м.п., а также вопросы сходимости м.п. для целого класса задач оптимального управления абстрактными полулинейными дифференциальными уравнениями в банаховом пространстве с терминальным ограничением и нефиксированным временем. Для того же класса задач в [225] были получены связанные с принципом максимума явные оценки уклонения произвольного управления от оптимального в некоторой естественной метрике. И, наконец, в самое последнее время интерес к проблеме необходимых условий субоптимальности и на м.п. был проявлен авторами работ [234, 235, 236], в которых были рассмотрены задачи оптимального управления распределенными системами, описываемыми нелинейными параболическими уравнениями.
Полунепрсрывность снизу функции значений /3 является наиважнейшим обстоятельством для теории оптимального управления, т.к. позволяет ’"подключить” к анализу оптимизационных задач интенсивно развивающийся в последние годы аииарат негладкого анализа, а, именно, анализа нормалей (проксимальных нормалей) для замкнутых множеств в банаховых пространствах и обобщенного дифференцирования негладких функций в банаховых пространствах. Различные важные результаты в этом направлении были получены в работах Р.Рокафеллара [247, 248, 249, 250], Ф.Кларка [55], Дж.Борвейна и Х.Сгроджуаса [208],
15
Б.Ш.Мордуховича [86, 87, 88, 237, 238], Б.Ш.Мордуховича и Й.Шао [239, 240] и ряда других авторов [227, 229, 230, 254]. Именно использование негладкого нормального анализа и теории обобщенного дифференцирования полунепрерывных снизу функций позволяет рассматривать каждую задачу оптимального управления ” не изолированно”, а как элемент семейства аналогичных задач и получать информацию ”в целом” о семействе и, как следствие, во многих важных частных случаях о каждой конкретной задаче отдельно. Такой подход приводит к возможности изучения условий регулярности, нормальности, проблемы чувствительности для широкого класса задач оптимального управления, а также позволяет ’’сблизить” теорию необходимых условий (теорию принципа максимума) и теорию численных методов оптимального управления.
Следует отметить, что первые результаты в этом направлении были получены, по-видимому, Ф.Кларком [55, 214], Ф.Кларком и Ф.Ловеном [215] для задач оптимального управления системами обыкновенных дифференциальных уравнений с помощью теории перпендикуляров [55] к замкнутым множествам в конечномерном пространстве[55, 215] и с помощью проксимальных нормален [208] к замкнутым множествам в рефлексивных пространствах [214]. В этих работах были получены полезные представления для обобщенных градиентов в смысле Кларка функций значений в терминах множителей Лагранжа. При этом рассматривались классические оптимальные управления и функции значений, а на задачи накладывались специальные условия для обеспечения полупепрерывности снизу классической функции значений в окрестности рассматриваемого фиксированного значения параметра.
Рассмотрение задачи (семейства задач) (Д) дает возможность изучения широкого спектра различных классических вопросов теории оптимизации, к которым можно отнести: 1) необходимые и достаточные условия для м.п.р. (в частности, для обычных или обобщенных оптимальных управлений); 2) различные свойства регулярности, нормальности, их связь с множителями Лагранжа, с дифференциальными свойствами функции значений, с векторами Куна-Таккера; 3) свойства чувствительности; 4) сходимость м.п.; 5) численные методы оптимального управления; 6) методы решения задач с приближенно известными исходными данными, регуляризация в задачах оптимального управления.
В результате ”расшифровки” абстрактных результатов для задачи (Д) в диссертации получаются конкретные результаты по указанным вопросам для распределенных задач оптимального управления системами, описываемыми линейными, полулинейными и квазилинейными параболическими, эллиптическими и гиперболическими уравнениями с различными функциональными и операторными ограничениями. При этом, несмотря на то, что целевое пространство задачи (Д) является равномерно выпуклым, мы показываем как на, основе этих результатов получаются результаты, связанные с перечисленными выше вопросами, также и для задач вида (Д), но для случая целевых пространств с равномерной метрикой. Мы показываем также возможность распространения указанных результатов и на так называемые негладкие задачи оптимального управления.
Развиваемая в диссертации теория субоптимального управления оказывается полезной также и для теории численных методов оптимального управления, в которых понятие м.п.р. является, по сути дела, центральным. Здесь предлагаются алгоритмы решения задач оптимального управления, основанные на двойственности, доказывается их сходимость, показывается, что такие алгоритмы также теснейшим образом связаны с дифференциальными свойствами функции значений: наличие нормали к надграфику функции значений ’’порождает” численный алгоритм.
16
Кроме того, понятие м.п.р. оказывается чрезвычайно полезным и для теории задач оптимального управления с приближенно известными исходными данными, т.к. благодаря этому понятию многие из результатов, о которых шла речь выше переносятся и на. такие важные с прикладной точки зрения задачи (в первую очередь это относится к принципу максимума). В то же время, использование в задачах с приближенными данными классического понятия оптимального управления встречает, как известно, принципиальные трудности.
Подытоживая сказанное, можно утверждать, что переход к рассмотрению м.п.р., представляющий собой в известном смысле ’’максимальное” расширение исходной задачи, находится в согласии с известным высказыванием Д.Гильберта [196] о том, что ’’каждая задача вариационного исчисления имеет решение, если слово ’’решение” понимать подходящим образом”. Понимая под решением оптимизационной задачи м.п., мы показываем, что теория, основанная на этом понятии, обобщая традиционную, даст возможность получить новую полезную информацию о задаче. Такая ситуация вполне схожа с той, что возникает при переходе от обычных управлений к обобщенным в смысле [18, 27, 29, 183, 196, 224].
Цель диссертационной работы. Цель работы состоит в разработке методов теории субоптимального управления распределенными системами, предназначенных для решения вопросов указанной теории, связанных с необходимыми и достаточными условиями на минимизирующие последовательности, с различными свойствами регулярности и нормальности, с проблемой чувствительности, с негладкими задачами, с численными методами, с задачами с приближенно известными исходными данными.
Методы исследования. В диссертации использованы методы оптимизации, оптимального управления, негладкого анализа, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными, функционального анализа и теории функций действительного переменного.
Научная новизна. В диссертации разработана теория субоптимального управления системами с распределенными параметрами. Показано, что на основе этой теории получаются новые для оптимального управления результаты, относящиеся как к собственно теории, так и к теории численных методов. Все результаты диссертации (главы 1-7) являются новыми.
Степень обоснования результатов диссертации. Все научные положепия и выводы диссертационной работы строго математически обоснованы. Результаты, полученные в диссертации. хорошо согласуются с работами других авторов как отечественных, так и зарубежных.
Теоретическая и практическая ценность. Работа носит теоретический характер. Полученные в ней результаты и методы могут быть применены в теории оптимального управления: 1) при теоретическом исследовании многих сложных конкретных задач с различного рода функциональными и операторными ограничениями; 2) при численном решении различных задач оптимального управления распределенными системами с помощью предложенных в диссертации двойственных численных методов.
17
Результаты диссертации вошли в отчет о НИР1, учебное пособие 2 и были включены в спецкурсы, читаемые для студентов Нижегородского государственного университета им.
Н.И. Лобачевского.
Апробация работы. Результаты диссертации докладывались и обсуждались: на Международной конференции "Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде" (Екатеринбург, 2000); на Симпозиуме "Математическое моделирование в естественных и гуманитарных науках”, посвященпом 80-летию М.А.Красносельского (Воронеж, 2000); на Международной конференции, посвященной 90-летию со дня рождения Л.С.Понтрягина (Москва, 1998); на IV,VI,VII,VIII,IX,X,XI весенних воронежских школах ’’Понтрягинские чтения” (Воронеж, 1993, 1995, 1996, 1997, 1998, 1999, 2000); на Международной конференции ИФИП ’’Моделирование и оптимизация систем с распределенными параметрами с приложениями к инженерии" (Варшава, 1995); на III Всесоюзной школе "Поп-трягпнекие чтения. Оптимальное управление. Геометрия и анализ” (Кемерово, 1990); на школе "Современные методы в теории краевых задач” (Воронеж. 1992); на XIV Всесоюзной школе по теории операторов в функциональных пространствах (Н.Новгород, 1991); на Первом Международном семинаре ИФАК ’’Негладкие и разрывные задачи управления и оптимизации” (Владивосток, 1991); на 1,11 Международных конференциях ’’Математические алгоритмы” (Н.Новгород, 1994,1995); на Международной научной конференции ’’Экстремальные задачи и их приложения" (Н.Новгород. 1992); на Всесоюзной конференции ’’Негладкий анализ и его приложения к математической экономике” (Баку, 1991); на Научной школе-семинаре ’’Разрывные динамические системы” (Ужгород, 1991); на. VII,IX Всесоюзных конференциях "Проблемы теоретической кибернетики” (Иркутск, 1985; Волгоград, 1990); на Всесоюзной конференции "Теория, методология и практика системных исследований" (Москва, 1985); на Итоговых научных конференциях Горьковского госуниверситета (1986-1990).
По теме диссертации были также сделаны доклады на семинаре по оптимальному управлению (ИНГУ, рук. проф. В.И.Плотников, 1977-1988), на Волго-Вятском региональном семинаре по математической физике и оптимальному управлению (рук. проф. С.Ф.Морозов, 1990-1992), па семинарах в Московском государственном университете (рук. проф. Ф.П.Васильев, 1987, 1993, 2000; рук. проф. М.И.Зеликин, 2000; рук. проф. М.С.Никольский, 1988, 1990), на семинаре в Институте математики и механики УРО РАН (рук. акад. РАН Ю.С.Осипов, чл.-корр. РАН А.В.Кряжимский, 1991,1993), на семинаре в Институте проблем управления (рук. проф. В.И.Уткин, 1986).
Результаты диссертации на протяжении ряда лет являлись составной частью результатов работы, выполняющейся при финансовой поддержке различных научных Фондов:
1993- 1994 г.г. - грант Международного Научного Фонда (фонд Дж.Сороса) и Российской Академии Естественных Наук (РАЕН);
1993 - 1995 г.г. - грант Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (проект А/о 93-1-71-19), тема "Теория оптимального
1 Теория оптимального управления распределенными системами: субоптимальпость, минимизирую-
щие последовательности, численные методы. Отчет о НИР по гранту Конкурсного центра при С.-Петербургском университете Госкомитета РФ по высшему образованию (М>93-1-71-19), Ао госрегистрапии 01.9.40006443.1994, 74 с.
-'Новоженов М.М., Сумин В.И., Сумин М.И. Методы оптимального управления системами математической физики. Учебное пособие. Горький: Изд-во ГГУ. 1986.-87 с.
18
управления распределенными системами: субоптимальность, минимизирующие последовательности, численне методы” (Сумин М.И. - ответственный исполнитель);
1995-1997 г.г. - грант Российского Фонда Фундаментальных Исследований (проект Äfo 95-01-00701), тема ’’Теория субоптимального унравления распределенными системами и функциональные вольтерровы уравнения” (Сумин М.И. - ответственный исполнитель);
1998-2000 г.г. - грант Российского Фонда Фундаментальных Исследований (проект Л/о 98-01-00793), тема’’Теория субоптимального управления распределенными системами: минимизирующие последовательности, операторные ограничения, граничные управления, численные методы” (Сумин М.И. - руководитель);
Публикации. Всего по теме диссертации опубликовано более 70 работ. Основпые результаты диссертации опубликованы в следующих 36 работах (в скобках указаны номера но списку литературы):
1. ([122]) Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей в задачах управления системами с распределенными параметрами // Ж. вычисл. матем. и матсм. физ. 1982. Т.22. .Vol. С.49-56.
2. ([123]) Плотников В.И., Сумин М.И. Необходимые условия в негладкой задаче оптимального управления // Матем. заметки. 1982. Т.32. Л/о 8. С.187-197.
3. ([124]) Плотников В.И., Сумин М.И. О построении минимизирующих последовательностей // Дифференц. ур-ния 1983. Т.19. Л/о4. С.581-588.
4. ([125]) Плотников В.И., Сумин М.И. Оптимальное управление объектами с распределенными параметрами, описываемыми негладкими системами Гурса-Дарбу с ограничениями типа, неравенства // Дифференц. ур-ния. 1984. Т.20. Л/Ь5. С.851-860.
5. ([156]) Сумип М.И. О достаточных условиях на элементы минимизирующих последовательностей // Ж. вычисл. матем. и матем. физ. 1985. Т.25. Л/ol. С.23-31.
6. ([126]) Плотников В.И., Сумин М.И. Об условиях на элементы минимизирующих последовательностей задач оптимального управления // Докл. АН СССР. 1985. Т.280. Л/о2. С.292-296.
7. ([89]) Морозов С.Ф., Сумин М.И. Об одном классе задач управления динамическими системам с разрывной правой частью // Кибернетика. 1985. Л/оЗ. С.59-65.
8. ([163]) Сумин М.И. О минимизирующих последовательностях в задачах оптимального управления при ограниченных фазовых координатах // Дифференц. ур-ния. 1986. Т.22. ЛГоЮ. С.1719-1731.
9. ([165]) Сумин М.И. Достаточные условия оптимальности в негладких задачах оптимального управления распределенными системами // Дифференц. ур-ния. 1986. Т.22. ЛГо2. С.326-337.
10. ([157]) Сумин М.И. Оптимальное управление системами с приближенно известными исходными данными // Ж. вычисл. матем. и матем. физ. 1987. Т.27. Л/о2. С. 163-177.
11. ([90]) Морозов С.Ф., Сумин М.И. Оптимальное управление скользящими режимами разрывных динамических систем // Известия ВУЗов, Математика. 1990. Л/ol. С.53-61.
12. ([166]) Сумин М.И. О функционале невязки принципа максимума в теории оптимального управления // Ж. вычисл. матем. и матем. физ. 1990. Т.30. Л/о8. С.1133-1149.
13. ([158]) Сумин М.И. Оптимальное управление разрывными динамическими системами со скользящими режимами // Дифференц. ур-ния. 1988. Т.24. Л/oll. С.1911-1922.
19
14. ([160]) Сумин М.И. Оптимальное управление объектами, описываемыми квазилинейными эллиптическими уравнениями // Дифференц. ур-ния. 1989. Т.25. jVoS. С.1406-1416.
15. ([161]) Сумин М.И. О первой вариации в теории оптимального управления системами с распределенными параметрами //Дифференц. ур-ния. 1991. Т.27. Л/о 12. С. 2179-2181.
16. ([162]) Сумин М.И. О необходимых условиях оптимальности в задачах оптимального управления системами с распределенными параметрами // Методы прикладного функционального анализа. Межвузовский сборник. Н. Новгород: Изд-во Нижегородского университета. 1991. С.88-94.
17. ([151]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами. Труды первой Международной конф. ’’Математические алгоритмы”, 1995. С.116-125, Изд-во Нижегородского ун-та, Н.Новгород.
18. ([152]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений // Ж. вычисл. ма-тем. и матем. физ. 1997. Т.37. N 1. С.23-41.
19. ([153]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами: свойства нормальности, субградиентный двойственный метод” // Ж. вычисл. матем. и матем. физ. 1997. Т.37. N 2. С.162-178.
20. ([252]) Sumin M.I. Suboptimal control of systems with distributed parameters: minimizing sequences, value function, regularity, normality // Control and Cybernetics, 1996, V.25, No.3, P.529-552.
21. ([150]) Сумин В.И., Сумин М.И. Субоптимальное управление вольтерровыми функциональными уравнениями: минимизирующие последовательности, функция значений, регулярность, нормальность. Математическое моделирование и оптимальное управление, Межвузовский сборник научн. тр., 1996, С.23-31, Изл-во Нижегородского ун-та, Н.Новгород.
22. ([251]) Sumin M.I. Suboptimal control of systems with distributed parameters: minimizing sequences, value function, regularity, normality, Abstracts of IFIP Conf. ” Modelling and optimization of distributed parameter systems with applications to engineering”, Warsaw, Poland, 1995, Warsaw: System Research Institute, 1995, P. 156-157.
23. ([159]) Сумин М.И. Субоптимальное управление системами с распределенными параметрами: минимизирующие последовательности, функция значений, регулярность, нормальность, негладкие задачи, Нижегородский ун-т.- Н.Новгород, 1996. - 120с. Ден. в ВИНИТИ 08.01.97. N 62-В97.
24. ([167]) Сумин М.И. Субоптимальное граничное управление системами, описываемыми параболическими уравнениями. Тезисы докл. школы ’’Ионтрягинские чтения - VII”, Воронеж, ВГУ, 1996, С.172, Изд-во Воронежского ун-та, Воронеж.
25. ([168]) Сумип М.И. Субоптимальное граничное управление эллиптическими уравнениями с фазовыми ограничениями. В кн. ” Современные методы в теории краевых задач ” Ионтрягинские чтения - VIII”: Тезисы докладов школы, Воронеж, ВГУ (4-9 мая 1997)”, Воронеж: ВГУ, 1997, С.146.
26. ([169]) Сумин М.И. Субоптимальное граничное управление параболическими уравнениями с операторными ограничениями, В кн. ’’Воронежская весенняя математическая школа, Современные методы в теории краевых задал, Ионтрягинские чтения-IX, Тезисы докладов (3-9 мая 1998 г.)”, 1998, Изд-во Воронежского ун-та, Воронеж, С. 192.
20
27. ([170]) Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами, В кн. '“’Международная конференция, посвященная девяностолетию со дня рождения Л.С.Нонтрягина, Москва, 31 августа - 6 сентября 1998 г., Тезисы докладов, Оптимальное управление и добавления”, 1998, Изд-во Московского ун-та, Москва, С.261-263.
28. ([154]) Сумин М.И. Субоптимальное управление распределенными системами 1. Абстрактная задача минимизации с операторным ограничением в гильбертовом пространстве, Вестник Нижегородского государственного университета ’’Математическое моделирование и оптимальное управление”, 1998, 2(19), Изд-во Нижегородского ун-та, Н.Новгород, С. 152-165.
29. ([155]) Сумин М.И. Субоптимальное управление распределенными системами II. Параболическое уравнение, операторное ограничение, граничное управление, Вестник Нижегородского государственного университета ’’Математическое моделирование и оптимальное управление”, 1999,1(20), Изд-во Нижегородского ун-та, Н.Новгород, С.138-153.
30. ([171]) Сумин М.И. Принцип максимума в параметрической задаче быстродействия для параболического уравнения с операторным ограничением в гильбертовом пространстве В кн. ’’Воропежскдя весенняя математическая школа, Современные методы в теории краевых задач, Понтрягинские чтения-Х, Тезисы докладов (3-9 мая 1999 г.)”, 1999, Изд-во Воронежского ун-та, Воронеж, С.235.
31. ([172]) Сумин М.И. Принцип максимума в теории субоптимального управления распределенными системами с операторными ограничениями в гильбертовом пространстве. Итоги науки н техники. ВИНИТИ. Современная математика и ее приложения. Тематические обзоры. 1999. Т.66. С.193-2ч35.
32. ([253]) Sumin M.I. Optimal control of semilinear elliptic equation with state constraint: maximum principle for minimizing sequence, regularity, normality, sensitivity // Control and Cybernetics. 2000. V.29. No.2. P.449-472.
33. ([173]) Сумин М.И. Субоптимальное управление полулинейным эллиптическим уравнением с фазовым ограничением и граничным управлением // Дифференц. ур-ния. 2000. Т.36. Afoll.
34. ([174]) Сумин М.И. Субоптимальное управление полулипейными эллиптическими уравнениями с фазовыми ограничениями, I: принцип максимума для минимизирующих последовательностей, нормальность // Известия ВУЗов, Математика. 2000. Л/об. С.ЗЗ-44.
35. ([175]) Сумин М.И. Субоптимальное управление полулинейными эллиптическими уравнениями с фазовыми ограничениями, II: чувствительность, типичность регулярного принципа максимума // Известия ВУЗов, Математика. 2000. Л'оЗ. С..
36. ([176]) Сумин М.И. Оптимальное управление параболическими уравнениями: двойственные численные методы, регуляризация, В кн. ’’Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде. Сб. докладов к Международной конференции (Екатеринбург, 30 мая - 2 июня 2000 г.)”, 2000, Екатеринбург: Изд-во Ин-та математики и механики УрО РАН. С.66-69.
Из них: 22 статьи в центральных математических журналах, 1 в периодическом издании ВИНИТИ ’’Итоги науки и техники”, 4 - в научных сборниках ННГУ, депонированных работ - 1, в трудах конференций - 8.
21
Все результаты, вошедшие в диссертацию (главы 1 - 7), являются новыми и изложены в указанных работах. Результаты главы 1 содержатся в работах [154, 159], главы 2 - в работах [122, 124, 126, 150, 151, 152, 153, 155, 156, 159, 166, 167, 169, 170, 171, 172, 251, 252], главы 3 - в работах [151, 152, 153, 160, 161, 162, 163, 168, 173, 174, 175, 252, 253], главы 4 - в работах [122, 124, 156, 159], главы 5 - в работах [89, 90, 123, 125, 156, 159, 165], главы 6 - в работах [153, 166, 176], главы 7 - в работах [153, 157, 166, 176]. Все результаты диссертации целиком принадлежат автору диссертации.
В трех совместных с В.И.Плотниковым работах [122, 124, 126] рассматривались лишь необходимые условия, причем только для классических минимизирующих последовательностей, т.е. для последовательностей управлений, удовлетворяющих ограничениям в точном смысле. Из этих, по сути дела, первых работ по минимизирующим последовательностям в оптимальном управлении автором используется лишь общая идея перехода в распределенных задачах оптимального управления к рассмотрению в качестве ”базового элемента” теории минимизирующей последовательности, а не оптимального управления. В диссертации же в качестве ”базового элемента” используется минимизирующее приближенное решение в смысле Дж.Варги. Это позволило построить совершенно новую теорию субоптимального управления и рассмотреть при этом весьма широкий спектр оптимизационных вопросов, изучение которых было бы совершенно невозможно в рамках классических минимизирующих последовательностей.
В двух других совместных с В.И.Плотниковым работах [123, 125], а также в двух совместных работах с С.Ф.Морозовым [89, 90] авторами были предложены методы получения необходимых условий оптимальности в негладких (разрывных) задачах оптимального управления, одними из составных частей которых являются процедуры сглаживания исходных данных. Эти процедуры сглаживания, в равной мере принадлежащие авторам указанных работ, используются в главе 5 для изучения новых вопросов, совершенно не затрагиваемых в указанных совместных статьях.
В совместной с В.И.Суминым работе [150] содержатся результаты, иллюстрирующие эффективность предлагаемых в диссертации методов и показывающие возможность их применения и к такому достаточно широкому кругу задач субоптимального управления распределенными системами, как задачи, описываемые так называемыми вольтерровыми уравнениями, теория которых разрабатывается в работах В.И.Сумина. Все результаты [150], связанные со свойствами регулярности, нормальности, чувствительности и т.п., получены методами, разработанными автором диссертации. При этом, естественно, использовались результаты, связанные с существованием и устойчивостью решений указанных уравнений, принадлежащие В.И.Сумипу.
0.3 Краткий обзор содержания диссертации
Первая глава диссертации посвящена изучению абстрактной задачи минимизации с аддитивно зависящим от параметра операторным ограничением типа включения в выпуклое замкнутое множество равномерно выпуклого банахова пространства с дифференцируемой по Фреше нормой. Вся аксиоматика этой абстрактной задачи нацелена лишь на изучение конкретных задач оптимального управления сосредоточенными и распределенными системами с различного рода ограничениями и на получение в них результатов, связанных с необходимыми и достаточными условиями на м.п., со свойствами регулярности, нормальности,
22
чувствительности и т.п..
При получении абстрактных необходимых условий (суб)оптимальности и представлений для субдифференциалов функций значений указанная абстрактная задача каждый раз на определенном этапе трансформируется в задачу минимизации на некотором полном метрическом пространстве функционала тина максимума от конечного числа ’’обычных” (в смысле существования первых вариаций) функционалов. Поэтому п.1.1 посвящен доказательству обобщенного правила множителей для (суб)оптимальных элементов в задаче (в более упрощенной по сравнению с п.1.1 формулировке)
^(«) = гпах{Ф;(«) + j = 0,1,... ,ае} -4 inf, и£Т>} (0.3.1)
где V - полное метрическое пространство элементов и, называемых также управлениями, Ф} : V R} - непрерывные ограниченные снизу функционалы, > 0 - некоторые фиксированные числа, d - метрика на V, & 6 V - некоторое фиксированное управление. Правило множителей для задачи (0.3.1) формулируется при определенных предположениях общего характера относительно ’’обычных” функционалов Ф; и метрики d. Использование в качестве множества допустимых элементов полного метрического пространства, а также наличие слагаемого с метрикой в каждой компоненте функционала объясняется тем, что одним из основных инструментов в теории субоптимальпого управления является вариационный принцип Экланда [218]. Указанные выше условия общего характера (которые мы даем ниже в ’’укороченной” по сравнению с п.1.1 форме) предполагают наличие линейного пространства ’’параметров варьирования” М с элементами m и отвечающих каждому управлению и Е V ’’своих” выпуклого множества М„ С М, числа а“,т > 0 и непрерывного отображения - вариации управления Nu~ : [0. <*u,,n] -> £>, Nu~(0) = «, таких, что
(a) (аксиома существования первых вариаций функционалов Ф?) для некоторой функции С : [0,1] с(0) = 0, с(а) > 0 при а > 0, существуют пределы V и Е V, m 6 Mu
$Ф>(*,т) = Пт^(Ф}(Ни~(а)) - Ф.(и)),
Vj е ] = {j Е {0,1,...,®} : Ф,(«) + {Д«,й) = Ми)}]
(b) (аксиома равномерной ограниченности производных чисел метрики, согласованных с вариацией управления) для некоторой постоянной L > 0 выполняется неравенство
^(N^sMjV) “ d(u,v) < Lc(or) V u,v E X>, m £ Mu, a E [0,au'm];
(c) (аксиома линейности первых вариаций функционалов Ф^)
бФ](и, Aim! + A2m2) = Аг6Ф,(1/, тг) + А2АФ;(гг, т2), 3 €
V« £V, mi, тг € Ai > 0, A2 > 0, Ai -f A2 < 1.
При сформулированных условиях справедлива
Теорема 0.3.1. Пусть и Е V - 8-оптимальный элемент в задаче (0.3.1), т.е. Ми) < inf J${v) + S. Тогда существуют элемент п6 Е V, удовлетворяющий неравенству d{u*,u) <
Д, и вектор множителей Лагранжа ps = (/ij,..., р^) Е Я**1, l//^ = 1, р[ > 0, рк(Ми&) ~ Фк(и*) — {*<{(«*,«)) = 0, к = 0,1,... ,ае, такие, что
£>2(<5Ф4(.Лт) + 2Щм + Д)) > О Vm G М„..
к=0
23
В п.1.2 рассматривается абстрактная параметрическая задача (Л?), причем, как уже было сказано в п.0.2, в качестве ’’искомого” элемента выступает м.п.р. в смысле Дж.Варги [18]. Выбор в качестве целевого в задаче (Л?) равномерно выпуклого пространства с дифференцируемой по Фреше нормой обусловлен тем методом, который мы применяем для ее изучения. При этом, с одной стороны, т.к. равномерная выпуклость пространства обеспечивает его строгую нормированного» [184, с.51], [35, с.496, упражнение 7], то проекция точки на выпуклое замкнутое множество в этом случае существует и единственна [177, с.152, лемма 1], что в совокупности с дифференцируемостью нормы приводит к непрерывной дифференцируемости по Фреше для любого выпуклого замкнутого множества М С В выпуклой функции (функционала) расстояния /?(■. М) в окрестности любой точки д £ в такой, что р(д, М) > 0. С другой же стороны, равномерная выпуклость пространства Б позволяет считать его также пространством Асплунда [200], что позволяет применять для изучения задачи (А?) как эффективные методы негладкого секвенциального анализа для таких пространств, развитые в последние годы в работах Б.Ш.Мордуховича и Й.Шао [240], так и различные другие эффективные методы негладкого проксимального анализа для замкнутых множеств в банаховых пространствах [208].
Особо оговоримся, что часть основных результатов настоящей работы так или иначе используют попятия нормалей и субдифференциалов именно в смысле работ [86], [240], т.к., с одной стороны, в этих работах развито весьма полное и удобное субдифференциальное исчисление, а с другой, как известно [227], именно эти, вообще говоря, невыпуклые конструкции негладкого анализа являются, в известном смысле, наиболее ’’топкими” по сравнению с другими аналогичными конструкциями.
Любой метод получения необходимых условий оптимальности предполагает прежде всего решение двух основных проблем. Одна из них заключается в эффективном вычислении первых вариаций функционалов оптимизационной задачи, другая же - в учете ограничений задачи. Можно утверждать, что предлагаемый в работе подход к получению необходимых условий для м.п.р. (условий (суб)онтимальностп) и, как следствие, представлений в терминах множителей Лагранжа для субдифференциалов д@(д), д™0(д) в смысле [240], в своей основе для решения двух отмеченных проблем опирается на два хорошо известных в теории оптимальною управления подхода. Для подсчета первых вариаций функционалов в конкретных задачах применяется идея В.И Плотникова, использования для этой цели линейных интегральпых представлений их приращений [112]. Для учета же ограничений задач применяются различные модификации метода Ф.Кларка [217], заключающегося в сведении задачи с ограничениями к задаче минимизации функционала типа максимума вида (0.3.1) с применением вариационного принципа Экланда [218], необходимые условия в которой получены в п.1.1.
Также как и в случае задачи (0.3.1), аксиоматика задачи (Лд) предполагает (в упрощенном здесь варианте) наличие линейного пространства ’’параметров варьирования” М с элементами т и отвечающих каждому управлению и £ V "своих” выпуклого множества Ми С М, числа > 0 и непрерывного отображения - вариации управления : [0,аи,т] V, №у,т(0) = и. Не имея здесь возможности в краткой форме изложить всю аксиоматику, остановимся лишь па ее главных моментах. Первые три аксиомы во многом напоминают аксиоматику задачи (0.3.1). Приняв обозначения Ф0(и) = /о(и), = р(1\(и) — д,Л4),
запишем
а) (аксиома существования первых вариаций) для некоторой фупкции с : [0,1] -> Л*,
24
<^(0) = 0, <г(а) > 0 при а > 0, существуют пределы
6ф0(и,т) = lim -j-r(^0(Nu>m(от)) - Фо(«)) V n в V, m в Mu>
6Vi(u,m;p) = lim ^^*(^i(NU|I1,(a), q) - Фг(«,д)) V« £V, m £ Mu таких, что q) > 0,
где p = dp(h(u) - q,M);
б) (аксиома равпомерной ограниченности производных чисел метрики, согласованных с вариацией управления) для некоторой постоянной L > 0 выполняется неравенство
d(NUifn(a), i/) - d(u, v) < L<;(a) V и, v £ £>, m £ Mu, a £ [0, au,m];
в) (аксиома линейности первых вариаций)
<5Фо(«, Ajmi + A2m2) = А1<5Фо(и, rni) + А2<5Фо(л> m2)
Vu £ T), mi, m2 E Mu» Ai > 0, A2 ^ 0, Ai + A2 < 1,
<5Фi(«,A1ml + A2m2;p) = \i6Vi(u, тцр) + A^ifu, m2;p)
V« £ V такого, что Ф1(u}q) > 0, Vmi, m2 E Mu, Aj > 0, A2 > 0, Ai 4- A2 < 1.
Прежде чем переходить к обсуждению последних трех аксиом для задачи (Ая) остановимся кратко на аксиоме а). Ее главное отличие от аксиомы (а) для задачи (0.3.1), а также от аналогичных аксиом абстрактных схем других авторов [51, 52, 53, 80, 81, 191, 192, 193, 194, 195, 219] заключается в том, что в пей постулируется существование не предела
6h(«,m) = lim _/,(*)) 6 ß
о-+о с(<*)
как элемента целевого пространства В: а числового предела £Фх(«, m;p), в котором ’’учитывается” одновременно посредством функции расстояния р(-, A4) и ограничение p(I\(u) — q, A4) = 0. В конкретных задачах с учетом дифференцируемости по Фреше функции расстояния р(-} A4) в окрестности точек q таких, что p(q, М) > 0 (см. выше) вычисление первой вариации m;p), как правило, существенно проще подсчета традиционного предела 6l\(u, т).
В то же время, градиент р = dp(I\(u) — q, A4) в конечном итоге ’’трансформируется” в множитель Лагранжа (функциональный, если В - функциональное пространство), отвечающий операторному ограничению 1\(и) £ A4 + с/.
Отдельно отметим, что п.1.2 содержит также аналогичные альтернативные аксиомам а), б) условия, связанные с так называемым двухпараметрическим варьированием управлений и дающие возможность использования эффективных повторных предельных переходов при вычислении первых вариаций во многих конкретных оптимизационных распределенных задачах.
Далее, т.к. метод получения необходимых условий для м.и.р. в задаче (Л*) предполагает использование предельного перехода в семействах необходимых условий в некоторых промежуточных оптимизационных задачах, то следующие две аксиомы как раз и представляют собой аксиомы предельных переходов но и и q в семействах первых вариаций <5Фо, £Фь Первая из них, которую можно назвать аксиомой сильного предельного перехода, постулирует непрерывность этих первых вариации в метриках пространств Т>, В: сильная сходимость
25
ul -t и, q1 -> q) i-^ocB случае {u,q) > 0 (для и, как следствие, сильная сходимость р' = др(1\(иг) — q\M) G В' к р = dp(Ji(u) — q, M) G В*, влечет сходимость первых вариаций №\-
Вторая аксиома, предельного перехода, которую условно можно назвать аксиомой слабого предельного перехода, постулирует возможность аналогичного предельного перехода при и* и, (f q, г -> оо, в метриках V и В в случае Ф1 (u,q) = 0, т.к. для таких (tf,g) первая вариация <5Фг вообще пе определена. В этом случае р1 = др(1-\ (u‘) - q\ М) G В* сходится к некоторому элементу р G В* лишь слабо и аксиома показывает как надо понимать предельный переход в семействе первых вариаций в ситуации когда и = и0 является оптимальным управлением, удовлетворяющим равенствам /о(«°) = /?(<?), p(/i(«°) - q,M) = 0.
И, наконец, последняя аксиома, которую можно условно назвать аксиомой компактности, предполагает, что оператор Д обладает свойством компактности образа в следующем смысле: множество {/,(и) : и G V, /0(д) < С} есть компакт в В при любом С, при котором оно не пусто. Это условие является очень естественным для задач оптимального управления и выполняется в большом числе наиболее интересных конкретных задач с различного рода ограничениями.
П. 1.3 посвящен доказательству первого результата для задачи (А) - необходимого условия для м.п.р.. Этот и ему подобные абстрактные результаты для задачи (А) мы называем также абстрактными принципами максимума для м.п.р., т.к. именно в результате ’’расшифровки" таких абстрактных принципов максимума получаются принципы максимума для м.п.р. в конкретных задачах оптимального управления. Первый абстрактный принцип максимума доказывается при одном важном дополнительном условии па целевое множество М, обеспечивающем его достаточное ’’богатство”. Для его формулировки напомпим, что в случае гильбертова пространства В в соответствии с терминологией [219] множество М С В пазывается множеством конечной коразмерности, если существует замкнутое подпространство И С В конечной коразмерности такое, что множество Мс = П(сопьМ) имеет непустую внутренность в Н, где П означает ортогональное проектирование В на Н. При условии достаточного ”богатства” множества М абстрактному принципу максимума удовлетворяет любое м.п.р. в задаче (А).
Теорема 0.3.2. Пусть в задаче (Aq) выполняются хотя бы одно из следующих двух условий: 1) существует компакт Q С В такой, что множество M + Q содержит внутреннюю точку; 2) пространство В является гильбертовым, множество М имеет конечную коразмерность.
Тогда, если fî(q) < 4-ос и последовательность управлений wl Ç.V, г == 1,2,..., является м.п.р., то существуют м.п.р.
wu 6 2JJ', d(w', W1’’) < V?, h(w1-') < Io(w'), (0.3.2)
последовательность векторов множителей Лагранжа р' г (/*ô>A*i) € ^2>
И = 1, И) > 0> J = 0,1» = 0, если p{h(wht) - q, M) = 0, (0.3.3)
такие, что
m) + p[64!i(wl,t, m;p‘) > —р*02L'Jr1 Vm G (0.3.4)
где r = /0(«/‘) - flei(q) < <&* + (fî(q) — &•(<?)), pl = dp(/i(wl,t) — <?. M), причем произвольная слабая предельная в Н.] х В* точка (р^, у) соответствующей последовательности пар
26
(/*о> №\р'), г = 1,2,..., удовлетворяет соотношениям
Во + М Ф 0, (у> г - т) < 0 Уг £ «М, (0.3.5)
г<?е ш Е Л4 - некоторая предельная точка последовательности Л (и/1'*) — <?, г = 1,2,..., /своя <9ля каждой точки у).
Если же целевое множество М не удовлетворяет свойствам 1), 2), то утверждение теоремы остается в силе, но выполнение соотношения невырожденности в (0.3.5) для предельной пары (р-о>у) «в гарантируется.
Замечание 0.3.1. В связи с формулировкой теоремы 0.3.2 следует, пояснить одно обстоятельство, характерное для всей работы. Здесь и ниже нам удобно часто записывать необходимые условия на м.п. в терминах некоторой ”близкой ” к ней м.п. (см. (0.3.2)). В конкретных задачах это условие ”близости" двух м.п. позволяет переписывать получаемые необходимые условия в терминах исходной м.п..
Замечание 0.3.2. Кроме того, важно отметить, что несмотря на равномерную выпуклость пространства В, благодаря последнему утверждению теоремы 0.3.2, она будет нами использована для получения необходимых условий и в задачах (Ая) с целевыми пространствами, которые не являются равномерно выпуклыми и, например, с пространствами В с равномерными метриками. В главах 3 и 4 мы показываем как это делается в случае задач (суб)оптимального управления для эллиптических и гиперболических уравнений с поточечными фазовыми ограничениями, в которых целевыми пространствами являются традиционные пространства непрерывных функций.
Замечание 0.3.3. Следствием сформулированного принципа максимума для м.п.р. и аксиомы слабого предельного перехода является абстрактный принцип максимума для оптимальных управлений.
Теорема 0.3.2, представляющая собой необходимые условия для м.п.р., доказана для любой точки <7 € дот (д. Конечно, это оказалось возможным лишь благодаря дополнительным условиям 1), 2) на целевое множество М. В отсутствие таких дополнительных условий первое утверждение теоремы, вообще говоря, не верно (см. примеры 0.2.2, 0.2.3, а также примеры в п.п.2.3, 4.1). В то же время, в теории (суб)оптимального управления распределенными системами задачи с равномерно выпуклыми целевыми пространствами являются совершенно естественными и во многих случаях постановки задач именно с такими пространствами являются ’’единственно возможными-’.
Выше уже отмечалось, что принцип максимума для задач с операторными ограничениями с выпуклыми замкнутыми целевыми множествами, не обладающими какими-либо дополнительными свойствами типа свойств 1), 2) теоремы 0.3.2 и которые для краткости будем называть ”бедными” множествами, вообще говоря, не верен (см., например, [11, 23, 225]). Одновременно, в ряде работ приводились различные дополнительные условия па исходные данные задач, которые позволяли в случае ”бедных” целевых множеств все же формулировать необходимые условия в форме принципа максимума. Так, например, в [219] такими дополнительными условиями в случае задачи быстродействия по переводу в фиксированную точку гильбертова фазового пространства (являющуюся, очевидно, ’’бедным-' множеством) для полулинейного абстрактного дифференциального уравнения (к которому сводятся многие конкретные распределенные системы) являются весьма жесткие условия на множество
27
допустимых управлений и правую часть управляемой системы, обеспечивающие в процессе доказательства принципа максимума слабую сходимость последовательности множителей Лагранжа к неравному нулю предельному множителю. При этом в некотором смысле эти дополнительные условия напоминают условия 1), 2) на множество М теоремы 0.3.2, но выполнимость их предполагается для некоторых множеств, записываемых в терминах правой части абстрактного уравнения, что, как уже отмечалось выше в п.0.2, ”не соответствует” классическим постановкам задач с управлениями, принимающими свои зпачепия в некотором компактном множестве.
В отличие от такого подхода, в п. 1.4 выполнимость аналогичного первой части теоремы 0.3.2 абстрактного принципа максимума для м.п.р. связывается с дифференциальными свойствами функции значений ß в данной точке q £ dorn ß, а, именно, либо с непустотой субдифференциала dß(q), либо с наличием ненулевого элемента в сингулярном субдифференциале dex>ß{q)> где оба субдифференциала понимаются в смысле [240] (в [154, 155] те же обстоятельства связываются с субдифференциалами в смысле Кларка [55]). Более того, здесь показывается, что в задаче (Л?) всегда имеет место регулярный абстрактный припцип максимума (т.е. с ненулевым множителем, соотвествующим целевому функционалу) для м.п.р., если только субднфференциал Фреше [240] dß(q) ^ 0 или, другими словами, конус нормалей Фреше N((q, ß(q))',epi ß) содержит элемент вида ((,—1).
Теорема 0.3.3. Если ß(q) < +оо, ( £ dß(q) и последовательность управлении wk £ V, к = 1,2,..., является м.п.р., то существуют м.п.р. wl,k £ Vrf, d(wk,wL'k) < г*, ограниченная последовательность множителей Лагранжа цк = (До,д{), 1/^*1 ф 0, fl) > 0, j = 0,1, последовательность точек qk £ в, ||g* - </|| < rk, р\ = 0, если p(Ii(wl,k) — qk.M) = 0, такие, что
o(w1,Ä,m) + /х{<5Ф1(д/1,<г,т;рк) + г*До > 0 Vm £ Mwu, pk ~ dp(I\(w1,k) -qk,M),
где rk > 0, г* —► 0, к оо, - некоторая последовательность чисел, а произвольная слабая в ß1 х 8я предельная точка (щ,у) последовательности (/4,д{р*), к = 1,2,..., удовлетворяет соотношениям д0 = 1, {y,z - т) < 0 Уг £ М, т £ М - некоторая предельная точка последовательности I\(vjl,k) - q, k = 1,2,..., (своя для каждой точки у).
Теорема 0.3.4. Пусть q £ Б такая точка, что ß(q) < +оо. Пусть также С £ dß(q). Тогда существуют м.п.р. wl £ Vf, t = 1,2,..., ограниченная последовательность векторов множителей Лагранжа /г = (1.-/4) € Я2, > 0, и последовательность точек
$' £ В, г = 1,2,..., ||$' - g|| < У, р\ = 0, если p(I\[wx) - $\М) = 0, такие, что
£Фо(«Лт) + т;р‘) > —7* Vm £ М«,.,
у = где у - слабый предел в В* последовательности р\р\ % = 1,2,..., р‘ = др(1i(w*) — Л A4), 11р‘|1 = * = 1,2,. -яра p(/i(w‘) — $‘,Л4) > 0, (;у,г - т) < 0 Wz £ М, т £ Л4
- некоторая предельная точка последовательности 1\(ги*) — <7, £ = 1,2,..., 7' >0, У -» 0, i -> оо.
Теорема 0.3.3, а также аналогичная теорема для случая С Е с^°/?(<7), С Ф 0» с lim р'0 = О
I—+0O
подводят к важному понятию стационарной последовательности управлений в задаче (Aq), обобщающему соответствующее классическое попятие (см., например, [18]).
28
Определение 0.3.1- Последовательность w% G D, г = 1,2,..., называется стационарной в задаче (Ая), если для некоторой последовательности чисел у1 > 0, і = 1,2,..., 7* -» О, і -> со, выполняются включения хиг G Vf, і = 1,2,..., и существуют ограниченная последовательность векторов множителей Лагранжа р1 = (Мо,МІ) Є
И/о, ^>о, > = о,1,
« последовательность точек s1 G В, * = 1,2,...,
ІК “4ІІ < 71» Ml = °> еслир(/і(^‘) - = 0,
такие, что
т) + > -7' Vm G Мш.,
р* = dp(I\(w') - s\ М), если p(I\(w') — $\ М) > 0,
причем произвольная слабая предельная в R1 х в* точка (р0} У) соответствуюхцей последовательности пар (р10г р'іР*), г = 1,2,... удовлетворяет соотношению Pq + ||у|| ф 0.
П.1.4 завершается получением полезных представлений для субдифференциалов в смысле [240] dfi(q), d°°fi(q) в терминал множителей Лагранжа (предельных точек последовательностей множителей Лагранжа), имеющих важное значение, в частности, для решения проблемы чувствительности в задачах (суб)оптимального управления.
Теорема 0.3.5. Пусть fi(q) < +00. Тогда справедливы равенства
Щч) = Щч) п м,\ &”№ = d“i%) п мі гдеМ? = ьЧ U{0}8., M\ = L\,
L* = {—у G В* : существует стационарная в задаче (Ая) последовательность, для которой соответствующая ей согласно определению 0.3.1 последовательность пар(р10) р\р1), г = 1,2,..., имеет слабую предельную в R1 х В* точку (А,у)}, А = 0,1.
В п.1.5 на основе результатов п.и.1.3, 1.4 доказываются некоторые общие свойства регулярности, нормальности, чувствительности для абстрактной задачи (Ая).
Определение 0.3.2. Последовательность иг G * = 1,2,..., 7* > 0, у1 -*■ 0, і оо, являющаяся стационарной в задаче (Ая), называется нормальной (регулярной, анормальной), если все (существуют, не существуют) соответствующие ей (согласно определению стационарной последовательности) последовательности (Мо>МІТ4)» • — 1,2,-. -, имеют (имеющие, имеющие) предельные точки (о слабом смысле для второй компоненты) (ро, у) лишь с компонентой (лишь с компонентой, с компонентой) ро > 0. Задача (Ая) называется нормальной (анормальной), если все ее стационарные последовательности нормальны (аиормальны). Задача (Aq) называется регулярной, если в ней существуют регулярные стационарные последовательности.
Выделим здесь следующие результаты и. 1.5.
Лемма 0.3.1. Пусть в задаче (Ая) fi(q) < +00, выполняются условия теоремы 0.3.2 (в случае конечномерного целевого пространства В эти условия выполняются автоматически) и М® = {О}#, т.е. задача (Ая) нормальна. Тогда функция fi является липшицевой в
некоторой окрестности Оя точки q с постоянной Липшица Ся = sup {|А| : A G Л/Н.
й'ео,
29
Для формулировки других свойств, связанных с понятием регулярности задачи (Ая), нам потребуется дополнительно также следующее естественное и легко проверяемое в конкретных задачах условие
е) если последовательности v\ w' £ V, t = 1,2,... эквивалентны, т.е. d(vl,w:) 0, i оо, то последовательности /о(^‘)> /о(^*), * = 1,2,..., имеют одни и те же предельные точки и из стационарности в задаче (Л?) одной из пих следует стационарность в той же задаче и другой, причем множества всех предельных точек цо всевозможных последовательностей //q, х = 1,2,..., из определения 0.3.2, отвечающих последовательностям v‘, w\ « = 1,2,..., совпадают.
Лемма 0.3.2. Пусть в задаче (Aq) выполняется и условие е), ((>-??) € N((q, ß(q))\epi ß) с Т] > 0. Тогда в задаче (Аа) имеются регулярные м. п.р. и, стало быть, она регулярна, причем (/7] G М). Если же ((, —г/) есть нормаль в смысле Фреше керг ß о точке (q, ß(q)) и
г] > 0, то в задаче (Ая) регулярными стационарными последовательностями являются все м.п.р..
Следствие 0.3.1. Множество точек q 6 domß, для которых в задаче (Ля) все м.п.р. регулярны, всюду плотно в dom ß.
С другой стороны, т.к. для локально липшицевых функций субдиффсрепциал dß не пуст в каждой точке ее области определения [240]), то на основании леммы 0.3.2 можно утверждать, что справедлива
Лемма 0.3.3, Пусть выполняется условие е) и функция значений ß в задаче (Ая) липшицева в окрестности некоторогI точки q. Тогда в каждой точке этой окрестности в задаче (Aq) существуют регулярные м.п.р..
Для формулировки другого достаточного условия регулярности задачи (Ая) введем предварительно важное понятие, обобщающее классическое понятие вектора Куна-Таккера. При этом мы рассмотрим достаточно представительный частный случай задачи (Ад), в котором
В = Я* х В1г (0.3.6)
В\ - равномерно выпуклое пространство с дифференцируемой по Фреше нормой,
М = {х = (£!,...,£*) € к* : х\ < 0,... ,хх < 0} х {0}д, С В.
Определение 0.3.3. Вектором Куна-Таккера о задаче (Ая), в которой пространство В и множество М имеют вид (0.3.6), назовем элемент
р = (А,г) € Л = {(А',г') <Е К* х В, : > О,...,А* > 0},
у до в лете оряюгц ий н ера венет в у
ß(q) < Io(w) + “ Pi) + (г> J(w) ~ 4i> € V,
где
q=[p,qi), р= (pi,...,pa), h{w) = ((/i,i(»)......A^M),J(«)).
30
Лемма 0.3.4. Если р = (Л, г) £ Л есть вектор Куна-Таккера в задаче (Ая), удовлетворяющей условиям (0.3.6), то —р £ М] и —р £ dß(q).
Здесь также устанавливается связь понятия нормальности задачи с существованием ненулевого зазора ßo(q) — ß[q).
Лемма 0.3.5. Пусть в задаче (Ая) выполняются условия теоремы 0.3.2, а также условие е). Если при этом имеет место неравенство ßo{q) > ß(q), то любая последовательность w\ t = 1,2,..., удовлетворяющая соотношениям
/оК) -> ß € \ß(q),ßo(q)\, /о(ш‘) < ßo(q) -f б„ wl £ а >0, 6,-4 0, % -4 оо,
является стационарной, а в случае ß £ [ß(q), ßo(q)) не является нормальной стационарной последовательностью в задаче (Ая).
Следствие 0.3.2. Строгое неравенство ß(q) < ßo(q) 0 задаче (Aq) при условиях леммы 0.3.5 не может выполняться, по крайней мере, в двух следующих случаях: 1) задача нормальна; 2) в задаче имеется нормальное м.п.р..
Заключительный п. 1.6 главы 1 посвящен так называемым экстремальным последовательностям. Понятие экстремальной последовательности обобщает классическое понятие [71] экстремального управления. С целью более компактного изложения мы предполагаем здесь, что В - гильбертово пространство.
Определение 0.3.4. Пусть множество {A(w) : w £'Р} есть компакт в пространстве В. Последовательность управлений и‘ £ V, г = 1,2,..., назовем экстремальной последовательностью (э.п.) для пары если все предельные точки последовательности
/ifu1), t = 1,2,..., принадлежат границе множества Т = Д(2>).
Здесь приводятся теоремы, связывающие выполнимость абстрактного принципа максимума для э.л. как с наличием проксимальной нормали в смысле [208] (в случае конечномерного Б понятие проксимальной нормали совпадаете понятием перпендикуляра [55]) к множеству достижимости Т в точке у = lim 1Лиг) так и с наличием ненулевого элемента в нормальном
____ »-»оо
конусе Кларка Nc(y\I\(V)). В бесконечномерном случае отсутствие нормали в указанной точке может привести, вообще говоря, к невыполнимости принципа максимума для э.п.. Факт возможной невыполнимости принципа максимума для классического экстремального управления при бесконечномерном В обсуждался, например, в [11].
Замечание 0.3.4. В силу условия компактности множества {/i(w) : w £ V}, из определения э.п., очевидно, следует, что в случае бесконечномерного гильбертова пространства Б любая последовательность и1 £ V, i = 1,2,..., является экстремальной. Однако, вообще говоря, не для любой такой последовательности соответствующая последовательность образов /i(u‘), * = 1,2,..., имеет своими предельными точки, в которых либо имеется проксимальная нормаль к множеству достижимости h('D), либо конус нормалей Кларка к этому множеству содержит ненулевой элемент.
Глава 2 посвящена рассмотрению на оспове абстрактных результатов главы 1 задач (суб)оптимального управления параболическими уравнениями. Как уже отмечалось выше,
31
некоторые результаты по необходимым условиям на м.п. в задачах оптимизации параболических уравнений (систем), могут быть найдены в [234, 235, 236, 220, 223]. В то же время, можно утверждать, что все рассматриваемые в главе 2 вопросы, связанные с необходимыми и достаточными условиями на м.п.р., а также с различными свойствами регулярности, нормальности, чувствительности в задачах оптимизации параболических уравнений, обсуждаются нами, по-видимому, впервые [150, 151,152,153, 155,159, 167,169, 170, 171, 172, 251, 252]. Следует отметить также, что везде в данной главе рассматриваются лишь линейные по фазовым переменным уравнения. Это связано не с существом дела, а только с желанием более компактного изложения результатов. Все эти результаты могут быть распространены и на случаи полулинейных и квазилинейных управляемых уравнений (см. ниже главу 3, посвященную эллиптическим уравнениям).
В ц.2.1 рассматривается задача с нефиксированным временем без его варьирования и с ограничением типа включения в конечномерное множество
(рч) /о(тг,:г)-мп£, д(я,г) ем + я, (п/Т)е'Р, е я = я*,
где Мтг,Т) = (Л(л-,Г),..., Л(тг,Г)),
Л(яг,Т)= / ф(аг,г[^Т](*,Г),гг(д:),Г)п&, * = 0,1,..., ае, 10(л/Г) =
■/о
7Г = («,«/) 6 Т>г = Т>\ у. Т>2, VI = {« € 1оо(<?т) : «(*>*) € Я п.в. на фу}, 7)2 = {у € Доо(П) : ъ(х) С V п.в. на Г2}, II С Ят, V С Я1 - компакты, 11 - ограниченная область в Яп, V = {(тг,Т) : яг ^ V , Т > 0} - множество троек управляющих параметров, М С Я* - выпуклое замкнутое множество, г[тг/Г] €У\*(Ят) - соответствующее тройке (тг,Т) слабое решение в смысле [67] первой краевой задачи для линейного параболического уравнения с дивергентной главной частью
* - +а{х,Ъи[х,г))х + /(х,*,«(*»*)) = 0, (0.3.7)
*(я,0) = у(х)} х е П, г(х^) = 0, (т,£) € Ят.
При некоторых естественных для теории оптимального управления предположениях здесь показывается, что для задачи (Я?) справедлива вся аксиоматика п.1.2. В первую очередь здесь подробно рассматривается задача (Ря) с фиксированным временем. Примем обозначения
п
Я (я, г, г, р, и, Г}) = -т?(£ Ьг (х} *, и)рг + а(х, г,и)г + {(Х,г,и)),
«=1
Нк(х}г}у}Туг\) = т]ь- С\(х,г} у,Т)} к = 0,1,..., ае.
Т.к. целевое множество М имеет конечную коразмерпость (по причине его конечномерности), то расшифровкой абстрактного принципа максимума для м.п.р. теоремы 0.3.2 является
Теорема 0.3.6. Пусть зг‘ € V, i = 1,2,..., есть м.п.р. в задаче (Ря). Тогда существуют
м.п.р. т1’1 е г = 1,2,...,
<Цп\пи) = теа${(#, *) € С}т : «*(#, 0 ^ + ^еа5{а; 6 И : ггг(дг) ^ г/2(д:)} < 07,
Яо(7Г1,С) < М*1),
32
и последовательность векторов р1 6 Я2,
И = *> Л > 0» k = °>!» /4 = 0. если P(A(^l,i) -q,M) = О,
такие, что
! max{tf(i,<,£[jr1',](i,i),u, ЯоТок1'']^, <) + и\ £р*Ч»[*’1,,](*, *))“ jQt v*u b-i
Я(л:,е,^[я'111](д:,<),«1*,(а;)(),^[я'1*|](а;,«) + р\ £ рМ*1,1](х, *))} dxdt < ЬТтеазП^у/и,
k=1
*
/ max{^o(s,г[)г1'‘](г,Г),v,4n[«r,,,](*,0)) + /4 ]ПР\НЛХ>Ф1,‘](*> Л,«.шКК1,0))-
*€V A=1
VoHq(x} T), v1’*», 0)) - Mi £ р^як(д:, z[nl*](xt T), vl*(x), fj*[jrl*](s, 0))} dx <
k~l
4 meas Clpo\/ri,
где rt = /о(я-‘)“А'(?) < $ + (Р(я)-Мч))> Vх = (pi, • • • ,Р*Ь P* = ЭДЛОг1*')-g, Л4), аг/^тг1-*] есть решение при п = тт1*1 сопряженной задачи
-Чк “ g^K; (*>*)%.- + М*»М(*»*))*Й + Ф»*» *(*»*))«? = °> (°-3-8)
r?(s, Г) = -ф(х), х е П; Г7(л;, t) = 0, (я,«) € ST,
<?ля
^(лг) = dk[ic](x) = У*<7*(я,г[я](:г,!Г),ф)).
Далее здесь последовательио ” переписываются” в терминах данной конкретной задачи абстрактные результаты п. 1.5, связанные со свойствами регулярности, нормальности задачи и приводится одно легко проверяемое достаточное условие нормальности, непосредственно не вытекающее из результатов п. 1.5.
Подробно в п.2.1 рассматривается важный частный случай задачи - задача с ограничениями типа равенства и неравенства: М — М- = {.т = (ть... ,тж) 6 Я* : х\ < 0,... ,тЖ1 < 0,яЖ14.1 = 0, ...,тж = 0}. Теорема 0.3.6, переписанная здесь в терминах, исходного м.и.р. выглядит более компактно и привычно.
Теорема 0.3.7. Пусть тг1 £Р,»= 1,2,..., есть м.п.р. в задаче (Pq) со множеством. М — М-. Тогда существуют последовательность чисел у1 >0, t = 1,2,..., 7' -> 00, t -4 00, и последовательность векторов р1 £ Я*+1,
И = !» Л > °> к = 0,l,...Iaei, дЦЛЮ - qk) > -У, к =
такие, что
[ тл?{£ /4(я(*>*»£И(*> 0) ЧкИ(*. 0)- (°-3-9)
veU kZо
Н{х, t, (И(*, t), д1(т, *), %И(1, 0))} < У)
L ВДЙЕ Д*№(*. г[я‘](т,Т), У,ш[я‘](д7,0))-
*=о
33