Ви є тут

Нелинейные задачи последовательного управления

Автор: 
Бердышев Юрий Иванович
Тип роботи: 
докторская
Рік: 
2000
Кількість сторінок: 
220
Артикул:
1000321757
179 грн
Додати в кошик

Вміст

Оглавление
Перечень основных обозначений.............................4
Введение..................................................7
Глава 1. Методы построения областей достижимости в некоторых задачах импульсного управления . . 28
1. Введение .............•...............................28
2. Уравнения пассивного движения.........................33
3. Область безопасности. Условия Гоудела.................36
4. Необходимые условия принадлежности тонки границе области безопасности ................................41
5. Область безопасности при круговой исходной орбите ... 48
6. Случай эллиптической исходной орбиты..................53
7. Построение области достижимости
материальной точки в ньютоновском поле................57
8. О задачах одноимпульсного перехода с исходной
орбиты в заданную точку...............................66
9. Алгоритмы и программы ................................73
Глава 2. Необходимые условия оптимальнсти в нелинейной задаче последовательного обхода системы гладких поверхностей............................79
1. Введение .............................................79
2. Мотивирующий пример . . . ......................... 83
3. Уравнения движения объекта и классы
допустимых управлений................................ 85
4. Постановки задач..................................... 90
5. Необходимые условия оптимальности в простейшей задаче последовательного управления с оптимизацией моментов сближения ...................................93
6. Соотношение решений исследуемых задач 104
7. Необходимые условия оптимальности в задаче последовательного сближения с оптимизацией
2
моментов встречи ....................................105
8. Задача быстродействия при последовательном
обходе ’’автомобилем” двух точек на плоскости .......108
9. Последовательная оптимизация линейных управляемых систем на основе двойственных конструкций Н.Н.Красовского (содержательный аспект) ............112
10. Постановки исследуемых задач........................119
11. Оптимизация взвешенного критерия
в условиях заданного расписания ....................124
12. Минимаксное решение задачи с заданным расписанием ........................................129
13. Задачи последовательной оптимизации при
выпуклых ограничениях ............................. 131
14. Оптимизация функционала в классе простых движений ...........................................136
15. Некоторые редукции задач оптимального управления
с интегральными ограничениями .......................141
16. Примеры.............................................150
17. К вопросу о построении ломаной наименьшей
длины, соединяющей замкнутые множества .............' 160
Глава 3. Структура управлений в некоторых
задачах космической навигации .......................164
1. Введение .......................................... 164
2. Уравнения управляемого движения......................168
3. Линейная модель движения и двойственные конструкции выпуклого программирования .............173
4. Исследование нелинейной системы уравнений
движения космического аппарата ......................179
5. Обход космическим аппаратом нескольких
точек в указанном порядке ..........'................189
6. Об одном быстродействующем алгоритме решения задачи о сборе ” космического мусора” 204
Заключение..............................................206
Литература......................................... . . 208
Перечень основных обозначений
КА — космический аппарат;
МТ — материальная точка;
И О — исходная орбита;
ПО — переходная орбита;
КМ — космический мусор;
ОБ — область безопасности;
ОД — область достижимости;
ОУ — оптимальное управление;
МП — математическое программирование;
V — квантор "для любого”;
& — связка ”и”;
— символ ”гю определению”;
А
= — равно по определению;
N = {1,2,...} — множество натуральных чисел;
. Ао = {1,2,...} — множество натуральных чисел, дополненное нулем;
е Є Е — элемент е принадлежит множеству Е\
1, тп = {г, г 6 N. і < т} — отрезок натурального ряда чисел (0,7п = {г, г Є АГ0, г < гтг}) ;
га Є N. к Є N. п Є N (к < п), г € N — заданные числа: п — размерность фазового пространства управляемой системы, к — размерность пространства ”геометрических координат”, г — размерность пространства управляющих функций;
К — числовая прямая;
Т = [*0, £°] — заданный отрезок времени (£о Є їй, £° Є К,
<0 < <°);
і — текущее время;
г — радиус-вектор МТ;
иу г — полярные координаты МТ (вектора г), г — расстояние от КА до притягивающего центра, и — угол между полярной осью, и вектором г;
4
1*1,7*1 — полярные координаты заданной в плоскости ИО точки МУ;
1ф — луч с центром в точке Притяжения, образующий угол -ф = щ - и с радиус вектором г точки М;
V — вектор скорости МТ;
Кг, К- — радиальная и трансверсальная составляющие вектора скорости;
Д V = (Л, Л) — импульс скорости;
Л — угол между направлением импульса скорости и вектором
V;
Д — величина импульса (длина вектора Д V);
£(А,Д) — траектория, порожденная импульсом (А, Д); е, р, и —соответственно эксцентриситет, фокальный параметр и аргумент перицентра ИО;
еь Р\ 1 ы\ — соответственно эксцентриситет, фокальный параметр и аргумент перицентра ПО;
д — истинная аномалия МТ, находящейся па ИО;
— область безопасности;
(7 — область достижимости;
до — число, равное произведению гравитационной постоянной на массу Земли;
0ъ 9ч — координаты вектора гравитационного ускорения;
Вл — множество всех функций /г, действующих из А в В (к : А В, так что Vа & А : к(а) 6 В);
(к | С) — след функции к : А —\ В на множестве С С А;
А х В (А х В х С) — декартово произведение множеств А и В (А, В и С), т.е. Ах В — множество всех пар (а,/;), таких, что а £ А, Ь £ В;
(^г)*€ЛГ € Ау — последовательность элементов а, множества.
Л;
V 5 Е N : Вя — 5-мерное арифметическое пространство
Л / \
множество всех 5-мерных векторов а = (а,),бу^ ;
V 5 6 N : — множество всех 5-мерных векторов а = с неотрицательными компонентами а,-, г £ 1,5 ;
5Ш = {а, а Е Я"1 : <*\ + ... + ат = 1} — единичный симплекс в Вт:
5
V s £ N, a £ Rs, b £ Rs : a'b = a,-6; — скалярное произведение векторов а и Ь;
V 5 6 ./V : сога;(Я5) — семейство выпуклых множеств в /Г;
V 5 £ iV V a. € Rs : || а ||s= /£*=1 а? — эвклидова норма в У?5;
т= {t = £Г: (V г € 17т : «,_! < U < *")}:
множество векторов t с упорядоченными координатами, называемых далее расписанием;
L = {I. £ Rk : || / ||*= 1} — единичный шар в /?*;
Ьт = Lx ... х L ( т сомножителей) — множество всех наборов А = (Л(1),..., А(т)), Л(г) £ L (i £ 1,т);
Р — компакт в РГ;
Ui и HJ2 — соответственно множества всех кусочно-постоянных и кусочно-непрерывных (непрерывных справа) функций U. : Т —> Rr, удовлетворяющих ограничению U(t) £ Р, t £ Т\
U3 — множество всех измеримых но Борелю функций U : Т -> Яг, почти всюду удовлетворяющих ограничению U(t) £ Р, t £ Т;
7?. — множество всех обобщенных программных управлений-мер /д определенных на произведении Т х Р;
V и £ Ui, и £ U2, I/ G HJ3 : W = (V4/(0> f' € Т) — движение управляемой системы из фиксированной начальной позиции, порожденное управлением U;
Фи = * € Т) — движение управляемой системы из фик-
сированной начальной позиции, порожденное обобщенным программным управлением-мерой //;
тг(•) : Rn -> Я* — оператор проектирования, для которо-го 7г(а) G Rk отождествляется с вектором первых к координат oi,... вектора а £ Rn : 71(a) = (а | 1, &) ;
V т/ G Я* V Я € сош|(Я*) :
’я)" IIу ~h II*
— расстояние от у до Я; ?■
Рн (I) = in ах l'h w /«ея
— значение опорной функции множества Я.
б
Введение
В настоящей работе исследуются нелинейные задачи последовательного управления, их конкретизации в области механики управляемого космического полета и задачи построения областей достижимости в ньютоновском поле. Отличие задач первого типа от классических задач оптимального управления [39, 42, 45, 46, 53, 67, 79, 100, 124] состоит в наличии не одного, а нескольких целевых множеств, подлежащих последовательному во времени обходу. Вез потери качества эти задачи нельзя, вообще говоря, декомпозировать на ряд последовательно решаемых ”двухточечных задач'’, заключающихся в переводе управляемой системы из одной фазовой точки в другую. Рассматриваемые в диссертации задачи возникают, например, в аэрокосмической навигации [6, 40, 41, 50, 51, 56, 59, 78, 85], в частности, при сборе космическим аппаратом (КА) фрагментов космического мусора (КМ) [44, 135, 139], либо при облете самолетом группы заданных точек с наименьшими ’’затратами энергетики”. Поэтому результаты теоретического исследования этих задач и предлагаемые методы их решения имеют прикладной характер.
Исследуемые здесь задачи относятся к нелинейной теории оптимального управления и ее приложениям. История развития теории оптимальных управляемых систем наиболее полно изложена в обзорной статье H.H. Красовского [66]. Здесь же отметим лишь основные моменты развития теории, связанные с задачами, рассматриваемыми в диссертационной работе. Одним из основных источников развития теории оптимальных процессов служат проблемы управления реактивным движением ракет. Важной работой в этом направлении является статья Д.Е. Охоцимского [95], опубликованная в 1946 году. В ней, с использованием методов вариационного исчисления, решены задачи определения расхода реактивной массы при подъеме ракеты на максимальную высоту и полете на максимальную дальность.
Качественный скачок в развитии теории оптимального управления произошел после формулировки Л.С. Понтрягиным в 1956 году принципа максимума, названного впоследствии его именем.
7
Принцип максимума резко активизировал исследования по задачам оптимизации, основополагающие результаты которых опубликованы в монографии JI.C. Понтрягина, В.Г. Болтянского, Р.В. Гамкрелидзе, Е.Ф. Мищенко [98]. Принципу максимума JLС. Понтрягина посвящено большое число научных работ, перечислить которые едва ли возможно. Здесь отметим лишь некоторые из них. Это работы следующих авторов: В.Г. Болтянского [39], Р.В. Гамкрелидзе [46], Дж. Варги [42], Р. Габасова, Ф.М. Кирилловой [45], А.Я. Дубовицкого, A.A. Милютина [53], Л.Д. Иоффе, В.М. Тихомирова [60], Л.И. Розоноэра [100].
Использование принципа максимума Л.С.Понтрягина [98] в классических задачах оптимального управления позволяет свести последние к краевым задачам, суть которых состоит в подборе некоторых параметров (недостающих краевых условий для вспомогательных функций на одном из концов траектории). Эти задачи более просты по сравнению с задачами оптимального управления (ОУ), но сути являющимися задачами минимизации в функциональном пространстве, но и они трудноразрешимы. Последнее связано с тем, что при определении краевых условий приходится использовать численные методы решения [41, 43, 87, 106] и при этом многократно интегрировать систему уравнений 2п—го порядка (п — размерность фазового вектора исследуемой системы).
Значительно дальше в определении решения удалось продвинуться при исследовании линейных систем управления [67]. Это связано с тем, что задачи управления с выпуклыми функционалами качества допускают, как известно [67], естественную двойственность с задачами математического программирования (МП). Данное свойство является следствием общего принципа двойственности, установленного H.H. Красовским и сформулированного им в терминах проблемы моментов [67, гл. 5]. Использование этого принципа позволило построить эффективные методы решения линейных задач управления на основе сведения задач минимизации в функциональном (бесконечномерном) пространстве к более простым задачам максимизации в конечномерном векторном пространстве, доставляющим оптимум исходным задачам и краевые условия принципа максимума Л.С.Понтрягина. Этот
8
подход к решению линейных задач управления был досконально изучен в работах II.Н Красовского, А.Б. Куржанского, Ю.С. Осипова, А.И. Субботина и их учеников.
Значительную роль в развитии теории оптимального управления сыграл метод динамического программирования Р. Веллмана [8, 9]. С этим методом связан один из первых этапов развития теории последовательного управления, относящийся к исследованиям маршрутно-распределительных задач [10, 111, 6], частным случаем которых являются задачи с одним или несколькими коммивояжерами. В динамических системах последовательное управление фактически использовалось в работах Л.Б. Куржанского, Ю.С. Осипова [76, 77] при исследовании линейных задач управления при стесненных фазовых координатах. В [76, 77] отрезок функционирования системы управления предварительно разбивался на п, п £ /V, равных частей моментами времени £i,...,£n_j и рассматривалась вспомогательная задача, в которой фазовым ограничениям необходимо было удовлетворять в упорядоченные моменты времени £i,...,£n_i. С использованием общего принципа двойственности, установленного H.H. Красовским [67, 68, гл. 5], задачи последовательного управления линейными системами исследовались в работах А.Г. Ченцова и его учеников [31]—[34], [89]. В [31]—[34] построены эффективные методы решения задач минимизации системы рассогласований между состоянием управляемого объекта в некоторые упорядоченные моменты времени г £ Г™, (заданные или также подлежащие определению) и точками (множествами) в пространстве геометрических координат Rk. При этом рассматриваются как геометрические [31]—[33], так и интегральные [34, 88, 89] ограничения на управление. В [32, 33] получено условие выравнивания — дополнительное необходимое условие оптимальности управляющего параметра.
Заметим, что близкие по постановке задачи рассматривались в работах [55, 84] и [45, с.131] при оптимизации, так называемых, ступенчатых и разрывных управляемых систем.
Вариационные задачи оптимизации процессов управления с функционалами, зависящими от промежуточных значений координат в несколько иной постановке и при других ограничениях
9
на управление, исследовались В.Л. Троицким [104] (1962 г.). При дополнительных ограничениях, обусловленных спецификой методов вариационного исчисления, получены необходимые условия оптимальности траекторий, сходные в идейном отношении с условиями, приведенными в настоящей работе.
Следует отметить, что задачи последовательной оптимизации в игровой постановке исследовались в работах А.Н.Красовского, Н.Н.Красовского [71, 136, 70], Н.К). Лукоянова [72].
В настоящей работе исследуется общий случай нелинейной управляемой системы. Поэтому с целью исчерпывающего решения проблем существования оптимального управления и корректности в наиболее интересном для практики случае соблюдения краевых и промежуточных условий с высокой, но все же конечной, точностью используется аппарат теории расширений [114]— [117] в классе регулярных борелевских мер, которые согласно теоремы Рисса, определяют представление пространства, топологически сопряженного к пространству непрерывных функций на компакте в конечномерном (в данном случае) пространстве. По сути дела такая же процедура применяется в [42] и в несколько более общей ситуации, где вместо упомянутого пространства непрерывных функций может использоваться пространство функций Каратеодори [42, стр.212]. Существо данной конструкции расширения связано с компактификацией пространства управлений посредством перехода от обычных управлений ( измеримых по Борелю функций) к обобщенным программным управлениям и замене правой части дифференциального уравнения, описывающего движение объекта, интегралом по нормированной борелев-ской мере на множестве Р [46, стр. 36]. Следует отметить, что конструкции расширения получили большое развитие в работах Н.Н.Красовского [70]—[73], его учеников [103], [114]—[117] в связи с исследованием задач как с геометрическими, так и с интегральными ограничениями на управление . В классических задачах управления с геометрическими ограничениями конструкции расширения с использованием скользящих режимов рассматривались в работах Дж. Варги [42], Р.В. Гамкрелидзе [46], Л. Янга [124] и многих других математиков. Конструкции расширения нашли также
10
свое применение и в теории нелинейных дифференциальных игр.
Подавляющее большинство задач, рассматриваемых в настоящей работе, либо непосредственно относятся к космической тематике, либо могут быть использованы при решении некоторых задач по космической навигации. Их объединяет общая проблема обхода конечной системы точек в плоскости исходной орбиты. В прикладном плане этой проблеме отвечает известная задача о сборе космического мусора.
В литературе по космической тематике, как правило, исследуется простейшая модель движения управляемого космического аппарата (КА) в околоземном пространстве. В этой модели Земля заменяется точкой, в которой сосредоточена вся ее масса, а КА заменяется управляемой материальной точкой (МТ), движущейся в поле, создаваемом лишь одной центральной силой И, определяемой формулой Ньютона [123, с. 18],[97, с. 10]
Р = ~/10 т (г Ф 0) . (0.1)
(закон всемирного тяготения). Здесь г — радиус-вектор МТ с началом в точке притяжения О, V — длина радиус-вектора г, до — произведение гравитационной постоянной на массу Земли, т
масса точки. Напомним, что ноле, создаваемое лишь одной силой Е (0.1), называется ньютоновским [97, с.10], а невозмущенное движение в этом поле — кеплеровским движением. Траекторией этого движения может быть только коническая кривая (эллипс, парабола, гипербола). Этот факт был получен благодаря тому, что кеилеровское движение описывается дифференциаль-. ными уравнениями, которые хорошо интегрируются. А именно, вычислены шесть независимых между собой первых интегралов [97, с.33] этого движения. Последнее позволило человечеству в довольно короткий срок постичь законы движения планет (Кеплер) и объяснить их (Ныотон). Ввиду существенной нелинейности системы дифференциальных уравнений, описывающих управляемое движение МТ в центральном поле (0.1), его качественное исследование вызывает затруднения.
Значительное продвижение в исследованиях поданной тематике было достигнуто в трех направлениях:
11
1) при использовании линеаризированных систем уравнений движения (теория Н.Н.Красовского [67], [68]);
2) при использовании численных методов решения, основанных на принципе максимума Л.С.Понтрягина [98];
3) в ’'импульсной постановке”, являющейся упрощенной моделью управляемого движения МТ.
Особое место в исследованиях российских [6, 11, 48, 51, 123, 56, 59, 63, 97, 120, 121] и зарубежных ученых [40, 47, 131, 132, 133, 129, 135, 81, 82, 85, 140] по данной тематике занимают конструкции ’’импульсного управления”, в которых сравнительно просто (в сравнении со случаем непрерывного управления) аналитическими методами вычисляются параметры движения КА в любой момент времени. Простота вычисления траектории обусловлена тремя обстоятельствами. Во-первых, уравнения пассивного движения проинтегрированы аналитически (см.[123, с.37];[97, гл.2]) и по начальному состоянию фазового вектора МТ с использованием конечных соотношений можно однозначно определить состояние фазового вектора МТ в любой момент времени. Во-вторых, в "импульсной” постановке движение МТ представляется пошагово в виде кусков пассивного движения со скачкообразным перебросом промежуточных краевых условий. В терминологии работ [90, 101] рассматриваемое здесь движение называется движением с толчками. При этом скачком меняются лишь координаты вектора скорости КА, а координаты радиус-вектора КА в момент приложения ’’импульса” остаются неизменными. При этом по ’’импульсу” и моменту его приложения однозначно определяется движение КА до следующего момента приложения ’’импульса”. В-третьих, энергетику КА, пропорциональную части его массы , расходуемой на создание реактивной силы, можно с использованием формулы Циолковского (см.[97, с. 135]) пересчитать в запас характеристической скорости [97, с. 136]. Слово импульс здесь взято в кавычки, в дальнейшем мы их будем опускать, для того, чтобы отметить существенное различие между данной моделью движения и моделью, принятой в математической теории импульсного управления [67,109, 54,141]. В этой теории возникают проблемы корректности записи уравнений движения и определения решения этих уравне-
12
ний. Это связано с тем, что, во-первых, в правой части уравнений движения присутствуют силы, меняющиеся импульсным образом, во-вторых, появляется необходимость умножения разрывной функции на обобщенную, т.е. на импульсную силу. Не претендуя на исчерпывающее решение исследуемых задач, в настоящей работе используется лишь реализация ”движения с толчками”. В этом случае не возникает никаких осложнений с проблемами существования и определения решений [99], если только не применять импульсы, ведущие к занулению длины радиус-вектора (см. систему дифференциальных уравнений, описывающих пассивное движение КА).
В импульсной постановке рассматривались, как правило, задачи орбитального перехода, вызванные запросами космонавтики. Список работ по данной тематике очень велик и не может быть приведен здесь в полном объеме. Но часть этого ’’списка” можно найти в монографиях [56, 59, 97] и в обзорной статье [131], переведенной на русский язык [47]. Отметим также обзорную статью [50]. Пионерской работой в данном направлении является работа Гомана [129] (1925 г.), в которой предложен переход между двумя компланарными круговыми орбитами по эллиптической траектории, касающейся начальной и конечной круговых орбит в своих апсидальных точках. Такой переход осуществляется при помощи двух импульсов, прикладываемых в точках касания орбит. При этом направление импульсов совпадает с направлением векторов скорости в этих точках. Позднее Лоуден [81, 82] доказал оптимальность, в смысле расхода характеристической скорости [97, с.136], описанного маневра при определенных соотношениях между радиусами начальной и конечной круговых орбит. Там же определено условие, при котором переход Гомана уже не оптимален, а экономичнее его является трех импульсный переход. Аналогичный результат, независимо от Лоудена, был получен Штерн-фельдом [120, 121]. Оптимальные траектории со многими импульсами были исследованы В.И. Парным [113] (1963 г.), который доказал, что оптимальный многоимпульсный перелет состоит из соприкасающихся в апсидальных точках дуг конических сечений. Двухимпульсный оптимальный перелет между орбитами с малым.
13
наклонением и эксцентриситетами исследован В.С. Новоселовым [93] (1963 г.), а оптимальный компланарный перелет между орбитами — С.Н. Кирничниковым [64] и Д.Ф. Лоуденом [80, 81] (1964 г.). Импульсные перелеты между орбитами, расположенными в окрестности базовой круговой орбиты исследованы в работах Г.Е. Кузмака [75] (1965 - 1967 г.г.), где определены число прилагаемых импульсов, их параметры и моменты приложения.
Заметим, что при орбитальных переходах необходимо прикладывать как минимум два импульса, один из которых порождает переходную орбиту, а другой, прилагаемый в точке встречи переходной и конечной орбит, зануляет относительную скорость. Необходимость приложения двух импульсов и громоздкость формул кеплерова движения затрудняет качественное исследование задач орбитального перехода. Эти обстоятельства являются причиной того, что несмотря на богатую литературу по конструкциям импульсного управления, встречается очень мало работ, в которых качественные результаты получены аналитическими метода-, ми без применения численных методов исследования. Именно, таким образом, в частности, получены результаты работ [40, 97], касающиеся построения эллипса (параболы) безопасности и результаты первой главы настоящей работы, углубляющие эти исследования. Напомним, что эллипсом безопасности называют множество точек в плоскости движения, в которые МТ может попасть с использованием одного импульса скорости, величина которого ограничена заданным числом С\> если до момента приложения импульса она находилась в состоянии покоя. Если величина с.) достаточно велика, то вместо эллипса получается парабола безопасности. Обобщением понятий эллипса и параболы безопасности является область безопасности (ОБ) [18].
Областью безопасности назовем множество О# всех точек в плоскости ИО, в каждую из которых МТ может попасть в какой-нибудь момент времени из фиксированного положения 0 на ИО, если в этом положении будет приложен один импульс, ограниченный по величине заданным числом с\.
Поскольку положение точки на исходной кеплеровоЙ орбите однозначно определяется углом 'О — истинной аномалией точки,
14
*
то в дальнейшем эту точку на ИО отождествляем с углом г).
Под областью достижимости (ОД) в первой главе будем понимать множество О всех точек в плоскости ИО. которые МТ может достичь с ИО при помощи импульса, ограниченного по величине заданным числом с\. Здесь точка приложения импульса не фиксируется, а пробегает всю ИО. Таким образом, С — суть множество всех точек плоскости ИО, заметаемых ОБ О# при перемещении точки А по всей ИО. При определении области безопасности (области достижимости) не требуется, чтобы момент попадания в область безопасности (достижимости) был фиксированным. Этот момент может быть любым.
В настоящее время задачи о построении областей безопасности и областей достижимости стали весьма актуальными [63] . Эго связано, в частности, с тем, что в околоземном пространстве скопилось большое количество космического мусора (КМ), затрудняющее дальнейшее исследование космоса. Задача по его сбору стала важной (см. [6, 44, 135, 139]) и требует разработки специальных методов. Для управляемого КА-сборщика, обладающего ограниченным запасом энергоресурсов и имеющего своей целью достижение с заданной точностью наибольшего числа фрагментов КМ, очень важно уметь в реальном масштабе времени (практически мгновенно) оценивать свои возможности но достижению той или иной цели. Это необходимо для выбора рационального маршрута обслуживания КМ [6]. В связи с этим возникает задача аналитического построения областей безопасности и достижимости, как наиболее быстро реализуемая. Отметим два обстоятельства. Во-первых, аналитическое описание ОБ и ОД возможно получить, по-видимому, лишь при использовании одноимпульсного управления. Во-вторых, одноимпульсный переход на границу ОД не является экзотическим и при более полных классах управления, нежели одноимпульсные. Это подтверждают результаты главы 3, где исследуется структура таких переходов. Здесь следует отметить работу [49], где приведены результаты численного решения задачи об оптимальном управлении силой тяги реактивного двигателя с постоянной скоростью истечения струи при выведении КА с поверхности Луны на круговую орбиту. С использованием
15
I
принципа максимума, и численных методой определения краевых условий для вспомогательной системы, фигурирующей в формулировке принципа максимума, показано, что оптимальная траектория состоит из трех участков. Первый и третий участки — движение с максимальной по величине тягой, второй — пассивный участок. Третий участок обусловлен необходимостью перехода на круговую орбиту. Отметим также аналогичный (более ранний) результат из работы [67], относящийся к линейной управляемой системе. Если в этих задачах [67, 49], следуя Д.Ф.Лоудену, ограничение на величину тяги двигателя устремить к бесконечности, то, по-видимому, мы получим двухимпульсное управление. При этом второй импульс прикладывается в конце траектории для выравнивания скоростей. Заметим, что при построении областей достижимости нет нужды выравнивать скорости на заключительном этапе движения. Это упрощение краевых условий определяет иную, более простую, структуру оптимального управления, чем в задаче об орбитальном переходе, поддающуюся качественному исследованию.
Настоящая работа состоит из трех глав. В главе 1 осуществляется построение и анализ областей безопасности и достижимости МТ в ньютоновском поле при одноимнульсных управлениях. Показано, что с использованием свойств кеплерова движения можно упростить громоздкие выражения, связывающие параметры ИО: точку приложения импульса, направление и величину импульса с координатами точки, лежащей на границе области безопасности. При определении ОД предполагается, что до приложения импульса МТ не находилась в состоянии покоя, а двигалась по исходной эллиптической орбите. Кроме того, предполагается, что используемый импульс не выводит МТ из плоскости исходной орбиты (ИО). В этом случае импульс скорости, являющийся вектором, компланарен плоскости ИО. Он однозначно определяется парой (Л, Д), где Д — длина этого вектора, именуемая далее величиной импульса, Л — угол между направлением импульса и вектором скорости КА в момент приложения импульса. Применяя условие Гоудела [40, с.117], связывающее начальную и конечную точки кеплеровой траектории, а также известные теоремы функцио-
16
пального анализа, удалось показать, что импульс (А,Д), обеспечивающий попадание МТ на границу ОБ, должен удовлетворять условию Д = сь т.е. иметь максимально возможную величину. С использованием полученных фактов и трудоемких аналитических выкладок получаются соотношения, позволяющие определить качественный вид области безопасности в зависимости от величины сі прилагаемого импульса и описать конечными ((юр-мулами границу ОБ. Как оказалось, область безопасности, в отличие от эллипса безопасности, не является не только выпуклой, но и односвязной областью. В частности, при круговой ИО получено следующее утверждение, полный текст которого приведен в §5.
Теорема. Пусть Уо — скорость МТ на круговой исходной орбите, С= В зависимости от величины с область безопасности О я моэюет иметь один из трех типов, изображенных на рисунках 1 - 3. При
С<\/2-1 (0.2)
область ограничена и имеет внутреннюю и внешнюю границу (см. рис. 1), при
а/2 —1<с<1 (0.3)
она неограничепа и также имеет, внутреннюю и внешнюю границу (см. рис. 2), при с > 1 она неограничепа (см., рис. 3) .
Рис . 1
На рис.1-3 буквами Мо, V отмечены положения МТ и ее век-
17
тор скорости в начальный момент времени; на рис. 3 М* — ближайшая к притягивающему центру точка области Д?. Отметим, что при малом запасе характеристической скорости эта область исследовалась также в работе [63]. Как выяснилось позднее [48], аналогичные но виду области получаются при решении задачи о достижимости на поверхности Земли при входе КА в атмосферу.
Рис. 2
Рис. 3
18
Заметим также, что и при эллиптической ИО область безопасности будет иметь такую же структуру, как и при круговой ИО, но будет несколько деформированной. Величина деформации зависит от точки приложения импульса и параметров ИО.
Используя вид ОБ и определение ОД, нетрудно показать, что в' случае круговой исходной орбиты решение задачи о нахождении ОД очень простое. А именно, область достижимости будет при с < >/2-1 кольцом с центром, совпадающим сточкой притяжения, при >/2 — 1 < с< 1 — плоскостью ИО без некоторого круга (с тем же центром), а при с > 1 — всей плоскостью ИО.
В §7 определяется вид ОД и указываются формулы для вычисления границ ОД в случае эллиптической ИО.
В §8 исследуются задачи одноимнульсного перехода с исходной орбиты в заданную точку плоскости ИО. Здесь, исходя из соотношения Гоудела [40, с.108], устанавливается зависимость величины Д переходного импульса от угла Л, определяющего его направление, параметров ИО, точки приложения импульса и координат точки цели. При этом импульс скорости называется касательным, если он параллелен вектору скорости МТ в момент его приложения. Заметим, что при касательном импульсе угол Л = 0. В работе удалось определить производную зависимости величины Д касательного импульса от $ — точки приложения этого импульса и, с использованием трудоемких аналитических выкладок, значительно упростить ее выражение. Это позволило получить аналитическое решение задач о переходах с И О в заданную точку соответственно с минимумом расхода кинетической энергии и характеристической скорости. Здесь также исследована зависимость величины Д импульса от пары ($, Л), где Л — угол, определяющий направление прилагаемого импульса.
В заключительном параграфе первой главы приведено описание алгоритмов и программ вычисления областей безопасности и достижимости, а также проверки условия принадлежности этим областям заданных целевых точек. Там же приведено описание приближенного быстродействующего алгоритма (использующего конечные формулы) вычисления множества всех точек на ИО из которых можно попасть в заданную точку.
19
В главе 2 исследуется задача о последовательном обходе нелинейным управляемым объектом в предписанном порядке заданной совокупности гладких многообразий [98, с.71], перемещающихся в фазовом пространстве, а также ее варианты при различных дополнительных условиях. Качество процесса оценивается суммой элементарных критериев, вычисляемых на этих многообразиях. Получены необходимые условия оптимальности управления движением нелинейного объекта и моментов сближения в форме принципа максимума Л.С.Понтрягина, не использующие декомпозицию во времени. Здесь задача обхода не разбивается на ряд последовательно решаемых ’’двухточечных” задач, а при выборе управления, реализующего переход от одной цели к другой, учитывается информация о всех последующих целях, подлежащих обходу.
По содержанию вторая глава делится на две части. В первой ее части исследуется общий случай нелинейной управляемой системы. Здесь движение управляемого объекта в п-мерном эвклидовом пространстве X = 11п на достаточно протяженном отрезке времени Т = [67, 98] описывается нелинейной си-
стемой дифференциальных уравнений . На правую часть системы и систему параметров накладываются стандартные условия, обеспечивающие существование оптимального, в указанном далее смысле, управления. Векторный управляющий параметр и полагаем удовлетворяющим геометрическому ограничению: и € Р (Р, Р С Яг, — компакт, г £ X). Определяются классы допустимых управлений. Каждое управление С/ = {и(Ь), I £ Т) из этих классов определяет движение объекта. Предполагается заданной совокупность гладких (п — к 4-1) - мерных многообразий [98, стр. 71] М'1 (г £ 1 ,т), перемещающихся в пространстве X. Каждое движение многообразия из этой совокупности определяется уравнением К<(Ь,х) = 0, г £ 1 ,га. Здесь и далее: К; :Т х X —> Лк (г £ 1 ,т) - непрерывно дифференцируемые (гладкие) по совокупности переменных функции. В основной задаче определению подлежат: программное управление I/ нелинейным объектом и моменты £1, ...,£т его встречи с с многообразиями Мг (?• £ 1,т) . Качество движения оценивается
20