Алгоритмы максиминного тестирования качества стабилизации
космических систем
Оглавление
Введение.......................................................... 4
Глава 1. Математические постановки задач максиминного тестирования и методы их решения. 11
1.1 Задача тестирования качества стабилизации билинейной системы............................................................... 11
1.1.1 Постановка задачи тестирования ....................... 11
1.1.2 Решение игровой задачи первого этана методики тестирования..................................................... 14
1.1.3 Существование тачки равновесия в классе смешанных сгратегий................................................... 17
1.1.4 Алгоритмы поиска минимакса............................ 19
1.1.5 Синтез смешашюй стратегии тестирования................ 25
1.1.6 Реализация второго этапа тестирования в случае смешанных стратегий тестирования............................... 30
1.2 Задача тестирования качества стабилизации линейной управляемой системы с учетом расхода топлива.......................... 33
1.3 Задача тестирования качества стабилизации нелинейной управляемой системы с конечным множеством возмущений. . . 36
1.3.1 Построение точечной аппроксимации множества достижимости нелинейной управляемой системы...................... 38
Глава 2. Методика тестирования качества ориентации микроспутника и её применение для оценки качества работы алгоритмов ориентации аппарата 4ГУииверситетский-Татья11а-2”. 41
2.1 Цели и состав системы ориентации............................ 43
2.2 Расчет множества возможных начальных угловых скоростей. . 46
2.3 Максиминнос тестирование качества гашения угловых скоростей микроспутника Земли на первом этапе ориентации.............. 50
2.3.1 Модель спутника.......................................: 50
2.3.2 Модель магнитного поля земли........................... 51
2.3.3 Орбитальное движение спутника........................ 53
2.3.4 Постановка задачи тестирования....................... 55
2.4 Решение максим и иной задачи первого этапа методики тестирования ............................................................. 56
2.4.1 Определение стратегии тестирования................... 58
2.5 Описание тестирующего стенда и реализация второго этапа. . 60
2.6 Результаты 'тестирования различных алгоритмов ориентации . 66
2.6.1 Сравниваемые алгоритмы .............................. 67
2.6.2 Результаты сравнения на основе статистических испытаний ........................................................ 68
2.6.3 Результаты сравнения на основе стратегии тестирования 75
Глава 3. Математическое обеспечение тестирующего тренажера но сближению устройства спасения космонавта с орбитальной станцией. 77
3.3 Смешанные стратегии тестирования качества стабилизации процесса сближения устройства спасения космонавта с орбитальной станцией................................................... 78
3.1.1 Уравнения движения устройства спасения космонавта. . 78
3.1.2 Реализация первого этапа тестирования в случае двух
возмущений............................................. 84
3.1.3 Реализация первого этапа тестирования в случае многих
возмущений............................................. 86
3.2 У чет расхода топлива при тестировании качества стабилиза1 щи процесса сближения УСК с орбитальной станцией...................... 88
3.2.1 Уравнения пространственного процесса сближения
УСК с орбитальной станцией............................. 88
3.2.2 Первый этап методики максиминпого тестирования. . . 91
3.3 Второй этап тестирования процесса сближения УСК с орбитальной станцией. Разработка тестирующего тренажера 95
Заключение.........................................................101
Литература.........................................................102
ВВЕДЕНИЕ
Важным этапом разработки и создании алгоритмов управления сложных динамических объектов является этап тестирования качества их работы. Особенно актуально проведение тестирования для систем с высокой ценой риска, например для систем управления космическими объектами.
Основным показателем качества работы (как для автоматических систем, так н полуавтоматических, где управление производится космонавтом оператором) является точность решения задач стабилизации. Типичным примером решения таких задач является стыковка орбитальных комплексов, сборка в космосе крупногабаритных конструкций, управление автономными космическими модулями.
Для космических систем, в контуре управления которых присутствует человек, точность решения задач управления осложняется наличием различных вес гибуло-двигательных нарушений в условиях невесомости. Использование наземных тестирующих стендов является одним из возможных путей решения згой проблемы.
Автоматические системы управления космическими объектами, в которых человек не принимает прямою участия, также обладают высокой ценой риска. Ярким примером может служить система ориентации спутника, от качества работы которой зависит не только работа полезной нагрузки, по и энергетика, и жизнь самого аппарата. Дія таких систем применение тестирующих стендов, очевидно, является одним из путей отладки и повышения надежности работы бортового алгоритма управления.
Одним из возможных подходов к задаче тестирования точности стабилизации является получение гарантированных показателей точности работы алгоритма, ориентированных на возможное наихудшее поведение начальных и постоянно действующих на управляемую систему возмущений, мешающих стабилизации.
Формирование мешающих управлению параметров (стратегии тестирования) производится в рамках предложенной в работах |1) [2] (3] методики тестирования точности стабилизации управляемых систем.
В результате тестирования осущесгвлястся контроль точности процесса
4
стабилизации, позволяющий произвести настройку (оптимизацию) параметров алгоритма управления, либо (в случае неудовлетворительной точности) калибровку параметров системы и диагностику сбоев в работе системы.
Заметим, что тестируемый алгоритм управления не обязательно из 1 честен системе тестирования - важны только его входы и выходы. Эго позволяет применять методику максиминного тестирования для проверки качества ручного управления космическими объектами.
Методика тестирования включает три этапа. На нервом этапе, в результате решения игровой задачи, формируется стратегия тестирования.
На втором этапе проводится непосредственно тестирование, которое может быть реализовано либо в компьютерном варианте, либо с помощью динамического стенда. На этом этане но заданным наихудшим возмущениям тестируется реальный алгоритм управления.
На третьем этапе, путем обработки результатов тестирования, выставляется оценка в смысле заданного функционала качества.
На Рис. 1. представлена функциональная схема компьютерного варианта системы тестирования.
Алгоритм
Тестирования
х(1о)
./
«(.)
Компьютерная модель
Исполнительные устройства Динамический объект Измерительные устройства
и Алгоритм стабилизации
Рис. 1.
Для реализации данной схемы необходимо иметь в распоряжении модель функционирования управляемого объекта, измерительных и исполнительных устройств. Сам тестируемый алгоритм управления может быть представлен только входом и выходом.
5
Рис. 2.
В случае стендового тестировании (Рис. 2.) ситуация несколько усложняется, поскольку кроме алгоритмов тестирования требуется разработка алгоритмов динамической имитации, создающих соответствующие условия для сенсоров системы управления (либо для сенсоров ил лота-оператора). В рассматриваемом варианте варианте также требуется компьютерная модель объекта управления.
Таким образом, на втором этане, путем компьютерного и (или) имитационного моделирования внешних и внутренних возмущений, создается в некотором смысле иаихудшая среда для функционирования автоматической системы управления, либо оператора, в случае ручного управления.
Важнейшим свойством предложенной схемы тестирования является возможность объективного сравнения между собой нескольких, представленных для тестирования алгоритмов стабилизации.
Формирование на первом этапе иаихудших возмущений (стратегии тестирования) происходит в рамках решения некоторой игровой задачи. Процесс управления б конфликтной ситуации представляется как антагонистическая игра двух лиц с противоположными интересами. Теория дифференциальных игр получила значительное развитие, начиная с работ Р. Айзекса (12). Л.С.Понтрягина [20] [30], Ю.Б.Гермейера [17] п многих других ученых. Особенно большой вклад в развитие теории внесен Красовским и его учениками
[20, 21, 22).
Игровая за чача тестирования имеет свои особенности, одной из которых является наличие дискриминации одного из игроков. Действительно, система тестирвоания имеет возможность формировать тестирующую стратегию возмущений в виде где .т - фазовые координаты, и - стабилизиру-
ющее управление. Т.е. фактически имеет' место дискриминация управления и, поскольку в данном случае возмущение формируется с учетом заведомого знания фазовых координат и управления. Теорема Н.Н.Красовского [22) утверждает наличие седловои точки в такой дифференциальной игре.
В работе [24| было рассмотрено несколько игровых постановок задачи тестирования качества стабилизации в которых использовался линейный подход для системы уравнений в отклонениях. Для случая фиксированного времени и выпуклого по фазовым координатам терминального функционала качества имеет место седловая точки дифференциальной игры для позиционных стратегий управления и = н(:с, /) и тестирующих возмущений V = у(х, I)
И-
К сожалению, численное построение позиционных стратегий тестирующих возмущений зачастую оказывается слишком сложным, чтобы реализовать сто в реальном времени в системе тестирования, что привело к постановкам задачи тестирования в классе программных стратегий. В этом случае динамическую игру можно свести к геометрической игре па областях дости жи.мостн управляемой и возмущенной систем. Такие задачи рассматривались в работах [21, 2, 3, 2$, 31).
В работе (24) была создана классификация стратегий тестирования — разделение на “мягкую”, “квазимягкую” и “жесткую” стратегии, был построен алгоритм поиска седловой точки в геометрической игре.
В данной работе получены новые результаты в области построения "мягких "стратегий тестирования в классе билинейных динамических игр С конечным множеством возмущений. В рассмотреных задачах множество допустимых возмущений является конечным, а множество допустимых управлений — бесконечномерное функциональное множество с заданными ограничениями.
Основные новые результаты данной диссертации опубликованы в
7
нескольких работах. Расширение методики максиминного тестирования на класс билинейных систем, синтез оптимальной смешанной стратегии возмущений — в работах [4, 31]. Разработка математического обеспечения компьютерного стенда для тестирования качества ориентации мнкроснутника Земли — в работах [25, 10, 9]. Разработка математического обеспечения тренажера по сближению устройства спасения космонавта с орбитальной станцией, постановка и решение задачи с учетом расхода топлива — в работах [4, 5, б, 26, 31].
Диссертация состоит из трех глав.
В первой главе дана постановка задачи тестирования точности алгоритма стабилизации билинейной управляемой системы с конечным множеством возмущений, в случае когда множество допустимых управлений (множество стратегий игрока "управление") - бесконечное функциональное множество, а множество стратегий возмущений - конечно. Приведен критерий существования седловой точки динамической игры, с помощью которого в данной постановке достаточно легко проверить возможность получения "мяг-коп"стратегии тестирования. Опираясь на результаты Л.А. Петросяна в области антагонистических игр с выпуклой функцией выигрыша [27] получен результат, позволяющий синтезировать смешанную "мягкую"стратегию тестирования даже в случае отсутствия седловой точки в исходной динамической игре. Этот результат также опирается па работы В.Г. Болтянского [14], В.Ф. Демьянова и Л.В. Васильева [18] для решения минимаксной игровой задачи и синтеза оптимальной смешанной стратегии. Также в этой главе рассмотрена задача максиминного тестирования линейной управляемой системы с критерием качества, содержащим информацию о расходе энергии. Ее реализации опираемся па результаты, полученные в работах [2] [3] [24]. В дальнейшем этот результат применен к задаче о сближении устройства спасения космонавта с орбитальной станцией, описанной во второй главе.
Получен результат, позволяющий проводить тестирование алгоритмов управления нелинейной управляемой системы с конечным множеством возмущений. Этот результат основан на алгоритме построения точечной аппроксимации множества достижимости нелинейной системы, который, в свою очередь, опирается на результаты полученные в [34].
8