Ви є тут

Максиминный контроль качества стабилизации космических объектов

Автор: 
Лемак Степан Степанович
Тип роботи: 
Дис. д-ра физ.-мат. наук
Рік: 
2004
Артикул:
4495
179 грн
Додати в кошик

Вміст

Оглавление
Введение..................................................... 5
Глава 1. Постановка задач и функциональная схема мак-
симинного контроля 15
1.1 Постановка задачи контроля качества качества стабилизации ...................................................... 15
1.2 Компьютерное тестирование алгоритмов стабилизации ... 19
1.3 Контроль качества полуавтоматического управления — стендовое тестирование пилотов...............................23
1.4 Математическая постановка 1-го этапа максиминного тестирования качества стабилизации ........................... 29
Глава 2. Стратегия жесткого тестирования 35
2.1 Описание формализма (методики) жесткого тестирования 35
2.2 Нахождение нижней (наилучшей) оценки ..........37
2.2.1 Тестирование при отсутствии постояннодействующих возмущений..................................37
2.2.2 Сингулярная задача тестирования...................47
2.2.3 Тестирование при наличии постояннодействующих возмущений..............................................49
2.3 Наилучшая оценка в случае стохастической стабилизации 55
2.3.1 Вычисление отличного результата в случае линейных обратных связей по управлению.......................55
2.3.2 Вычисление отличного результата для нелинейных управлений..............................................60
Глава 3. Стратегия мягкого тестирования 65
3.1 Описание методики мягкого тестирования..........65
3.2 Существование седловой точки динамической игры......68
3.2.1 Существование седловой точки в случае начальных возмущений..............................................68
3.2.2 Седловая точка в линейно-квадратиченой игре(при
^ отсутствии параметричских возмущений) ..........70
3.2.3 Седловая точка в задаче робастной стабилизации системы второго порядка.................................70
2
3.2.4 Существование седловой точки для случая финитного функционала и программных стратегий.........76
3.3 Решение задачи Булгакова для нахождения стратегии тестирования ................................................... 79
3.4 Седловая точка геометрической игры.......................91
3.4.1 Примеры существования седловой точки геометрической игры ..............................................92
3.4.2 Процедура поиска седловой точки динамической игры 101
3.5 Классификация задач тестирования........................111
3.5.1 Функциональный подход.............................111
3 5.2 Стохастический подход.............................115
Глава 4. Компьютерное тестирование точности магнитной
стабилизации спутника 117
Введение......................................................117
4.1 Уравнения движения........................................120
4.2 Структура алгоритмов магнитной стабилизации, возмуща-
ющих воздействий внешней и внутренней среды и описание функциональной схемы тестирования.......................126
4.3 Пример реализации методики тестирования в задаче стабилизации тангажных колебаний спутника 138
Заключение ...................................................144
Глава 5. Стендовое тестирование качества управляемого
спуска с орбиты 146
Введение......................................................146
5.1 Кинематическая схема динамического стенда управляемого спуска и постановка задачи акселерационной имитации . 148
5.2 Математическое описание управляемого спуска с орбиты 154
5.2.1 Уравнения движения центра масс КЛА................154
5.2.2 Имитационная модель атмосферы.....................158
5.3 Алгоритмы динамической имитации перегрузок на центрифуге с использованием 3-х степеней свобода кардано-вого подвеса.................................................164
#
5.4 Реализация алгоритма динамической имитации спуска на тренажере ТС-18................................................177
5.5 Стендовое тестирование кандидата в космонавты .............182
Заключение ....................................................190
Глава 6. Стендовое тестирование качества визуальной стабилизации "Сейфера" 192
Введение.......................................................192
6.1 Описание структуры управления сейфером.....................193
6.1.1 Инструментальные погрешности........................194
6.2 Уравнения движения в окрестности МКС.......................196
6.3 Алгоритмы формирования среды функционирования для системы управления сейфером и сенсоров пилота-оператора 200
6.3.1 Уравнения возмущенного движения модуля на фазе причаливания ............................................ 200
6.3.2 Постановка задачи тестирования точности причаливания ..................................................205
6.3.3 Постановка задачи динамической имитации для сенсоров космонавта-оператора.............................207
6.4 Сенсорный конфликт в условиях микрогравитации и его динамическая имитация на стенде ЦФ-18 208
6.4.1 Глазодвигательные нарушения на орбите...............208
6.4.2 Описание вестибуло-сенсорного конфликта невесомости ....................................................210
6.4.3 Моделирование сенсорного конфликта невесомости. 212
6.5 Реализация методики тестирования точности причаливания сейфера ...................................................217
Заключение ....................................................221
Заключение к диссертации.......................................223
Литература.....................................................225
41
4
Введение
Важным этапом разработки и создания алгоритмов управления сложных динамических объектов является этап тестирования качества его работы. Особенно актуально проведение тестирования для систем с высокой ценой риска, например для систем управления космическим объектами.
Космические системы 21 века характеризуются высоким уровнем сложности решаемых задач, высокой ценой риска, повышенными требованиями к средствам коммуникаций и широким внедрением дистанционного управления как непосредственно операциями в космосе, так и телероботами. Типичным примером таких задач является стыковка орбитальных и межпланетных космических комплексов, сборка в космосе крупногабаритных конструкций. В связи со всем сказанным указанная ситуация требует развития и применения новых подходов к проблемам подготовки космонавтов к профессиональной деятельности в условиях микрогравитации, обеспечения мониторнинга состояния систем управления движением и точности координации космонавта-оператора при слежении за движущимися космическим объектами и ручном управлении их движением. Результаты многочисленных исследований [64, 131, 132, 63, 101, 120) показали, что невесомость существенно изменяет активность гравитационно зависимых систем человека и нарушает их привычное, эволюционно обусловленное взаимодействие. Есть все основания полагать, что имевшие место на орбите неудачные стыковки космических аппаратов, ошибки при сборке конструкций и другие случаи ошибок в ручном управлении были обусловлены нарушениями функции слежения в результате изменения сенсорных функций организма.
Наличие хронических вестибуло-двигательных нарушений в условиях микрогравитации заставляет более ответственно подойти к проблеме визуального управления движением космических модулей. В процессе подготовки космонавта-оператора необходимо осуществлять тренировки и регулярно проводить тестирование качества визуального управления того или иного модуля.
5
В работах (9],[100] показано, что на динамическом стенде типа центрифуги с кабиной в управляемом кардановом подвесе (ЦФ) при наличии полускфандра возможна имитация условий микрогравитацин для барорецепторов системы кровообращения и вестибулярной системы.
Расположение космонавта-оператора в кабине ЦФ в исходном положении полулежа ногами к центру вращения консоли ЦФ и выбор специального алгоритма вращения консоли и поворотов кабины и внутреннего кольца карданова подвеса позволяет создавать механический стимул для саккулюсов и передних полукружных каналов вестибулярной системы оператора, аналогичный стимулу на орбите (в условиях невесомости). Наличие полускафандра позволяет реализовать в кабине разное внешнее давление воздуха на нижнюю и верхнюю части корпуса оператора. Таким образом, реакция наиболее ответственных механорецепторов человека — вестибулярной системы и барорецепторов, оказывается аналогичной реакции этих механорецепторов в орбитальном полете, что позволяет говорить о динамической имитации условий орбитального полета или более того, об имитации сенсорного конфликта невесомости, в том числе и вестибуло-сенсорного конфликта.
Как показано в работах [11, 9, 100, 101, 103], в качестве тестирующего и контролирующего стенда может быть использована центрифуга с кабиной в трехстепенном управляемом кардановом подвесе. Для того, чтобы тренажер стал тестирующей системой, необходимо ввести третий уровень управления, осуществляющий управление параметрами, описывающими начальные и постоянно действующие возмущения, оказывающие влияние на динамику управляемого космонавтом модуля.
Важным показателем работы (как для автоматических систем, так и полуавтоматических, где управление производится космонавтом оператором) является точность решения задач стабилизации. Типичным примером решения таких задач является стыковка орбитальных комплексов, сборка в космосе крупногабаритных конструкций, управление автономными космическими модулями. Как уже было сказано выше, для космических систем, в контуре управления которых присутствует оператор, точность решения задач управления осложняется наличием различных
вестибулодвигательных нарушений в условиях невесомости. Использование наземных стендов является одним из возможных путей решения этой проблемы. Наряду с динамическими стендами тестирующие компьютерные стенды значительно упрощают процесс разработки и испытания систем управления космическими объектами. Один из возможных подходов к задаче тестирования точности стабилизации является получение гарантированных показателей точности работы алгоритма, ориентированных на возможное наихудшее поведение начальных и постоянно действующих на управляемую систему возмущений, мешающих стабилизации.
Формирование мешающих управлению параметров производится в рамках предложенной в работах (13, 16, 15, 19, 11] и развитой в данной диссертации методики максиминного тестирования точности стабилизации управляемых систем.
Функциональная схема контроля качества (точности) процесса стабилизации изображена на рис. 1.
Тестирование системы стабилизации
__ _жГ_ _ п 1>*Г
1 Удовлетворительная 1 1 | 1 Неудовлетворительная 1
точность точность '
1
Коррекция, Калибровка,
оптимизация диагностика
Рис. 1.
Как видно из приведенной схемы, в результате тестирования осуществляется контроль точности процесса стабилизации, позволяющий произвести настройку (оптимизацию) параметров алгоритма управления, либо (в случае неудовлетворительной точности) калибровку параметров системы и диагностику сбоев в работе системы.
Заметим, что тестируемый алгоритм управления не обязательно из-
вестей системе тестирования — важны только его входы и выходы. Это позволяет применять предложенную методику тестирования для тестирования ручного управления космическими объектами.
Методика тестирования включает три этапа. Стратегия тестирования формируется на первом этапе в результате решения игровой задачи.
Непосредственно тестирование — которое может быть реализовано либо в компьютерном варианте либо с помощью динамического стенда — реализуется на втором этапе, когда по заданным наихудшим начальным возмущениям и постоянно действующим возмущениям тестируется реальный алгоритм управления.
На третьем этапе путем обработки результатов тестирования выставляется оценка в смысле заданного функционала качества стабилизации ( по десятибальной либо стобальной шкале).
На рис.2 представлена функциональная схема компьютерного варианта системы тестирования.
Рис. 2.
Для реализации указанной схемы необходимо иметь в распоряжении модель функционирования управляемого объекта, измерительных и исполнительных устройств. Как было указано выше, сам алгоритм тестирования может быть представлен только входом и выходом.
В случае стендового тестирования, функциональная схема которого представлена на рис. 3, ситуация несколько усложняется, поскольку
Рис. 3.
кроме алгоритмов тестирования требуется разработка алгоритмов динамической имитации, создающих соответствующие условия для сенсоров системы управления ( либо для сенсоров пилота-оператора). В рассматриваемом варианте также требуется компьютерная модель объекта управления, но сенсоры и исполнительные механизмы (полунатурные испытания) могут быть размещены на самом стенде.
Таким образом на втором этапе путем компьютерного и (или) имитационного моделирования внешних и внутренних возмущений создается в некотором смысле наихудшая среда для функционирования автоматической системы управления либо оператора в случае ручного управления.
Важным свойством предложенной схемы тестирования является возможность объективного сравнения между собой нескольких, представленных для тестирования алгоритмов стабилизации.
Формирование на первом этапе наихудших возмущений для тестирования происходит в рамках решения некоторой игровой задачи. Управление в конфликтной ситуации представляется как игра двух лиц с противоположными интересами. Теория дифференциальных игр получила значительной развитие, начиная с фундаментальных работ Р.Айзекса [27), Л.С.Понтрягина [91, 92), Ю.Б. Гсрмейера [47), Б.Н.Пшеничного [94], и многих других ученых. Особенно большой вклад в развитие теории
внесен H.H. Красовским и его учениками (68, 66, 67, 114].
Игровая задача тестирования имеет свои особенности, одной из которых является наличие дискриминации одного из игроков. Действительно, тестирующая система имеет возможность формировать стратегию тестирования в виде v(x,u>t), где х — фазовые координаты, и — стабилизирующее управление. Теорема Н.Н.Красовского (68] утверждает наличие седловой точки в такой динамической игре, что в некоторых случаях дает возможность построить стратегии "мягкого"тестирования, рассмотренные в третьей главе работы.
Следующей особенностью рассмотренных в работе игровых постановок является (во многих случаях) возможность использовать линейный подход для системы уравнений в отклонениях (54, 68, 114]. Для случая фиксированного времени и выпуклого по фазовым координатам терминального функционала качества здесь также доказано существование седловой точки дифференциальной игры (67) и (114] для позиционных стратегий управления и = и(х,t) и тестирования v = v(z,t). Для таких задач в настоящее время развиты численные методы построения позиционных стратегий, основанные на сведении задачи к игре преследования-уклонения, конструировании стабильных мостов и.т.д. (62, 23, 55].
К сожалению, численное построение позиционных стратегий зачастую оказывается слишком сложным, чтобы реализовать его в реальном времени в системе тестирования, что привело к постановкам тестирования в классе программных стратегий. В этом случае динамическую игру можно свести к геометрической игре на множествах достижимости управляемой системы. Такие задачи рассматривались в работах (85), [84], (83), (50].
В данной работе получены некоторые новые результаты дтя геометрических игр и построен алгоритм поиска седловой точки игры.
Работа состоит из шести глав.
В первой главе дана постановка задачи контроля качества алгоритмов стабилизации, приведена функциональная схема тестирования. Описаны два подхода к задаче тестирования. Первый, предназначенный для задач управления, в которых управляющий сигнал формируется борто-
10
выми алгоритмами и для тестирования могут быть предъявлены входы и выходы этих алгоритмов. В этом случае можно построить компьютерный вариант тестирующей системы. Для решения задачи тестирования необходимо проводить анализ уравнений в отклонениях от программного движения управляемой системы. Первая постановка задачи тестирования была дана в работе (13]. В работе [16] рассмотрен случай, когда отклонения от программной траектории описываются стохастической системой уравнений. Задачи управления стохастическими системами рассматривались многими авторами [80, 119, 51, 135, 36, 116). В задачах максиминного тестирования стохастических систем широко используется решение задачи синтеза оптимального управления для линейных систем с квадратичным критерием качества, приведенные в [119, 116).
Во второй главе дано описание методики " жесткого'1 тестирования, когда стратегия тестирования находится из решения задачи Булгакова в виде синтеза наихудшего возмущения на втором этапе тестирования. На первом этапе решается задача поиска нижней оценки тестирования. Здесь рассмотрены различные задачи вычисления нижней оценки — для начальных возмущений, сингулярной задаче тестирования, а также при наличии аддитивных постоянно действующих возмущений. В этих задачах процедура вычисления нижней оценки содержит внутреннюю экстремальную задачу поиска оптимального управления на расширенном множестве допустимых управлений и для его вычисления используется уравнение Беллмана (30, 17, 119, 60, 134) — в детерминированном либо стохастическом варианте. Внешняя задача — поиска максимума по возмущениям — как правило, находится численно, методом последовательных приближений. Рассмотрены различные модификации метода Крылова-Черноусько для решения поставленной задачи.
В третьей главе представлена задача "мягкогоитестирования. В этом случае предполагается, что существует седловая точка динамической игровой задачи. Рассмотрены различные случаи существования седловой точки динамической игры. Особый интерес с точки зрения тестирования представляют седловые точки в классе программных стратегий с финитным функционалом качества тестирования. В этом случае дина-
мическ&я игра может быть сведена к геометрической игре на множествах достижимости возмущаемой и управляемой подсистем [67, 17) и решение задачи тестирования сводится к комбинации двух задач Булгакова специального вида. В главе приведен алгоритм решения задачи Булгакова и доказана его сходимость.
Рассмотрены различные случаи существования седловой точки в геометрических играл, доказаны теоремы об условиях существования и единственности седловой точки. Разработан алгоритм поиска седловой точки геометрической игры.
В четвертой главе рассмотрена задача тестирования алгоритма активной магнитной стабилизации углового положения спутника.
Активные системы применяются, если необходимо обеспечить очень высокую точность ориентации, противодействовать большим возмущающим моментам, совершать сложные развороты спутника. Особенно актуарным использование магнитных систем ориентации, ввиду их надежности, простоты и экономичности, оказалось при разработке малых ИСЗ [108, 78). Наиболее распространенным методом обеспечения углового движения малых (особенно микроспутников) спутников является активное управление с помощью токовых катушек.
В главе приведены результаты по тестированию стабилизации тан-гажных колебаний мексиканского спутника "Satexм(140).
В пятой главе рассмотрена задача тестирования управляемого спуска космического аппарата типа "Союз".
Тренировки космонавтов по управлению спуском проводятся на динамическом стенде — центрифуге с управляемым кардановым подвесом.
Известно (101), что при спуске вестибуло-глазодвигательные нарушения осложняют процесс управления движением. В работах (9, 126, 100) показано, что на динамическом стенде типа центрифуги с кабиной в управляемом кардановом подвесе при наличии специального полуск-фандра возможна имитация условий микрогравитации для барорецепторов системы кровообращения и вестибулярной системы.
Кроме этого, на тренажере управляемого спуска с орбиты реализуется алгоритм имитации перегрузок, возникающих при спуске аппарата.
12
Задачи динамической имитации рассматривались в работах [4, 9, 104]. В работе предложен алгоритм динамической имитации, использующий на каждом шаге имитации все три поворота колец карданова подвеса центрифуги. Во многих случаях это повышает качество имитации перегрузок, а также делает возможной имитацию движения маневренных летательных аппаратов (104].
Перечисленный набор алгоритмов составляет основу информационного обеспечения второго уровня управления тренажером на базе ЦФ. Для того, чтобы тренажер стал тестирующей системой, необходимо ввести третий уровень управления. Основу третьего уровня управления тренажером составляют алгоритмы тестирования качества управления космическим объектом.
В главе рассмотрены две постановки задачи тестирования спуска космического аппарата.Рассматриваются уравнения движения центра масс пилотируемого космического аппарата на участке траектории спуска, соответствующему движению в плотных слоях атмосферы. Математическая модель движения объекта имеет шестой порядок. Управление аппаратом осуществляется путем изменения угла скоростного крена. Начальные возмущения представляют собой отклонения от номинальных скоростей входа и углов входа аппарата в атмосферу. Параметрические возмущения в системе представляют неточности в задании аэродинамического качества и баллистического коэффициента аппарата. Постоянно действующие возмущения — это возмущения плотности атмосферы и скорости ветра. О возмущениях предполагаются известными только границы их изменения. Полученные в результате решения игровой задачи тестирования наихудшие параметрические и постоянно действующие возмущения используются на втором этапе на стенде при проведении тренировок космонавтов.
В шестой главе рассмотрена задача тестирования точности управления пилотируемого космического модуля, движение которого происходит в окрестности орбитальной станции ( устройство спасения космонавта — "Сейфер”).
Рассматриваемая задача характеризуется тем, что вестибуло-
глазодвигательные хронические нарушения, возникающие в космическом полете, осложняют процесс управления движением. В качестве наземного тренажера по отработке навыков по управлению космическими модулями тина "Сейфер" предлагается использовать динамический стенд на базе центрифуги, позволяющий имитировать сенсорный конфликт. Рассмотрен вариант использования стенда как тестирующей системы, что требует разработки третьего уровня управления стендом. Для формирования математического обеспечения третьего уровня управления стендом, решается задача тестирования точности управления "Сей-фером".
Большую ]юль в формировании изложенного в работе подхода сыграли обсуждение и консультации с профессором В.В.Александровым, за что автор выражает ему искреннюю благодарность. Также хотелось поблагодарить сотрудников Центра подготовки космонавтов им. АЛО.Гагарина, представивших возможность реализовать предложенные в работе алгоритмы динамической имитации и тестирования на центрифуге ЦФ-18.
Постановка задач и функциональная схема максиминного контроля
1.1. Постановка задачи контроля качества качества стабилизации
Пусть движение управляемой системы представлено уравнениями У = /Ы + ?\{у)й + Г2(ф, й(-) еи= {«(•) € Ц | й(0 еПс К*},
*(•) € V = {*(■) 6 КС? | №Ю|<0. 1 = 1... .,т},
у(*о) € У,
где у — п-мерный вектор координат системы; й(-) — 5-мерный вектор управлений, измеримая квадратично-интегрируемая вектор-функция, в каждый момент времени принимающая любое значение из заданного множества П С г>() — тп-мерный вектор возмущений, кусочногладкая вектор-функция, ограниченная по модулю и производной. Включения у(*о) € У, г>(-) € V описывают ресурсы возмущений (начальных и постоянно-действующих), а включение £(•) € II — ресурсы управлений. Будем считать, ’по имеет место программный процесс {уп(*),ип(ОЛ*0|**)}> удовлетворяющий тождеству
гГ№ = /(у"«) + ^(уп«К». (1.1)
Рассмотрим отклонения х — у — уп когда управляющее воздействие формируется в виде й = ип + и, где и е и — оставшиеся ресурсы по управлению для решения задачи стабилизации. Тогда в линейном по х приближении уравнения в отклонениях примут вид
гпр дп — л — йШ в _ V''5 Г* — 'Гт
где л0 - зу, л, - ^, а - 2-1=1 ду, > ° - г-і=і ^ •
В случае разрешимости относительно мп уравнений (1.1), систему (1.2) можно переписать в виде
і = (Ло(у" (<)) + £ /Му"(«М(*))г + В(у”(<))« + С(у"(4))«. (1.3)
Так как, вообще говоря, х(іо) Ф 0, то возникают экстремальные задачи анализа и синтеза системы (1.3) с функциональными включениями гі(-) Є и и г»(-) Є V. Ограничимся случаем, когда качество функционирования системы (1.2) описывается функционалом
Ґк
У = хт(^)5з:(іа:) + / {х1 Сх-\-итN4)^, (1.4)
Jto
где 5Т — 5 ^ О, Єт = Є ^ О, ЛГТ = N ^ 0 и і* — первый момент достижения фиксированного многообразия в пространстве отклонений (в частном случае фиксировано). Описанную нами задачу можно представить в несколько более общем виде. Предположим, что необходима стабилизация любой программной траектории из заданного функционального множества и, кроме того, имеют место постоянно действующие возмущения. В связи с этим перепишем уравнения (1.3) в виде
тп т
х= (л0 + £ АіРі^х + (#0 + 53 В*Р*)и + с(р)у>
1-1 1=1
- Р(*) Є р = {р( ) € я| |р,(*)1 < Ц>> }, (1.5)
^(•) Є V, г(<о) Є Хо,
. и(-) Є и.
Здесь х(£) — п-мерный вектор отклонений от заданной траектории; р(-) — т-мерная вектор-функция параметрических возмущений; ч(-) — з-мерная вектор-функция стабилизирующих управлений; х(<о) Є Хо — множество начальных отклонений; ио — заданные величины, описывающие ресурсы параметрических возмущений. В качестве постоянно действующих параметрических возмущений могут выступать как программные траектории (если их несколько), так и возможные неточности в задании отдельных параметров системы или их изменения в процессе
функционирования системы. Будем считать, что система (1.5) полностью управляема при любом постоянном р € Р и стабилизируема при соответствующем алгоритме стабилизации и(х, t) 6 U.
Под задачей тестирования будем понимать задачу анализа текущих отклонений, позволяющую оценить точность стабилизации любой программной траектории из заданного множества. При этом в зависимости от степени знания алгоритма стабилизации а(-) будем различать два варианта: структура алгоритма стабилизации либо известна, либо неизвестна. Имеют смысл следующие задачи анализа и синтеза системы (1.5):
а) задача минимаксной стабилизации
sup J{u{-),v(-),p{-),x(t0)) — inf (1.6)
u()eV *»<■)€!/
p()e/>
*(«>)€ X о
б) задача 1-го этапа максиминного тестирования
inf J(ti(-),v(*),p(*).®(<b)) sup • (1-7)
«()€(/ vl.)£V
Pi-)eP
x«o)eXo
Задаче (1.6) посвящено достаточно большое число статей и монографий ((65), [87], (45],[14],[5) ). Задача (1.7) впервые сформулирована в работе (13].
Если структура алгоритма стабилизации известна и она является линейной, то, не ограничивая общности, можно считать и = 0 и тогда возможна постановка обобщенной задачи Булгакова о максимальном отклонении [2). Решение этой задачи и дает точное значение максимальной ошибки при стабилизации программной траектории. Алгоритмы решения задачи Булгакова будут рассмотрены в п.3.3. Если аддитивное возмущение отсутствует (г> = 0), то можно воспользоваться формулировкой задачи об абсолютной устойчивости с оценкой [5].
Возможен случай, когда структура алгоритма стабилизации u(x, t) неизвестна и возможно лишь использовать информацию о выходном сигнале алгоритма. Подобная ситуация возникает при наличии полуавтоматического или ручного управления стабилизацией, а также когда создатели алгоритма не желают предоставить информацию о его структу-
17
ре. Таким образом, алгоритм управления представляется "черным ящи-ком"(либо "серым ящиком", если известна структура алгоритма но точно не известны его параметры). Кроме того, естественно предположить, что часть сенсоров системы управления, поставляющих информацию о движении объекта, расположена внутри "черного ящика".
В рассматриваемом случае необходимо создавать условия для функционирования сенсоров, аналогичные условиям реального движения. Такие условия можно осуществить помощью имитационных динамических стендов (ИДС).
В общем случае контроль качества управления динамическим объектом можно представить в виде функциональной схемы (рис. 1.1).
Рис. 1.1
Верхний блок на схеме представляет тестирующую систему, задачей которой и является создание внешней (начальные и постоянно действующие возмущения) и внутренней ( инструментальные ошибки сенсоров и исполнительных механизмов) сред, в которых функционирует управляемый динамический объект.
Процедура тестирования, описание которой будет дано ниже, как правило, состоит из трех этапов.
На первом этапе (предварительном) решается экстремальная зада-
ча на максимин (1.7). При этом определяются оптимальные стратегия и°(х,<) и контрстратегия у°(х^,и),р°(х,1,и),х°(Ьо) (если они существуют) и нижняя цена игры 7р (1.6),(1.7), являющаяся неулучшаемой оценкой снизу качества стабилизации программных траекторий.
На втором этапе реализуется собственно тестирование представленного заказчиками алгоритма -й(х,<) (либо группы алгоритмов й*(х,<), i = 1 ,...,£). Целью тестирования является получение объективных показателей точности стабилизации представленного алгоритма (либо сравнение показателей точности, когда алгоритмов несколько). Такое сравнение логично проводить с полученной на первом этапе неулучшаемой оценкой 7$-
Таким образом, на втором этапе, в рамках компьютерной либо динамической имитации, когда на выходные действия й(х,С) тестируемого алгоритма стабилизации имитаторы среды вырабатывают контрстратегию х°(£о),Р°, V0, вычисляем реальный результат точности стабилизации 7 в смысле выбранного функционала качества (1.4). Заметим, что при наличии случайных возмущений па втором этапе может проводится статистическое моделирование для вычисления показателя 7.
На третьем этапе вычисляем оценку тестирования путем сравнения реального результата тестирования 7 с неулучшаемой оценкой То-
1.2. Компьютерное тестирование алгоритмов стабилизации
Если система управления является полностью автоматической, то возникает возможность построить компьютерный вариант тестирующей системы. Рассмотрим одну из возможных постановок задачи тестирования в этом случае.
Рассмотрим случай, когда вектор постоянно действующих возмущений г(<) имеет две составляющие: V = q{t) + £(£), причем составляющую <?(£) постоянно действующего возмущения считаем произвольными кусочно-непрерывными функциями, принимающими любые значения из заданного множества <?(£) £ О С Я1, а £(£) — стационарный случайный
19
процесс с известной спектральной плотностью. Как известно [82, 135), такие возмущения могут быть смоделированы возмущениями на выходе линейной стохастической системы, входные воздействия которой представляют собой белый шум с заданной интенсивностью, поэтому, не ограничивая общности, можно считать, что возмущения £(£) моделируются векторным белым шумом с с известной матрицей интенсивности F(t) > 0, А/(£(£)£т(£/)) = F(t)ô(t — f) ( М — операция взятия математического ожидания, S(t) — дельта-функция.). Начальные возмущения также имеют две составляющие аг(£0) = 1*о + С> гДе ГМ) € Rq С Я", а Ç — нормально распределенная случайная величина с нулевым средним М[С] = 0 и известной матрицей ковариации Pq = М[СС )• Поведение вектора отклонений х описывается стохастической системой уравнений
х = A(t,p)x + B(t}p)u + C(t,p)q Ч- C(ttp)Ç. (1.8)
Уравнение (1.8) надо понимать как краткую формальную запись соответствующего интегрального уравнения, а £(£) — как обобщенную производную нормального процесса х(^) с независимыми приращениями, Çdt = d\- Управление и принадлежит множеству и Е U, где U — множество случайных процессов, допускающих представление вида (18). В частности, при u = K(t)x, где K{t) € /С, К, — множество функций на отрезке (£о>**)> значениями которых являются матрицы размерности л х s с кусочно-непрерывными элементами, такое представление возможно [51, 80].
В зависимости об информации о тестируемом алгоритме возможны различные варианты решения задачи первого этапа тестирования — вычисления нижней оценки точности стабилизации, так и второго этапа — вычисления реальной оценки тестирования.
Предположим сначала, что отсутствует всякая информация о тестируемом алгоритме, кроме его входов и выходов, т.е. он представляет собой "черный ящик". Структура оценивателя в рассматриваемом случае тоже неизвестна. При неполной информации об отклонениях алгоритм стабилизации формируется как обратная связь по оценке отклонений х(£), вырабатываемой системой оценивания по данным от измерителей. Обозначим Ах = х — х — ошибки оценки координат. Пусть имеется ин-
20
формация о точности системы оценивания — Дх € КС\Ь0,£*| )Дх(£) € С}1, где С}1 известное ограниченное множество. Тогда задача тестирования на первом и втором этапе не отличается от случая полной информации об отклонениях — задачи (1.7) для системы (1.5) и функционала (1.4) но число постоянно действующих возмущений увеличивается за счет добавления ошибки оценки Дх 6 Q1.
Если тестируемое управление формируется в виде линейных обратных связей й — /С(£)х(£), система (1.8) запишется в виде
(Их
— = Д(£,р) + £(£)/Г(£)х +Я^р^ОДя+ <?(£, р)<?>
Дх(-) 6 Ух = {Дх(-) е КС Дх(£) €(Э1 С Я"};
. (1-9)
</(') € К = {</(•) € КС\ д(1) € С} С Ят}, х(£0) € Х0 С Яп; р(-) € Р - (р(-) 6 Я'] |рг(£)| < и0, |р,(*)| < ^}.
Здесь х(() — п-мерный вектор отклонений от заданной траектории, р(-) — т-мерная вектор-функция параметрических возмущений, <?(£) — по-стояннодействующие возмущения, х(£0) 6 Хо — множество начальных отклонений.
Предположим теперь, что известна структура системы оценивания, и оценка отклонений х вырабатывается с помощью калмановской фильтрации по информации от сенсоров (измерителей), которые могут быть представлены вектором измерений г = Нх + Н^+т?, где т}' — инструментальные погрешности измерителей, описываемые процессом типа белого шума [7, 80]. Пусть для получения оценок х используется оптимальный алгоритм оценивания, который в данном случае имеет вид
£ = А(^р)х + В(^р)и + С(Ьр)ч + К(х - Нх), ^
г = Нх + #1<7 4- т\,
где К (£) — матрица усиления, вычисляемая из соответствующего уравнения Риккати. В этом случае представленный для тестирования алгоритм является "серым ящиком", так как известна структура оценивателя.
Таким образом, имеем более сложную задачу на всех трех этапах
21