Ви є тут

Нейрокерування нелінійними динамічними об’єктами на основі багатошарового персептрону

Автор: 
Шамраєв Анатолій Анатолійович
Тип роботи: 
Дис. канд. наук
Рік: 
2005
Артикул:
0405U001476
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
СИНТЕЗ НЕЙРОСЕТЕВЫХ СХЕМ ИДЕНТИФИКАЦИИ
2.1. Принципы формирования нейросетевых моделей
Можно выделить два типа НСМ объектов: модели, полученные методами прямой и
инверсной идентификации. При построении моделей, основанных на прямых методах
идентификации, используют два различных подхода: “предсказание”
(прогнозирование) поведения объекта и “имитация” или моделирование поведения
объекта [7]. При моделировании поведения объекта доступной является лишь
информация о значениях входных сигналов и выходных сигналов модели , при этом
сигналы на выходе объекта не измеряются. Полученная таким образом модель
называется параллельной и описывается уравнением
(2.1)
Данная модель может использоваться для имитации поведения объекта без
подключения к реальной системе или когда датчики входят в состав самой модели.
Для диагностики состояния системы необходимо сравнить значения сигналов на
выходе объекта и модели и оценить величину ошибки.
При прогнозировании поведения объекта используется последовательно-параллельная
модель. Значение сигнала на выходе модели рассчитывается на основании значений
входных и выходных сигналов объекта согласно уравнению
(2.2)
Структура параллельной модели представлена на рис. 2.2, а
последовательно-параллельной на рис. 2.1. Последняя позволяет предсказывать
поведение объекта на любое количество тактов вперед, благодаря чему она
получила наибольшее распространение при решении задач идентификации.
Если объект управления описывается уравнением вида:
(2.3)
Рис. 2.1. Последовательно-параллельная НСМ, описываемая уравнением (2.2)
Рис. 2.2. Параллельная НСМ, описываемая уравнением (2.1)
то для построения системы управления можно использовать инверсную модель (рис.
2.3) [62], реализующая обратную функцию объекта управления. Однако данная
модель применима лишь к ограниченному классу объектов управления, для которых
запаздывание по сигналу управления равно одному такту [63].
Рис. 2.3. Инверсная НСМ, описываемая уравнением (2.3)
Наибольшее распространение для решения задач идентификации и управления
получили ИНС типа МП и РБС [19]. То обстоятельство, что обе эти сети позволяют
аппроксимировать с любой заданной точностью любую непрерывную функцию,
обеспечило их широкое применение в задачах идентификации нелинейных объектов, а
сочетание аппроксимирующих свойств со способностью быстро обучаться позволяет
использовать их для управления нелинейными динамическими объектами в реальном
времени [7, 64, 65]. Обе сети используют аппроксимацию нелинейного оператора
объекта (2.4) некоторой системой базисных функций , реализуемой нейронами,
образующими слои сети, а задача идентификации сводится к обучению сети, то есть
настройке параметров сети на основе предъявления обучающей выборки, в состав
которой входят измеряемые значения входных и соответствующих выходных
переменных
(2.4)
где - весовые параметры сети;
.
При построении МП выбор вида активационной функции играет существенную роль.
Так как для обучения сети обычно применяются различные методы оптимизации,
оперирующие как значениями самой функции активации, так и значениями ее
производных, то необходимо, чтобы используемая функция удовлетворяла ряду
условий: была ограниченной, монотонной и непрерывно-дифференцируемой. Функции,
обладающие перечисленными свойствами, называются сигмоидальными. К ним
относятся:
логистическая
(2.5)
гиперболический тангенс
(2.6)
Особо важную роль такие функции играют при моделировании нелинейных
зависимостей между входными и выходными переменными.
Как уже отмечалось, МП являются универсальными аппроксиматорами и позволяют
аппроксимировать с любой заданной точностью любую непрерывную функцию [5,
66-68], при условии, что существует достаточное количество скрытых слоев в
сети. Это утверждение справедливо и для сетей только с одним скрытым слоем.
Необходимым условием является то, что функции активации нейронов скрытого слоя
должны быть непрерывными, ограниченными и непостоянными. Эти требования
достаточно мягкие, причем сигмоидальные функции (2.5) и (2.6) являются лишь
одним из возможных вариантов активационных функций, удовлетворяющих этим
условиям. Данный теоретический результат является логическим обоснованием
использования МП для моделирования нелинейных систем, т.к. гарантирует, что
сети с одним скрытым слоем всегда будет достаточно для представления любой
произвольной непрерывной функции. Однако открытым остается вопрос о выборе
количества нейронов в скрытом слое, которое обеспечит заданную точность
решения. Кроме того, изложенные результаты основаны на предположении, что
значения весов в сети заданы корректно.
В настоящее время существует большое число методов настройки параметров ИНС,
отличающихся как динамическими свойствами, так и вычислительной сложностью.
Обучение МП состоит в настройке весов, характеризующих силу взаимодействия
между нейронами, и обычно выполняется на конечном обучающем множестве,
содержащем обучающих пар. Каждая обучающая пара включает вектор входных
сигналов и соответствующий ему целевой (желаемый) выходной вектор .
РБС обладают высокой скоростью обучения и благодаря механизму адоптации
структуры сети при их обучении не возникает проблем с остановкой в локальных
минимумах. Однако надо отметить, что число нейронов в шаблонном слое РБС
экспоненциально зависит от размерности входного пространства, что при
использовании параллельной или параллельно-последовательной моделей объектов
может привести к достаточно громоздкой структуре сети и увеличить время
получени