13.4.1.     Постановка задачи и метод решения

Идея использования отображения Пуанкаре (точечного отображения) для управления хаотическими колебаниями была предложена Оттом, Гребоджи и Йорке [180] и явилась основой значительного количества публикаций. Однако, ряд задач остались нерешенными, в частности, не были рассмотрены задачи адаптивного управления по выходу. Пиже изложено решение этой задачи, основанное на использовании ме-

тода рекуррентных целевых неравенств [103], предложенного В.А. Якубовичем в 1966 г. (см. Приложение В).

Рассмотрим нелинейную управляемую систему, описанную моделью состояния

где X = x[t) - п-мерный вектор состояния; и = u[t) - скалярный вход (управляющее воздействие); у = y[t) - скалярная выходная переменная, доступная измерению. Задача состоит в определении закона управления (алгоритма управления) u[t) = f/{y(r), и(г), О < т < ^} в виде w(^)gU, где U - выпуклое множество допустимых значений управления, например U=[- й,й] при й>0. Требуется обеспечить достижение следующей цели управления

где y^,{t)=h{x^,{t)) - желаемая выходная функция, соответствующая желаемой периодической или рекуррентной траектории (орбите) x^,{t) системы (13.39) для u{t) = и*. Папомним, что траектория x{t) называется рекуррентной, если для каждого е >0 она возвращается в е-окрестность своей произвольной точки не позже, чем через некоторое ограниченное время Т^. (Свойство рекуррентности было введено Дж. Бирк- гофом в 1927 г., [45].

Трудность поставленной задачи вызвана ее существенной нелинейностью. Более того, во многих приложениях некоторые из параметров системы (13.39) неизвестны, т.е. желаемая орбита x^,{t) и ’’идеальное” управление и* также неизвестны. Наконец, иногда значения у*(^) определены и y{t) доступно измерению только в некоторые моменты t^, к=1, 2,...

Для решения задачи мы формулируем ее дискретизованный вариант. Положим, что в пространстве состояний системы задана гиперповерхность S^, которая зависит от значения управления, как от параметра, и пересекает данную опорную траекторию x{t) трансверсально, т.е. не касаясь ее в точке Хо = ж(0) для всех и GU. трансверсально к x{t). Можно показать, что в этом случае существует (меньшее) открытое множество Su С такое, что каждая траектория (13.39), начинающаяся в точке X Е Su пересечется снова с поверхностью

Su в точке х'=Р[х,и). Отображение Р : X U —>■ называется управляемым отображением Пуанкаре. Оно определяет новую дискретную систему управления:

где Uk GU, Xk = x{tk) G 3^,., no крайней мере для х^, близких к X. Траектория (13.41) совпадает с траекторией исходной системы (13.39) в моменты пересечения x{t) с поверхностью , если управляющее воздействие кусочно-постоянно между пересечениями: u{t) = и^, < t < t^^i. Пусть 2 G 7^"“^ - вектор координат в окрестности S в точке Xq в некотором координатном базисе z{x). Без потери общности мы можем предположить, что z{xq)=0, и рассмотреть систему (13.41) в фазовом пространстве

гдеР(0,0)=0, /г(0)=0. Тогда дискретная система (13.42) может быть описана моделью вход-выход:

где аі,Ьі - коэффициенты передаточной функции линеаризованной системы (13.42) :

а возмущение удовлетворяет неравенству

Введем вектор настраиваемых параметров

вектор наблюдаемых величин [регрессор)

и выберем закон управления следующим образом

Алгоритмы адаптации осповапы па методе целевых неравенств и содержат зоны нечувствительности, которые парируют влияние как возмущения, так и ошибок измерения. Возмущение модели (13.43) становится существенным вне некоторой окрестности опорной траектории x{t). Поэтому, представляется оправданным введение инверсных, или внешних, зон нечувствительности (отключение адаптации для больших значений Цж/; —ж(^/;)|| или Ц^/; —2/;||, превышающих некоторый порог), дополнительно к основной ’’целевой” зоне нечувствительности. В итоге алгоритм адаптации выглядит следующим образом [148]:

где 7 >0 - коэффициент усиления адаптации, й - максимальное абсолютное значение управления; Ау - максимальная желаемая разница между и у*; Д связано с размером ’’трубки” в пространстве состояния около базовой траектории x[t), где определена модель вход-выход (13.43). Для формулировки условий работоспособности алгоритма вводится следующий вариант свойства наблюдаемости: дискретная нелинейная система (13.42) называется N-наблюдаемой, если

Результат о сходимости предложенного адаптивного регулятора содержится в следующем утверждении.

Теорема [148]. Пусть F в (13.39) - дважды непрерывно дифференцируема, h - непрерывно дифференцируема. Предположим, что

1)   опорная траектория x{t) рекуррентна;

2)   система (13.42) ІѴ-наблюдаема для некоторого N >0;

3)   знак Ьо в (13.43) известен;

4)   параметры системы и цель удовлетворяют следующим ограничениям:

Тогда существует До > О такое, что для каждого Д^<До существуют Д > До, 7>0, Ag(0,1) такие, что цель (13.40) с Ау* и ХАу для всех достаточно больших А; >0 в системе (13.39), (13.45), (13.46) с ограничением \uk\<Xu.

Доказательство теоремы основано на использовании функции Ляпунова Ѵ{х) = ||0 —Вышеуказанный алгоритм был успешно применен к задачам адаптивного управления моделью брюсселятора с внешним возбуждением, моделью Рёс- слера и моделью Кукушкина-Осипова химической реакции с фазовым переходом [31, 149].

Ниже приводятся в качестве примеров результаты для брюсселятора и системы Рёсслера, следуя [31].