12.2. Системы с переменной структурой в задаче оценивания состояния

Известным методом получения более полной текущей информации о поведении объекта управления является использование рассмотренных в гл. 8. с. 181 наблюдателей. Ири синтезе алгоритма оценивания имеет смысл не ограничиваться описанными в гл. 8. линейными структурами, а использовать и возможности нелинейных методов управления, в том числе - организации скользящих режимов в системах с переменной структурой [5, 21, 22, 102]. Поскольку такие системы обладают, в некотором смысле, адаптивными свойствами, близкими к свойствам систем с сигнальной адаптацией (по этому поводу см., например, [9, 74] и 12.5.), аналогичных свойств можно ожидать и от систем оценивания состояния. Использование скользящих режимов в наблюдателях предназначено, в первую очередь, для уменьшения ошибок, связанных с неточностью математической модели объекта. Рассмотрим этот подход более подробно.

Запишем уравнения линейного стационарного объекта в виде

Объект (12.20) считаем полностью наблюдаемым. Не нарушая общности рассуждений, можно принять, что rank С* = I.

Следуя [102], рассмотрим возможность осуществления декомпозиции движения наблюдателя за счет преднамеренного введения скользящего режима. Представим выход объекта в виде y{t) = C\xi{t)+ C2X2{t), причем

x(t) = со1{жі(^), X2{t)}, X2{t) G detC2 ф 0. Заметим, что выполнение указанного представления всегда возможно, так как, по условию, rank С* = I. Перейдем к новым переменным состояния. В качестве нового вектора состояния используем

вектор x{t) = со1{жі (^), у(^)} (ср. с описанными в п. 8.3. с. 187 наблюдателями Луенбергера). Очевидно, переход к вектору X выполняется невырожденным преобразованием с матрицей

Уравнения состояния системы в результате преобразования принимают вид x[t) = Ax[t) + Bu(t), где А = ТАТ~^,В = ТВ. Более подробно их можно записать как

Здесь

Как показано в работе [102], из наблюдаемости пары {А,С) следует и наблюдаемость пары (Лц, Л21), т.е. наблюдаемость системы Хі = АцХі с выходом 2 = А21Х1.

Запишем теперь уравнения наблюдателя со скользяш;им режимом. Они имеют вид [102]

где v[t) = Msignut, at = y{t)— y{t), постоянная М > О - величина ’’полки реле”, функция sign(-) от векторного аргумента понимается покомпонентно.

Вычитая из (12.21) уравнения (12.22), получим уравнения относительно ошибок оценивания:

Разрывная вектор-функция v{t) выбирается таким образом, чтобы на многообразии и = О возникло движение в сколь- зяш;ем режиме. Этим обеспечивается равенство y{t) = y{t). Как показано в [102], при ограниченном начальном рассогласовании всегда найдется такое (достаточно большое) М, при котором скользяш;ий режим возникает.

Матрица L определяется исходя из требования устойчивости движения в скользяш;ем режиме и желаемой динамики

системы относительно рассогласования е. По методу эквивалентного управления (см. с. 297) для получения уравнения скольжения следует решить уравнение (т^ = О относительно v(t) и найденное решение ѵ = v^q подставить в первое уравнение системы (12.23), полагая сг^ = 0. Выполняя эти преобразования, получаем = А21Х1, поэтому

В силу наблюдаемости пары (Лц,Л2і) всегда можно подобрать матрицу L так, чтобы обеспечить любое заданное расположение собственных чисел системы (12.24), и, следовательно - желаемую динамику движения в скользяш;ем режиме (по этому поводу см. п. 7.3. , с. 174, и п. 8.5 с. 185).

Можно заметить обш;ие и отличительные свойства наблюдателя (12.22) и рассмотренного в п. 8.3. на с. 188 наблюдателя Луенбергера (8.10). При синтезе обоих наблюдателей выполняются однотипные преобразования базиса переменных состояния, сходным образом находится матрица коэффициентов обратной связи, а также и в том, и в другом случае обеспечивается равенство нулю рассогласования а между выходом объекта и его оценкой. Разница состоит в том, что наблюдатель Луенбергера является системой пониженного порядка, в которой последнее условие выполняется тождественно в силу самой процедуры синтеза. Порядок наблюдателя (12.22) равен порядку объекта управления и условие СГ( = О обеспечивается организацией скользяш;их режимов и наступает по истечении некоторого промежутка времени. ®

В литературе [5, 21, 22] известны и другие, несколько отличные от (12.22) структуры и методы синтеза наблюдателей со скользяш;ими режимами.