9.3. Модальное управление по выходу объекта. Теорема разделения

Рассмотрим теперь более характерную для практики задачу, когда измерению доступен не вектор состояния x[t), а выход

объекта y{t). Объект будем считать невырожденным (полностью управляемым и наблюдаемым). В этом случае представляется естественным использовать в законе управления не сами переменные состояния объекта x{t), а их оценки x{t), полученные с помощью наблюдателя (рис. 9.1). Уравнения замкнутой системы тогда принимают вид

Уравнения (9.8), (9.9) описывают регулятор, входом которого является процесс у(^), выходом - управляющее воздействие u{t). В отличие от регулятора (9.2) данный регулятор явля

ется динамической системой, порядок которой совпадает с порядком уравнений объекта управления (9.7). Регуляторы такого вида называются иногда динамическими компенсаторами [76]. ^

Возникает вопрос: каковы динамические свойства системы (9.7)-(9.9), как влияет на свойства системы замена в модальном регуляторе значений состояния на его оценки? Для ответа на него найдем характеристический многочлен замкнутой системы.

Упростить вычисление данного многочлена можно преобразованием уравнений состояния. Для этого снова используем ошибку оценивания e{t) = x[t) — x[t). Тогда можем записать x[t) = x[t) и уравнения (9.7) - (9.9) преобразуются к виду

Переход от уравнений (9.7)-(9.9) к (9.10)-(9.12) соответствует преобразованию вектора состояния системы (9.7)-(9.9) x(t) = соі{ж(^), x{t)^ к вектору x{t) = соі{ж(^), x{t) — x{t)^ = соі{ж(^),е(^)}, которое, конечно, является невырожденным. Относительно вектора x{t) получим однородную систему x{t) = Ax{t), где матрица А имеет следуюш;ую блочную структуру:

Поскольку матрица А имеет блочную треугольную форму, ее характеристический многочлен равен произведению характеристических многочленов диагональных блоков

Ввиду того что система (9.10)-(9.12) получена невырожденным преобразованием уравнений (9.7)-(9.9), исходная замкнутая система (9.7)-(9.9) имеет такой же характеристический многочлен. Следовательно, справедлива следуюш;ая теорема.

Теорема разделения [3, 47]. Характеристический многочлен замкнутой системы с регулятором, используюш;им оценки состояния объекта, и набюдателем равен произведению характеристического многочлена системы с ’’идеальным” модальным регулятором (9.2) и характеристического многочлена (8.5) наблюдателя (9.9).

Корни характеристического многочлена системы (9.7)-(9.9) получаются объединением корней системы с модальным регулятором и собственных чисел наблюдателя состояния. Таким образом, задачи синтеза модального регулятора (определения матрицы К) и наблюдателя (вычисления матрицы L) могут решаться независимо. □

Заметим, что аналогичная теорема справедлива и при ис- нользовании наблюдателей нониженного порядка, описанных в п. 8.3. [3].

Уравнения (9.10)-(9.12) позволяют также сделать вывод, что при отсутствии внешних воздействий процессы в системе (9.7) - (9.9) будут асимптотически приближаться к процессам в системе с модальным регулятором по состоянию (9.2), как если бы система (9.3) была подвержена действию затухающих возмущений. Роль этих возмущений играет составляющая Ke{t) в уравнении (9.11). Скорость затухания ошибки e{t) определяется при синтезе наблюдателя. Практически рекомендуется выбирать время переходного процесса наблюдателя в несколько раз меньшим требуемого времени переходного процесса в системе с модальным регулятором.

Нетрудно убедиться, что для SISO-систем (/ = m = 1) уравнения (9.8), (9.9) приводятся к передаточной функции динамического регулятора в цепи обратной связи. ® Поэтому изложенный метод синтеза можно рассматривать как подход к определению параметров корректирующего звена, обеспечивающего заданное расположение корней характеристического многочлена замкнутой системы. Решение этой задачи на основе операций с многочленами приведено, например, в [76]. Следует также отметить, что и в том, и в другом случае требуется невырожденность объекта управления. Если в передаточной функции разомкнутой системы имеются совпадающие нули и полюса, то их значения неизбежно будут содержаться среди корней характеристического многочлена замкнутой системы D(s). Действительно, D(s) = A(s) -Ь B(s), где A(s), B(s) - знаменатель и числитель передаточной функции разомкнутой системы. Пусть A(s) = A'(s)R(s), B(s) = B'(s)R(s), т.е. имеются общие нули и полюса. Тогда D(s) = R(s)(A'(s) -Ь B'(s)) и среди корней многочлена D(s) при любых A'(s), B'(s) содержатся корни R(s). Устойчивость замкнутой системы может быть обеспечена только в том случае, когда они имеют отрицательные вещественные части, что соответствует стабилизируемости и обнаруживаемости объекта управления.

Как отмечено нри определении понятия управляемости (с. 167, п. 7.1.), полностью управляемую стационарную систему можно (теоретически) перевести из любого начального состояния в любое другое за произвольно заданный конечный промежуток времени. Рассмотренное выше модальное управление обеспечивает лишь асимптотическую стабилизацию системы, т.е. - приведение из любого исходного состояния в нулевое при t ^ оо. Во многих приложениях требуется именно решение задачи попадания в заданное состояние к назначенному моменту времени. Такие задачи называются задачами терминального, или финитного, управления [3, 20]. Они возникают, например, при выведении ракет-носителей, сближении и посадке космических аппаратов [19, 20], выполнении типовых маневров самолетов [23], при управлении манипуляционными роботами и транспортными средствами. ® Решение этой задачи для стационарных систем фактически дано при доказательстве положительной определенности грамиа- на управляемости в п. 7.2. (п. 10, с. 172). Там показано, что для приведения стационарного, полностью управляемого объекта x{t) = Ax{t) + Bu[t) из начального состояния Xq в заданное состояние Хі за указанный временной интервал Ѳ = ti — to > О можно использовать программное управление [3, 30, 83].

где грамиан управляемости

Таким образом, найдено управление не в форме обратной связи по состоянию (или другой текуш;ей информации о поведении объекта), а в виде функции времени, которая должна быть рассчитана заранее, исходя из заданных значений Хо,Хі,Ѳ.

Управление (9.13) для решения данной задачи не является единственным [3]. Оно определяется с точностью до некоторой аддитивно добавляемой функции r{t), удовлетворя-

юш;ей условиюДействительно, данный

интеграл (по формуле Коши (6.9), с. 130) выражает реакцию системы на воздействие r{t). При равенстве его нулю реакции на u{t) и u{t) + r[t) совпадают. Как показано в [3], управление u[t) (9.13) из всех воздействий, переводяш;их Xq в Жі, обладает минимальной нормой (т.е. минимизирует интеграл

Перечислим некоторые свойства функции [3, 47]:

Это пхп матричная функция, которая

1)   симметрична - W{to,ti) = W{to,ti) ;

2)   неотрицательно определена для всех to,ti > to',

3)   удовлетворяет линейному матричному дифференциальному уравнению [уравнению Ляпунова)

В частности, для стационарных систем при 0 —>■ оо матрица УѴ{Ѳ) приближается к решению УѴ алгебраического уравнения Ляпунова

4) удовлетворяет функциональному уравнению

При вычислении грамиана управляемости (9.14) можно также учесть следуюш;ие соотношения. Введем функцию

w{t) =    Как показано в 6.2. (с. 132), при скалярном вход

ном воздействии (т = 1) можно трактовать w[t), как функцию веса рассматриваемой системы и находить, решая однородное уравнение x[t) = Ax[t) при ж(0) = В. Если m > 1, то в качестве начальных условий берутся столбцы 6,- матрицы

В = [61:62: ... :6т] и w{t) находится объединением т решений.

Эти свойства можно использовать при решении задач финитного и терминального управления.

Полученное выше решение задает программное управление. Представляет интерес получить управление в форме обратной связи, как это обычно принято в системах автоматического управления. Покажем, как это сделать при решении задачи стабилизации, - когда требуется привести состояние объекта в начало координат, жі = 0.

Обратимся к форму, ле (9.13). Обозначив С = УѴ{Ѳ) ^(жі — CeTZ, получим

Введем сопряженное уравнение ®

Согласно формуле Коши, его решение ip{t) = е~^  =

Т

(ti-t)Q Сравнивая полученное выражение для с формулой для u{t), видим, что управляюш;ее воздействие можно выразить как u{t) = В ф{і), где ф{і) удовлетворяет уравнению (9.16), 'ф{іо) = ^С. Объединяя уравнения объекта, закон управления и сопряженное уравнение, получим систему

Подставляя второе уравнение в первое, получим систему

Для решения этой системы можно использовать преобразование Риккати [3, 47, 88]. Будем искать ф{і) в виде ф{і) = где S{t) - подлежаш;ая определению матрица-функция. Подстановкой ф{і) во второе уравнение и путем дифференцирования получаем Sx + Sx = —А Sx. Учитывая первое уравнение системы, после подстановок получаем Sx+ SAx+ SBB Sx = -A Sx. Чтобы полученное равенство было выполнено при всех X, S{t) должна удовлетворять следуюш;ему матричному дифференциальному уравнению:

Чтобы найти начальное значение S{tQ), учтем, что рассматривается задача стабилизации и Жі = 0. Поэтому

Так как должно выполняться условие ф{іо) = S{to)x{to), то получим S{to) = —^УѴ{Ѳ)~^ Таким образом, управление, переводяш;ее состояние объекта из x{to) = Xq в нулевое за заданное время 0 > О, выражается в виде обратной связи

где S{t) удовлетворяет уравнению (9.19). Данное уравнение является частным случаем так называемого уравнения Риккати, которое часто встречается при решении различных оптимизационных задач [2, 3, 23, 93, 47]. В Приложении С. на с. 423 приведено обраш;ение к MATLAB-программе для вычисления установившегося решения этого уравнения.