8.4. Аналітичне конструювання регуляторів методом динамічного програмування

 

Розглянемо розв’язання задач АКР методом динамічного програмування на прикладі задачі про регулятор стану.

Нехай лінійний нестаціонарний об’єкт описується рівнянням стану (8.1):

.

За критерій якості використаємо (8.5):

.

За стандартною методикою (див. п. 5.3) записуємо рівняння Беллмана (5.21):

 

.

Позначимо через  мінімальне значення критерію якості :

 

 

,  (8.27)

де  – підінтегральна функція.

Ураховуючи це, рівняння Беллмана набуде вигляду

 

.  (8.28)

Подальша техніка пошуку оптимального управління для рівняння Беллмана у формі (8.28) повністю збігається з методикою (див. п. 5.3) для рівняння Беллмана (5.21).

1. На управління  обмежень не накладено, тому оптимальне управління шукаємо з умови рівності нулю часткової похідної за  від поданого у фігурних дужках рівняння (8.28):

.

Звідки визначаємо, що

.                     (8.29)

2. Щоб знайти функцію , необхідно підставити  (8.29) у вираз у фігурних дужках рівняння Беллмана (8.28) й отримати рівняння типу Гамільтона-Якобі, яке не залежить від управління :

 

 

 

.

Рівняння Гамільтона-Якобі набуде вигляду

 

.  (8.30)

3. Виберемо граничні умови. Із (8.27) видно, що при

.                (8.31)

При  введемо поки що невідому симетричну нестаціонарну  матрицю , при якій виконується рівність

,                   (8.32)

причому .

Оскільки , а , то, підставивши (8.32) у рівняння Гамільтона-Якобі (8.30), отримаємо

 

.   (8.33)

Надалі для простоти не будемо записувати залежність від часу .

Оскільки , то рівняння (8.33) запишемо у формі

.

Ця умова виконується при будь-яких станах , якщо вираз у дужках дорівнює нулю, тобто

.

Звідси випливає, що

.                  (8.34)

У результаті отримали нелінійне квадратичне щодо матриці  диференціальне рівняння, назване матричним рівнянням Ріккаті.

У роботах Калмана доведено, що для стаціонарних об’єктів можна ввести матрицю , де  – постійна симетрична додатно визначена матриця. Ця матриця визначається з рівняння Ріккаті, у якому слід уважати . Тоді нелінійне матричне рівняння Ріккаті набуде вигляду

.                       (8.35)

Рівняння Ріккаті в основному розв’язується за допомогою ЕОМ, починаючи з  і вважаючи, що . Для цього приблизно беруть, що

,

де  – малий приріст часу.

Це дозволяє подати рівняння Ріккаті (8.34) у такій формі:

 

.

4. Знайшовши матрицю , можна за формулою (8.32) визначити  і, підставивши його у вираз (8.29), знайти оптимальне управління .