7.2. Динамічне програмування в задачі про максимальну швидкодію

 

Задачу про максимальну швидкодію можна подати як задачу із закріпленим правим кінцем траєкторії ( задане), нефіксованим часом  і критерієм оптимальності

.                                 (7.3)

При порівнянні критеріїв (6.2)  та (7.3) видно, що для задачі про максимальну швидкодію . Якщо в рівнянні Беллмана (5.21)  припустити, що , , а  замінити на , то отримаємо рівняння Беллмана в задачі про максимальну швидкодію:

             (7.4)

або в скалярній формі

,         (7.5)

де  – неперервна функція, що має неперервні часткові похідні за змінною .

Розглянемо методику визначення оптимального управління методом динамічного програмування в задачі про максимальну швидкодію. Як і у випадку динамічного програмування (див. п. 5.3), із умови мінімуму виразу у фігурних дужках знаходиться оптимальне управління . Потім, підставивши отримане оптимальне управління  у рівняння Беллмана (7.5), отримаємо диференціальне рівняння першого порядку в часткових похідних типу Гамільтона-Якобі для задачі про максимальну швидкодію (див. методику визначення оптимального управління за допомогою рівняння Беллмана, п. 5.3). Із урахуванням граничної умови  знаходимо  і, підставивши його у вираз для оптимального управління , отримаємо шукане оптимальне управління .

Частіше для розв’язання таких задач використовуються чисельні методи, реалізовані за допомогою ЕОМ.

Для простоти розглянемо задачу про максимальну швидкодію для лінійного об’єкта, описуваного рівнянням стану

,              (7.6)

або у векторній формі

,                       (7.7)

де  – матриця  з елементами , ;

 – матриця  з елементами , , .

Область допустимих управлінь найчастіше задається системою нерівностей

,    ,                     (7.8)

де .

Із урахуванням того що  , рівняння Беллмана (7.4) для лінійного об’єкта набуде вигляду

.

Оскільки перший доданок  не залежить від , то його можна винести за знак операції мінімізації, що приведе до рівняння

      (7.9)

або в скалярній формі

. (7.10)

Щоб доданок у фігурних дужках був мінімальним, необхідно, щоб він був від’ємним і набував найбільшого значення за модулем. Ця умова виконується, якщо в (7.8) припустии, що . Щоб при від’ємному множнику  вираз у фігурних дужках (7.10) був від’ємним, необхідно, щоб  було додатним або навпаки. Враховуючи це, можна записати, що

,  ,           (7.11)

де  при   при *.

Із (7.11) випливає, що оптимальні управління  в задачі про максимальну швидкодію є кусково-постійними функціями, що набувають дискретних значень: або, або  залежно від множника  (рис. 7.2).

 

* Властивості функції сигнум наведені в додатку А

Ураховуючи, що , і підставивши оптимальне управління  (7.11) у рівняння Беллмана (7.10), отримаємо:

,

.     (7.12)

Розв’язавши рівняння (7.12), можна знайти , і підставивши його в (7.11), визначаємо оптимальне управління , .