7.4. Принцип максимуму в задачі про максимальну швидкодію

 

Як і у випадку динамічного програмування, для простоти розглянемо задачу про максимальну швидкодію для лінійного об’єкта, описуваного рівнянням стану

 

.              (7.27)

Через стаціонарність (лінійність) рівняння (7.27) змінну  із властивостями (6.3) можна не вводити. Немає також причин для введення змінної  із властивостями (6.4), тому що в задачі про максимальну швидкодію  і не залежить від управління .

Запишемо принцип максимуму (6.22) через функцію Гамільтона (6.21) із урахуванням (7.27):

 

.                   (7.28)

Від управлінь  залежить тільки друга група доданків у складі (7.28), тоді принцип максимуму набуде такої форми:

.                  (7.29)

Ця умова (7.29) повинна виконуватися для кожного управління , , унаслідок чого можна записати

,   .            (7.30)

Умова (7.30) при існуванні обмежень  на управління  виконується, якщо  при  або  при .

Звідси випливає, що

,  .            (7.31)

Таким чином, у задачі про максимальну швидкодію у випадку застосування принципу максимуму, як і при динамічному програмуванні, оптимальне управління  може набувати двох значень:  або  залежно від функції  ( – при динамічному програмуванні).

Як видно з (7.31), для знаходження конкретного управління необхідно знати компоненти,  вектора . З цією метою складається система сполучених рівнянь (6.26) із урахуванням лінійності рівняння (7.27):

, (7.32)

.

Тут ураховано, що .

Таким чином, функцію  можна знайти із системи однорідних лінійних рівнянь, які не залежать від управління  та стану  об’єкта управління.

Однак, коли не задається ні початкове , ні кінцеве  значення вектора , таку систему розв’язати не можна. У цьому випадку початкове значення вектора  вибирається довільно. Із (7.32) знаходять компоненти вектора  і підставляють у вираз для оптимального управління  (7.31). Після обчислення управління  його підставляють у рівняння стану лінійного об’єкта (7.27), звідки знаходять вектор стану , обумовлений оптимальним управлінням  і початковим станом .

Якщо можна підібрати таке , при якому , то початкове значення  виявилося правильним, а знайдене управління  – оптимальним. Якщо , то вибирається інше початкове значення вектора . Послідовний пошук оптимального управління здійснюється за допомогою ЕОМ.

У деяких випадках знайти оптимальне управління можна, не розв’язуючи систему сполучених рівнянь (7.32). Для цього скористаємося рівнянням стану (7.27) за відсутності управління :

,          .          (7.33)

У векторній формі рівняння (7.32) та (7.33) набудуть вигляду

,        .

У загальному випадку розв’язок рівняння (7.32) можна подати, використовуючи формулу Ейлера:

, ,   (7.34)

де  – постійні інтегрування;

 – додатні корені характеристичного рівняння, визначені із системи сполучених рівнянь:

,                            (7.35)

де .

Після підставлення  в (7.35) маємо . Після скорочення на множник  отримаємо характеристичне рівняння

,                            (7.36)

де  – одинична матриця;

 – комплексна змінна.

Визначивши корені характеристичного рівняння  та постійні інтегрування, можна отримати вираз для оптимального управління :

,   ,        (7.37)

де  – деяка константа.

Схематично зміну оптимального управління  можна подати у вигляді графіка (рис. 7.4), як і у випадку динамічного програмування, тільки тут моменти часу перемикання оптимального управління відповідають кореням характеристичного рівняння .

Із рис. 7.4 видно, що оптимальне управління  є кусково-постійною функцією, що має на інтервалі управління не більше  точок розриву, у яких воно переходить із однієї границі області допустимих управлінь на іншу. Інакше кажучи, оптимальне управління  має не більше  інтервалів сталості, а кількість перемикань управління  не перевищує . Ця властивість називається теоремою про  інтервалів (доведена Фельдбаумом).

Теорема про n інтервалів: якщо кількість дійсних коренів характеристичного рівняння об’єкта дорівнює , то кількість перемикань кожного з управлінь , , …,  не перевищує