6.2. Умова оптимальності

 

Для простоти розглянемо випадок одновимірного управління. Уявимо, що оптимальне управління  при початкових умовах (6.9) відомо. Нехай до часу  неоптимальне  та оптимальне  управління збігаються (рис. 6.1), а на відрізку часу  вони відрізняються на величину , тобто

.

 

Далі на відрізку  неоптимальне й оптимальне управління знову збігаються. Нехай відрізок  є нескінченно малим.

Тепер розглянемо траєкторію руху об’єкта при оптимальному та неоптимальному управліннях (рис. 6.2).

Як видно з рис. 6.2, до точки  оптимальна  та неоптимальна  траєкторії руху збігаються. Відмінність в управлінні на відрізку  спричиняє відмінність оптимальної  та неоптимальної  траєкторій руху при .

Позначимо відхилення вектора стану  від оптимального вектора  через :

,                            (6.11)

де .

На нескінченно малому відрізку  траєкторію можна вважати лінійною внаслідок малості . Тоді при  відхилення  можна записати використовуючи розкладання в ряд Маклорена:

 

.          (6.12)

Оскільки  є критерієм якості, то відхилення від критерію якості також повинне бути мінімальним, тобто

.               (6.13)

Умову (6.13) можна переписати в такий спосіб:

.                               (6.14)

Якщо ввести - вимірний вектор

,                       (6.15)

то умова (6.14) набуде вигляду

.                      (6.16)

Для довільних  можна підібрати такий вектор , щоб виконувалася умова

.                 (6.17)

Оскільки , то при  можна записати, що

.                      (6.18)

Підставивши (6.12) у вираз (6.18), отримаємо

.  (6.19)

Тут  не залежить від , тому його можна скоротити.

Якщо  може бути вибрана на будь-якій ділянці , то  можна замінити на . Тоді вираз (6.19) набуде вигляду

.

Оскільки другий доданок відповідає оптимальному управлінню  і не залежить від неоптимального управління , тобто є постійним при кожному , щоб виконувалася умова максимуму, необхідно, щоб максимальним був перший доданок. Отже,

.               (6.20)

Як правило, добуток  записують як аргумент якоїсь функції, наприклад :

 

,                   (6.21)

де ,  – компоненти векторів  та .

Функцію  називають функцією Гамільтона або гамільтоніаном.

Отже, принцип максимуму Понтрягіна формулюється в такий спосіб: для того щоб у задачі з закріпленим лівим кінцем траєкторії , вільним правим кінцем траєкторії  та фіксованим часом управління  управління  було оптимальним, необхідне існування такої безперервної ненульової векторної функції , щоб при будь-яких  функція , що являє скалярний добуток вектора швидкості руху точки   на вектор , досягала максимуму за управлінням , тобто необхідно, щоб виконувалася умова

               (6.22)

і в кінцевий момент часу  мало місце співвідношення .

Оптимальне управління  отримано для розімкненої системи. Для переходу до замкненої системи необхідно, щоб оптимальне управління  залежало тільки від , тобто . Для багатовимірного управління замість скаляра  використовується вектор .