5.1. Принцип оптимальності

 

Основу методу динамічного програмування розробив американський математик Р. Беллман. Цей метод придатний для розв’язання будь-яких задач оптимального управління. В основі методу лежить такий принцип оптимальності: будь-яка кінцева ділянка оптимальної траєкторії, що залишилася, сама по собі є також оптимальною.

Іншими словами, незалежно від того, яким шляхом у момент часу  функція  досягла оптимального значення (рис. 5.1), її подальшим рухом буде ділянка 2 оптимальної траєкторії, тобто оптимальне управління в будь-який момент часу не залежить від передісторії систем і визначається тільки станом системи в цей момент часу та метою управління.

Як приклад Беллман викладає стратегію бігуна на дальню дистанцію: для того щоб пробігти дистанцію за мінімальний час, необхідно так розподілити свої сили, щоб кінцеву ділянку, що залишилася, пробігти за мінімальний час. Якщо ставити завдання пробігти кожну ділянку за мінімальний час, то не виключено, що фінішувати бігунові не доведеться.