- Подробности
- Автор: Super User
- Категория: Теория управления
- Просмотров: 6057
Используя метод динамического программирования найти оптимальное управление для системы, описываемой уравнениями

Критерий оптимальности имеет вид

Решение
Формируем задачу по исходным данным.
tf – не ограничено, то есть tf →∞

Составим уравнение Беллмана с учетом того, что
(S-функция Беллмана)
Из (3) находим
Подставим (5) в (4)
Подставим значения Беллмана в виде квадратичной формы
причем это должно быть положительно определенная квадратичная форма, а значит
Вычисляя
подставим их в (6) и обратим коэфициенты при x12, x1x2 и x22 в поле, ноль, т.к. справа у нас ноль:

откуда
Если
, то
. Получаем под корнем < 0, что нельзя допустить. Тогда
то тогда а12 и а22 должны быть одного знака, так как а11 > 0.
Тогда
.
Следовательно решение имеет вид из (5) и (9):

Критерий оптимальности имеет вид

А | В | t0 | tf | S | а | b |
![]() | ![]() | 0 | - | 0 | ![]() | 4 |
Решение
Формируем задачу по исходным данным.

tf – не ограничено, то есть tf →∞

Составим уравнение Беллмана с учетом того, что


Из (3) находим

Подставим (5) в (4)

Подставим значения Беллмана в виде квадратичной формы

причем это должно быть положительно определенная квадратичная форма, а значит

Вычисляя

подставим их в (6) и обратим коэфициенты при x12, x1x2 и x22 в поле, ноль, т.к. справа у нас ноль:

откуда

Если



Тогда

Следовательно решение имеет вид из (5) и (9):
