Постановка задачи оптимального управления.

Состояние объекта управления характеризуется n -мерной вектор функцией, например, функцией времени

Так, шестимерная вектор-функция времени полностью определяет положение самолета как твердого тела в пространстве. Три координаты определяют положение центра масс, а три - вращение вокруг центра масс.

От управляющего органа к объекту управления поступает вектор-функция . Векторы x' и u' , обычно связаны между собой каким-то соотношением. Наиболее развитым в настоящее время является уравнение, в котором векторы связаны системой обыкновенных дифференциальных уравнений.

И так, пусть движение управляемого объекта описывается системой дифференциальных уравнений

(1.1)

где - вектор координат объекта или фазовых координат,
- заданная вектор-функция, - вектор управлений или просто управление.

В уравнении (1.1) векторы являются функциями переменной t, обозначающей время, причем, где - отрезок времени, на котором происходит управление системой.
На управление обычно накладывается условие

, (1.2)

где U(t) - заданное множество в при каждом .
Будем называть далее управлением кусочно-непрерывную на отрезке (т. е. имеющую конечное число разрывов первого рода) r--мерную вектор-функцию и, непрерывную справа в точках разрыва и непрерывную в точке Т. Управление и называется допустимым, если оно удовлетворяет ограничению (1.2).
Заметим, что ограничиться рассмотрением непрерывных управлений оказывается невозможным, так как с их помощью трудно моделировать моменты переключения управления такие, как, например, включение и отключение двигателей, отделение ступеней ракеты, поворот рулей и т. д.
Иногда рассматривают и более широкие классы допустимых управлений, например, класс всех ограниченных измеримых управлений, удовлетворяющих условию (1.2).
Покажем, как при произвольном начальном положении  и допустимом управлении и определяется траектория управляемого объекта. Рассмотрим задачу Коши

(1.3)

Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо, поясним, что понимается в данном случае под решением задачи (1.3). Для этого поступим следующим образом.

Пусть функция и имеет скачки в точках причем. Предположим, что задача (1.3) имеет решение х, определенное на всем отрезке [to,], причем . Далее рассмотрим задачу Коши

.

Предполагая, что она имеет решение на отрезке [] и ,приходим к задаче

и т. д.

Если функцию х удалось определить указанным способом на всем отрезке [to. Т], то будем называть ее решением задачи (1.3) или фазовой траекторией (иногда просто траекторией), соответствующей управлению и. Отметим, что x - непрерывная по построению функция, удовлетворяющая на отрезке равенству

При выполнении определенных условий на f решение задачи (1.3), соответствующее управлению и, существует и единственно при произвольном начальном положении и произвольном допустимом управлении и.

Помимо ограничения на управление могут существовать ограничения и на фазовые координаты

(1.4)

Ограничения на концах траектории целесообразно рассматривать отдельно:

(1.5)


здесь, S (Т) - заданные множества из R";
-заданные множества из R, причем inf < sup, to<.T.

Таким образом, начальный и конечный моменты времени не обязательно фиксированы. Случаю фиксированных to, Т соответствуют множества , , состоящие из одной точки; при этом говорят, что рассматривается задача с закрепленным временем.

Если So (to) = {} при любом ,то левый конец траектории называют закрепленным. Если же So (to) == R" при всех , то левый конец траектории называют свободным. Во всех остальных случаях левый конец называют подвижным. В аналогичных ситуациях говорят о закрепленном, свободном или подвижном правом конце траектории.

Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов.

Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)].

Наиболее часто под задачами управления понимаются задачи, в которых роль функционала выполняет интегральный функционал

Мы будем рассматривать задачу с целевым функционалом

(1.6)

представляющим собой сумму интегрального функционала 

и терминального

функционала Ф(х(Т), Т). Эта задача называется задачей Больца. Ее частными случаями являются задача с интегральным функционалом, называемая задачей Лагранжа, и задача с терминальным функционалом, называемая задачей Майера. Задача с интегральным функционалом при  называется задачей оптимального быстродействия.

Набор (to, Т, х, и, х), минимизирующий функционал (1.6), называется решением задачи оптимального управления, управление и - оптимальным управлением, а траектория х - оптимальной траекторией. Часто решением задачи оптимального управления называют пару (ц, х).

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

(2.1)
,
где (2.2)

При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где -константа,

Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений  относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь 

.

>В более подробной покоординатной записи сопряженная система принимает вид

, (2.3)

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, Ф, g1, ..., gm имеют частные производные по переменным х1, ..., Хn и непрерывны вместе с этими производными по совокупности аргументов х , и  U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение  сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа  такие, что

| + || (t) || при t [to, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t [to. Т] функция Гамильтона, достигает максимума по при v=u (t), т. е.

H(x(t), u(t),=max H(x(t), v(t), (2.4)

б)(условие трансверсальности на левом конце траектории) существуют числа, такие, что

(2.5)

в) (условие трансверсальности на правом конце траектории) существуют числа  такие, что

(2.6)

Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием

и добавить еще одно условие трансверсальности на правом конце траектории:

Примеры применения принципа максимума.


Информация о работе «Принцип Максимума Понтрягина»
Раздел: Разное
Количество знаков с пробелами: 17888
Количество таблиц: 0
Количество изображений: 3

Похожие работы

Скачать
25233
1
627

... с нач. условием , такая что выполняется условие: -здесь достигается максимум. 2); 3). Теорема о необходимых условиях оптимальности. Если в линейной задаче быстродействия мн-ва выпуклы, -оптимальное управление, переводящее на отр. , а -соответствующая траектория, то пара удовлетворяет принципу максимума Понтрягина. 23. Применение необхо­димых условий оптималь­ности(схема и пояснения к ней). ...

Скачать
113538
12
32

... проектирования. Целью проекта является создание программного продукта (ПП), основанного на математическом пакете MatLab, реализующего математическую модель системы управления, построенной на основе оптимального закона, для системы слежения РЛС. Данный проект можно отнести к научно-исследовательской работе, которая принадлежит к типу прикладных, направленных на решение научных проблем с целью ...

Скачать
41899
0
0

... от года-x и от номера месяца в году-y следующим образом: F(x)=50-x2+10x-y2+10y. Определите, в каком году и в каком месяце прибыль была максимальной. Зав. кафедрой --------------------------------------------------   Экзаменационный билет по предмету МЕТОДЫ ОПТИМИЗАЦИИ Билет № 22 1) Постановка вариационной задачи с ограничениями. Привести пример. 2) Дайте геометрическую ...

Скачать
31890
0
18

... пользы прыгунам - и действительно принесла. Положительной стороной книги является рассмотрение всех стадий прыжка, что у нас присутствует пока только в планах на будущее. Вопросам моделирования прыжка с трамплина посвящены работы Л.П.Ремизова [2,3]. Первая из них, опубликованная в советском журнале "Теория и практика физической культуры" в 1973 году, создает впечатление то ли выборки, то ли ...

0 комментариев


Наверх