Постановка задачи оптимального управления. Состояние объекта управления характеризуется n x u 1.1 1.1 t 1.2 Ut r 1.2 1.2 1.3 1.3 1.3 , to to 1.3 x f 1.3 1.4 1.5 , S – R – R, inf sup , to .T to So to So to R yfx I, IIyIyxIfx 1.6 to 1.6 Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума
Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах. Формулировка принципа максимума. Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше 2.1 , где 2.2 При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем множество U не зависит от времени, фазовые ограничения отсутствуют.
Положим , где -константа, Функция Н называется функцией Гамильтона. Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь . В более подробной покоординатной записи сопряженная система принимает вид , 2.3 Система 2.3 имеет при любых начальных условиях единственное решение , определенное и непрерывное
на всем отрезке . Следующая теорема выражает необходимые условия оптимальности в задаче 1. Теорема принцип максимума Понтрягина. Пусть функции и, Ф, g1, gm имеют частные производные по переменным х1, Хn и непрерывны вместе с этими производными по совокупности аргументов х , и U, t to. Т. Предположим, что и, х-решение задачи 2.1.
Тогда существует решение сопряженной системы 2.3, соответствующей управлению и и траектории х, и константа такие, что t при t to, Т, и выполняются следующие условия а условие максимума при каждом t to. Т функция Гамильтона , достигает максимума по при vu t, т. е. Hxt, ut, max Hxt, vt, 2.4 бусловие трансверсальности на левом конце траектории существуют числа , такие, что 2.5 в условие трансверсальности на правом конце траектории существуют числа такие, что 2.6 Центральным в теореме является условие максимума -4. Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие 2.6 заменим условием и добавить еще одно условие трансверсальности на правом конце траектории Примеры применения принципа максимума. 1.
Простейшая задача оптимального быстродействия. Пусть точка движется по прямой в соответствии с законом 3.1 где х – координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т задача оптимального быстродействия. При этом скорость точки в конце траектории должна быть нулевой, а управление – удовлетворять условию . Применим к сформулированной задаче принцип максимума
Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка 3.2 Начальное положение при t00 и конечное положение 0, 0 фиксированы, а конечный момент времени Т не фиксирован. В обозначениях п.п. 1, 2 в данной задаче U -1, 1, f01, Ф0, а функция Гамильтона имеет вид Общее решение сопряженной системы легко выписывается в явном виде
где С, D – постоянные. Очевидно, что максимум функции Н по и U достигается при Таким образом, оптимальное управление и может принимать лишь два значения 1 . 2.Определить управление ut , которое дает минимум интегралу , в процессе, описываемом уравнением 1. Решение. Введем дополнительную переменную 2 Для этой переменной имеем дифференциальное уравнение 3 с начальными условиями, получаемыми из 2, т.е. х200.
Минимизирующий функционал, используя 2, можно записать в виде ITx2T. Построим функцию Гамильтона Запишем сопряженную систему 3 Запишем Y1Т0 т.к. с10 Y2Т-1 Из поэтому Y2е-1. Теперь функция Гамильтона запишется в виде H-aY1x1Y1u-0,5×12-0,5u2 . По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u откуда . Осталось решить систему уравнений 2 и 3 при условии , Y2Т-1 с граничными условиями Сведем данную систему к одному уравнению относительно U. Добавим к этому уравнению граничные условия и решим его. Составим характеристическое уравнение к2 – а21 0, к1,2- Найдем С1 и С2. С2-с2е . Тогда Используя граничные условия найдем
С Таким образом, определено оптимальное решение Примеры применения принципа максимума. 1. Простейшая задача оптимального быстродействия. Пусть точка движется по прямой в соответствии с законом 3.1 где х – координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т задача оптимального быстродействия. При этом скорость точки в конце траектории должна быть нулевой,
а управление – удовлетворять условию . Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка 3.2 Начальное положение при t00 и конечное положение 0, 0 фиксированы, а конечный момент времени Т не фиксирован. В обозначениях п.п. 1, 2 в данной задаче U -1, 1, f01,
Ф0, а функция Гамильтона имеет вид Общее решение сопряженной системы легко выписывается в явном виде где С, D – постоянные. Очевидно, что максимум функции Н по и U достигается при Таким образом, оптимальное управление и может принимать лишь два значения 1 . 2.Определить управление ut , которое дает минимум интегралу , в процессе, описываемом уравнением 1. Решение. Введем дополнительную переменную 2 Для этой переменной имеем дифференциальное уравнение 3 с
начальными условиями, получаемыми из 2, т.е. х200. Минимизирующий функционал, используя 2, можно записать в виде ITx2T. Построим функцию Гамильтона Запишем сопряженную систему 3 Запишем Y1Т0 т.к. с10 Y2Т-1 Из поэтому Y2е-1. Теперь функция Гамильтона запишется в виде H-aY1x1Y1u-0,5×12-0,5u2 . По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u откуда . Осталось решить систему уравнений 2 и 3 при условии , Y2Т-1 с граничными условиями Сведем данную систему к одному уравнению относительно U. Добавим к этому уравнению граничные условия и решим его. Составим характеристическое уравнение к2 – а21 0, к1,2-
Найдем С1 и С2. С2-с2е . Тогда Используя граничные условия найдем С Таким образом, определено оптимальное решение О методах решения задач оптимального управления Убедимся вначале, что необходимые условия оптимальности в форме принципа максимума дают, вообще говоря, достаточную информацию для решения задачи оптимального управления 2.1, 2.2. Условие максимума 2.4 позволяет, в принципе, найти управление и как функцию параметров х, t,
2.7 Рассмотрим систему дифференциальных уравнений 2.8 объединяющюю систему уравнений движения объекта и сопряженную систему. Как известно, общее решение системы 2.8, состоящей из 2n обыкновенных дифференциальных уравнений первого порядка, зависит от 2п параметров. Кроме того, система необходимых условий оптимальности содержит т параметров и параметр y0. Таким образом, общее число неизвестных равно 2nm1.
Для их определения мы имеем 2п условий 2.5, 2.6 и т условий 2.2. Еще одно условие определяется из следующих соображений. Легко понять, что, в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор с точностью до положительного постоянного множителя. Поэтому если в конкретной задаче удается показать, что , то полагают обычно –
1. В противном случае накладывают какое-либо условие нормировки, например, Таким образом, общее число условий равно 2nm1 и совпадает с числом неизвестных параметров, что, в принципе, позволяет определить эти параметры. Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде. Опишем численный метод, основанный на тех же соображениях. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений 2.8 с краевыми условиями 2.5, 2.6, а также выписанными на основе 2.2 краевыми условиями 2.9 Эта задача называется краевой задачей принципа максимума. Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы 2.8, можно найти хТ, Т. При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи 2.7 считаем, что параметр задан и равен
либо 0, либо -1. Значения х Г, являются очевидно, некоторыми функциями от а и Ь . Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из 2.9, 2.5, 2.6 системы уравнений Эта система содержит 2пт неизвестных а, Ь, и состоит из 2пт уравнений. Ее решение можно находить известными численными методами, например методом Ньютона. Отметим, что вычисление значений весьма трудоемко, так как требует при каждом а, b решения
задачи Коши для системы дифференциальных уравнений 2.8. Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов . При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных
задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т. п. Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами впрочем, разделение вычислительных методов на прямые и непрямые довольно условно. Конечномерные аналоги задач оптимального управления имеют особенности, позволяющие эффективно применять некоторые методы нелинейного, динамического программирования и т. д. Продемонстрируем пример такого подхода. Рассмотрим следующую задачу оптимального управления где моменты времени , Т фиксированы. Это задача более общего вида, чем 2.1, ибо в 2.10 U зависит от времени и имеются фазовые ограничения произвольного вида, которые, в частности, могут содержать
ограничения на концах траектории вида 2.2. Зафиксируем моменты времени и заменим задачу 2.10 ее конечноразностным аналогом Положив задачу можно переписать в виде 2.11 Мы получили задачу математического программирования с переменными Задав начальное состояние х0 и управление u0, u1, uN-1, по формулам легко вычислить траекторию х1, хN. Тем самым 2.12 сводится к задаче с переменными х0, u0 , u1, uN-1, и ее размерность, таким образом,
оказывается равной nNr. Для решения задачи 2.11 часто применяют метод динамического программирования. В данном случае этот метод выглядит следующим образом. Ввелем функцию где минимум берется по таким что будем предполагать, что все фигурирующие здесь и ниже минимумы достигаются. Если множество таких наборов uк, uN-1 пусто, то значение не определено. Нетрудно видеть, что 2.12 где минимум берется по таким , что значение определено.
Положив и проводя вычисления по формулам 2.12 при kN-1,N-2 0 можно найти решение задачи 2.11. Действительно, пусть – значение управления, реализующее минимум в 2.12. Ясно, что значение задачи 2.11 , т.е. минимальное значение минимизирующей функции, равно , где минимум берется по таким , что значение определено. Оптимальное управление и оптимальная траектория находятся, очевидно, по формулам 2.13 При численной реализации данного метода задаются сеточные аппроксимации множеств т.е. некоторые конечные множества Затем строятся множества , которые служат сеточными аппроксимациями интересующих нас подмножеств Далее по формулам 2.12 вычисляются значения для и т.д причем при каждом k минимум в 2.12 берется по После того как приближенно найдена точка , минимизирующая решение задачи определяется формулами 2.13. Заключение Отметим, что дискретные задачи оптимального управления встречаются на практике например, при описании импульсных систем и потому представляют интерес не только как конечноразностные
аналоги непрерывных задач. Задачи оптимизации управляемых процессов, или как они будут в дальнейшем называться, задачи оптимального управления, составляют один из широких классов экстремальных задач и имеют важное прикладное значение. Структурная схема задачи управления состоит из двух звеньев управляющего органа и объекта управления . В качестве объекта управления может служить, например, космический эксперимент, экономика отрасли промышленности, система машин, семейный бюджет и т. д.
Управляющее звено со времени возникновения задач управления претерпело эволюции от простейшего регулятора до современной ЭВМ. Кыргызско – Российская Академия образования Доклад По дисциплине ТУТС Тема Принцип максимума Понтрягина. Выполнил Бахарев Д. В.ИВТ-1-98. Проверила Жданова С. В. г. Бишкек 2001