Болезни Военный билет Призыв

Принцип максимума Понтрягина. Максимальное быстродействие. Код для обучения случайного леса. Настройка параметра регуляризации


Специфика задач на максимальное быстродействие начинает сказываться при записи критерия качества. Для этих задач критерием качества является следующий функционал (5.1)

Таким образом, требуется найти такое управление, при котором перевод объекта управления из начального состояния в конечное выполняется за минимально возможное время.

Последовательность решения рассматриваемых задач не отличается от процедуры решения других задач, решаемых на основе принципа максимума:

Составление Гамильтониана;

Определение зависимости оптимального управляющего воздействия от сопряженных переменных на основе максимизации Гамильтониана;

Составление сопряженной системы дифференциальных уравнений;

Составление общей системы дифференциальных уравнений, среди решений которой и находится искомое управляющее воздействие.

При рассмотрении объектов управления, описываемых линейными уравнениями, задачи максимального быстродействия имеют некоторую особенность. Дело в том, что соответствующая этим задачам функция Гамильтона содержит управление в степени не выше первой и, следовательно, определение максимального значения гамильтониана не может быть выполнено путем приравнивания нулю его первой производной по управлению. Поиск максимального значения гамильтониана в этом случае производится путем анализа возможных комбинаций между управлением и переменными сопряженной системы уравнений. При этом оказывается, что оптимальное управление должно быть максимально по модулю внутри интервала управления и в некоторых его точках мгновенно менять знак в соответствии со знаком некоторой функции от сопряженных переменных. В условиях такого слабого влияния сопряженной системы уравнений на управляющее воздействие возникает возможность вообще отказаться от решения сопряженной системы уравнений и рассматривать моменты смены знака управления (моменты переключения) как самостоятельные переменные.

Более подробно рассмотрим решение задачи максимального быстродействия на следующем примере.

Объект управления:

Критерий качества:

Гамильтониан:

Анализируя возможные комбинации значений и можно сделать вывод о том, что для обеспечения максимальной величины Гамильтониана в зависимости от управления необходимо выполнение следующего соотношения:

Сопряженная система уравнений:

Общая система уравнений:

Поскольку в системе уравнений (5.1) уравнения для сопряженных переменных не зависят от состояний объекта управления, то выражения для можно найти только из системы сопряженных уравнений не обращая внимания на уравнения для состояний объекта управления.

В данном случае:

Анализируя полученные выражения можно сделать вывод о том, что искомое управляющее воздействие имеет вид прямоугольной волны, которая меняет знак не более одного раза. Очевидно, что момент смены знака управления (момент переключения) должен выбираться из условия обеспечения заданных граничных условий для состояний объекта управления. для определения моментов переключения может быть использовано несколько способов.

Первый способ определения моментов переключения – аналитический. При использовании этого способа необходимо получить аналитическое выражение для реакции объекта управления на управляющее воздействие, имеющее вид прямоугольной волны. Используем для этой цели преобразование Лапласа. Момент переключения обозначим через .

Преобразованная по Лапласу система уравнений объекта управления, учитывающая воздействие прямоугольной волны имеет вид:

Из этой системы уравнений можно получить следующие выражения для L-изображений состояний объекта управления:

или, после выполнения обратного преобразования Лапласа, собственно аналитические выражения для переходных процессов во времени:

Последние выражения позволяют найти как значение момента переключения , так и момента времени перевода объекта управления в требуемое состояние .

Второй способ определения моментов переключения – поиск минимума.

Для возможности применения для решения задачи оптимального управления алгоритмов поиска минимума задачу максимального быстродействия сформулируем следующим образом:

Допустим, что управляющее воздействие является кусочнопостоянной функцией времени, которая меняет знак в момент времени , а перевод объекта управления в конечное состояние происходит в момент времени . Требуется определить такие значения параметров и при которых достигается минимальное значение невязки между фактическими и требуемыми значениями состояний объекта управления в момент . Значение невязки вычисляется как сумма квадратов разностей между фактическими и заданными значениями состояний объекта управления в момент времени .

Вычисление параметров оптимального управления методом поиска минимума может быть выполнено с помощью следующей MATLAB-программы:

Файл Main5.m

%вектор начальных приближений для момента переключения и

%момента завершения интервала управления

T=fminsearch("fms5",ti0)

function f=fms5(T)

%численное решение дифф. ур-ний объекта управления при действии

%на него прямоугольной волны управления

Ode45("odefun5",,);

%вычисление невязки

f=x(length(t),1)^2+x(length(t),2)^2;

%генерация массива значений управления для построения графика

for i=1:length(t)

plot(t,x(:,1),t,u)

Файл odefun5.m

function f=odefun5(t,x)

Третий способ определения моментов переключения графическое построение линии переключения.

Этот способ отличается большой наглядностью, но применим к объектам управления второго порядка, т.к. поведение только таких объектов полностью описывается фазовым портретом. При использовании этого способа задача оптимального управления решается путем построения линии переключения, геометрического места точек фазового пространства объекта управления, из которых перевод объекта в конечное состояние возможен без переключения знака управления. В том случае, когда линия переключения найдена, процедура управления объектом заключается в следующем:

К объекту прикладывается управление некоторого знака и под действием этого управления объект движется до тех пор, пока его изображающая точка не окажется на линии переключения

При попадании изображающей точки на линию переключения выполняется смена знака управляющего воздействия и его изображающая точка начинает двигаться по линии переключения к целевому состоянию. Таким образом, гарантия попадания изображающей точки в целевое состояние обеспечивается по определению линии переключения.

Очевидным способом построения линии переключения является сканирование всей фазовой плоскости и запоминание тех ее точек, из которых целевое состояние достигается путем применения постоянного по величине и знаку управления.

Однако существует способ построения всей линии переключения за один прием. Дело в том, что фазовая траектория движения объекта в обратном времени из целевой точки под действием постоянного по величине и знаку управлении обладает всеми свойствами линии переключения. Следовательно, линия переключения может быть построена путем решения дифференциальных уравнений объекта управления записанных в обратном времени. Математически переход к обратному времени выполняется заменой на в уравнениях объекта. Следует учитывать. что линия переключения имеет две ветви: одна из них соответствует положительному значению управляющего воздействия, а другая – отрицательному.

Программное обеспечение решения задачи максимального быстродействия состоит из двух частей:

Скрипт, выполняющий построение фазовой траектории объекта путем численного решения его уравнений записанных в обратном времени из начальной точки, соответствующей целевому состоянию (построение линии переключения);

Скрипт, выполняющий построение фазовой траектории объекта путем численного решения его уравнений записанных в обычном времени из начальной точки, соответствующей начальному состоянию (знак управляющего воздействия противоположен знаку, использованному при построении линии переключения).

Длительность фазовой траектории, порождаемой вторым скриптом должна быть достаточной для ее пересечения с линией переключения. Момент пересечения и является искомым моментом переключения.

§1.Уравнение теплопроводности

К классическим уравнениям параболического типа относятся уравнение теплопроводности.

Теорема (принцип максимального значения): .

Функция u(x,t) непрерывная в G и удовлетворяющая однородному уравнению теплопроводности:

(*) utt = a2uxx в G + H принимает наибольшее и наименьшее значения на границе Г (т.е. при х = 0, x = l или t = 0).

Физический смысл: если температура на границе или в начальный момент времени меньше K, то при отсутствии источников тепла, внутри тела не может создаваться температура, большая К.

Доказательство: от противного.

Обозначим М наибольшее значение u(x,t) в G = G + H + Г, а через m - наибольшее значение u(x,t) на Г:

Допустим, что существует такое решение u(x,t), для которого M > m, т.е. где не выполняется условие теоремы.

Пусть эта функция принимает значение М в некоторой точке (x0,t0) є G + H; т.е. u(x0,t0) = M.

Замечание: всякая непрерывная функция в замкнутой области достигает своего максимального значения. Достаточным условием существования относительного минимума функции в точке x0 є (0;l) являются:

тогда для максимума:

б) не может быть f"" (x0)>0; т.е. .

Сравним знаки левой и правой частей уравнения в точке М, где по предположению u(x,t) достигает максимума: ; так как u(x0,t) достигает максимума при t = t0, то.

Получаем, что в точке (x0,t0): .

Однако, это еще не есть противоречие, так как может быть равно 0.

Для полного доказательства найдем точку (x1,t1), в которой оценка одной из частных производных, входящих в уравнение будет иметь строгое неравенство.

Рассмотрим вспомогательную функцию:

Функция х(x0,t0) = u(x 0,t0) = M и значит, наибольшее значение х(x,t) в G не меньше, чем М:

Но на границе Г для х(x,t) имеем (на Г max(x - x0)) = l:

(так как m < M).

Следовательно, функция х(x,t) также как и u(x,t) не принимает наибольшего значения на Г. Пусть х(x,t) принимает наибольшее значение в точке (x1,t1) є G (внутренняя точка).

Согласно необходимым условиям максимума в точке (x1,t1) для х(x,t) должно быть: , т.е в точке (x1,t1): .

Тогда в этой же точке для функции u(x,t) из (**):

Тогда для функции u(x,t) в точке (x1,t1) получаем:

т.е. уравнение (*) во внутренней точке (x1,t1)є G не удовлетворяется.

Замечание: при доказательстве изначально мы не требуем, чтобы u(x,t) удовлетворяла уравнению теплопроводности, мы только изучаем ее поведение (max и min) и показываем, что, если максимум u(x,t) достигается внутри G, то u(x,t) - не удовлетворяет уравнению.

Следствие1. Если два решения уравнения теплопроводности u1(x,t) и u2(x,t) удовлетворяют условиям:

для всех.

Доказательство: пусть х(x,t) = u2(х,t) - u1(х,t): f(x,t) = 0, отсюда u max, min;

Отсюда неотрицательный max достигается на границе, тогда в G u(x,t) - неотрицательна, т.е. в G.

Следствие2. Если три решения уравнения теплопроводности щ, u, u, удовлетворяют условиям: при t = 0; x = 0; x = l, то эти неравенства выполняются тождественно, т.е. (x,t) є G.

Доказательство: применяя следствие1 сначала к функциям u(x,t), u(x,t), а затем щ(x,t) и u(x,t) получим требуемые соотношения.

Следствие3. Если для двух решений уравнения теплопроводности u1(х,t) и u2(х,t) имеет место:

для t = 0; x = 0; x = l, то тождественно в G.

Доказательство: к функциям:

u(x,t) = u1(х,t) - u2(х,t)

применим следствие2, тогда получим то, что требовалось доказать.

Это следствие доказывает устойчивость решения 1ой краевой задачи для уравнения теплопроводности.

§2.Примеры применения принципа максимума в задачах управления процессами

Принцип максимума является основным математическим приемом, используемым при расчете оптимального управления во многих важных задачах математики, техники и экономики.

Принцип максимума применяется к общей задаче управления, имеющей вид

x= f(x, u, t), x(t0) = x0, x(t1) = x1, {u(t)}U. (1)

уравнение параболический максимум экстремальный

Здесь I(…), F(..) и f(…) - заданные непрерывно дифференцируемые функции, t0, x0 - фиксированные параметры, t1 или x1 - фиксированные параметры (либо с помощью уравнения T(x, t)=0 определяется конченая поверхность). Траектория управления {u(t)} должна принадлежать фиксированному множеству управлений U, причем u(t) - кусочно-непрерывная функция времени, значения которой должны принадлежать некоторому фиксированному множеству, являющемуся непустым компактным подмножеством пространства Er.

Приведем некоторые задачи оптимального управления, которые, благодаря их типичности, часто встречаются во многих учебниках по теории оптимальных процессов. Эти задачи относятся к различным областям человеческой деятельности: технике, экономике, экологии и др. Но в то же время они являются "учебными" и служат, в основном, для иллюстрации некоторых теоретических положений. Очевидно, задачи и модели, представляющие непосредственный практический интерес, должны быть более подробными, глубокими и сложными. Учебные задачи - это первое приближение к реальным практическим задачам, их упрощенный аналог.

Максимизация дальности полета аппарата в атмосфере. Рассматривается летательный аппарат, положение которого описывается следующими параметрами: дальность и высота полета, величина и угол наклона к горизонту вектора скорости. Роль управлений играют угол атаки и функция, отвечающая возможности изменять в полете геометрию крыльев (т.е. их эффективную площадь). Требуется найти такие управляющие функции, которые доставляют максимум дальности полета.

Задача ракетодинамики в однородном поле (задача об оптимальном в смысле расхода топлива движении ракеты в пустоте). Рассматривается управляемый ракетный аппарат, состояние которого задается координатами в трехмерном пространстве, вектором скорости и значением массы. Управление осуществляется выбором направления и абсолютного значения тяги ракеты. Требуется так управлять ракетой, чтобы в фиксированный момент времени она достигла заданной точки, имея определенную скорость и израсходовав минимум топлива (т.е. имея максимально возможную массу).

Задача о максимальной высоте подъема вертикально взлетающей в атмосфере ракеты-зонда. Состояние ракеты задается значениями высоты, скорости и массы. Задача состоит в выборе тяги, которая максимизировала бы высоту подъема при свободной продолжительности полета.

Задача об оптимизации мясозаготовок. На ферме имеется стадо скота. Ежегодно часть стада отправляется на мясозаготовки, причем доход фермы зависит от количества проданного скота. Фазовой переменной выступает количество скота на ферме в конце каждого года после мясозаготовок, управляющим параметром - количество проданного на мясо скота. Требуется определить, каким образом ферма может получить максимальный доход за несколько лет при определенном минимуме ежегодных мясозаготовок и заданном значении поголовья скота на конец планового периода.

Оптимальное распределение ресурсов. Некоторая заданная начальная сумма денег затрачивается на приобретение оборудования двух типов А и В. С помощью этого оборудования организуется производство. Распределяя имеющиеся средства между различными типами оборудования, к концу срока эксплуатации получают определенный экономический эффект. Затем амортизированное оборудование реализуют, а вырученные средства используют как начальную сумму для следующего цикла, и т.д. Требуется найти такую стратегию распределения средств для покупки оборудования типов А и В в каждом цикле, чтобы обеспечить наибольший экономический эффект после фиксированного числа производственно-экономических циклов.

В этом параграфе мы докажем свойство решений одномерного уравнения теплопроводности, которое называется принципом максимального значения . Оно может быть сформулировано как теорема.

Т е о р е м а. Если функция u (x ,t ), определенная и непрерывная в замкнутой области и , удовлетворяет в этой области уравнению теплопроводности

то максимальное и минимальное значения функции u (x ,t ) достигаются или в начальный момент времени или в граничных точках x = 0 или x = l.

Функция , очевидно, удовлетворяет уравнению (40) и достигает своего максимального (минимального) значения в любой точке. Однако это не противоречит теореме, так как из её условия следует, что если максимальное (минимальное) значение достигается внутри области, то оно также должно достигаться или при t= 0, или при x = 0 илипри x=l.

Физический смысл этой теоремы очевиден и заключается в следующем. Если температура на границе или в начальный момент не превосходит некоторого значения M , то при отсутствии источников тепла внутри тела не может создаться температура, больше чем М .

Остановимся на доказательстве теоремы для максимального значения. Оно ведется от противного. Итак, пусть М – максимальное значение функции u (x ,t ) при t = 0 (0 ≤ x l ) или при x = 0 илипри x = l (0 ≤ t T ). Допустим теперь, что в некоторой точке области (x 0 , t 0), такой, что 0 < x 0 < l и0 < t 0 ≤ T , функция u (x ,t ) достигает своего максимального значения, превосходящего М на величину ε, т.е.

Тогда в точке (x 0 , t 0) должны выполняться соотношения

причем при всех значениях будет выполняться знак равенства.

где k – постоянный коэффициент. Очевидно, что

Выберем так, чтобы kT было меньше ε/2, т.е. , тогда максимальное значение v (x , t ) при t = 0 (0 ≤ x l ) или при x = 0 илипри x = l не будет превосходить , т.е.

(при t = 0 или x = 0 или x = l ), (44)

так как для этих аргументов первое слагаемое в формуле (43) не превосходит М , а второе .

В силу непрерывности функции v (x , t ), она должна в некоторой точке (x 1 ,t 1) достигать своего максимального значения, причем

Момент времени t 1 строго больше нуля и , так как при или , или имеет место неравенство (44). В точке (x 1 , t 1), по аналогии с (41) и (42), должно быть

Имея в виду определение функции v (x , t ) (43), получим

Отсюда следует, что

т.е. уравнение (40) во внутренней точке (x 1 ,t 1) не удовлетворяется. Тем самым доказано, что решение u (x ,t ) уравнения теплопроводности (40) внутри области не может принимать значений, превосходящих наибольшее значение u (x ,t ) на границе.



Аналогично может быть доказана и вторая часть теоремы для минимального значения.

Приведем и докажем следствия из принципа максимального значения:

Следствие 1. Если два решения уравнения (40) и удовлетворяют условиям:

,

Доказательство. В силу линейности (40) функция является его решением, следовательно, удовлетворяет принципу максимального значения. При этом:

Следовательно:

в противном случае имела бы отрицательное минимальное значение. Следствие 1 доказано.

Следствие 2. Если три решения уравнения (40) , и удовлетворяют условию:

при , и , то это же неравенство выполняются и для всех .

Доказательство. Проводится просто применением следствия 1 к парам функций и , и .

Рассмотрим в решение уравнения (1), соответствующее начальному и граничным условиям вида:

Пусть есть решение уравнения (40), соответствующее возмущенным начальному и граничным условиям, задаваемыми функциями , и , такими, что:

Используем следствие 3, можем заключить, что: , что и подразумевает сколь угодную близость решений исходной и возмущенной задач.

Принцип максимума определяет необходимые условия оптимальности управления в нелинейных управляющих системах. Он распространен и на случаи, когда на координаты состояния системы накладываются ограничения. Рассмотрим основную теорему принципа максимума и дадим более удобную формулировку оптимального управления.

Пусть оптимальное управление описывается системой нелинейных дифференциальных уравнений:

(1)

или в векторной форме:

--мерный вектор состояния объекта

--мерный вектор управляющих воздействий

- функция правой части уравнения (1)

Полагаем, что вектор управления принимает значения из некоторой замкнутой области Ur-мерного пространства управлений. Положим, что функции
непрерывны по всем аргументам и имеют непрерывные производны по переменным состояния. Назовем допустимыми управлениями те управления
, которые являются кусочно-непрерывными функциями времени и принимают значения из множестваU.

Основная задача оптимального управления формулируется следующим образом: среди всех допустимых управления, приводящих изображающую точку в фазовом пространстве Xиз начального положенияв конечное, если эти управления существуют. И нужно найти такие управления, для которых функционал:

(2)

достигает минимума.

Введем новую переменную , которая определяется следующим дифференциальным уравнениям:

(3)

Здесь
- подынтегральная функция функционала (2).

Присоединив уравнение (3) к системе уравнений (1), получим:


(4)

Запишем (4) в векторной форме. Для этого введем в рассмотрение (n+1)-ый вектор координат состояния:
, тогда в векторной форме записи это уравнение запишется следующим образом:

(5)

вектор правых частей системы (5).

Заметим, что вектор-функция
не зависит от координатывектора. Обозначим черезточку с координатами
в (n+1)-ом фазовом пространстве. Пусть
- некоторое допустимое управления, для которого соответствующая фазовая траектория (1) проходит при
через точку. А при выполнении равенства
через точку.

Из уравнения (2) следует, что координата определяется равенством:

Если
, то будем иметь:

Таким образом, в пространстве фазовая траектория системы (5), соответствующая тому же управлению
, проходит при
через точку
, а при
через точку
. Это иллюстрирует следующий рисунок:

Обозначим через П прямую в пространстве , проходящую через точку
и параллельную оси. Тогда основную задачу оптимально управления можно сформулировать следующим образом:

В (n+1)-мерном пространствезаданы начальная точка
и прямая П, параллельная осии проходящую через точку
. Среди всех допустимых управлений, обладающих тем свойством, что решение системы (5) с начальными условиями
проходит через точку прямой П, необходимо выбрать такое управления, для которого координата точкиимело бы минимальное значение.

Сформулированная задача представляет собой задачу Майера на условный экстремум. Однако в силу ограничений, накладываемых на допустимое управление методами классического вариационного исчисления, эта задача не решается.

Формулировка теоремы, дающей необходимое условие экстремума:

Введем в рассмотрение вспомогательные переменные
, которые удовлетворяю следующей системе уравнений:


(6)

Система (6) называется сопряженной по отношению к системе уравнений (5). Если выбрать некоторое допустимое управление
на отрезке
и найти соответствующее ему решение
с заданными начальными условиями
, то при подстановки в систему уравнений (6) управления
и решения
, получим линейную однородную систему уравнений:


(7)

Система (7) удовлетворяет условиям существования и единственности решения системы дифференциальных уравнений. Системы уравнений (5) и (6) можно объединить одной формой записи, для этого надо ввести в рассмотрение функцию H:

(8)

Тогда системы (5) и (6) запишутся следующим образом:


(9)


(10)

Отметим, что вектор функций
и
непрерывны всюду, кроме точек разрыва допустимого управления
. Эти вектор-функции имеют непрерывные производные. При фиксированных значениях
и
функцияHстановится функцией только управления
.

Учтем теперь ограничения (2.2.2) на управление. Если в процессе оптимального управления функции не достигают границ множества (2.2.2) (что означает ) то для них выполняются соотношения (2.2.13), (2.2.14). Однако часто оптимальное управление принимает граничные значения либо - , более того, оптимальное управление может скачком переходить с одной границы на другую. Такие управления уже являются кусочно-непрерывными функциями времени.

При попадании оптимального управления на границу множества U соотношения (2.2.13), (2.2.14) нарушаются. Оптимальные управления удовлетворяют в этом случае принципу максимума Л. С. Понтрягина, установленного и доказанного в форме приведенной ниже - теоремы.

Переходя к этой теореме, сделаем некоторые пояснения. Возьмем произвольное допустимое управление и при начальных условиях найдем решение системы (2.2.1): .

Подставляя это решение и управление в (2.2.8), определим, пока при некоторых произвольных начальных условиях , решение (2.2.8): . При фиксированных (постоянных) значениях векторов функция Н становится функцией вектора . Максимум этой функции по и обозначим через :

Максимум (наибольшее значение) непрерывной функции может достигаться как в точках локального максимума этой функции, в которых

так и на границах множества .

Теорема 2.2.1 (принцип максимума Л. С. Понтрягина). Пусть , - такое допустимое управление, что соответствующие ему решения уравнения (2.2.11), исходящие в момент из состояния (2.2.3), (2.2.7), проходят в момент времени через точку .

Для оптимальности управления (при котором ) принимает наименьшее значение) необходимо существование таких ненулевых непрерывных функций удовлетворяющих уравнениям (2.2.12), что при любом функция переменного достигает при максимума

при этом в конечный момент времени выполняются соотношения

Если удовлетворяют (2.2.11), (2.2.12) и (2.2.17), то функции переменного t являются постоянными и поэтому проверку соотношений (2.2.18) можно проводить не обязательно в момент времени а в любой момент .

Доказательство теоремы является достаточно сложным, и поэтому в приложении 2 приведен лишь вывод основного соотношения (2.2.17) теоремы для случая свободного правого конца ( не задан) и фиксированного .

Соотношения (2.2.17) и (2.2.18) можно записать в более простой форме:

Таким образом, центральным в теореме 2.2.1 является условие максимума (2.2.19). Оно означает, что если - оптимальные управления, а -оптимальные траектории, то непременно найдутся такая постоянная и такие решения ), системы (2.2.12), что функция их, переменных при всех будет достигать максимума на U именно при оптимальных управлениях . Поэтому теорему 2.2.1, дающую необходимое условие оптимальности в задачах оптимального управления, принято называть принципом максимума. Отметим, что во внутренних точках множества U для оптимального управления выполняются условия (2.2.13), (2.2.14), которые являются необходимыми для (2.2.19).

Практическое применение принципа максимума.

Как же практически воспользоваться условием (2.2.19), ведь функции и постоянная , входящие в это условие, неизвестны?

Здесь поступают следующим образом: рассматривая функцию ) как функцию переменных и считая переменные параметрами, решают задачу максимизации функции и находят функцию

на которой достигается наибольшее значение функции .

В ряде случаев функция (2.2.20) может быть записана в явном виде. Например, если правые части (2.2.1) имеют структуру

а подынтегральное выражение функционала (2.2.5)

множество описывается U неравенствами (2.2.2), то

и эта функция достигает наибольшего значения на U в точке с координатами

Формула (2.2.22) дает большой объем информации о структуре оптимального управления: координата оптимального управления является ступенчатой (кусочно-постоянной) функцией со значениями при этом моменты переключения определяются условием

Итак, допустим, что функция (2.2.20) известна. Рассмотрим систему дифференциальных уравнений

Функции и , входящие в правые части этих уравнений, известны. Общее решение системы (2.2.24), (2.2.25) зависит от произвольных постоянных, которые определяются из краевых условий (2.2.3), (2.2.4). Задача интегрирования уравнений (2.2.24), (2.2.25) при краевых условиях (2.2.3), (2.2.4) называется краевой задачей (двухточечной краевой задачей).

Таким образом, принцип максимума позволяет свести решение задачи об оптимальном программном управлении к решению краевой задачи.

Трудность ее решения состоит в том, что интегрирование уравнений (2.2.24), (2.2.25) в «прямом времени» не представляется возможным, так как неизвестны начальные условия Один из возможных подходов к решению краевой задачи заключается в следующем. Задаваясь произвольным вектором и интегрируя (2.2.24), (2.2.25) при известных начальных условиях , найдем функции и при проверим выполнение равенства (2.2.4). Если оно нарушается, задаемся другим вектором и, интегрируя (2.2.24), (2.2.25) при начальных условиях , получим при вектор .

Если он не совпадает с заданным, продолжаем процесс до тех пор, пока не найдется такой вектор что условия (2.2.4) будут выполняться с приемлемой точностью. При этом подходе используются градиентные методы, когда определяется из условия минимума «расстояния» от заданного вектора .

В вычислительной математике разработан ряд методов приближенного численного решения краевых задач: метод стрельбы, метод прогонки, ряд итерационных методов , . Во многих случаях не представляется возможным найти из условия (2.2.19) явный вид (2.2.22) оптимального управления. Тогда уравнения (2.2.1), (2.2.6), сопряженная система (2.2.12) и условия максимума (2.2.19) образуют краевую задачу принципа максимума. Эта задача имеет ряд специфических особенностей, затрудняющих применение стандартных численных методов решения краевых задач. К числу таких особенностей относятся разрывы функций удовлетворяющих условию максимума (2.2.14), их неединственность, нелинейный характер зависимости (2.2.20) даже в линейных системах. Кроме того, особенностью краевых задач, связанных с принципом максимума даже в случаях, когда удается найти явный вид управлений (2.2.20), является их плохая сходимость, вызванная неустойчивостью системы (2.2.24), (2.2.25). Ряд приемов решения краевых задач принципа максимума изложен, например, в .

Отметим в заключение, что, несмотря на различные методы численного решения краевой задачи принципа максимума, процесс решения каждой оптимизации на основе этого принципа является самостоятельной творческой задачей, решаемой в рамках той частной отрасли динамики, к которой относится объект управления, с учетом его специфических особенностей, используемых для улучшения сходимости численного решения краевой задачи.

Пример 2.2.1. Построение оптимального по расходу топлива управления .

Рассмотрим объект управления, описываемый уравнениями

Пусть на управление наложено ограничение

Функционал оптимизации, выражающий расход топлива, имеет вид

Заданы начальное состояние

и условие в момент времени

Требуется найти , при котором объект (2.2.26) переходит из состояния (2.2.29) в состояние (2.2.30), при этом выполняются ограничения (2.2.27), а функционал (2.2.28) принимает наименьшее значение.

Переходя к определению оптимального управления на основе принципа максимума, сформируем функцию

уравнения для вспомогательных переменных

Управление , доставляющее максимум функции (2.2.31), определяется как

Уравнения (2.2.26), (2.2.32), (2.2.33) составляют краевую задачу. Переходя к ее исследованию, запишем решение системы (2.2.32):

где - неизвестные числа, которые необходимо определить так, чтобы управление (2.2.33) привело объект (2.2.26) в состояние (2.2.30).

Найдем решение системы (2.2.26) при и . В первом случае решение этой системы имеет вид . Оно зависит от постоянных R и р, при этом . Фазовые траектории этой системы представляют собой окружности с центром в начале координат (рис. 2.2.1, а). Фазовые траектории системы (2.2.26) при и также являются окружностями, центры которых расположены в точках соответственно (рис. 2.2.1, б, в).