|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Принцип максимума Понтрягина. Для решения задачи оптимального управления нужно рассмотреть вопрос о необходимых условиях экстремумаДля решения задачи оптимального управления нужно рассмотреть вопрос о необходимых условиях экстремума. Ответ дает теорема, которая носит название принципа максимума Понтрягина. Теорема (принцип максимума Понтрягина). Пусть (x*, u*, t0*, t1*) – оптимальный процесс в задаче оптимального управления (7.1.2)–(7.1.6). Предположим, что -функции fi, φ непрерывны вместе со своими производными по x в окрестности множества {(t, x*(t),u) | u∈U}; -функции ψi непрерывно дифференцируемы в окрестности точки (t0*, t1*, x*(t0*), x*(t1*)). Тогда найдутся множители Лагранжа: числа λk∈R, k =0,…,N и функция p(t)∈ACR[a; b], не все равные нулю, такие что для функции Лагранжа (функции Понтрягина) H = ∫[t(0); t(1)] f(t, x, u) + p(t)(x' - φ(t, x, u))dt + ψ(t0, t1, x(t0), x(t1)), (7.2.1) в которой f(t, x, u) = ∑ 0≤ k ≤ N λkfk(t, x, u); ψ(t0, t1, x0, x1) = ∑ 0≤ k ≤ N λkψk(t0, t1, x0, x1); (7.2.2) выполняются следующие условия: А) стационарность по x (уравнение Эйлера): d/dt L*x ' (t) = L*x (t), или p'(t) = fx*(t) – p(t) φx*(t), (7.2.3) где L = f(t, x, u) + p(t)(x'–φ(t, x, u)) – лагранжиан задачи. Б) трансверсальность по x:Lx’* (t0*) = ψx0*, Lx’* (t1*) = – ψx1*, или p(t0*) = ψx0*, p(t1*) = – ψx1*. (7.2.4) В) оптимальность по u: minu∈U L(t, x*(t), u) = L(t, x*(t), u*(t)) (7.2.5) для всех t ∈ [t0*, t1*]. Г) стационарность по t0 и t1 (только для подвижных концов): Ht0* = 0, H t1* = 0; (7.2.6) Д) дополняющая нежесткость: λkBk* = 0, k = 1,…,m; (7.2.7) Е) неотрицательность: λk ≥ 0, k = 0,…,m. (7.2.8) Доказательство. Зафиксируем управление u. Тогда задача (7.1.2) - (7.1.5) - типичная гладкая задача с ограничениями, к которой применима теорема о множителях Лагранжа. Единственное, что требуется - это записать условия (7.1.4) и (7.1.5) в виде уравнения F(x, t0, t1) = 0, где оператор F действует в пространство Y = RN-m×R[a, b] (напомним, что на пространстве R[a, b] мы рассматриваем равномерную норму). Cогласно теореме о множителях Лагранжа найдутся не все равные нулю числа λk, k = 0,…,m (соответствующие целевой функции и ограничениям-неравенствам) и функционал y*∈Y*, такие что в в решении задачи дифференциал функции H = ∑ 0≤ k ≤ m λkBk + y*F равен нулю, причем выполняются условия дополняющей нежесткости (7.2.7) и неотрицательности (7.2.8). Отметим, что элемент y*∈Y* задается вектором из N-m чисел (которые мы обозначим λk, k = m+1,…, N) и линейным ограниченным функционалом на R[a, b]. Последний функционал согласно теореме Рисса для пространства C[a, b] задается некоторой функцией ограниченной вариации g. Следовательно, имеет место формула: H = ∑ 0≤ k ≤ N λkBk + ∫[a; b] (x'–φ(t, x, u))dg(t). Можно показать, что в качестве функции g можно подобрать абсолютно непрерывную функцию. В этом случае найдется интегрируемая функция p, для которой dg(t) = p(t)dt. Следовательно (с учетом обозначений (7.2.2)), H = ∑ 0≤ k ≤ N λkBk + ∫[t(0); t(1)] p(t)(x'–φ(t, x, u))dt = = ∫[t(0); t(1)] f(t, x, u) + p(t)(x'–φ(t, x, u))dt + ψ(t0, t1, x(t0), x(t1)) = ∫[t(0); t(1)] L dt + ψ. Функция H по переменной x имеет такой же вид, как целевой функционал в задаче Больца, поэтому получаем уравнение Эйлера (7.2.3) и условия трансверсальности (7.2.4). По переменным t0 и t1 функция H - обычная функция двух действительных переменных, поэтому в точке экстремума частные производные по этим переменным должны равняться нулю, т.е. выполняется условие стационарности (7.2.6). Заметим, что в оптимальной точке при λ0=1 выполняется H(x*, u, t0*, t1*)=H(u) = B0(u), поэтому minu(t)∈U H(u) = minu(t)∈U B0(u) = H(u*). Поскольку H = ∫[t(0); t(1)] L dt + ψ, и функция ψ не зависит от u, получаем условие оптимальности по u (7.2.4)..
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.) |