Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego z ograniczeniami chwilowymi sterowania i z uwik lanym sterowaniem w równaniach stanu Rozważmy zadanie optymalnego sterowania docelowego z uwik lanym sterowaniem w równaniach stanu i z ograniczeniami chwilowymi sterowania: zminimalizować wskaźnik jakości G(x, u) = uwzglȩdniaj ac równanie stanu warunki graniczne oraz ograniczenia chwilowe sterowania g(x(t), u(t), t)dt ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x 0, x(t 1 ) = x 1 u(t) U, t [, t 1 ]. Za lóżmy chwilowe ograniczenia w postaci u(t) u max, t [, t 1 ]. Wprowadzamy funkcjȩ kary za przekroczenie ograniczeń chwilowych K j (u j (t)) = 0 jeśli u j (t) u max j i K j (u j (t)) = ρ j ( u j (t) u max j ) 2 jeśli u j (t) > u max j, gdzie ρ j > 0 jest wspó lczynnikiem kary. Wraz ze wzrostem wspó lczynnika kary ρ j > + funkcja kary staje siȩ coraz bardziej stroma i tym samym coraz dok ladniejsza. Stosuj ac metodȩ funkcyjnych mnożników Lagrange a λ(t) dla równań stanu i funkcjȩ kary K(u(t)) =. m j=1 K j(u j (t)) dla ograniczeń chwilowych sterowania w l aczamy te ograniczenia do wskaźnika jakości G(x, λ, u). = ( g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) ) dt 1
minimalizowanego przy jedynych pozosta lych ograniczeniach jakimi s a warunki graniczne x( ) = x 0, x(t 1 ) = x 1. Tak wiȩc rozszerzamy zakres zmiennych do postaci wektora zmiennych funkcyjnych (x, λ, u) traktuj ac je jako równoprawne zmienne optymalizacyjne z przestrzeni C 1. Warunki konieczne optymalności określimy definiuj ac funkcjȩ g jak nastȩpuje g(x(t), ẋ(t), λ(t), λ(t), u(t), u(t), t) = g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) i zapisujemy warunki konieczne optymalności w postaci nastȩpuj acego uk ladu równań Eulera-Lagrange a g o x(t) d dt gȯ x(t) = 0, t [, t 1 ], ( ) g o λ(t) d dt gȯ λ (t) = 0, t [, t 1 ], ( ) g u(t) o d dt gȯ u(t) = 0, t [, t 1 ], ( ). Jest to uk lad 2n + m równań różniczkowych dla 2n + m zmiennych funkcyjnych. Mnożnik funkcyjny λ(t) nazywany jest także zmienn a sprzȩżon a lub zmienn a kostanu (wektorem kostanu). Równanie (*) nazywane jest równaniem sprzȩżonym lub równaniem kostanu optymalnego, równanie (**) jest równaniem stanu optymalnego, zaś (***) jest równaniem sterowania optymalnego. Uk lad tych równań pozwala dla niektórych klas problemów sterowania optymalnego efektywnie sparametryzować sterowanie optymalne, co u latwia jego dookreślenie za pomoc a prostego dodatkowego algorytmu obliczeniowego. Minimalnoczasowe sterowanie docelowe dla uk ladów liniowych Zadanie polega na minimalizacji czasu realizacji procesu docelowego G(x, u) = dt = t 1 z uwzglȩdnieniem liniowego stacjonarnego równania stanu uk ladu ẋ(t) = Ax(t) + Bu(t), t [, t 1 ], 2
warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1 oraz ograniczeń chwilowych sterowania u(t) u max, t [, t 1 ]. Rozszerzamy zestaw zmiennych i zapisujemy zmodyfikowany wskaźnik jakości G(x, λ, u) = ( 1 + λ T (t)(ẋ(t) Ax(t) Bu(t)) + K(u(t)) ) dt. Mamy wiȩc g x = λ T (t)a, gẋ = λ T (t), g λ = (ẋ(t) Ax(t) Bu(t)) T, g λ = 0, g u λ T (t)b + K u (u(t)), g u = 0. Uk lad równań Eulera-Lagrange a przyjmie postać równanie kostanu optymalnego λ T (t)a λ T (t) = 0, równanie stanu optymalnego ẋ(t) Ax(t) Bu(t) = 0, równanie sterowania optymalnego λ T (t) + K u (u(t)) = 0. Przyk lad: minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia równowagi, jeśli jest on opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 = x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1. 3
Schemat rozważanego uk ladu przedstawiony jest na rysunku ściana podstawowa amortyzator Obiekt sterowania M si la stabilizuj aca W tym przypadku ( ) ( ) 0 1 A =, A T 0 1 = 1 0 1 0 Oznacza to, że zmienne kostanu spe lniaj a równania λ 1 (t) = λ 2 (t), λ2 (t) = λ 1 (t), λ 1 (t) = λ 1 (t), r 2 = 1, r 1,2 = ±j, λ 1 (t) = c 1 sin(t + c 2 ), λ 2 (t) = c 1 cos(t + c 2 ), K u (u(t)) = λ 2 (t). Kszta lt trajektorii stanu oscylatora ze sterowaniem u = ±1: ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) ± 1 ẍ 1 (t) = x 1 (t) ± 1 x 1 (t) = c 1 cos t+c 2 sin t±1, x 2 (t) = c 1 sin t+c 2 cos t, x 10 = c 1 ±1; x 20 = c 2 x 1 (t) = (x 10 1)cos t + x 20 sin t ± 1; x 2 (t) = (x 10 1)sin t + x 20 cos t. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (x 1 (t) 1) 2 = (x 10 1) 2 cos 2 t + x 2 20sin 2 t + 2(x 10 1)cos t x 20 sin t, 4
x 2 2(t) = (x 10 1) 2 sin 2 t + x 2 20cos 2 t 2(x 10 1)cos t x 20 sin t czyli (x 1 1) 2 + x 2 2 = (x 10 1) 2 + x 2 20. Tak wiȩc trajektorie stanu oscylatora s a okrȩgami o środku (1, 0) dla sterowania u = +1 i okrȩgami o środku ( 1, 0) dla sterowania u = 1. Promień okrȩgu jest równy ρ = ( ) 1/2. (x 10 1) 2 + x 20 Trajektorie stanu oscylatora idealnego dla sterowania u(t) = +1 x 2 1 x 1 5
Trajektorie stanu oscylatora idealnego dla sterowania u(t) = 1 x 2-1 x 1 Wnioski z równania sterowania optymalnego: Sterowanie minimalnoczasowe przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π jednostek czasu (okres drgań badanego oscylatora wynosi 2π, a czas przebiegu po lowy okrȩgu wynosi π). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π. 6
Innym przyk ladem uk ladu, dla którego minimalnoczasowe sterowanie jest typu bang-bang jest uk lad z lożony z dwóch powi azanych oscylatorów opisywany równaniami stanu ẋ 1 0 1 0 0 x 1 0 0 ( ) ẋ 2 = 1 0 1 0 x 2 0 0 0 1 + 1 0 u 1 0 0 ẋ 3 ẋ 4 4 0 4 0 x 3 x 4 0 1 Jednak każde ze sterowań u 1 (t) i u 2 (t) może mieć w tym przypadku inne przedzia ly sta lości sterowania określone przez parametry poduk ladów. u 2 Minimalnoenergetyczne sterowanie docelowe dla uk ladów liniowych Zadanie polega na minimalizacji strat energetycznych na realizacjȩ procesu docelowego w ustalonym przedziale czasowym [, t 1 ] G(x, u) = u 2 (t)dt z uwzglȩdnieniem liniowego stacjonarnego równania stanu uk ladu ẋ(t) = Ax(t) + Bu(t), t [, t 1 ], warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1 oraz ograniczeń chwilowych sterowania u(t) u max, t [, t 1 ]. Rozszerzamy zestaw zmiennych i zapisujemy zmodyfikowany wskaźnik jakości G(x, λ, u) = ( u 2 + λ T (t)(ẋ(t) Ax(t) Bu(t)) + K(u(t)) ) dt. W tym przypadku funkcja g przybiera postać g(x(t), ẋ(t), λ(t), λ(t), u(t), u(t), t) = u 2 (t)+λ T (t)(ẋ(t) Ax(t) Bu(t))+K(u(t)). 7
Obliczamy pochodne funkcji g g x = λ T (t)a, gẋ = λ T (t), g λ = (ẋ(t) Ax(t) Bu(t)) T, g λ = 0, g u = 2u(t) λ T (t)b + K u (u(t)), g u = 0. Zapisujemy uk lad równań Eulera-Lagrange a równanie optymalnego kostanu λ T (t)a λ T (t) = 0, równanie optymalnego stanu ẋ(t) Ax(t) Bu(t) = 0, równanie optymalnego sterowania 2u(t) λ T (t)b + K u (u(t)) = 0. Z równania optymalnego sterowania wynika, że przebieg optymalnego sterowania może być scharakteryzowany na podstawie przebiegu zmiennych sprzȩżonych 2u(t) + K u (u(t)) = λ T (t)b. Sterowanie minimalnoenergetyczne, w odróżnieniu od sterowania minimalnoczasowego, może przyjmować wartości znajduj ace siȩ wewn atrz zakresu dopuszczalnego u o (t) < u max na skończonym podprzedziale czasowym przedzia lu sterowania [, t 1 ]. Postać tego sterowania udaje siȩ sparametryzować za pomoc a momentów charakterystycznych τ k, k = 1,..., K, w których nastȩpuje zmiana charakteru sterowania. Dla niektórych zastosowań parametryzacja ta 8
pozwala ca lkowicie określić przebieg sterowania minimalnoenergetycznego. Przyk lad: Minimalnoenergetyczne sterowanie tarcz a obrotow a tarcza obrotowa θ(t), Ω(t) U(t) silnik rewersyjny przek ladnia zmienna steruj aca - napiȩcie obwodu steruj acego silnika u(t) = U(t), zmienne stanu - po lożenie k atowe tarczy x 1 (t) = θ(t), prȩdkość k atowa tarczy x 2 (t) = Ω(t). Zadanie minimalnoenergetycznego sterowania docelowego tarcz a obrotow a bez tarcia polega na minimalizacji wskaźnika jakości G(x, u) = z uwzglȩdnieniem równań stanu 1 0 u 2 (t)dt ẋ 1 (t) = x 2 (t), ẋ 2 (t) = bu(t), t [0, 1], warunków dwugranicznych x i (0) = x i0, x i (1)) = x i1, oraz ograniczeń amplitudy sterowania u(t) 1, t [0, 1]. Zapisujemy równania sprzȩżone λ 1 (t) = 0, λ2 (t) = λ 1 (t) i ich rozwi azania λ 1 (t) = c 1, λ 2 (t) = c 1 t + c 2. Z równania sterowania optymalnego dla rozważanego przypadku 2u(t) + K u (u(t)) = C 1 t + C 2, t [0, 1] 9
wynika, że sterowanie minimalnoenergetyczne jest funkcj a przedzia lami liniow a z trzema przedzia lami liniowości i np. dla warunków granicznych x 10 < 0, x 20 = 0, x 11 = 0, x 20 = 0 sterowanie to można sparametryzować za pomoc a dwóch momentów charakterystycznych τ 1, τ 2 jak nastȩpuje +1, t [0, τ 1 ) u o (t) = C 1 t + C 2, t [τ 1, τ 2 ) (1) 1, t [τ 2, 1] W zwi azku z tym również problem minimalnoenergetycznego sterowania tarcz a obrotow a udaje siȩ sprowadzić do zadania optymalizacji funkcji dwóch zmiennych Ǧ(τ 1, τ 2 ) =. 1 0 u 2 (t, τ 1, τ 2 )dt z ograniczeniami równościowymi wynikaj acymi z zadanych warunków końcowych stanu x 1 (1, τ 1, τ 2 ) = 0, x 2 (1, τ 1, τ 2 ) = 0, gdzie x 1 (1, τ 1, τ 2 ) i x 2 (1, τ 1, τ 2 ) s a rozwi azaniami równań stanu tarczy obrotowej bez tarcia w chwili końcowej t 1 = 1. Zadanie minimalnoenergetycznego sterowania docelowego tarcz a obrotow a z tarciem polega na minimalizacji wskaźnika jakości G(x, u) = z uwzglȩdnieniem równań stanu 1 0 u 2 (t)dt ẋ 1 (t) = x 2 (t), ẋ 2 (t) = ax 2 (t) + bu(t), t [0, 1], warunków dwugranicznych x i (0) = x i0, x i (1)) = x i1, oraz ograniczeń amplitudy sterowania u(t) 1, t [0, 1], gdzie a jest wspó lczynnikiem tarcia tarczy. 10
Zapisujemy równania sprzȩżone λ 1 (t) = 0, λ2 (t) = aλ 2 (t) λ 1 (t) i ich rozwi azania λ 1 (t) = c, λ 2 (t) = c 1 e at + c 2. Z równania sterowania optymalnego dla rozważanego przypadku 2u(t) + K u (u(t)) = C 1 e at + C 2, t [0, 1] wynika, że sterowanie minimalnoenergetyczne jest funkcj a sta l a lub eksponencjaln a z trzema przedzia lami charakterystycznymi i np. dla warunków granicznych x 10 < 0, x 20 = 0, x 11 = 0, x 20 = 0 sterowanie to można sparametryzować za pomoc a dwóch momentów charakterystycznych τ 1, τ 2 jak nastȩpuje +1, t [0, τ 1 ) u o (t) = C 1 e at + C 2, t [τ 1, τ 2 ) (2) 1, t [τ 2, 1] W zwi azku z tym również problem minimalnoenergetycznego sterowania tarcz a obrotow a z tarciem udaje siȩ sprowadzić do zadania optymalizacji funkcji dwóch zmiennych Ǧ(τ 1, τ 2 ). = 1 0 u 2 (t, τ 1, τ 2 )dt z ograniczeniami równościowymi wynikaj acymi z zadanych warunków końcowych stanu x 1 (1, τ 1, τ 2 ) = 0, x 2 (1, τ 1, τ 2 ) = 0, gdzie x 1 (1, τ 1, τ 2 ) i x 2 (1, τ 1, τ 2 ) s a rozwi azaniami równań stanu tarczy obrotowej z tarciem w chwili końcowej t 1 = 1. 11