Wprowadzenie do metod sterowania optymalnego Pojȩcie procesu sterowania obejmuje zestaw trajektorii stanu i sterowania (x, u) X U, gdzie X jest przestrzeni a trajektorii stanu, a U jest przestrzeni a sterowania. Optymalizacja uk ladów sterowania oznacza poszukiwanie takiego sposobu prowadzenia procesu sterowania, który zapewnia ekstremum wskaźnika jakości procesu (wydajność procesu, koszt prowadzenia procesu, zysk z prowadzenia procesu) i jest dopuszczalny tj. spe lnia ograniczenia odzwierciedlaj ace warunki prowadzenia procesu (ograniczone zużycie surowców i energii, ograniczenia wartości chwilowych zmiennych procesowych). Dopuszczalny proces sterowania ekstremalizuj acy wskaźnik jakości nazywa siȩ optymalnym procesem sterowania, a zwi azane z nim sterowanie nazywa siȩ sterowaniem optymalnym. Różne potrzeby praktyczne prowadz a do wyróżnienia szczególnych zadań sterowania optymalnego np. zadania optymalnego sterowania docelowego, zadania optymalnego sterowania okresowego, czy też zadania optymalnego sterowania stochastycznego.. Niech u(t) = u 1 (t) 2 + u 2 (t) 2 +... + u m (t) 2 oznacza normȩ euklidesow a sterowania chwilowego. optymalnego przestrzeń sterowania określana jest jako unormowany zbiór funkcji ci ag lych W zależności od rodzaju zadania sterowania U. = C([, t 1 ]; R m ), u. = max t [,t 1 ] u(t) ; jako unormowany zbiór funkcji przedzia lami ci ag lych U =. P C([, t 1 ]; R m ), u =. sup t [,t 1 ] u(t) ; jako unormowany zbiór funkcji przedzia lami sta lych U =. P S([, t 1 ]; R m ), u =. max u k ; k 0 k k 1 ] jako unormowany zbiór funkcji istotnie ograniczonych U =. L ([, t 1 ]; R m ), u =. esssup u(t) ; t [,t 1 ] jako unormowany zbiór funkcji ca lkowalnych z kwadratem U =. L 2 ([, t 1 ]; R m ), u =. u(t) 2 dt; jako unormowany zbiór funkcji ca lkowalnych z kwadratem w obszarze wielowymiarowym Ω. = [, t 1 ] [0, 1] 1
U. = L 2 (Ω; R m ), u. = Ω u(t, z) 2 dz dt. Na podstawie wyboru przestrzeni sterowania określana jest przestrzeń trajektorii stanu jako unormowany zbiór funkcji różniczkowalnych w sposób ci ag ly X =. C 1 ([, t 1 ], R n ), x =. max x(t) + max ẋ(t) ; t [,t 1 ] t [,t 1 ] jako unormowany zbiór funkcji przedzia lami różniczkowalnych w sposób ci ag ly X =. P C 1 ([, t 1 ], R n ), x =. sup t [,t 1 ] x(t) + sup t [,t 1 ] ẋ(t) ; jako unormowany zbiór funkcji o pochodnej istotnie ograniczonej U =. W1 ([, t 1 ]; R m ), u =. esssup x(t) + esssup ẋ(t) ; t [,t 1 ] t [,t 1 ] jako unormowany zbiór funkcji o pochodnej ca lkowalnej z kwadratem X =. W1 2 ([, t 1 ], R n ), x =. ( x(t) 2 + ẋ(t) 2 )dt; jako unormowany zbiór funkcji o pochodnej ca lkowalnej z kwadratem w obszarze Ω. = [, t 1 ] [0, 1] X. = W 2 1 (Ω, R n ), x. = Ω ( x(t, z) 2 + ẋ(t, z) 2 ) dz dt. Ważn a klas a zadań sterowania optymalnego s a zadania optymalnego sterowania docelowego formu lowane w odniesieniu do procesów mechanicznych, elektromechanicznych, metalurgicznych, chemicznych, biotechnologicznych i wielu innych. Podstawowe zadanie optymalnego sterowania docelowego polega na minimalizacji ca lkowego wskaźnika jakości G(x, u) = g(x(t), u(t), t)dt z uwzglȩdnieniem równania stanu procesu ẋ(t) = f(x(t), u(t), t), t [, t 1 ], warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1, oraz ograniczeń chwilowych sterowania u(t) U, t [, t 1 ], 2
gdzie x 0, x 1 R n, U R m, zaś u P C([, t 1 ]; R m ), x P C 1 ([, t 1 ]; R n ) lub u C([, t 1 ]; R m ), x C 1 ([, t 1 ]; R n ). Przyk lad. Minimalnoenergetyczne nagrzewanie zbiornika z ciecz a: zminimalizować straty energetyczne G(x, u) = 1 0 u 2 (t)dt procesu nagrzewania opisywanego równaniem stanu ẋ(t) = ax(t) + bu(t), t [0, 1] z warunkami dwugranicznymi x(0) = x 0, x(1) = x 1, gdzie x(t) jest temperatur a cieczy w zbiorniku w chwili t, x 0 jest jego zadan a temperatur a pocz atkow a, x 1 jest jego zadan a temperatur a końcow a, u(t) jest natȩżeniem pr adu obwodu grzejnego, a jest wspó lczynnikiem stygniȩcia cieczy, zaś b jest wspó lczynnikiem nagrzewania cieczy. Przyk lad. Minimalnoenergetyczne sterowanie tarcz a obrotow a: zminimalizować straty energetyczne G(x, u) = u 2 (t)dt procesu przestawiania tarczy obrotowej opisywanej równaniami stanu z warunkami dwugranicznymi ẋ 1 (t) = x 2 (t), ẋ 2 (t) = bu(t), t [, t 1 ], x i ( ) = x i (0), x i (t 1 ) = x i (1) (i = 1, 2), gdzie x 1 (t) oznacza po lożenie k atowe tarczy, x 2 (t) oznacza prȩdkość k atow a tarczy, zaś u(t) jest napiȩciem obwodu steruj acego silnika. W zadaniach tych pominiȩto ograniczenia chwilowe sterowania zak ladaj ac, że postać wskaźnika jakości automatycznie ograniczy chwilow a wartość sterowania. 3
Przyk lad. Minimalnoczasowa stabilizacja oscylatora: sprowadzić oscylator do po lożenia równowagi w minimalnym czasie G(x, u) = z uwzglȩdnieniem równań stanu oscylatora dt = t 1 ẋ 1 (t) = x 2 (t), ẋ 2 (t) = ax 1 (t) + bu(t), t [, t 1 ], warunków dwugranicznych x i ( ) = x i0, x i (t 1 ) = x i1, i = 1, 2, oraz ograniczeń chwilowych sterowania u(t) 1, t [, t 1 ], gdzie x 1 (t) jest po lożeniem oscylatora w chwili t, x 2 (t) jest prȩdkości a oscylatora, u(t) jest jego si l a stabilizuj ac a, a jest wspó lczynnikiem amortyzatora sprȩżynowego, zaś b jest wspó lczynnikiem oddzia lywania si ly stabilizuj acej. Przyk lad. Minimalnoczasowa stabilizacja oscylatora z t lumieniem w lasnym: sprowadzić oscylator do po lożenia równowagi w minimalnym czasie G(x, u) = dt = t 1 z uwzglȩdnieniem równań stanu oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) a 2 x 2 (t) + bu(t), t [, t 1 ], warunków dwugranicznych x i ( ) = x i0, x i (t 1 ) = x i1, i = 1, 2, oraz ograniczeń chwilowych sterowania u(t) 1, t [, t 1 ], gdzie x 1 (t) jest po lożeniem oscylatora w chwili t, x 2 (t) jest prȩdkości a oscylatora, u(t) jest jego si l a stabilizuj ac a, a 1 jest wspó lczynnikiem amortyzatora sprȩżynowego, a 2 jest wspó lczynnikiem t lumika, zaś b jest wspó lczynnikiem oddzia lywania si ly stabilizuj acej. 4
Do rozwi azywania zadań optymalnego sterowania docelowego zastosować można klasyczne metody rachunku wariacyjnego, metody analizy funkcjonalnej oraz zaawansowane metody nieliniowego programowania. Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych dla przypadku jednowymiarowego. Rozważymy w pierwszej kolejności przypadek jednowymiarowy pojedynczej krzywej (n = 1, m = 1). Za lóżmy, że równanie stanu pozwala jednoznacznie określić sterowanie u(t) w funkcji stanu x(t), pochodnej stanu ẋ(t) oraz czasu t tj. ẋ(t) = f(x(t), u(t), t) u(t) = F (x(t), ẋ(t), t). Podstawiaj ac uzyskane wyrażenie do wskaźnika jakości sprowadzamy problem optymalnego sterowania docelowego do zadania rachunku wariacyjnego: zminimalizować funkcjona l zależny od krzywej x, jej pochodnej ẋ i czasu t G(x) = g(x(t), ẋ(t), t)dt z wiȩzami ustalaj acymi po lożenie pocz atkowe i końcowe krzywej x( ) = x 0, x(t 1 ) = x 1. Zadanie wariacyjne polega wiȩc na wyborze krzywej x l acz acej punkty (, x 0 ) oraz (t 1, x 1 ) i minimalizuj acej funkcjonal G(x). Aby określić warunki konieczne optymalności krzywej w zadaniu wariacyjnym zak ladamy, że krzywa jest elementem przestrzeni funkcji różniczkowalnych w sposób ci ag ly tj. x C 1 ([, t 1 ]; R n ), x =. max x(t) + max ẋ(t) t [,t 1 ] t [,t 1 ] Definicja: Funkcjona l G(x) osi aga na krzywej ˆx lokalne s labe ekstremum, jeżeli istnieje takie ɛ > 0, że ( x ˆx ɛ) ( G(x) G(ˆx))) tj. dla wszystkich krzywych z C 1 -otoczenia krzywej ˆx wartości funkcjona lu G(x) nie s a mniejsze od G(ˆx). 5
Mówimy w tym przypadku o s labym ekstremum, gdyż rozwi azanie ekstremalne porównujemy z s asiednimi krzywymi różniczkowalnymi w sposób ci ag ly (czyli z krzywymi z C 1 -otoczenia) w odróżnieniu od porównania z s asiednimi krzywymi ci ag lymi (czyli z krzywymi z C-otoczenia). Niech ˆx + αδx C 1 ([, t 1 ]; R n ) bȩdzie zaburzeniem krzywej ekstremalnej ˆx spe lniaj acym równania wiȩzów (warunki graniczne) δx( ) = 0, δx(t 1 ) = 0, przy czym α R jest parametrem rzeczywistym. Funkcjona l G(x) traktowany jako funkcja parametru α przybierze postać G(α) = g(ˆx(t) + αδx(t), ˆx(t) + αδẋ(t), t)dt. Ponieważ funkcja G z za lożenia osi aga dla α = 0 ekstremum, to d G dα α=0 = 0. Zak ladaj ac, że funkcja g ma ci ag le pochodne cz astkowe g x i gẋ uzyskujemy oraz d G(α) t1 dα = ( gx (ˆx + αδx(t), ˆx(t) + αδẋ(t), t)δx(t)+ gẋ(ˆx(t) + αδx(t), ˆx(t) + αδẋ, t)δẋ(t) ) dt gdzie d G(α) t1 dα α=0 = (ˆ g x (t)δx(t) + ˆ gẋ(t)δẋ(t) ) dt, ˆ g x (t). = g x (ˆx(t), ˆx(t), t), ˆ gẋ(t). = gẋ(ˆx(t), ˆx(t), t). Zastosowanie wzoru na ca lkowanie przez czȩści i uwzglȩdnienie wiȩzów krzywej prowadzi do zależności ˆ gẋ(t)δẋ(t)dt = ˆ gẋ(t)δx(t) t 1 t0 = ˆ gẋ(t 1 )δx(t 1 ) ˆ gẋ(t)δx( ) = d dt ˆ gẋ(t)δx(t)dt. d dt ˆ gẋ(t)δx(t)dt d dt ˆ gẋ(t)δx(t)dt 6
Mamy wiȩc d G(α) t1 dα α=0 = (ˆ g x (t) d dt ˆ gẋ(t) ) δx(t)dt = 0. Aby ostatnie wyrażenie by lo równe zeru dla dowolnych wariacji δx(t) krzywej ˆx(t) wyrażenie w nawiasie musi być równe zeru tj. spe lnione musi być równanie Eulera-Lagrange a ˆ g x (t) d dt ˆ gẋ(t) = 0, t [, t 1 ]. Twierdzenie: Warunkiem koniecznym s labego lokalnego ekstremum funkcjona lu G(x) na zbiorze krzywych x C 1 z wiȩzami x( ) = x 0, x(t 1 ) = x 1 jest spe lnienie równania Eulera-Lagrange a na krzywej ekstremalnej ˆx. Krzywe spe lniaj ace równanie Eulera-Lagrange a nazywamy ekstremalami. Aby stwierdzić czy dana ekstremala stanowi minimum funkcjona lu (a nie maksimum lub punkt przegiȩcia) stosujemy warunki optymalności wyższych rzȩdów. W szczególności warunki optymalności drugiego rzȩdu uzyskujemy obliczaj ac drug a pochodn a = d 2 G(α) dα 2 α=0 (ˆ g xx (t)δx 2 (t) + 2ˆ g xẋ (t)δx(t)δẋ(t) + ˆ gẋẋ (t)δẋ 2 (t) ) dt. Ponieważ zawsze można dobrać wariacjȩ δx(t) krzywej ˆx(t) ma l a co do modu lu lecz z dowolnie duż a pochodn a, wiȩc o znaku drugiej pochodnej decyduje wyrażenie ˆ gẋẋ (t). Wynika st ad, że warunkiem koniecznym drugiego rzȩdu osi agania minimum przez ekstremalȩ ˆx jest nierówność Legendre a ˆ gẋẋ (t) 0, t [, t 1 ]. Warunkiem dostatecznym drugiego rzȩdu osi agania minimum przez ekstremalȩ ˆx jest ostra nierówność Legendre a ˆ gẋẋ (t) > 0, t [, t 1 ], pod warunkiem, że ekstremala nie posiada tzw punktów sprzȩżonych. 7
Dla zadania z przyk ladu 1 z parametrami a = 2, b = 1 i wiȩzami x(0) = 1, x(1) = 2 uzyskujemy u(t) = ẋ(t) + 2x(t) i sprowadzamy zadanie optymalnego sterowania docelowego do zadania wariacyjnego postaci: zminimalizować funkcjona l G(x) = uwzglȩdniaj ac wiȩzy krzywej 1 0 (ẋ(t) + 2x(t)) 2 dt x(0) = 1, x(1) = 2. W tym przypadku g(x(t), ẋ(t), t) = (ẋ(t)+2x(t)) 2 i równanie Eulera-Lagrange a przybiera postać ˆ g x (t) d dt ˆ gẋ(t) = 4(ẋ + 2x(t)) d 2(ẋ(t) + 2x(t)) dt = 4ẋ(t) + 8x(t) 2ẍ(t) 4ẋ(t) = 2ẍ(t) + 8x(t) = 0 czyli ẍ(t) 4x(t) = 0. Tak wiȩc równanie Eulera-Lagrange a ma dla badanego przyk ladu postać liniowego stacjonarnego równania różniczkowego, którego rozwi azanie określamy wyznaczaj ac pierwiastki równania charakterystycznego r 2 4 = 0 r 1,2 = ±2 ˆx(t) = c 1 e 2t + c 2 e 2t û(t) = 2c 1 e 2t 2c 2 e 2t + 2c 1 e 2t + 2c 2 e 2t = 4c 1 e 2t. Sterowanie optymalne jest wiȩc dla rozważanego procesu nagrzewania funkcj a eksponencjaln a. Sta le c i określamy z warunków granicznych uzyskuj ac ostatecznie û(t) = 8e2 4 e 4 1 e2t. Sprawdzamy warunek optymalności drugiego rzȩdu ˆ gẋẋ (t) = 2(ẋ(t) + 2x(t)) = 2 > 0. ẋ 8
Wyznaczone sterowanie jest wiȩc lokalnym minimum. Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych dla przypadku wielowymiarowego. Uzyskane warunki optymalności uogólniamy bezpośrednio na przypadek zadania wielowymiarowego n > 1, m > 1. Zak ladamy, że wektorowe sterowanie u(t) R m można jednoznacznie określić z równań stanu w funkcji stanu x(t), jego pochodnej ẋ(t) i czasu t. Przechodzimy nastȩpnie do wielowymiarowego zadania wariacyjnego: zminimalizować funkcjona l zależny od wielowymiarowej krzywej x z wiȩzami G(x) = gdzie x(t) R n, x 0, x 1 R n. g(x(t), ẋ(t), t)dt, x( ) = x 0, x(t 1 ) = x 1, W tym przypadku badamy wariacje wektorowej trajektorii stanu ˆx i (t) + α i δx i (t), δx i ( ) = 0, δx i (t 1 ) = 0, i = 1,..., n, gdzie α i R jest parametrem wariacji i-tej wspó lrzȩdnej stanu. Wskaźnik jakości zadania wariacyjnego przybierze postać funkcji n skalarnych argumentów α 1,..., α n tj. G(α 1,..., α n ). = g(ˆx 1 (t) + α 1 δx 1 (t), ˆx 1 (t) + α 1 δẋ 1 (t),..., ˆx n (t) + α n δx n (t), ˆx n (t) + α n δẋ n (t), t)dt. Ponieważ funkcja G(α1,..., α n ) osi aga z za lożenia minimum, wiȩc musz a być spe lnione warunki konieczne optymalności pierwszego rzȩdu funkcji wielu zmiennych tj. G (0) = 0, i = 1,..., n. α i Uzyskujemy st ad po zastosowaniu wzoru na ca lkowanie przez czȩści G t1 (0) = (ˆ g xi (t)δx i (t) + ˆ gẋi (t)δẋ i (t) ) dt α i = (ˆ g xi (t) d dt ˆ gẋi (t) ) δx i (t) = 0. 9
Warunek konieczny optymalności pierwszego rzȩdu krzywej wielowymiarowego zadania wariacyjnego można wiȩc zapisać w postaci uk ladu równań Eulera- Lagrange a ˆ g xi (t) d dt ˆ gẋi (t) = 0, t [, t 1 ], i = 1,..., n. Celem określenia czy krzywa ekstremalna wyznaczona na podstawie warunków optymalności rzȩdu pierwszego stanowi minimum funkcjona lu G(x) (a nie jego maksimum lub punkt przegiȩcia) stosujemy warunki optymalności drugiego rzȩdu tj. badamy macierz pochodnych cz astkowych drugiego rzȩdu funkcjona lu G(x). Pochodne te przybieraj a postać 2 G(α) t1 α=0 = (ˆ g xi x α i α j (t)δx i (t)δx j (t) j +2ˆ g xi ẋ j (t)δx i (t)δẋ j (t) + ˆ gẋi ẋ j (t)δẋ i (t)δẋ j (t) ) dt. Warunki optymalności drugiego rzȩdu sprowadzaj a siȩ do badania dodatniej pó lokreśloności lub dodatniej określoności macierzy pochodnych cz astkowych drugiego rzȩdu ( 2 G(α) α i α j α=0 ) i,j=1,...,n. Stosuj ac analogiczne rozumowanie jak w przypadku warunków drugiego rzȩdu dla krzywej jednowymiarowej wnioskujemy, że o dodatniej (pó l)określoności analizowanej macierzy decydować bȩdzie macierz drugich pochodnych cz astkowych postaci (ˆ gẋiẋj (t) ) i,j=1,...,n 0 (> 0). Przyk lad. Minimalnoenergetyczne nagrzewanie uk ladu dwóch zbiorników z ciecz a: zminimalizować sumaryczne straty energetyczne G(x, u) = 1 0 (u 2 1(t) + u 2 2(t))dt procesu nagrzewania opisywanego za pomoc a równań stanu z warunkami granicznymi ẋ i (t) = a i x i (t) + u i (t), t [0, 1], i = 1, 2 x i (0) = 1, x i (1) = 2, i = 1, 2. 10
Sprowadzamy zadanie do postaci wariacyjnej a wiȩc oraz 1 2 u i (t) = x i (t) + a i x i (t), G(x) = (ẋ i (t) + a i x i (t)) 2 dt, 0 i=1 2 g = (ẋ i (t) + a i x i (t)) 2, g xi = 2a i (ẋ i (t) + a i x i (t)) i=1 gẋi = 2(ẋ i (t) + a i x i (t)). Zestawiamy uk lad równań Eulera-Lagrange a 2a i (ẋ i (t) + a i x i (t)) d dt 2(ẋ i(t) + a i x i (t)) = 0, i = 1, 2. St ad i a i ẋ i (t) + a 2 i (t)x i (t) ẍ i (t) a i ẋ i (t) = 0 ẍ i (t) = a 2 i x i (t), r 2 i = a 2 i, r i,1,2 = ±a i. Optymalna trajektoria stanu ma wiȩc postać ˆx i (t) = c i1 e ait + c i2 e ait, zaś sterowanie optymalne jest określone jak nastȩpuje û i (t) = 2a i c i1 e ait, t [0, 1], i = 1, 2, przy czym sta le c i1, c i2 określamy z warunków granicznych. Warunki optymalności drugiego rzȩdu sprowadzaj a siȩ do badania macierzy ) ( ) (ˆ gẋ1 ẋ 1 gẋ1 ẋ 2 2 0 = ˆ gẋ2 ẋ 1 gẋ2 ẋ 1 0 2 Wyznaczone rozwi azanie jest rozwi azaniem minimalizuj acym, ponieważ minory g lówne tej macierzy s a dodatnie. Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych z pochodnymi wyższych rzȩdów. W niektórych przypadkach z równań stanu ẋ i (t) = f i (x(t), u(t), t), i = 1,..., n 11
można jednoznacznie wyznaczyć sterowanie w funkcji pewnego podwektora x(t) R k (k < n) wektora stanu x(t) R n i jego pochodnych ẋ(t), ẍ(t),..., x (n) (t) oraz czasu t tj. u(t) = F (x(t), ẋ(t), ẍ(t),..., x (n) (t), t), przy czym warunki graniczne wektora stanu x(t) implikuj a odpowiednie warunki graniczne podwektora stanu x(t) x i (t κ ) = x iκ (i = 1..., n; κ = 0, 1) x (l) (t κ ) = x (l) κ (l = 0, 1,..., n 1; κ = 0, 1). Rozpatrzmy przypadek k = 1, n > 1 i funkcjona l zadania wariacyjnego w postaci G(x) = i wariacjȩ krzywej z parametrem α R g(x(t), ẋ(t),..., x (n) (t), t)dt ˆx(t) + αδx(t), δx (l) (t κ ) = 0 (l = 0, 1,..., n 1; κ = 0, 1). Przechodzimy do α-parametryzacji funkcjona lu G(x) tj. do funkcji G(α) = ( g(ˆx(t) + αδx(t), ˆx(t) + αδẋ(t),..., ˆx (n) (t) + αδx (n) (t), t)dt. Zapisujemy warunek konieczny optymalności rzȩdu pierwszego funkcji G(α) czyli d G(α) dα = 0 (ˆ g x (t)δx(t) + g ˆx (t)δẋ(t) +... + ˆ g x (n)(t)δx (n) (t) ) dt = 0. Do wyrażeń typu t 1 ˆ g x (l)(t)δx (l) (t)dt stosujemy l-krotnie wzór na ca lkowanie przez czȩści z uwzglȩdnieniem zerowania siȩ wariacji krzywej w wiȩzach, co prowadzi do wyrażenia ( (ˆ g x (t) d dt ˆ gẋ(t) + d2 dt 2 ˆ gẍ(t) +... + ( 1) n dn dt n ˆ g x (n)(t))δx(t) ) dt 12
Uzyskujemy w ten sposób warunek konieczny optymalności pierwszego rzȩdu dla s labego ekstremum zadania wariacyjnego z pochodnymi wyższych rzȩdów w postaci równania Eulera-Poissona ˆ g x (t) d dt ˆ gẋ(t) + d2 dt 2 ˆ gẍ(t) +... + ( 1) n dn dt n ˆ g x (n)(t) = 0, t [, t 1 ]. Warunki optymalności drugiego rzȩdu przybieraj a w tym przypadku postać ˆ g x (n) x (n) (t) 0 (> 0). Przyk lad. Minimalnoenergetyczne sterowanie tarcz a obrotow a: zminimalizować straty energetyczne G(x, u) = 1 0 u 2 (t)dt procesu przestawiania tarczy obrotowej opisywanej równaniami stanu z warunkami dwugranicznymi ẋ 1 (t) = x 2 (t), ẋ 2 (t) = bu(t), t [0, 1], x i (1) = 1, x i (1) = 0 (i = 1, 2), gdzie x 1 (t) oznacza po lożenie k atowe tarczy, x 2 (t) oznacza prȩdkość k atow a tarczy, zaś u(t) jest napiȩciem obwodu steruj acego silnika. Przeprowadzamy redukcjȩ problemu zadania wariacyjnego z pochodn a drugiego rzȩdu. Wyróżniamy podwektor wektora stanu w postaci x(t). = x 1 (t) i z równań stanu uzyskujemy ẍ(t) = ẋ 2 (t) = u(t). Zadanie wariacyjne przyjmuje postać: zminimalizować funkcjona l określony na krzywej x o postaci G(x) = z uwzglȩdnieniem wiȩzów krzywej 1 0 ẍ 2 (t)dt x(0) = 1, ẋ(0) = 1, x(1) = 0, ẋ(1) = 0. W tym przypadku g = ẍ 2, g x = 0, gẋ = 0, gẍ = 2ẍ i równanie Eulera-Poissona przybiera postać d 2 dt g 2 ẍ = 0 2 d4 x(t) = 0. dt4 13
Równanie charakterystyczne różniczkowego równania Eulera-Poissona zapisujemy jako r 4 = 0. Posiada ono czterokrotny pierwiastek zerowy. Rozwi azanie tego równania jest postaci ˆx(t) = c 0 + c 1 t + c 2 t 2 + c 3 t 3 sk ad û(t) = 6c 3 t + 2c 2. Sta le wyznaczamy z wiȩzów krzywej uzyskuj ac c 2 = 5, c 3 = 3 oraz û(t) = 18t 10, t [0, 1]. Warunek optymalności drugiego rzȩdu daje w wyniku gẍẍ = 2 > 0, a wiȩc wyznaczone rozwi azanie jest poszukiwanym minimum. Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego z ograniczeniami chwilowymi sterowania i z uwik lanym sterowaniem w równaniach stanu Rozważmy zadanie optymalnego sterowania docelowego z uwik lanym sterowaniem w równaniach stanu i z ograniczeniami chwilowymi sterowania: zminimalizować wskaźnik jakości G(x, u) = uwzglȩdniaj ac równanie stanu g(x(t), u(t), t)dt ẋ(t) = f(x(t), u(t), t), t [, t 1 ], warunki graniczne x( ) = x 0, x(t 1 ) = x 1 14
oraz ograniczenia chwilowe sterowania u(t) U, t [, t 1 ]. Niech chwilowe ograniczenia sterowania bȩd a postaci u(t) u max, t [, t 1 ]. Wprowadzamy funkcjȩ kary za przekroczenie ograniczeń chwilowych { 0 gdy u j (t) u max j K j (u j (t)) = ρ j u j (t) u max j 2 gdy u j (t) > u max j gdzie ρ j > 0 jest wspó lczynnikiem kary. Wraz ze wzrostem wspó lczynnika kary ρ j + funkcja kary staje siȩ coraz bardziej stroma i tym samym coraz dok ladniejsza. Stosuj ac metodȩ funkcyjnych mnożników Lagrange a λ(t) dla równań stanu i funkcjȩ kary K(u(t)). = m j=1 K j(u j (t)) dla ograniczeń chwilowych sterowania w l aczamy te ograniczenia do wskaźnika jakości modyfikuj ac go do postaci G(x, λ, u). = ( g(x(t), u(t), t) +λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) ) dt minimalizowanego przy jedynych pozosta lych ograniczeniach jakimi s a warunki graniczne x( ) = x 0, x(t 1 ) = x 1. Tak wiȩc rozszerzamy zakres zmiennych do postaci wektora zmiennych funkcyjnych (x, λ, u) traktuj ac je jako równoprawne zmienne optymalizacyjne z przestrzeni C 1. Warunki konieczne optymalności określimy definiuj ac funkcjȩ g jak nastȩpuje g(x(t), ẋ(t), λ(t), λ(t), u(t), u(t), t) = g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) i zapisujemy warunki konieczne optymalności w postaci nastȩpuj acego uk ladu równań Eulera-Lagrange a ˆ g x (t) d dt ˆ gẋ(t) = 0, t [, t 1 ], ( ) 15
ˆ g λ (t) d dt ˆ g λ(t) = 0, t [, t 1 ], ( ) ˆ g u (t) d dt ˆ g u (t) = 0, t [, t 1 ], ( ). Jest to uk lad 2n + m równań różniczkowych dla 2n + m zmiennych funkcyjnych. Mnożnik funkcyjny λ(t) nazywany jest także zmienn a sprzȩżon a lub zmienn a kostanu (wektorem kostanu). Równanie (*) nazywane jest równaniem sprzȩżonym lub równaniem kostanu optymalnego, równanie (**) jest równaniem stanu optymalnego, zaś (***) jest równaniem sterowania optymalnego. Uk lad tych równań pozwala dla niektórych klas problemów sterowania optymalnego efektywnie sparametryzować sterowanie optymalne, co u latwia jego dookreślenie za pomoc a prostego dodatkowego algorytmu obliczeniowego. Minimalnoczasowe sterowanie docelowe dla uk ladów liniowych Zadanie polega na minimalizacji czasu realizacji procesu docelowego G(x, u) = dt = t 1 z uwzglȩdnieniem liniowego stacjonarnego równania stanu uk ladu ẋ(t) = Ax(t) + Bu(t), t [, t 1 ], warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1 oraz ograniczeń chwilowych sterowania u(t) u max, t [, t 1 ]. Rozszerzamy zestaw zmiennych i zapisujemy zmodyfikowany wskaźnik jakości G(x, λ, u) = ( 1 + λ T (t)(ẋ(t) Ax(t) Bu(t)) + K(u(t)) ) dt. Mamy wiȩc g x (t) = λ T (t)a, gẋ(t) = λ T (t), 16
g λ (t) = (ẋ(t) Ax(t) Bu(t)) T, g λ(t) = 0, g u (t) = λ T (t)b + K u (u(t)), g u (t) = 0. Uk lad równań Eulera-Lagrange a przyjmie postać równanie kostanu optymalnego λ T (t)a λ T (t) = 0, równanie stanu optymalnego ẋ(t) Ax(t) Bu(t) = 0, równanie sterowania optymalnego λ T (t)b + K u (u(t)) = 0. Przyk lad. Minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia równowagi, jeśli jest on opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1. Schemat rozważanego uk ladu przedstawiony jest na rysunku ściana podstawowa amortyzator sprȩżynowy Maszyna M si la stabilizuj aca W tym przypadku ( ) ( ) 0 1 A =, A T 0 1 = 1 0 1 0 17
Oznacza to, że zmienne kostanu spe lniaj a równania λ 1 (t) = λ 2 (t), λ2 (t) = λ 1 (t), λ 1 (t) = λ 1 (t), r 2 = 1, r 1,2 = ±j, λ 1 (t) = c 1 sin(t + c 2 ), λ 2 (t) = c 1 cos(t + c 2 ), K u (u(t)) = λ 2 (t). Ostatnie równanie jest równaniem sterowania minimalnoczasowego oscylatora idealnego. Implikuje ono, że sterowanie to przyjmuje wy l acznie wartości û(t) = ±1. Podstawienie tego sterowania do równań stanu pozwala określić kszta lt trajektorii stanu dla sterowania minimalnoczasowego. ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) ± 1 ẍ 1 (t) = x 1 (t) ± 1 x 1 (t) = c 1 cos t + c 2 sin t ± 1, x 2 (t) = c 1 sin t + c 2 cos t, x 10 = c 1 ± 1; x 20 = c 2 x 1 (t) = (x 10 1)cos t + x 20 sin t ± 1; x 2 (t) = (x 10 1)sin t + x 20 cos t. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (x 1 (t) 1) 2 = (x 10 1) 2 cos 2 t + x 2 20sin 2 t +2(x 10 1)cos t x 20 sin t, x 2 2(t) = (x 10 1) 2 sin 2 t + x 2 20cos 2 t 2(x 10 1)cos t x 20 sin t czyli (x 1 1) 2 + x 2 2 = (x 10 1) 2 + x 2 20. Tak wiȩc trajektorie stanu oscylatora s a okrȩgami o środku (1, 0) dla sterowania û(t) = +1 i okrȩgami o środku ( 1, 0) dla sterowania û(t) = 1. Promień okrȩgu jest równy ρ = ( ) 1/2. (x 10 1) 2 + x 20 18
Trajektorie stanu oscylatora idealnego dla sterowania û(t) = +1 x 2 1 x 1 19
Trajektorie stanu oscylatora idealnego dla sterowania û(t) = 1 x 2-1 x 1 Wnioski z równania sterowania optymalnego: Sterowanie minimalnoczasowe przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π jednostek czasu (okres drgań badanego oscylatora wynosi 2π, a czas przebiegu po lowy okrȩgu wynosi π). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π. Przyk lad 7. Minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia 20
równowagi z dowoln a czȩstotliwości a drgań w lasnych ściana podstawowa amortyzator sprȩżynowy Maszyna M si la stabilizuj aca Uk lad o charakterze oscylatora idealnego jest opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1, gdzie a 1 jest wspó lczynnikiem amortyzatora sprȩżynowego. Dla celów analizy w lasności matematycznych modelu uk ladu użyteczna jest symetryzacja równań stanu uzyskiwana przez podstawienia ω = a 1, x 1 (t) := x 1 (t)/ω. Równania stanu oscylatora idealnego ze sterowaniem po symetryzacji przybieraj a postać ẋ 1 (t) = ωx 2 (t), ẋ 2 = ωx 1 (t) + u(t), t [0, t 1 ]. W tym przypadku macierze stanu, kostanu i sterowania można zapisać nastȩpuj aco: ( ) ( ) ( ) 0 ω A =, A T 0 ω 0 =, B = ω 0 ω 0 1 Równanie optymalnego kostanu λ(t) = A T λ T (t) 21
implikuje dla zmiennych sprzȩżonych równania λ 1 (t) = ωλ 2 (t), λ2 (t) = ωλ 1 (t). Uk lad ten można zredukować do pojedynczego równania drugiego rzȩdu z równaniem charakterystycznym λ 1 (t) = ω 2 λ 1 (t) r 2 = ω 2, r 1,2 = ±jω. Oznacza to, że zmienne sprzȩżone s a w tym przypadku okresowymi funkcjami czasu i w szczególności λ 2 (t) = αsin(ωt + β). Z równania optymalnego sterowania uzyskujemy K u (u(t)) = λ 2 (t). Wynika st ad, że przebieg sterowania minimalnoczasowego jest określony zależności a û(t) = sign(αsin(ωt + β)). Wnioski z równania sterowania minimalnoczasowego: Sterowanie minimalnoczasowe oscylatora idealnego przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π/ω jednostek czasu (okres drgań badanego oscylatora wynosi 2π/ω, a czas przebiegu po lowy okrȩgu wynosi π/ω). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π/ω, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π/ω. Liczba prze l aczeń sterowania minimalnoczasowego może nieograniczenie narastać wraz ze wzrostem czȩstotliwości sterowania. Kszta lt trajektorii stanu oscylatora idealnego ze sterowaniem û(t) = +1: ẋ 1 (t) = ωx 2 (t), ẋ 2 (t) = ωx 1 (t) + 1 22
ẍ 1 (t) = ω 2 x 1 (t) + ω x 1 (t) = 1/ω + c 1 cos ωt + (c 2 /ω)sin ωt, x 2 (t) = c 1 ωsin ωt + c 2 cos ωt x 10 = c 1 + 1/ω; x 20 = c 2 ω x 1 (t) = 1/ω + (x 10 1/ω)cos ωt + x 20 sin ωt, x 2 (t) = (x 10 1/ω)sin ωt + x 20 cos ωt ωx 1 (t) 1 = (ωx 10 1)cos ωt + ωx 20 sin ωt, ωx 2 (t) = (ωx 1 (t) 1)sin ωt + ωx 20 cos ωt. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (ωx 1 1) 2 + (ωx 2 ) 2 = (ωx 10 1) 2 + (ωx 20 ) 2. Stosuj ac analogiczne przekszta lcenia uzyskujemy dla sterowania u = 1 (ωx 1 + 1) 2 + (ωx 2 ) 2 = (ωx 10 1) 2 + (ωx 20 ) 2. Tak wiȩc trajektorie stanu oscylatora idealnego s a, we wspó lrzȩdnych (ωx 1, ωx 2 ), okrȩgami o środku (1, 0) dla sterowania û(t) = +1 i okrȩgami o środku ( 1, 0) dla sterowania û(t) = 1. Promień okrȩgu jest równy ρ = ((ωx10 1) 2 + (ωx 20 ) 2). 23
ωx 2 ωx 1 ωx 2 ωx 1 24
Przyk lad. Minimalnoczasowe sprowadzanie oscylatora z t lumieniem w lasnym do po lożenia równowagi. ściana podstawowa amortyzator sprȩżynowy Obiekt sterowania M si la stabilizuj aca t lumik Uk lad o charakterze oscylatora z t lumieniem w lasnym jest opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) 2ξx 2 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1, gdzie ξ (0, 1) jest wspó lczynnikiem t lumienia oscylatora. Dla celów analizy w lasności matematycznych modelu uk ladu dokonujemy symetryzacji równań stanu wprowadzaj ac nowe wspó lrzȩdne stanu za pomoc a przekszta lcenia ( x 1 x 2 ) = 1 0 1 ξ 2 1 ξ ξ 1 2 ( z 1 z 2 ) czyli ( z 1 z 2 ) = ( ) ( 1 ξ 2 0 ξ 1 x 1 x 2 ) 25
Równania stanu w nowych wspó lrzȩdnych przybior a postać ( ) ( ) ( ) ż 1 (t) 1 ξ 2 0 0 1 = ż 2 (t) ξ 1 1 2ξ 1 0 1 ξ 2 1 ξ ξ 1 2 ( ) z 1 (t) z 2 (t) ( ) + 0 1 u(t) czyli ( ) ( ) ( ) ( ) ż 1 (t) ξ 1 ξ 2 = ż 2 (t) z 1 (t) 0 + u(t). 1 ξ 2 ξ z 2 (t) 1 Zadanie minimalnoczasowego sterowania dla oscylatora z t lumieniem w lasnym w nowych wspó lrzȩdnych stanu przybierze postać: zminimalizować wskaźnik jakości G(z, u) = uwzglȩdniaj ac ograniczenia w postaci przekszta lconych równań stanu ż(t) = Az(t) + Bu(t), t [0, t 1 ], z(0) = z 0, z(t 1 ) = z 1 oraz w postaci maksymalnej dopuszczalnej amplitudy sterowania u(t) 1, t [0, t 1 ], gdzie ( ) ( ) ξ 1 ξ 2 A = 0, B = u(t). 1 ξ 2 ξ 1 Zapisujemy zmodyfikowany funkcjona l Lagrange a G(z, λ, u) = oraz równania Eulera-Lagrange a 0 0 dt ( 1 + λ T (t)(ż(t) Az(t) Bu(t)) + K(u(t)) ) dt λ(t) = A T λ(t), ż(t) = Az(t) + Bu(t), K u (u(t)) = λ T (t)b, gdzie ( A T ξ = 1 ξ 2 26 ) 1 ξ 2 ξ
Z równania optymalnego sterowania wynika, że û(t) = sign(λ 2 (t)). W zwi azku z tym analizujemy rozwi azanie równań sprzȩżonych przyjmuj acych w zapisie skalarnym postać λ 1 (t) = ξλ 1 (t) + 1 ξ 2 λ 2 (t), λ 2 (t) = 1 ξ 2 λ 1 (t) + ξλ 2 (t). Wyznaczamy rozwi azanie uk ladu równań sprzȩżonych jako uk ladu stacjonarnych jednorodnych równań różniczkowych λ 1 (t) = C 1 e ξt sin( 1 ξ 2 t + C 2, λ 2 (t) = C 1 e ξt cos( 1 ξ 2 t + C 2. Tak wiȩc sterowanie minimalnoczasowe określone jest przez znak funkcji typu cosαt (modulowanej przez eksponentȩ) û(t) = sign(c 1 e ξt cos( 1 ξ 2 t + C 2 ). Wynika st ad, że sterowanie minimalnoczasowe dla oscylatora z t lumieniem w lasnym przyjmuje wartości +1 lub -1 i zachowuje sta l awartość nie d lużej niż π 1 ξ 2 jednostek czasu. Aby określić krzyw a prze l aczeń sterowania minimalnoczasowego zapisujemy równania stanu dla u(t) = ±1: i ich rozwi azanie dla û = +1 ż 1 (t) = ξz 1 (t) + 1 ξ 2 z 2 (t), ż 2 (t) = ξz 1 (t) ξz 2 (t) ± 1. oraz dla û = 1 z 1 (t) = 1 ξ 2 + C 1 e ξt cos( 1 ξ 2 t + C 2 ), z 2 (t) = ξ C 1 e ξt sin( 1 ξ 2 t + C 2 ) z 1 (t) = 1 ξ 2 + C 1 e ξt cos( 1 ξ 2 t + C 2 ), 27
z 2 (t) = ξ C 1 e ξt sin( 1 ξ 2 t + C 2 ). Wprowadzaj ac wspó lrzȩdna biegunowe uzyskujemy dla û(t) = +1 ρ(t). = C 1 e ξt, ϕ(t). = 1 ξ 2 t C 2 z 1 (t) 1 ξ 2 = ρ(t)cos ϕ(t), z 2 (t) ξ = ρ(t)sin ϕ(t). Trajektoria stanu opisywana tymi równaniami jest spiral a logarytmiczn a o środku ( 1 ξ 2, ξ). Natomiast dla û(t) = 1 uzyskujemy z 1 (t) + 1 ξ 2 = ρ(t)cos ϕ(t), z 2 (t) + ξ = ρ(t)sin ϕ(t). Trajektoria stanu opisywana tymi równaniami jest spiral a logarytmiczn a o środku ( 1 ξ 2, ξ). Po lowa zwoju każdej ze wskazanych spirali odpowiada π 1 ξ jednostkom 2 czasu. Pierwsze dwa kawa lki krzywej prze l aczeń określone s a spiralami przechodz acymi przez pocz atek uk ladu wspó lrzȩdnych. Kolejne kawa lki krzywej prze l aczeń określane s a przez osi aganie tych pierwszych kawa lków za pomoc a po lowy zwoju spirali jako przebiegu trajektorii stanu uk ladu odpowiadaj acego π 1 ξ 2 jednostkom czasu. Każdemu stanowi pocz atkowemu po lożonemu nad krzyw a prze l aczeń odpowiada sterowanie optymalne û(t) = 1, a pod krzyw a - sterowanie optymalne û(t) = +1. 28