Metody rzutowania i funkcji barierowych dla problemów sterowania optymalnego

Podobne dokumenty
Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Sterowalność liniowych uk ladów sterowania

Metody kierunków poprawy dla nieliniowych problemów sterowania optymalnego

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka

POCHODNA KIERUNKOWA. DEFINICJA Jeśli istnieje granica lim. to granica ta nazywa siȩ pochodn a kierunkow a funkcji f(m) w kierunku osi l i oznaczamy

Niesimpleksowe metody rozwia zywania zadań PL. Seminarium Szkoleniowe Edyta Mrówka

Synteza optymalnego regulatora stanu. Uk lady z czasem ci ag lym.

Zasada optymalności Bellmana. Uogólniony optymalny regulator stanu.

Sterowanie minimalnoczasowe dla uk ladów liniowych. Krzywe prze l aczeń.

Funkcje wielu zmiennych

Liczby zespolone, liniowa zależność i bazy Javier de Lucas. a d b c. ad bc

Ekonomia matematyczna i dynamiczna optymalizacja

liniowych uk ladów sterowania

Wyk lad 14 Formy kwadratowe I

Elementy analizy funkcjonalnej PRZESTRZENIE LINIOWE

Stabilność liniowych uk ladów sterowania

Liniowe uk lady sterowania.

Funkcje wielu zmiennych

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

Równania różniczkowe cz astkowe rzȩdu pierwszego

ANALIZA II 15 marca 2014 Semestr letni. Ćwiczenie 1. Czy dan a funkcjȩ da siȩ dookreślić w punkcie (0, 0) tak, żeby otrzymana funkcja by la ci ag la?

Po wprowadzeniu zmiennych uzupe lniaj acych otrzymamy równoważny mu problem w postaci kanonicznej:

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Wyk lad 7 Baza i wymiar przestrzeni liniowej

y 1 y 2 = f 2 (t, y 1, y 2,..., y n )... y n = f n (t, y 1, y 2,..., y n ) f 1 (t, y 1, y 2,..., y n ) y = f(t, y),, f(t, y) =

Wprowadzenie do teorii sterowania

Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010

Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania

Metody Numeryczne Wykład 4 Wykład 5. Interpolacja wielomianowa

Pierwsze kolokwium z Matematyki I 4. listopada 2013 r. J. de Lucas

Sterowanie optymalne

Zestaw nr 7 Ekstremum funkcji jednej zmiennej. Punkty przegiȩcia wykresu. Asymptoty

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Cia la i wielomiany Javier de Lucas

Wprowadzenie do metod sterowania optymalnego

Asymptota pozioma: oṡ x, gdy y = 0 Asymptota pionowa: oṡ y, gdy x = 0. Hyperbola 1 x

PROGRAMOWANIE NIELINIOWE

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Funkcje wielu zmiennych

SZKO LA PODSTAWOWA HELIANTUS WARSZAWA ul. BAŻANCIA 16. Hyperbola 1 x FUNKCJE ELEMENTARNE WYMIERNE POTȨGOWE LOGARYTMICZNE.

Uogólnione modele uk ladów sterowania

P (x, y) + Q(x, y)y = 0. g lym w obszrze G R n+1. Funkcje. zania uk ladu (1) o wykresie przebiegaja

WYKŁAD 9 METODY ZMIENNEJ METRYKI

PROGRAMOWANIE KWADRATOWE

Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego

CHEMIA KWANTOWA MONIKA MUSIA L. Ćwiczenia. mm

KOLOKWIUM Z ALGEBRY I R

ci agi i szeregi funkcji Javier de Lucas Ćwiczenie 1. Zbadać zbieżność (punktow a i jednostajn a) ci agu funkcji nx 2 + x

Optymalizacja ciągła

Wprowadzenie z dynamicznej optymalizacji

Zadania do wykładu Jakościowa Teoria Równań Różniczkowych Zwyczajnych

W poszukiwaniu kszta ltów kulistych

Teoria miary WPPT IIr. semestr zimowy 2009 Wyk lady 6 i 7. Mierzalność w sensie Carathéodory ego Miara Lebesgue a na prostej

Zestaw nr 6 Pochodna funkcji jednej zmiennej. Styczna do krzywej. Elastyczność funkcji. Regu la de l Hospitala

Analiza dla informatyków 2 DANI LI2 Pawe l Domański szkicowe notatki do wyk ladu

Wyk lad 11 1 Wektory i wartości w lasne

Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej

Dyskretne modele populacji

LOGIKA ALGORYTMICZNA

Wprowadzenie do teorii sterowania. Procesy sterowania o parametrach skupionych.

edzi (local edge detectors) Lokalne operatory wykrywania kraw

Suma i przeciȩcie podprzestrzeni, przestrzeń ilorazowa Javier de Lucas

Metody systemowe i decyzyjne w informatyce

Pierwiastki arytmetyczne n a

Rys Mo liwe postacie funkcji w metodzie regula falsi

Programowanie liniowe

Metody numeryczne I Równania nieliniowe

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Seria zadań z Algebry IIR nr kwietnia 2017 r. i V 2 = B 2, B 4 R, gdzie

Rozdział 1 PROGRAMOWANIE LINIOWE

Niech X bȩdzie dowolnym zbiorem. Dobry porz adek to relacja P X X (bȩdziemy pisać x y zamiast x, y P ) o w lasnościach:

A. Kasperski, M. Kulej Badania Operacyjne- metoda sympleks 1

1 Metody rozwiązywania równań nieliniowych. Postawienie problemu

ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH

MATEMATYKA REPREZENTACJA LICZB W KOMPUTERZE

1 Przestrzenie unitarne i przestrzenie Hilberta.

KADD Minimalizacja funkcji

T O P O L O G I A WPPT I, sem. letni WYK LAD 8. Wroc law, 21 kwietnia D E F I N I C J E Niech (X, d) oznacza przestrzeń metryczn a.

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

Monika Musia l. METODA MIESZANIA KONFIGURACJI Configuration Interaction (CI) (ujȩcie wyznacznikowe)

Aproksymacja. funkcji: ,a 2. ,...,a m. - są funkcjami bazowymi m+1 wymiarowej podprzestrzeni liniowej X m+1

Normy wektorów i macierzy

Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera

Optymalizacja ciągła

Układy równań nieliniowych (wielowymiarowa metoda Newtona-Raphsona) f(x) = 0, gdzie. dla n=2 np.

Dyskretne modele populacji

Informacja o przestrzeniach Sobolewa

Wyk lad 4 Macierz odwrotna i twierdzenie Cramera

gdy wielomian p(x) jest podzielny bez reszty przez trójmian kwadratowy x rx q. W takim przypadku (5.10)

Wprowadzenie do teorii sterowania. Procesy o parametrach skupionych

Rozwiązywanie równań nieliniowych

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

0.1 Reprezentacja liczb w komputerze

FUNKCJE LICZBOWE. x 1

Zestaw zadań z Równań różniczkowych cząstkowych I 18/19

Wyk lad 12. (ii) najstarszy wspó lczynnik wielomianu f jest elementem odwracalnym w P. Dowód. Niech st(f) = n i niech a bedzie

Metody Rozmyte i Algorytmy Ewolucyjne

Transkrypt:

Metody rzutowania i funkcji barierowych dla problemów sterowania optymalnego Problem optymalnego sterowania procesem dynamicznym z ograniczeniami zasobowymi może polegać na polega na minimalizacji wskaźnika jakości obejmuj acego koszty realizacji procesu i wartość produktu użytecznego G(x, u) = z uwzglȩdnieniem t1 t 0 g(x(t), u(t), t)dt + h(x(t 1 )) równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [t 0, t 1 ], x(t 0 ) = x 0 ograniczeń chwilowych sterowania u(t) [u, u + ], t [t 0, t 1 ], oraz ograniczeń zasobowych sterowania w postaci równościowej lub nierównościowej t1 t 0 ϕ(u(t))dt = b, t1 t 0 ϕ(u(t))dt b, gdzie x W2 1 ([t 0, t 1 ]; R n ) jest trajektori a stanu procesu, u L 2 ([t 0, t 1 ]; R m ) jest jego sterowaniem, a g : R n R m R R, h : R n R, f : R n R m R R n, ϕ : R n R m R R q s a, ogólnie bior ac, funkcjami nieliniowymi. 1

Na podstawie standardowych twierdzeń o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym można uważać równanie stanu rozważanej klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Pozwala to zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości J(u). = t1 t 0 g(x(t, u), u(t), t)dt + h(x(t 1, u)) z uwzglȩdnieniem ograniczeń chwilowych i równościowych ograniczeń zasobowych sterowania u U. = {u L 2 ([t 0, t 1 ]; R m ) : u(t) [u, u + ] (t [t 0, t 1 ]), t1 t 0 ϕ(u(t))dt = b} lub ograniczeń chwilowych i nierównościowych ograniczeń zasobowych sterowania u U. = {u L 2 ([t 0, t 1 ]; R m ) : u(t) [u, u + ] (t [t 0, t 1 ]), t1 t 0 ϕ(u(t))dt b}. Praktyczna realizacja wielu algorytmów sterowania optymalnego zwi azana jest z dyskretyzacj a sterowania. Zastosowanie znajduje tu przede wszystkim baza funkcji schodkowych (t 0 = 0, t 1 = 1) u(t, u) = e k(t)u k, gdzie u k R m and { 1 if t [k/k, (k + 1)/K), e k (t) = 0 if t / [k/k, (k + 1)/K). Wyznaczamy rozwi azanie równania stanu ze sterowaniem dyskretnym ẋ(t) = f(x(t), u(t, u), t), t [0, 1], x(0) = x 0 oraz równanie sprzȩżone ze sterowaniem dyskretnym η(t) = fx T (x(t), u(t, u), t)η(t) + gx T (x(t), u(t, u), t), t [0, 1], η(1) = h T x (x(1)), a nastȩpnie określamy funkcjȩ Hamiltona dla przypadku sterowania zdyskretyzowanego H u (x(t), u(t, u), t) = g(x(t), u(t, u), t) + η(t) T f(x(t), u(t, u), t). 2

Gradient wskaźnika jakości zredukowanego do przestrzeni funkcji schodkowych uzyskuje siȩ w postaci zdyskretyzowanej gdzie J uk (u) = (k+1)δ kδ J u (u) = (J uk (u)), H u (x(t), u(t, u), t)dt, δ. = 1/K, k = 0, 1,..., K 1. Metoda rzutowania gradientu w przestrzeni sterowania Funkcja wypuk la: Za lożenie: sk ladowe funkcji ograniczeń zasobowych ϕ p (u(t)), s a funkcjami wypuk lymi wzglȩdem u(t) w przedziale [u, u + ] tj. p = 1, 2,..., q ϕ p (αu(t) + (1 α)ũ(t)) αϕ p (u(t)) + (1 α)ϕ p (ũ(t)), α [0, 1] gdzie u(t) i ũ(t) s a sterowaniami z przedzia lu [u, u + ]. Warunkiem koniecznym i wystarczaj acym wypuk lości funkcji dwukrotnie różniczkowalnych jest nieujemność drugiej pochodnej funkcji w danym obszarze. Tak wiȩc funkcje ϕ 1 (u(t)) =. u 1 (t), ϕ 2 (u(t)) =. u 2 (t) s a wypuk le w każdym nieujemnym przedziale. Wypuk lość funkcji ϕ p poci aga za sob a wypuk lość zbioru sterowań dopuszczalnych. Do optymalizacji sterowania można zastosować metodȩ rzutowania gradientu w przestrzeni sterowań ( u κ+1 = P U u κ γ κ Ju T (u κ ) ), κ = 0, 1, 2,..., gdzie u κ jest sterowaniem na κ-tej iteracji algorytmu, γ + jest d lugości a kroku w kierunku antygradientu, a P U (ũ κ ) =. argmin{ u ũ κ : u U} jest rzutem ortogonalnym antygradientowej modyfikacji sterowania ũ κ. = u κ γ κ Ju T (u κ ) 3

na zbiór sterowań dopuszczalnych. W przypadku stosowania schodkowej dyskretyzacji sterowania zbiór dyskretnych sterowań dopuszczalnych z ograniczeniami chwilowymi i równościowymi ograniczeniami zasobowymi przybiera postać U K. = { {uk } : u k [u, u + ], k = 0, 1,..., K 1; ϕ(u k )/K = b }, zaś zbiór dyskretnych sterowań dopuszczalnych z ograniczeniami chwilowymi i nierównościowymi ograniczeniami zasobowymi przybiera postać U K. = { {uk } : u k [u, u + ], k = 0, 1,..., K 1; ϕ(u k )/K b }. Określenie rzutu ortogonalnego sterowania dyskretnego {ũ k } na zbiór U K jest równoważne z minimalizacj a kwadratu odleg lości euklidesowej od wypuk lego zbioru U K. min u k U K (u k ũ k ) 2 /K, Wkomponowanie ograniczenia zasobowego do funkcji celu za pomoc a mnożnika Lagrange a λ pozwala przekszta lcić powyższy problem do postaci minimalizacji zmodyfikowanej funkcji celu (u k ũ k ) 2 /K + λ( ϕ(u k )/K b) z uwzglȩdnieniem ograniczeń chwilowych sterowania dyskretnego u k [u, u + ], k = 0, 1, 2,..., K 1. Jeśli uznać mnożnik λ za ustalony parametr, to ostatni problem można zapisać w postaci równoważnej: zminimalizować na zbiorze ( (uk ũ k ) 2 + λϕ(u k ) ) u k [u, u + ], k = 0, 1, 2,..., K 1. Dla liniowej funkcji ϕ(u(t)) = u(t) stosowanej np. do określenia sumaryczego zużycia substratu 1 u(t)dt uzyskuje siȩ 0 ( (uk ũ k ) 2 + λu k ) 4

na zbiorze u k [u, u + ], k = 0, 1, 2,..., K 1. Optymalne rozwi azanie wyznaczone jest przez obliczenie punktu zerowego pochodnej sk ladowych funkcji celu i obciȩcie tego punktu do przedzia lu dopuszczalnych wartości sterowania [u, u + ] tj. 2(u k ũ k ) + λ = 0, u k = ũ k λ/2, u k = sat(ũ k λ/2, u, u + ), gdzie funkcja sat jest zdefiniowana jak nastȩpuje x gdy x [y, z] sat(x, y, z) = y gdy x < y z gdy x > z Mnożnik λ obliczany jest jako rozwi azanie równania zasobowego ψ(λ) = b, ψ(λ). = sat(ũ k λ/2, u, u + )/K. Jeśli ˆλ 0 jest rozwi azaniem powyższego równania, to rzut ortogonalny antygradientowej modyfikacji sterowania dyskretnego na zbiór U K daje siȩ określić w postaci P UK (ũ k ) = {sat(ũ k ˆλ/2, u, u + )}. Dla kwadratowej funkcji ϕ(u(t)) = u 2 (t) stosowanej np. do określenia sumaryczego zużycia energii 1 0 u2 (t)dt uzyskuje siȩ zadanie z mnożnikiem λ: zminimalizować na zbiorze ( (uk ũ k ) 2 + λu 2 k) u k [u, u + ], k = 0, 1, 2,..., K 1. W tym przypadku wygodnie jest przekszta lcić minimalizowan a funkcjȩ do postaci ( (1 + λ)u 2 k 2u k ũ k ) ) Optymalne rozwi azanie wyznaczone jest przez obliczenie punktu zerowego pochodnej sk ladowych funkcji celu i obciȩcie tego punktu do przedzia lu dopuszczalnych wartości sterowania [u, u + ] tj. 2(1 + λ)(u k 2ũ k ) = 0, u k = ũ k /(1 + λ), u k = sat(ũ k /(1 + λ), u, u + ), 5

gdzie funkcja sat jest zdefiniowana jak nastȩpuje x gdy x [y, z] sat(x, y, z) = y gdy x < y z gdy x > z Mnożnik λ obliczany jest jako rozwi azanie równania zasobowego ψ(λ) = b, ψ(λ). = sat 2 (ũ k /(1 + λ), u, u + )/K. Jeśli ˆλ 0 jest rozwi azaniem powyższego równania, to rzut ortogonalny antygradientowej modyfikacji sterowania dyskretnego na zbiór U K daje siȩ określić w postaci P UK (ũ k ) = {sat(ũ k /(1 + λ), u, u + )}. Dla równościowych ograniczeń zasobowych mnożnik λ jest nieograniczonego znaku. W przypadku nierównościowych ograniczeń zasobowych należy wyznaczyć nieujemny mnożnik λ 0 jako rozwi azanie nierówności zasobowej ψ(λ) b, ψ(λ). = sat(ũ k λ/2, u, u + )/K jeśli ϕ(t) = u(t) (ograniczenie surowcowe) i jako rozwi azanie nierówności zasobowej ψ(λ) b, ψ(λ). = jeśli ϕ(t) = u 2 (t) (ograniczenie energetyczne). sat 2 (ũ k /(1 + λ), u, u + )/K 6

Algorytm rzutowania gradientu dla problemów sterowania optymalnego z ograniczeniami zasobowymi Etap wstȩpny. Wybierz wymiar bazy schodkowej sterowania K i dyskretne sterowanie pocz atkowe (wspó lczynniki bazy schodkowej) u =. {u k } i dok ladność obliczeń ɛ. Etap pierwszy. Wyznacz rozwi azanie równania stanu ze sterowaniem dyskretnym ẋ(t) = f(x(t), u(t, u), t), t [0, 1], x(0) = x 0 oraz równanie sprzȩżone ze sterowaniem dyskretnym η(t) = f T x (x(t), u(t, u), t)η(t) + g T x (x(t), u(t, u), t), t [0, 1], η(1) = h T x (x(1)). Etap drugi. Oblicz gradient zredukowanego wskaźnika jakości (k+1)δ J uk (u) = H u (η(t), x(t), u(t, u), t)dt, δ = 1/K, k = 0, 1,..., K 1, kδ i podstaw startow a d lugość kroku γ. Etap trzeci. Wyznacz rzut ortogonalny sterowania antygradientowego na l aczne ograniczenia chwilowe zasobowe sterowania P U (u γj u (u)) = {sat(u γj u (u)) + λ/2, u, u + )} rozwi azuj ac równanie krzywej zasobowej ψ(λ) = 0 wzglȩdem λ sat(u γj u (u)) + λ/2, u, u + )/K = b. Etap czwarty. Jeśli J(P U (u γj u (u))) < J(u), to podstaw u := u γj u (u). W przeciwnym przypadku podstaw γ := γ/2 i wróć do etapu 3. Etap pi aty. Jeśli u P U (u J u (u) < ɛ, to stop. W przeciwnym razie wróć do etapu pierwszego. 7

Zbieżność metody rzutowania gradientu. Gradient zredukowanego wskaźnika jakości może mieć postać wierszow a J u (u) =. (J u1 (u), J u2 (u),..., J um (u)) lub kolumnow a J (u) =. Ju T (u). Lemat. Jeśli gradient J (u) zredukowanego wskaźnika jakości spe lnia na zbiorze wypuk lym U warunek Lipschitza ze sta l a L 0 J (u) J (v) L u v, u, v U, to zachodzi nierówność J(u) J(v) J, u v L u v 2 dla dowolnych u, v U. Dowód. Na podstawie rozwiniȩcia funkcji J(u) w szereg Taylora pierwszego rzȩdu można napisać, że J(u) J(v) J (v), u v = 1 Z warunku Lipschitza dla gradientu J (u) uzyskuje siȩ J(u) J(v) J (v), u v 1 0 1 J (v + t(u v)) J (v) u v dt 0 0 0 J (v + t(u v)) J (v), u v dt. J (v + t(u v)) J (v), u v dt 1 L u v 2 tdt = L u v 2. Twierdzenie. Jeśli zredukowany wskaźnik jakości J(u) spe lnia na zwartym wypuk lym zbiorze U warunek Lipschitza, to ci ag sterowań u κ określony za pomoc a metody rzutowania gradientu u κ+1 = P U (u κ γ k J (u κ )), γ κ [ɛ 0, 2/(L + 2ɛ 1 )], ɛ 1, ɛ 2 > 0, κ = 0, 1, 2,... jest zbieżny do sterowania u spe lniaj acego warunek optymalności na zbiorze U J (u ), u u 0 u U. 8

Metoda funkcji barierowych dla problemów sterowania optymalnego z ograniczeniami chwilowymi stanu Problem optymalnego sterowania procesem dynamicznym z chwilowymi ograniczeniami stanu może polegać na minimalizacji kombinowanego wskaźnika jakości G(x, u) = z uwzglȩdnieniem τ 0 g(x(t), u(t), t)dt + h(x(τ)) równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [0, τ], x(0) = x 0 ograniczeń chwilowych niektórych wspó lrzȩdnych stanu h(x(t)) 0, t [0, τ], oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [0, τ], gdzie [0, τ] jest przedzia lem czasowym sterowania, x W ([0, 1 τ]; R n ) jest trajektori a stanu procesu, u L ([0, τ]; R m ) jest jego sterowaniem, a g : R n R m R R, f : R n R m R R n, h : R n R, h : R n R p, s a, ogólnie bior ac, funkcjami nieliniowymi. Standardowe twierdzenia o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym pozwalaj a uważać równanie stanu rozważanej klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Na tej podstawie można zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości J(u) =. z uwzglȩdnieniem τ 0 g(x(t, u), u(t), t)dt + h(x(τ, u)) 9

nierównościowych ograniczeń nieliniowych stanu chwilowego oraz ograniczeń chwilowych sterowania h(x(t, u)) 0, t [0, τ] u(t) [u, u + ], t [0, τ]. Te ostatnie ograniczenia mog a nie być w l aczone w sposób jawny do sformu lowania niektórych problemów jeśli minimalizacja wskaźnika jakości automatycznie ogranicza amplitudȩ sterowania. Aby zastosować algorytmy optymalizacji skończenie wymiarowej do rozważanego problemu celowo jest wprowadzić dwie, ogólnie bior ac, różne dyskretyzacje przedzia lu sterowania.. Dyskretyzacja t k = kτ/k1, k = 0, 1,..., k 1 1 zwi azana jest z dyskretyzacj a schodkow a sterowania u(t, u) = k 1 1 e k(t)u k.. Natomiast dyskretyzacja t k = kτ/k2, k = 0, 1,..., k 2 zwi azana jest ze skończenie wymiarow a aproksymacj a ograniczeń chwilowych stanu h k (u) 0, k = 1,..., k 2, gdzie h k (u). = h( t k, u)). Ogólnie bior ac k 1 k 2. Duża liczba k 2 punktów aproksymacji ograniczeń stanu chwilowego może zapewnić dobr a reprezentacjȩ ograniczeń trajektorii stanu h(x(t, u)) 0 w ca lym przdziale sterowania [0, τ]. Dwuskalowa dyskretyzacja sprowadza rozpatrywany problem do zadania optymalizacji skończenie-wymiarowej typu: zminimalizować zredukowany wskaźnik jakości przy ograniczeniach J(u). = τ 0 g(x(t, u), u(t, u), t)dt + h(x(τ, u)) h k (u) 0, k = 1, 2,..., k 2, u k [u, u + ], k = 0, 1,..., k 1 1. Przyk lad: Proces produkcyjny prowadzony w zbiornikowym reaktorze chemicznym polega na przemianie surowca A w produkt użyteczny B w rezultacie odwracalnej reakcji egzotermicznej wydzielaj acej energiȩ ciepln a. W charakterze 10

zmiennych stanu i zmiennych steruj acych wyróżnione s a nastȩpuj ace wielkości: x 1 (t) - stȩżenie A w reaktorze w chwili t, x 2 (t) - temperatura w reaktorze w chwili t, u 1 (t) - natȩżenie dop lywu katalizatora do reaktora oraz u 2 (t) - natȩżenie dop lywu czynnika ch lodz acego do tego reaktora. Równania stanu procesu maj a postać ẋ 1 (t) = a 1 u 1 (t)x 2 1(t)e b 1/x 2 (t) + a 2 x 1 (t)e b 2/x 2 (t), t [0, 1], x 1 (0) = x 10, ẋ 2 (t) = a 3 u 1 (t)x 2 1(t)e b 1/x 2 (t) a 4 u 2 (t), t [0, 1], x 2 (0) = x 20, gdzie przyjȩto jednostkowy przedzia l czasowy sterowania. Należy zminimalizować zawartość surowca w chwili końcowej procesu (tj. zmaksymalizować zawartość produktu użytecznego w chwili końcowej procesu) J(u) =. x 1 (1) z uwzglȩdnieniem ograniczenia temperatury chwilowej w reaktorze w przedziale sterowania x 2 (t) x 2, t [0, 1] oraz ograniczeń chwilowych sterowania u j (t) [u j, u+ j ], t [0, 1]. Redukcja problemu do przestrzeni sterowania i jego dyskretyzacja pozwalaj a zapisać go w postaci zadania optymalizacji: zminimalizować wskaźnik jakości J(u) = x 1 (1, u) przy ograniczeniach x 2 ( t k, u) x 2, k = 1, 2,..., k 2, u jk [u j, u+ j ], j = 1, 2; k = 0, 1,..., k 1 1. Zastosowanie metody przesuwanej funkcji kary do wyznaczania optymalnego rozwi azania powyższego zadania jest utrudnione ze wzglȩdu na konieczność wykonania znacznej liczby przesuniȩć tej funkcji w powi azaniu z obliczeniem naruszenia kolejnych ograniczeń. Lepsze rezultaty można uzyskać za pomoc a metody funkcji barierowych, które odpychaj a obliczane sterowania od brzegu obszaru dopuszczalnego. Dla opisu tej metody celowo jest przeformu lować zadania rozważanego typu do postaci: zminimalizować zredukowany wskaźnik jakości J(u) 11

przy ograniczeniach h k (u) 0, k = 1, 2,..., k 2, u U, gdzie nieliniowe ograniczenia nierównościowe s a zapisane w postaci wiȩksze niż zero lub równe zeru h k (u) 0, k = 1, 2,..., k 2, h k (u) =. h k (u), a U jest zbiorem ograniczeń zakresu zmiennych steruj acych U =. {u R m : u k [u, u + ], k = 0, 1,..., k 1 1, m =. mk 1 }. W przypadku braku jawnych ograniczeń zakresu zmiennych steruj acych uwzglȩdnianych pośrednio przez wskaźnik jakości problem obejmuje jedynie nieliniowe ograniczenia nierównościowe: zminimalizować J(u) przy ograniczeniach h k (u) 0, k = 1, 2,..., k 2. W rezultacie zastosowania różnych funkcji barierowych uzyskuje siȩ zadanie optymalizacji bez ograniczeń. W metodzie funkcji barierowych Carolla minimalizowana jest zastȩpcza funkcja celu postaci Φ(u, ρ) =. min u R m{j(u) + ρ 1 k 1 k=1 h 1 k (u)}, gdzie ρ > 0 jest wspó lczynnikiem funkcji barierowej (ρ + ), zaś jest funkcj a barierow a Carolla. h 1 k (u) Funkcja ta tworz ac barierȩ na brzegu obszaru dopuszczalnego wprowadza też dodatni sk ladnik w ca lym obszarze dopuszczalnym. Może to powodować nadmierne przesuwanie optymalizowanego sterowania do wnȩtrza obszaru dopuszczalnego. W metodzie funkcji barierowych Frischa minimalizowana jest zastȩpcza funkcja celu postaci Φ(u, ρ) =. min u R m{j(u) ρ 1 12 k 1 k=1 ln(h k (u))},

gdzie ρ > 0 jest wspó lczynnikiem funkcji barierowej, zaś ln(h k (u)) jest funkcj a barierow a Frischa (logarytmiczn a funkcj a barierow a). Funkcja ta tworz ac barierȩ na brzegu obszaru dopuszczalnego wprowadza dodatni sk ladnik tylko w pewnej strefie przygranicznej obszaru dopuszczalnego. Funkcja ta w mniejszym stopniu odpycha optymalizowane sterowania od brzegu obszaru dopuszczalnego. Wskazane funkcje barierowe nie pozwalaj a wyznaczyć optymalnych sterowań przyjmuj acych wartości z brzegu obszaru dopuszczalnego, a optymalne sterowania przyjmuj ace wartości z wnȩtrza obszaru dopuszczalnego mog a być wyznaczone dok ladnie jedynie przy wspó lczynniku funkcji barierowej d aż acym do nieskończoności. Aby unikn ać tych wad klasycznych funkcji barierowych zaproponowano różne ich modyfikacje. Metoda zmodyfikowanych funkcji barierowych dla problemów sterowania optymalnego z ograniczeniami chwilowymi stanu W metodzie zmodyfikowanych logarytmicznych funkcji barierowych stosowane jest przesuniȩcie tej funkcji, tak aby mog l ona dopuszczać rozwi azania brzegowe Φ(u, ρ) =. min u R m{j(u) ρ 1 k 1 k=1 ln(ρh k (u) + 1)}. W metodzie zmodyfikowanych mnożnikowych logarytmicznych funkcji barierowych minimalizowana jest zastȩpcza funkcja celu postaci Ψ(u, λ, ρ) =. min u R m{j(u) ρ 1 k 1 k=1 λ T ln(ρh k (u) + 1)}, gdzie ρ > 0 jest wspó lczynnikiem funkcji barierowej, λ R p jest mnożnikiem Lagrange a, zaś ρ 1 ln(ρh k (u) + 1)) jest zmodyfikowan a logarytmiczn a funkcj a barierow a. 13

Ta ostatnia metoda umożliwia wyznaczenie optymalnych sterowań zarówno z brzegu jak i z wnȩtrza obszaru dopuszczalnego przy skończonej wartości wspó lczynnika funkcji barierowej. Niech L(u, λ) =. k 1 J(u) λ T k h k bȩdzie funkcj a Lagrange a problemu wyjściowego i niech û bȩdzie jego lokalnym minimum. Za lóżmy, że minimum to spe lnia standardowe warunki wystarczaj ace optymalności rzȩdu drugiego tj. gradienty h k(u) ograniczeń aktywnych h k (u) = 0, k K s a liniowo niezależne, co oznacza, że istniej a jednoznacznie określone mnożniki Lagrange a ˆλ k, k = 1, 2,..., k 1 zwi azane z danym minimum, hesjan L uu funkcji Lagrange a w punkcie (û, ˆλ) jest dodatnio określony na podprzestrzeni stycznej do zbioru rozwi azań dopuszczalnych v T L uu v > 0, v T h k (û), k K, k=1 zachodz a warunki ścis lej komplementarności λ T k h k (u) = 0, k = 0, 1,..., k 1, λ k > 0, k K. Jeśli s a spe lnione powyższe za lożenia, to można udowodnić, że zmodyfikowana logarytmiczna funkcja barierowa posiada w pewnym otoczeniu minimum dodatnio określony hesjan (jest ściśle wypuk la w pewnym otoczeniu minimum) Ψ uu (û, ˆλ, ρ) > 0. Hesjan ten jest w zwi azku z tym odwracalny i można zastosować metodȩ Newtona do minimalizacji funkcji bez ograniczeń u κ+1 = u κ γψ 1 uu (û, ˆλ, ρ)ψ u (û, ˆλ, ρ). Można udowodnić, że przeliczanie mnożników Lagrange a wed lug wzoru λ κ+1 k = λ κ k/(ρh k (û) + 1) zapewnia ich zbieżność do mnożników optymalnych. 14

Optymalizacja procesów w przestrzeni stanu i sterowania Metoda punktu wewnȩtrznego Dla szerokiej klasy problemów optymalnego sterowania celowo jest traktować l acznie zmienne stanu i zmienne steruj ace jako niezależne zmienne decyzyjne. Równania stanu nie s a rozwik lywane lecz s a traktowane jako ograniczenia równościowe. Liczba zmiennych decyzyjnych ulega w ten sposób zwiȩkszeniu, jednak u latwia to wkomponowanie różnorodnych ograniczeń stanu i sterowania do algorytmów optymalizacji. Rozwik lywanie równania stanu jest użyteczne dla problemów o niewielkiej wymiarowości stanu i wielomianowych modelach procesu. W innych przypadkach (znaczna liczba zmiennych stanu, eksponencjalne zależności w modelach procesu) wymagane s a czasoch lonne procedury rozwi azywania równań stanu. S a też klasy równań stanu, które nie s a rozwik lywalne wzglȩdem stanu w funkcji sterowania takie jak równania z uwik lan a pochodn a lub równania statycznych procesów sterowania. Optymalizacja w przestrzeni stanu i sterowania umożliwia bezpośrednie obliczanie pochodnych pierwszego i drugiego rzȩdu wzglȩdem ca lego zestawu zmiennych decyzyjnych, co pozwala stosować zaawansowane algorytmy optymalizacji wyznaczaj ace rozwi azanie warunków koniecznych optymalności problemu. Nawi azuj ac w tym kontekście do optymalizacji nieliniowych statycznych problemów optymalizacji rozważymy proces optymalizacji egzotermicznej przemiany surowca A w produkt użyteczny B zachodz acy w reaktorze zbiornikowym. Za lożymy, że temperatura w reaktorze jest bezpośrednio wymuszana za pomoc a p laszcza grzejnego i silnego źród la ciep la. Niech x oznacza stȩżenie surowca A w reaktorze, zaś u temperaturȩ wymuszan a w nim. Wskaźnik jakości procesu jest równoważny z maksymalizacj a ilości produktu użytecznego B z uwzglȩdnieniem kosztów nagrzewania tj. należy zminimalizować x + cu przy ograniczeniach w postaci statycznego równania stanu 0 = 1 x ae b 1/(b 2 +u) x 2 /(1 + x 2 ) oraz w postaci wymagania nieujemności zmiennych x 0, u 0. 15

Postać równania stanu utrudnia jego rozwik lywanie, wiȩc stosujemy optymalizacjȩ procesu w przestrzeni stanu i sterowania tj. traktujemy l acznie (x, u) jako wektor zmiennych decyzyjnych. Niech przebieg temperatury bȩdzie wymuszany pośrednio za pomoc a obwodu grzejnego i niech temperatura bȩdzie drug a zmienn a stanu. Wskaźnik jakości procesu jest równoważny z maksymalizacj a ilości produktu użytecznego B z uwzglȩdnieniem kosztów nagrzewania tj. należy zminimalizować x 1 + cu przy statycznych równaniach stanu obejmuj acych bilans masy dla surowca A i bilans energii cieplnej w obiekcie 0 = 1 x 1 a 1 x 2 1e b 1/(b 2 +x 2 ), 0 = a 2 x 2 1e b 1/(b 2 +x 2 ) + u a 3 + u (b 3 x 2 ) + b 4 x 2, oraz przy wymaganiu nieujemności zmiennych procesowych x 1 0, x 2 0, u 0. Wartości zmiennych procesowych s a ograniczone od góry przez minimalizacjȩ wskaźnika jakości (jeśli chodzi o zmienne x 1 i u) oraz przez endotermiczny charakter procesu (jeśli chodzi o x 2 ). Dla celów optymalizacji w przestrzeni stanu i sterowania definiujemy now a zmienn a procesow a z = (z 1, z 2, z 3 ) T, gdzie z 1 = x 1, z 2 = x 2, z 3 = u. Problem przybiera postać: zminimalizować funkcjȩ przy ograniczeniach lub w skrócie z 1 + cz 2 0 = 1 z 1 a 1 z 2 1e b 1/(b 2 +z 2 ), 0 = a 2 z 2 1e b 1/(b 2 +z 2 ) + z 3 a 3 + z 3 (b 3 z 2 ) + b 4 z 2, z 1 0, z 2 0, z 3 0, min z Rp{ g(z) : f(z) = 0, z 0}, ( ) 16

gdzie p = n + m jest l aczn a liczb a zmiennych procesowych, a g(z). = z 1 + cz 2, f(z). = {1 z 1 a 1 z 2 1e b 1/(b 2 +z 2 ), a 2 z 2 1e b 1/(b 2 +z 2 ) + z 3 a 3 + z 3 (b 3 z 2 ) + b 4 z 2 } T. Każdy problem z ograniczeniami nierównościowymi ogólnej postaci ϕ(z) 0 można sprowadzić do postaci równościowej stosuj ac nieujemn a zmienn a dope lniaj ac a s ϕ(z) + s = 0, s 0. Odwrotnie każde równanie ϕ(z) = 0 można zast apić równoważnym uk ladem dwóch nierówności Problem min z Rp{ g(z) : ϕ(z) 0, ϕ(z) 0. f(z) = 0, z 0}, ( ) nazywamy problemem optymalizacji w postaci standardowej. Sprowadzamy go do problemu barierowego p min z R p{ g(z) µ ln(z i ) : i=1 f(z) = 0, }, ( ), gdzie dla ograniczeń nieujemności zmiennych zastosowano logarytmiczn a funkcjȩ barierow a. Zak ladamy, że ograniczenia równościowe spe lniaj a warunek regularności dla lokalnego minimum ẑ rank(f (ẑ)) = n, co oznacza, że rz ad macierzy Jacobiego jest równy licznbie ograniczeń aktywnych (gradienty ograniczeń aktywnych s a liniowo niezależne). Zapisujemy funkcjȩ Lagrange a problemu standardowego L(z, λ). = g(z) λ T f(z) 17

i funkcjȩ Lagrange a problemu barierowego L(z, λ, µ) =. n g(z) µ ln(z i ) λ T f(z), gdzie λ R n jest mnożnikiem Lagrange a dla ograniczeń równościowych. i=1 Formu lujemy warunki optymalności problemu barierowego pierwszego rzȩdu L z(z, λ, µ) = 0, L λ (z, λ, µ) = 0 tj. g (z) µz 1 e λ T f (z) = 0, f(z) = 0, gdzie Z 1. = diag(z1, z 2,..., z p ), e. = (1, 1,..., 1) T R p. Stosujemy podstawienie v = µz 1 e, które określa tzw. dualne zmienne barierowe. Podstawienie to można zapisać w postaci równoważnej ZV e = µe, gdzie V. = diag(v 1, v 2,..., v p ). rzȩdu Uzyskujemy w ten sposób now a postać warunków optymalności pierwszego g (z) v λ T f (z) = 0, f(z) = 0, ZV e µe = 0. Powyższy nieliniowy uk lad równań jest rozwi azywany metod a Newtona. Celem jej zastosowania określamy macierz Jacobiego uk ladu i uk lad równań zlinearyzowanych Newtona. L zz(z, λ) f (z) T I δz g (z) v λ T f (z) f (z) 0 0 δλ = f(z) V 0 Z δv V Ze µe Wektor (δz, δλ, δv) T wyznacza kierunek Newtona dla rozwi azywania uk ladu warunków koniecznych optymalności problemu barierowego. Rozwi azanie wyznaczamy iteracyjnie dobieraj ac krok σ w kierunku Newtona z := z + σδz, λ := λ + σδλ, v := v + σδv. D lugość kroku dobieramy minimalizuj ac zmodyfikowan a funkcjȩ Lagrange a wzglȩdem tej d lugości i zachowuj acograniczenie z 0 (st ad nazwa metoda ścieżki centralnej) L(z + σz). = g(z + σz) µ p ln((z i + σz i ) 1 ) λ T f(z + σz) + ρ f(z + σz). i=1 18

W charakterze kryterium stopu przyjmujemy stopień naruszenia warunków optymalności ɛ g (z) v λ T f (z) + f(z) + V Ze µe < ɛ. Problemy optymalizacji w przestrzeni stanu i sterowania z ograniczeniami postaci innej niż standardowa mog a być sprowadzone do tej postaci za pomoc a dodatkowych zmiennych dope lniaj acych np. ograniczenia nierównościowe ϕ(z) 0 sprowadzamy do postaci równościowej ϕ(z) + s = 0, s 0, gdzie s jest nieujemn a zmienn a dope lniaj ac a. Do postaci standardowej umożliwiaj acej zastosowanie metody punktu wewnȩtrznego sprowadzane s a także problemy optymalizacji dynamicznej w przestrzeni stanu i sterowania. Pe lna dok ladna dyskretyzacja równań stanu dla uk ladów o parametrach skupionych prowadzi do problemów aproksymuj acych z tysi acami zmiennych i ograniczeń, zaś dla uk ladów o parametrach roz lożonych - do problemów z setkami tysiȩcy zmiennych i ograniczeń. Mimo tego wysoka efektywność wspó lczesnych komputerów w powi azaniu z zaawansowanymi technikami dekompozycji macierzy pozwalaj a stosować metodȩ punktu wewnȩtrznego dla problemów o tak dużym stopniu z lożoności. Niech problem sterowania optymalnego dla uk ladu o parametrach skupionych ma postać: zminimalizować wskaźnik jakości 1 0 g(x(t), u(t))dt + h(x(1)) uwzglȩdniaj ac ograniczenia ẋ(t) = f(x(t), u(t)), t [0, 1], x(0) = x 0, x x(t) x +, u u(t) u +, t [0, 1]. Jeśli zast apić pochodn a prawostronnym ilorazem różnicowym, to aproksymacja (jednokrokowa) problemu przybierze postać k 1 g(x k, u k )/ k + h(x k), 19

x k+1 x k = δ k f(x k, u k ), k = 0, 1,..., k 1, x 0 = x 0, x i x k x + i, k = 1, 2,..., k, u i u k u + i, k = 0, 1,..., k 1,.. gdzie x k = x(k/ k) jest zdyskretyzowanym sterowaniem, uk = u(k/ k) jest zdyskretyzowanym sterowaniem, a δ k jest krokiem dyskretyzacji. Dyskretyzacja taka zapewnia możliwość bezpoŕedniego obliczania pochodnych pierwszego i drugiego rzȩdu funkcji celu i warunków ograniczaj acych. Jeśli zast apić pochodn a symetrycznym ilorazem różnicowym, to aproksymacja (dwukrokowa) problemu przybierze postać k 1 g(x k, u k )/ k + h(x k), x k+1 x k 1 = 2δ k f(x k, u k ), k = 0, 1,..., k 1, x 0 = x 0, x 1 = x 0 + 2δ 0 f(x 0, u 0 ), x i x k x + i, k = 1, 2,..., k, u i u k u + i, k = 0, 1,..., k 1. W powyższych przyk ladach zastosowano stosunkowo ma lo dok ladn a jawn a aproksymacjȩ równań stanu. Dok ladniejsze wyniki można uzyskać stosuj ac niejawn a aproksymacjȩ tych równań. Jeśli do aproksymacji równań stanu zastosować wzór trapezów, to niejawna dyskretyzacja problemu przybierze postać k 1 g(x k, u k )/ k + h(x k), x k+1 x k 1 = 0.5δ k (f(x k, u k ) f(x k+1, u k+1 ), k = 0, 1,..., k 1, x 0 = x 0, x 1 = x 0 + 2δ 0 f(x 0, u 0 ), x i x k x + i, k = 1, 2,..., k, u i u k u + i, k = 0, 1,..., k 1. Jeśli do aproksymacji równań stanu zastosować wzór punktu środkowego, to niejawna dyskretyzacja problemu przybierze postać k 1 g(x k, u k )/ k + h(x k), x k+1 x k = δ k (f(x k, u k ) + f(x k+1, u k+1 ), k = 0, 1,..., k 1, x 0 = x 0, x 1 = x 0 + 2δ 0 f(x 0, u 0 ), x i x k x + i, k = 1, 2,..., k, u i u k u + i, k = 0, 1,..., k 1. 20

W uk ladach sterowania procesami o parametrach roz lożonych wyróżniamy zmienn a czasow a t [t 0, t 1 ] i zmienn a przestrzenn a s [0, 1]. Zmienne procesowe s a funkcjami, ogólnie bior ac, zmiennej czasowej i zmiennej przestrzennej: x(t, s) - stan procesu, x t (t, s) - pochodna cz astkowa stanu wzglȩdem zmiennej czasowej, x s (t, s) - pochodna cz astkowa stanu wzglȩdem zmiennej przestrzennej, x ss (t, s) - druga pochodna cz astkowa stanu wzglȩdem zmiennej przestrzennej. Problem optymalnego transferu ciep la może polegać na minimalizacji wskaźnika jakości 1 (x(t, 1) r(t)) 2 dt + ρ 1 0 0 u 2 (t)dt określonego dla dynamicznego roz lożonego stanu procesu x W2 1 ([0, 1] [0, 1], R nx ) i jego dynamicznego sterowania brzegowego u L 2 ([0, 1], R nu ) i interpretowanego jako osi aganie zadanego przebiegu temperatury r(t) na jednym brzegu obiektu z jedn a zmienn a przestrzenn a przy za lożeniu, że sterowanie (źród lo ciep la) oddzia lywuje na drugim jego brzegu z uwzglȩdnieniem dynamicznego równania stanu w postaci równania przewodnictwa cieplnego x t (t, s) = ax ss (t, s) bx(t, s), t [0, 1] z warunkiem pocz atkowym x(0, s) = x 0 (s), s [0, 1], i z warunkami brzegowymi x(t, 0) αx s (t, 0) = u(t), x s (t, 1) = 0, t [0, 1] oraz z ograniczeniami chwilowymi stanu roz lożonego obiektu (zapobieganie przegrzaniu obiektu) x(t, s) x max, (t, s) [0, 1] [0, 1]. 21

Aproksymacja pochodnej cz astkowej stanu wzglȩdem czasu za pomoc a prawostronnego ilorazu różnicowego pierwszego rzȩdu przybiera postać x t (t, s) x k+1,l x kl δ 1, zaś aproksymacja drugiej pochodnej cz astkowej stanu wzglȩdem zmiennej przestrzennej za pomoc a symetrycznego ilorazu różnicowego drugiego rzȩdu przybiera postać x ss (t, s) x k,l+1 2x kl + x k,l 1. δ2 2 Prowadzi to do nastȩpuj acej siatkowej aproksymacji równania stanu procesu x k+1,l x kl δ 1 = α x k,l+1 2x kl + x k,l 1 δ 2 2 bx(k, l), k = 0, 1,..., k 1, l = 1,..., l z aproksymowanymi warunkami pocz atkowymi x 0,l = x 0 (l), l = 0, 1,..., l, i brzegowymi x k,0 α(x k,1 x k,0 )/δ 2 = u k, (x k, l+1 x k, l)/δ 2, k = 0, 1,..., k 1 oraz aproksymowanymi ograniczeniami stanu x k,l x max, k = 0, 1,..., k, l = 0, 1,..., l. 22