Metody kierunków poprawy dla nieliniowych problemów sterowania optymalnego Problem optymalnego sterowania procesem dynamicznym może polegać na polega na minimalizacji wskaźnika jakości obejmuj acego koszty realizacji procesu i wartość produktu użytecznego z uwzglȩdnieniem G(x, u) = g(x(t), u(t), t)dt + h(x(t 1 )) równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, t 1 ], gdzie x W2 1 ([, t 1 ]; R n ) jest trajektori a stanu procesu bȩd ac a elementem przestrzeni funkcji o pochodnej ca lkowalnej z kwadratem, u L 2 ([, t 1 ]; R m ) jest jego sterowaniem bȩd acym elementem przestrzeni funkcji ca lkowalnych z kwadratem, g : R n R m R R, h : R n R, f : R n R m R R n, s a, ogólnie bior ac, funkcjami nieliniowymi. Na podstawie standardowych twierdzeń o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym można uważać równanie stanu rozważanej klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Pozwala to zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości J(u). = g(x(t, u), u(t), t)dt + h(x(t 1, u)) z uwzglȩdnieniem ograniczeń chwilowych u(t) [u, u + ]. 1
Gradient wskaźnika jakości zredukowanego do przestrzeni sterowania celowo jest obliczać z wykorzystaniem równania sprzȩżonego. Dla określenia tego równania definiowany jest funkcjona l Lagrange a w postaci normalnej L(η, x, u). = g(x(t), u(t), t)dt + h(x(t 1 )) + η T (t)(ẋ(t) f(x(t), u(t), t))dt + η T ( )(x( ) x ), gdzie η(t) W 1 2 ([, t 1 ]; R n ) jest zmienn a sprzȩżon a zwi azan a z analizowanym problemem. Zastosowanie wzoru na ca lkowanie przez czȩści daje w wyniku L(η, x, u). = g(x(t), u(t), t)dt + h(x(t 1 )) + η T (t 1 )x(t 1 ) η T ( )x( ) η T (t)x(t)dt η T (t)f(x(t), u(t), t)dt + η T ( )(x( ) x ). Uproszczenie wyrażeń identycznych i wprowadzenie funkcji Hamiltona postaci H(η(t), x(t), u(t), t). = g(x(t), u(t), t) + η T (t)f(x(t), u(t), t) umożliwia zapisanie funkcjona lu Lagrange a w postaci L(η, x, u) = h(x(t 1 )) ( η T (t)x(t) + H(η(t), x(t), u(t), t))dt +η T (t 1 )x(t 1 ) η T ( )x. Ponieważ dla każdego dopuszczalnego procesu sterowania obowi azuje tożsamość Lagrange a J(u) = L(η, x, u), wiȩc dla wariacji zredukowanego wskaźnika jakości zachodzi zależność J u (u)δu = L η (η, x, u)δη + L x (η, x, u)δx + L u (η, x, u)δu, gdzie δη, δx, δu s a wariacjami odpowiednio zmiennej sprzȩżonej, trajektorii stanu i sterowania. Wariacja funkcjona lu Lagrange a wzglȩdem zmiennej sprzȩżonej L η δη wyzerowuje siȩ na każdym procesie dopuszczalnym, gdyż ma ona postać iloczynu skalarnego wariacji zmiennej sprzȩżonej i równania stanu L η δη = δη T (t)(ẋ(t) f(x(t), u(t), t))dt L η δη =. 2
Wariacja funkcjona lu Lagrange a wzglȩdem trajektorii stanu wyzerowuje siȩ, jeśli zmienna sprzȩżona zostanie dobrana tak, aby by lo spe lnione tzw. równanie sprzȩżone. L x (η, x, u)δx = ( η T (t)δx(t) + H x (η(t), x(t), u(t), t))δx(t)dt. +h x (x(t 1 ))δx ( t 1 ) + η T (t 1 )δx(t 1 ). Zdefiniowanie równania sprzȩżonego w postaci równania różniczkowego z zadanym stanem końcowym η(t) = H T x (η(t), x(t), u(t), t), t [, t 1 ], η(t 1 ) = h T x (x(t 1 )) wyzerowuje wariacjȩ funkcjona lu Lagrange a wzglȩdem trajektorii stanu L x (η, x, u)δx. Tak wiȩc wariacja zredukowanego wskaźnika jakości wzglȩdem sterowania jest równa wariacji funkcjona lu Lagrange a wzglȩdem sterowania J u (u)δu = L u (u)δu. Ponieważ L u δu = H u (η(t), x(t), u(t), t)δu(t)dt wiȩc gradient wskaźnika jakości zredukowanego do przestrzeni sterowania wyraża siȩ wzorem J u (u)δu = J u (u)(t)δu(t)dt, J u (u)(t) = H u (η(t), x(t), u(t), t) t [, t 1 ]. Korzystaj ac z definicji funkcji Hamiltona można równanie sprzȩżone przepisać w postaci η(t) = f T x (x(t), u(t), t)η(t)+g T x (x(t), u(t), t), t [, t 1 ], η(t 1 ) = h T x (x(t 1 )), co oznacza, że równanie sprzȩżone jest liniowym (niestacjonarnym) równaniem różniczkowym z zadanym stanem końcowym. Wyznaczanie gradientu wskaźnika jakości zredukowanego do przestrzeni sterowania za pomoc a równania sprzȩżonego sprowadza siȩ do rozwi azania jednego pomocniczego liniowego równania różniczkowego. Natomiast bezpośrednie obliczanie gradientu zredukowanego do przestrzeni sterowania wymaga pos lugiwania siȩ macierz a fundamentaln a równania stanu X(t) J u (u) = (g x (x(t), u(t), t)δx(t) + g u (x(t), u(t), t)δu(t))dt + h x (x(t 1 ))δx(t 1 ). 3
gdzie wariacja trajektorii stanu δx(t) spe lnia zlinearyzowane równanie stanu δẋ(t) = f x (x(t), u(t), t)δx(t) + f u (x(t), u(t), t)δu(t), δx(t) =, którego rozwi azanie ma postać δx(t) = t X(t)X 1 ( t)f u (x( t), u( t), t)δu( t)d t, przy czym macierz fundamentalna X(t) spe lnia macierzowe równanie różniczkowe Ẋ(t) = f x (x(t), u(t), t)x(t), t [, t 1 ], X( ) = I n. Celem wyznaczenia gradientu zredukowanego metod a bezpośredni a należy wiȩc rozwi azać uk lad n 2 równań różniczkowych, a metod a pośredni a - tylko uk lad n równań różniczkowych. Różnica w czasie obliczeń może być istotna, jeśli obliczanie gradientu zredukowanego dokonywane jest wielokrotnie np. w algorytmach iteracyjnych z tysi acami iteracji. Podstawowy algorytm kierunków poprawy dla problemów sterowania optymalnego bazuje na Gradient wskaźnika jakości zredukowanego do przestrzeni sterowania i stanu pocz atkowego też moiżna oblicza z wykorzystaniem równania sprzȩżonego. Dla określenia tego równania definiowany jest funkcjona l Lagrange a w postaci normalnej η T (t)(ẋ(t) f(x(t), u(t), t))dt + η T ( )(x( ) x ), L(η, x, u, x ) =. g(x(t), u(t), t)dt + h(x(t 1 )) + gdzie η(t) W 1 2 ([, t 1 ]; R n ) jest zmienn a sprzȩżon a zwi azan a z analizowanym problemem. Zastosowanie wzoru na ca lkowanie przez czȩści daje w wyniku L(η, x, u) =. g(x(t), u(t), t)dt + h(x(t 1 )) + η T (t 1 )x(t 1 ) η T ( )x( ) η T (t)x(t)dt η T (t)f(x(t), u(t), t)dt + η T ( )(x( ) x ). Uproszczenie wyrażeń identycznych i wprowadzenie funkcji Hamiltona postaci H(η(t), x(t), u(t), t). = g(x(t), u(t), t) + η T (t)f(x(t), u(t), t) umożliwia zapisanie funkcjona lu Lagrange a w postaci L(η, x, u) = h(x(t 1 )) ( η T (t)x(t) + H(η(t), x(t), u(t), t))dt 4
+η T (t 1 )x(t 1 ) η T ( )x. Ponieważ dla każdego dopuszczalnego procesu sterowania obowi azuje tożsamość Lagrange a J(u, x ) = L(η, x, u, x ), wiȩc dla wariacji zredukowanego wskaźnika jakości zachodzi zależność J u (u, x )δu = L η (η, x, u, x )δη + L x (η, x, u, x )δx +L u (η, x, u, x )δu + L x (η, x, u, x ), gdzie δη, δx, δu oraz δx s a wariacjami odpowiednio zmiennej sprzȩżonej, trajektorii stanu, sterowania i stanu pocz atkowego. Stosuj ac analogiczne rozumowanie jak poprzednio wnioskujemy, że wariacja funkcjona lu Lagrange a wzglȩdem zmiennej sprzȩżonej L η δη wyzerowuje siȩ na każdym procesie dopuszczalnym, gdyż ma ona postać iloczynu skalarnego wariacji zmiennej sprzȩżonej i równania stanu L η δη = δη T (t)(ẋ(t) f(x(t), u(t), t))dt L η δη =. Wariacja funkcjona lu Lagrange a wzglȩdem trajektorii stanu wyzerowuje siȩ, jeśli zmienna sprzȩżona zostanie dobrana tak, aby by lo spe lnione równanie sprzȩżone. L x (η, x, u, x )δx = ( η T (t)δx(t) + H x (η(t), x(t), u(t), t))δx(t)dt. +h x (x(t 1 ))δx ( t 1 ) + η T (t 1 )δx(t 1 ). Zdefiniowanie równania sprzȩżonego w postaci równania różniczkowego z zadanym stanem końcowym η(t) = Hx T (η(t), x(t), u(t), t), t [, t 1 ], η(t 1 ) = h T x (x(t 1 )) wyzerowuje wariacjȩ funkcjona lu Lagrange a wzglȩdem trajektorii stanu L x (η, x, u, x )δx. Tak wiȩc wariacja zredukowanego wskaźnika jakości wzglȩdem sterowania i stanu pocz atkowego jest równa wariacji funkcjona lu Lagrange a wzglȩdem sterowania J u (u, x )δu = L η,x,u,x (u)δu + L x (η, x, u, x ). 5
Ponieważ L u δu = H u (η(t), x(t), u(t), t)δu(t)dt wiȩc gradient wskaźnika jakości zredukowanego do przestrzeni sterowania i stanu pocz atkowego wyraża siȩ wzorami J u (u, x )δu = jeśli chodzi o sterowanie oraz J u (u, x )(t)δu(t)dt, J u (u, x )(t) = H u (η(t), x(t), u(t), t) t [, t 1 ] jeśli chodzi o stan pocz atkowy. J x (u, x ) = η( ) Podstawowy algorytm kierunków poprawy dla problemów minimalizacji wskaźnika jakości zredukowanego do przestrzeni sterowania i stanu pocz atkowego bazuje na poszukiwaniu rozwi azania polepszaj acego ten wskaźnik w kierunku antygradientu u + (t) = u(t) γ + J u (u, x )(t), t [, t 1 ], x + = x γ + J x (u, x ), gdzie γ + > jest d lugości a kroku wyznaczan a w wyniku optymalizacji kierunkowej. Gradient wskaźnika jakości procesów okresowych zredukowanego do przestrzeni sterowań okresowych u L τ 2(R m ) można również obliczać z wykorzystaniem okresowego równania sprzȩżonego. Dla określenia tego równania definiowany jest funkcjona l Lagrange a w postaci normalnej L(η, x, u). = τ g(x(t), u(t), t)dt τ + η T (t)(ẋ(t) f(x(t), u(t), t))dt + η T ( )(x(τ) x()), gdzie η(t) W2 1τ ([, τ], R n ) jest zmienn a sprzȩżon a zwi azan a z analizowanym problemem. Zastosowanie wzoru na ca lkowanie przez czȩści daje w wyniku τ L(η, x, u). = τ η T (t)x(t)dt τ g(x(t), u(t), t)dt + η T (τ)x(τ) η T ()x() η T (t)f(x(t), u(t), t)dt + η T ()(x(τ) x()). 6
Uproszczenie wyrażeń identycznych i wprowadzenie funkcji Hamiltona postaci H(η(t), x(t), u(t), t) =. g(x(t), u(t), t) + η T (t)f(x(t), u(t), t) umożliwia zapisanie funkcjona lu Lagrange a w postaci L(η, x, u) = τ ( η T (t)x(t) + H(η(t), x(t), u(t), t))dt +η T (τ)x(τ) η T ()x(). Ponieważ dla każdego dopuszczalnego procesu sterowania obowi azuje tożsamość Lagrange a J(u) = L(η, x, u), wiȩc dla wariacji wskaźnika jakości zredukowanego do przestrzeni sterowań okresowych zachodzi zależność J u (u)δu = L η (η, x, u)δη + L x (η, x, u)δx + L u (η, x, u)δu, gdzie δη, δx, δu s a wariacjami odpowiednio zmiennej sprzȩżonej, trajektorii stanu i sterowania. Wariacja funkcjona lu Lagrange a wzglȩdem zmiennej sprzȩżonej L η δη wyzerowuje siȩ na każdym procesie dopuszczalnym, gdyż ma ona postać iloczynu skalarnego wariacji zmiennej sprzȩżonej i równania stanu L η δη = τ δη T (t)(ẋ(t) f(x(t), u(t), t))dt L η δη+δη T (τ)x(τ) δη T ()x() =. Wariacja funkcjona lu Lagrange a wzglȩdem trajektorii stanu wyzerowuje siȩ, jeśli zmienna sprzȩżona zostanie dobrana tak, aby by lo spe lnione tzw. równanie sprzȩżone z warunkiem okresowości zmiennych sprzȩżonych. L x (η, x, u)δx = τ ( η T (t)δx(t) + H x (η(t), x(t), u(t), t))δx(t)dt +(η T (τ) η T ())δx(). Zdefiniowanie równania sprzȩżonego w postaci równania różniczkowego z warunkiem okresowości zmiennych sprzȩżonych η(t) = Hx T (η(t), x(t), u(t), t), t [, τ], η(τ) = η() wyzerowuje wariacjȩ funkcjona lu Lagrange a wzglȩdem trajektorii stanu L x (η, x, u)δx. 7
Tak wiȩc wariacja zredukowanego wskaźnika jakości wzglȩdem sterowania okresowego jest równa wariacji funkcjona lu Lagrange a wzglȩdem tego sterowania J u (u)δu = L u (u)δu. Ponieważ τ L u δu = H u (η(t), x(t), u(t), t)δu(t)dt wiȩc gradient wskaźnika jakości zredukowanego do przestrzeni sterowania okresowego wyraża siȩ wzorem J u (u)δu = τ J u (u)(t)δu(t)dt, J u (u)(t) = H u (η(t), x(t), u(t), t) t [, τ]. Korzystaj ac z definicji funkcji Hamiltona można równanie sprzȩżone przepisać w postaci η(t) = f T x (x(t), u(t), t)η(t) + g T x (x(t), u(t), t), t [, t 1 ], η(τ) = η(), co oznacza, że równanie sprzȩżone jest liniowym (niestacjonarnym) równaniem różniczkowym z warunkiem okresowości. Wyznaczanie gradientu wskaźnika jakości zredukowanego do przestrzeni sterowania okresowego za pomoc a równania sprzȩżonego sprowadza siȩ do rozwi azania jednego pomocniczego liniowego równania różniczkowego z warunkiem okresowości zmiennych sprzȩżonych. Praktyczna realizacja wielu algorytmów sterowania optymalnego zwi azana jest z dyskretyzacj a sterowania. Zastosowanie znajduje tu przede wszystkim baza funkcji schodkowych ( =, t 1 = 1) u(t, u) = K 1 k= e k(t)u k, gdzie u k R m and { 1 if t [k/k, (k + 1)/K), e k (t) = if t / [k/k, (k + 1)/K). Gradient wskaźnika jakości zredukowanego do przestrzeni funkcji schodkowych uzyskuje siȩ po podstawieniu do wyrażenia J u (u)δu = 1 H u (x(t), u(t), t)δu(t)dt, schodkowej dyskretyzacji sterowania δu(t, u) = k 1 k= e k(t)δu k J u (u) = (J uk (u)) K 1 k=, gdzie (k+1)δ J uk (u) = H u (x(t), u(t), t)dt, δ =. 1/K, k =, 1,..., K 1. kδ 8
Metody optymalizacji różnicowej procesów sterowania W wielu problemach sterowania dok ladne obliczanie gradientu J (u) wskaznika jakości zredukowanego do przestrzeni sterowania jest utrudnione z uwagi na z lożoność modelu procesu (duża liczba zmiennych stanu, nieliniowy charakter procesu, niestandardowe warunki brzegowe stanu - okresowe, pseudookresowe, mieszane). Zastosowanie równań sprzȩżonych daje dobre wyniki dla zadań z zadanym stanem pocz atkowym i stosunkowo niewielk a liczb a równań stanu. W innych przypadkach celowe może być wykorzystanie gradientu różnicowego, który obliczany jest wy l acznie na podstawie znajomości wartości wskaznika jakości J (u) ( (J(u+de 1 ) J(u))/d, (J(u+de 2 ) J(u))/d,..., (J(u+de k) J(u))/d ), gdzie e k. = (,...,, 1,,..., ) T jest k-tym wersorem uk ladu wspó lrzȩdnych dyskretnego sterowania, a d jest d lugości a kroku ilorazu różnicowego. Lemat: Niech funkcja J : R k R bȩdzie różniczkowalna w sposób ci ag ly w obszarze otwartym i wypuk lym D zawieraj acym punkt u i niech gradient J (u) funkcji J(u) spe lnia w obszarze D warunek Lipschitza J (u + δu) J (u) L δu, u, u + δu D. Dla funkcji posiadaj acych gradient ci ag ly w sensie Lipschitza prawostronna aproksymacja różnicowa sk ladowych gradientu jest zbieżna liniowo do ich dok- ladnych wartości wzglȩdem d lugości kroku ilorazu różnicowego. Dowód. Za lożenie lematu gwarantuje spe lnienie przez funkcjȩ J(u) nierówności J(u + de k) J(u) d J (u)e k L 2 d. J(u + δu) J(u) J (u)δu.5l δu 2. Oszacowanie to wynika z rozwiniȩcia funkcji J(u) w szereg Taylora pierwszego rzȩdu J(u + δu) = J(u) + J (u)δu + 9 1 J (u + θδu)δudθ
czyli J(u + δu) J(u) J (u)δu = 1 (J (u + θδu) J(u))δudθ. Warunek Lipschitza dla gradientu J (u) implikuje zależności J(u + δu) J(u) J (u)δu 1 Podstawienie δu = de k 1 J (u + θδu) J(u) δu dθ 1 L θδu δu dθ = L δu 2 θdθ = L 2 δu 2. J(u + de k ) J(u) J (u)de k L 2 de k 2 = L 2 d 2. Dziel ac powyższ a nierówność przez d uzyskujemy J(u + de k) J(u) d J (u)e k L 2 d. Jeśli wiȩc funkcja posiada gradient ci ag ly w sensie Lipschitza, to prawostronna aproksymacja różnicowa sk ladowych gradientu jest zbieżna do ich dok ladnych wartości liniowo wzglȩdem d lugości kroku ilorazu różnicowego. Zalet a metody gradientu różnicowego jest jej uniwersalność (można j a zastosować do każdej funkcji L-ci ag lej jeśli tylko dostȩpne s a jej wartości) i prostota realizacji metody (stosuje siȩ w tym przypadku elementarne operacje obliczeniowe). Jej wad a jest duża wrażliwość na b lȩdy pojawiaj ace siȩ przy ma lej precyzji obliczeń. Zmniejszenie tej wrażliwości osi agn ać można stosuj ac dok ladniejsze metody aproksymacji różnicowej np. dwustronny centralny iloraz różnicowy: J (u) ( (J(u + de 1 ) J(u de 1 )))/2d, (J(u + de 2 ) J(u de 2 )))/2d,..., (J(u + de k) J(u de k)))/2d ), gdzie obliczane s a wartości wskaznika jakości dla argumentów przesuniȩtych na prawo i na lewo od punktu aktualnego. Niech H(u). = J u k u l (u) oznacza hesjan funkcji J(u) tj. macierz jej drugich pochodnych cz astkowych. Lemat: Niech funkcja J : R k R bȩdzie dwukrotnie różniczkowalna w sposób ci ag ly w obszarze otwartym i wypuk lym D zawieraj acym punkt u i niech hesjan H(u) funkcji J(u) spe lnia w obszarze D warunek Lipschitza H(u + δu) H(u) L δu, u, u + δu D. 1
Dla funkcji posiadaj acych hesjan ci ag ly w sensie Lipschitza dwustronna centralna aproksymacja różnicowa sk ladowych gradientu jest zbieżna kwadratowo do ich dok ladnych wartości wzglȩdem d lugości kroku ilorazu różnicowego. J(u + de k) J(u de k ) 2d J (u)e k L 6 d 2. Dowód wykorzystuje oszacowanie dok ladności rozwiniȩcia funkcji J(u w szereg Taylora drugiego rzȩdu z uwzglȩdnieniem spe lnienia warunku Lipschitza przez hesjan tej funkcji J(u + δu) J(u) J (u)δu +.5δu T H(u)δu L 6 δu 3 ( ). Określa siȩ nastȩpnie prawostronne i lewostronne rozwiniȩcie funkcji J wzd luż wersora u k : α. = J(u + de k ) J(u) dj u k (u) d 2 J u k u k (u), β. = J(u de k ) J(u) + dj u k (u) d 2 J u k u k (u), Zastosowanie oszacowania (*) do wielkości α i β w kierunku ±de k daje w wyniku nierówności α L 6 d3, β L 6 d3. St ad α β α + β L 3 d3. Poszukiwane oszacowanie wynika z równości 1 2d (α β) = J(u + de k) J(u de k ) J (u)e k. d Obliczanie hesjanu wskaznika jakości zredukowanego do przestrzeni sterowania wymaga znacznego nak ladu obliczeń. Dlatego użyteczna jest aproksymacja drugich pochodnych cz astkowych za pomoc a ilorazów różnicowych drugiego rzȩdu J uk u l (u) ( J(u + de k + de l ) J(u + de k ) J(u + de l ) + J(u) ) /d 2. Dla funkcji z hesjanem ci ag lym w sensie Lipschitza aproksymacja powyższa jest zbieżna liniowo do dok ladnej wartości drugiej pochodnej, co wynika z oszacowania J uk u l (u) ( J(u + de k + de l ) J(u + de k ) J(u + de l ) + J(u) ) /d 2 5 3 Ld uzyskiwanego na podstawie dok ladności rozwiniȩcia funkcji J w szereg Taylora drugiego rzȩdu. 11
Jedn a z klas problemów optymalnego sterowania, dla której obliczanie gradientu zredukowanego wskanika jakości jest utrudnione, jest klasa problemów optymalnego sterowania cyklicznego. Równania sprzȩżone s a w tym przypadku z regu ly niestabilne i ich ca lkowanie wymaga zastosowania szczególnie dok ladnych metod. Dlatego celowo jest w tym przypadku wykorzystać metodȩ gradientu różnicowego. Metoda przesuwanej funkcji kary i zmodyfikowanej funkcji Lagrange a dla problemów sterowania optymalnego z równościowymi ograniczeniami nieliniowymi Problem optymalnego sterowania procesem dynamicznym z równościowymi ograniczeniami nieliniowymi może polegać na minimalizacji ca lkowego wskaźnika jakości z uwzglȩdnieniem G(x, u) = g(x(t), u(t), t)dt równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x ograniczeń równościowych niektórych lub wszystkich wspó lrzȩdnych stanu końcowego h(x(t 1 )) = oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, t 1 ], gdzie x W ([t 1, t 1 ]; R n ) jest trajektori a stanu procesu, u L ([, t 1 ]; R m ) jest jego sterowaniem, a g : R n R m R R, f : R n R m R R n, h : R n R p, s a, ogólnie bior ac, funkcjami nieliniowymi. Standardowe twierdzenia o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym pozwalaj a uważać równanie stanu rozważanej 12
klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Na tej podstawie można zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości z uwzglȩdnieniem J(u). = g(x(t, u), u(t), t)dt równościowych ograniczeń nieliniowych stanu końcowego oraz ograniczeń chwilowych sterowania h(x(t 1, u)) = u(t) [u, u + ], t [, t 1 ]. Te ostatnie ograniczenia mog a nie być w l aczone w sposób jawny do sformu lowania niektórych problemów jeśli minimalizacja wskaźnika jakości automatycznie ogranicza amplitudȩ sterowania. Przyk lad: Niech x 1 (t) oznacza po lożenie nieliniowego obiektu oscylacyjnego w chwili t, x 2 (t) - jego prȩdkość w chwili t, zaś u(t) - si lȩ stabilizuj a a obiektu. Minimalnoenergetyczne sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci strat energetycznych na sterowanie G(x, u) = z uwzglȩdnieniem 1 u 2 (t)dt równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, oraz 13
nieliniowych ograniczeń stanu końcowego x 1 (1) =, x 2 (1) =. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 1 u 2 (t)dt przy równościowym ograniczeniu nieliniowym x 1 (1, u) =, x 2 (1, u) =. Minimalnoczasowe sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci czasu realizacji procesu G(x, u) = z uwzglȩdnieniem równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, dt nieliniowych ograniczeń stanu końcowego x 1 (t 1 ) =, x 2 (t 1 ) =, oraz ograniczenia chwilowego sterowania u(t) [u, u + ], t [, t 1 ]. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 14 dt
przy równościowym ograniczeniu nieliniowym x 1 (t 1, u) =, x 2 (t 1, u) =. i nierównościowym ograniczeniu chwilowym sterowania u(t) [u, u + ], t [, t 1 ]. Powyższe przyk lady ilustruj a problemy sterowania docelowego - obiekt należy przeprowadzić z zadanego stanu pocz atkowego (tj. stanu zaburzonego) do zadanego stanu końcowego (tj. stanu równowagi). Z zadaniami tego rodzaju mamy do czynienia przy rozruchu procesów np. należy przeprowadzić obiekt z naturalnego stanu pocz atkowego (wsad pewnej ilości surowca w chwili pocz atkowej, brak produktu użytecznego w chwili pocz atkowej) do docelowego stanu technologicznego (np. stabilnego statycznego punktu równowagi procesu umożliwiaj acego statyczny sposób jego prowadzenia). Przyk lad: Proces produkcyjny prowadzony w zbiornikowym reaktorze chemicznym polega na przemianie surowca A w produkt użyteczny B z wykorzystaniem sterowania temperaturowego. Niech x 1 (t) oznacza stȩżenie A w obiekcie w chwili t, x 2 (t) - stȩżenie B w obiekcie w chwili t, a x 3 (t) - temperaturȩ obiektu w chwili t. Należy zminimalizować koszty sterowania temperaturowego G(x, u) = z uwzglȩdnieniem 1 u(t)dt równań stanu procesu z naturalnymi pocz atkowymi wartościami wspó lrzȩdnych stanu ẋ 1 (t) = a 1 e b/u(t) x 2 1(t), t [, 1], x 1 () = x 1 >, ẋ 2 (t) = a 1 e b/u(t) x 2 2(t), t [, 1], x 2 () =, ẋ 3 (t) = a 2 u(t) a 3 x 2 3(t), t [, 1], x 3 () = x 3 >, ograniczeń stanu docelowego oraz x 1 (1) = x 11, x 2 (1) = x 21, x 3 (1) = x 31 15
ograniczeń chwilowych sterowania u(t) [u, u + ], t [, 1]. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 1 u(t)dt przy równościowym ograniczeniu nieliniowym x 1 (1, u) = x 11, x 2 (1, u) = x 21, x 3 (1, u) = x 31 i nierównościowych ograniczeniach chwilowych sterowania u(t) [u, u + ], t [, 1]. Problemy sterowania optymalnego z nieliniowymi ograniczeniami równościowymi s a charakterystyczne dla niektórych procesów o parametrach roz lożonych. Przyk lad. Sterowanie nagrzewem prȩta metalowego z izolowanymi końcami. x(t, z) z 1 u(t, z) Roz lożonym stanem procesu x(t, z) jest temperatura prȩta w chwili t i w punkcie z. Roz lożonym sterowaniem procesu u(t, z) jest intensywność źród la ciep la w chwili t i w punkcie z. Problem sterowania optymalnego może polegać na minimalizacji strat energetycznych na nagrzewanie 1 u 2 (t, z)dtdz z uwzglȩdnieniem równania stanu jako równania przewodnictwa cieplnego ze sterowaniem temperaturowym x t (t, z) = α(x(t, z), u(t, z))x zz (t, z) ãx(t, z) + bu(t, z), (t, z) [, t 1 ] [, 1] 16
i z warunkami brzegowymi x(t, ) =, x(t, 1) =, t [, t 1 ] (co oznacza, że na izolowanych końcach prȩta utrzymywana jest umowna temperatura zerowa) oraz z warunkiem pocz atkowym tj. z zadanym rozk ladem pocz atkowym temperatury w prȩcie x(, z) = x (z), z [, 1], przy czym określony jest docelowy rozk lad temperatury w prȩcie x(t 1, z) = x 1 (z), z [, 1]. W równaniu stanu wziȩto pod uwagȩ zależność wspó lczynnika przewodnictwa cieplnego α od stanu i sterowania (np. z uwagi na niejednorodność materia lu). Równanie to jest wiȩc nieliniowe i określa nieliniow a zależność stanu od sterowania x(t, z, u). Po redukcji do przestrzeni sterowania zadanie przybiera postać: zminimalizować wskaźnik jakości 1 u 2 (t, z)dtdz przy nieliniowym funkcyjnym ograniczeniu równościowym x(t 1, z, u) = x 1 (z), z [, 1]. Dyskretyzacja schodkowa sterowania u(t, u k ) = K 1 k= e k(t)u k sprowadza rozpatrywane problemy do zadań optymalizacji skończenie-wymiarowej typu min u R m{j(u k) : ϕ(u) =, u k [u, u + ], k =, 1, 2,..., K 1, m =. mk}, gdzie sk ladowe odwzorowania ϕ : R m R p s a funkcjami nieliniowymi i niewypuk lymi. Jeśli wskaźnik jakości ogranicza amplitudȩ sterowania, to zadanie powyższe upraszcza siȩ do postaci min u R m{j(u) : ϕ(u) = }. Do zadania tego można zastosować metodȩ kwadratowej funkcji kary, która prowadzi do zadania optymalizacji bez ograniczeń Φ(u, ρ). = min u R m{j(u) + ρ 2 ϕ(u) 2 }, 17
gdzie ρ > jest wspó lczynnikiem funkcji kary. Analiza tej metody pokazuje jednak, że sterowania optymalne dla problemu z funkcj a kary s a zbieżne do rozwi azania problemu wyjściowego tylko wtedy, gdy wspó lczynnik kary ρ jest zwiȩkszany do nieskończoności. Przy dużych wspó lczynnikach kary problem staje siȩ źle uwarunkowany i metoda kwadratowej funkcji kary jest ma lo skuteczna. Dlatego zaproponowano ulepszone warianty tej metody. Jednym z nich jest metoda przesuwanej kwadratowej funkcji kary Ψ(u, ρ, ν). = min u R mk {J(u) + ρ 2 ϕ(u) + ν 2 }, gdzie sk ladowe przesuniȩcia funkcji kary ν R p s a zwiȩkszane w t a stronȩ, w któr a naruszone zosta lo ograniczenie na danym sterowaniu. Zwiȩksza to wartość funkcji kary baz zmiany wspó lczynnika ρ i wymusza zbliżenie sterowania do obszaru dopuszczalnego. Niech nieliniowe ograniczenie równościowe ma postać zwi azan a ze stanem końcowym procesu tj. ϕ(u) = x(t 1, u) x 1. Algorytm przesuwanej funkcji kary Etap wstȩpny. Wybierz wymiar bazy schodkowej sterowania K i dyskretne sterowanie pocz atkowe u =. {u k } K 1 k=, pocz atkowe dopuszczalne naruszenie ograniczenia d, wspó lczynnik zmniejszania naruszenia ograniczenia α (, 1), pocz atkowy wspó lczynnik kary ρ i wspó lczynnik jego zwiȩkszania β > 1, pocz atkowe przesuniȩcie kary ν = i dok ladność obliczeń ɛ. Etap pierwszy. dyskretnym Wyznacz rozwi azanie równania stanu ze sterowaniem ẋ(t) = f(x(t), u(t, u), t), t [, 1], x() = x oraz równanie sprzȩżone ze sterowaniem dyskretnym η(t) = fx T (x(t), u(t, u), t)η(t) + gx T (x(t), u(t, u), t), t [, 1], η(1) = ρ(x(1) x 1 + ν). 18
Etap drugi. Oblicz gradient zredukowanego wskaźnika jakości (k+1)δ J uk (u) = H u (η(t), x(t), u(t, u), t)dt, δ = 1/K, k =, 1,..., K 1, kδ i podstaw startow a d lugość kroku γ = 1. Etap trzeci. Wyznacz rozwi azanie problemu optymalizacji bez ograniczeń u = arg min u R m Ψ(u, ρ, ν) z dok ladności a ɛ stosuj ac metodȩ typu gradientowego u := u γψ u (u) i oblicz naruszenie ograniczenia c = x(1) x 1. Jeśli c d, to podstaw ν := ν + x(1) x 1, d := αd. Jeśli c > d, to podstaw ν := 1 β (ν + x(1) x 1), ρ := βρ. Etap czwarty. Jeśli u + u < ɛ, to stop. W przeciwnym razie wróć do Etapu pierwszego. Przesuwanie funkcji kary celowo jest powi azać z mnożnikami Lagrange a charakteryzuj acymi rozwi azanie optymalne. Wskaźnik jakości z przesuwan a kwadratow a funkcj a kary można przekszta lcić jak nastȩpuje J(u) + ρ 2 ϕ(u) + ν 2 = J(u) + ρ ( ϕ(u) + ν, ϕ(u) + ν ) 2 = ϕ(u), ϕ(u) + 2 ϕ(u), ν + ν, ν. Po podstawieniu ν = λ/ρ uzyskuje siȩ równoważn a funkcjȩ celu zwan a zmodyfikowan a funkcj a Lagrange a M(u, λ, ρ). = J(u) + λ T ϕ(u) + ρ 2 ϕ(u) 2, gdzie λ R p jest mnożnikiem Lagrange a. Algorytm optymalizacji z wykorzystaniem zmodyfikowanej funkcji Lagrange a przybierze postać u = arg min M(u, ρ, ν), λ := λ + ρϕ(u). u R m 19
Zbieżność i szybkość zbieżności algorytmu zmodyfikowanej funkcji Lagrange a W analizie w lasności algorytmu korzysta siȩ z nastȩpuj acego lematu o minimum lokalnym funkcji zaburzonej. Lemat. Jeśli u jest lokalnym minimum funkcji f(u ) spe lniaj acym warunki optymalności drugiego rzȩdu f (u ) =, f (u ) >, a g(u ) jest różniczkowalna w sposób ci ag ly w otoczeniu u, to funkcja zaburzona f(u ) + εg(u ) posiada dla dostatecznie ma lego ɛ lokalne minimum u ε określone zależności a u ε = u ε(f (u )) 1 g (u ) + o(ε). Niech λ oznacza optymalny mnożnik Lagrange a dla zadania optymalizacji z równościowym ograniczeniem nieliniowym, niech λ κ i u κ oznaczaj a mnożnik Lagrange a i sterowanie na κ-tej iteracji algorytmu i niech f(u) =. M(u, λ, ρ), g(u) =. λ κ λ, ϕ(u). Wtedy f(u) + g(u) = M(u, λ, ρ) + λ κ λ, ϕ(u) = J(u) + λ, ϕ(u) +.5ρ ϕ(u) 2 + λ κ, ϕ(u) λ, ϕ(u) = M(u, λ κ, ρ). Jeśli λ κ jest dobrym przybliżeniem λ, to λ κ λ jest wielkości a ma l a (tj. λ κ λ ε) i można uważać, że u κ+1 jest minimum lokalnym funkcji f(u) + g(u) w otoczeniu u, przy czym u κ+1 u = (f (u )) 1 ϕ T (u )(λ κ λ ) + o(λ κ λ ). ( ) Wprowadzenie oznaczeń C. = ϕ (u ), L(u, λ). = J(u) + λ, ϕ(u), A. = L uu(u, λ ), pozwala zapisać nastȩpuj ace wyrażenia dla pochodnych funkcji f i g: f (u ) = L uu(u, λ ) + ρ(ϕ(u)ϕ (u)) u=u = A + ρc T C, ϕ(u ) =, Ze wzoru ( ) uzyskuje siȩ oszacowanie g (u ) = C T (λ κ λ ). u κ+1 u (A + ρc T C) 1 C T λ κ λ + o( λ κ λ ) c ρ λκ λ + o(λ κ λ ), 2
przy czym stosuje siȩ tu wynikaj ace z teorii macierzowych form kwadratowych oszacowanie Ponieważ wiȩc (A + ρc T C) 1 c/ρ. λ κ+1 = λ κ + ρ(ϕ(u κ+1 ) ϕ(u κ )) = λ κ + ρc(u κ+1 u ) + o(u κ+1 u ) = λ κ ρc(a + ρc T C) 1 C T (λ κ λ ) + o(λ κ λ ), λ κ+1 λ I ρc(a + ρc T C) 1 C T λ κ+1 λ + o(λ κ+1 λ ). Stosuj ac wynikaj ace z teorii macierzowych form kwadratowych oszacowanie ostatecznie uzyskuje siȩ I ρc(a + ρc T C) 1 c/ρ u κ u ( c 1 ρ )κ, λ κ λ ( c 2 ρ )κ, κ =, 1, 2,.... Oznacza to, że metoda zmodyfikowanych funkcji Lagrange a (a co za tym idzie i metoda przesuwanej funkcji kary) jest zbieżna liniowo dla rozważanych problemów sterowania optymalnego. 21
Metoda przesuwanej funkcji kary i zmodyfikowanej funkcji Lagrange a dla problemów sterowania optymalnego z nierównościowymi ograniczeniami nieliniowymi Problem optymalnego sterowania procesem dynamicznym z równościowymi ograniczeniami nieliniowymi może polegać na minimalizacji ca lkowego wskaźnika jakości z uwzglȩdnieniem G(x, u) = g(x(t), u(t), t)dt równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x ograniczeń nierównościowych niektórych lub wszystkich wspó lrzȩdnych stanu końcowego h(x(t 1 )) oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, t 1 ], gdzie x W ([t 1, t 1 ]; R n ) jest trajektori a stanu procesu, u L ([, t 1 ]; R m ) jest jego sterowaniem, a g : R n R m R R, f : R n R m R R n, h : R n R p, s a, ogólnie bior ac, funkcjami nieliniowymi. Standardowe twierdzenia o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym pozwalaj a uważać równanie stanu rozważanej klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Na tej podstawie można zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości z uwzglȩdnieniem J(u). = g(x(t, u), u(t), t)dt 22
nierównościowych ograniczeń nieliniowych stanu końcowego oraz ograniczeń chwilowych sterowania h(x(t 1, u)) u(t) [u, u + ], t [, t 1 ]. Te ostatnie ograniczenia mog a nie być w l aczone w sposób jawny do sformu lowania niektórych problemów jeśli minimalizacja wskaźnika jakości automatycznie ogranicza amplitudȩ sterowania. Przyk lad: Niech x 1 (t) oznacza po lożenie nieliniowego obiektu oscylacyjnego w chwili t, x 2 (t) - jego prȩdkość w chwili t, zaś u(t) - si lȩ stabilizuj a a obiektu. Minimalnoenergetyczne sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci strat energetycznych na sterowanie G(x, u) = z uwzglȩdnieniem 1 u 2 (t)dt równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, oraz nieliniowych ograniczeń stanu końcowego x 2 1(1) ɛ, x 2 2(1) ɛ, ɛ >. W tym przypadku obiekt należy sprowadzić do pewnego otoczenia punktu równowagi. 23
Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 1 u 2 (t)dt przy równościowym ograniczeniu nieliniowym x 2 1(1, u) ɛ, x 2 2(1, u) ɛ. Minimalnoczasowe sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci czasu realizacji procesu G(x, u) = z uwzglȩdnieniem równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, dt nieliniowych ograniczeń nierównościowych stanu końcowego x 2 1(t 1 ) ɛ, x 2 2(t 1 ) ɛ, oraz ograniczenia chwilowego sterowania u(t) [u, u + ], t [, t 1 ]. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = przy nierównościowych ograniczeniach nieliniowych stanu końcowego x 2 1(t 1, u) ɛ, x 2 2(t 1, u) ɛ. 24 dt
i nierównościowym ograniczeniu chwilowym sterowania u(t) [u, u + ], t [, t 1 ]. Powyższe przyk lady ilustruj a problemy sterowania do obszaru docelowego - obiekt należy przeprowadzić z zadanego stanu pocz atkowego do zadanego obszaru końcowego. Z zadaniami tego rodzaju mamy do czynienia np. przy ograniczeniach na zawartość produktu ubocznego w produkcie końcowym. Przyk lad: Proces produkcyjny prowadzony w zbiornikowym reaktorze chemicznym polega na przemianie surowca A w produkt użyteczny B z uwzglȩdnieniem produktu ubocznego C. Niech x 1 (t) oznacza stȩżenie A w obiekcie w chwili t, x 2 (t) - stȩżenie B w obiekcie w chwili t, a x 3 (t) - stȩżenie C w chwili t. Należy zmaksymalizować ilość produktu użytecznego w chwili końcowej procesu G(x, u) = x 2 (1) przy ograniczeniach w postaci równań stanu procesu z zadanymi pocz atkowymi wartościami wspó lrzȩdnych stanu ẋ 1 (t) = a 1 e b/u(t) x 2 1(t), t [, 1], x 1 () = x 1 >, ẋ 2 (t) = a 1 e b/u(t) x 2 2(t), t [, 1], x 2 () =, ẋ 3 (t) = a 2 u(t) a 3 x 2 3(t), t [, 1], x 3 () = x 3 >, nierównościowego ograniczeńia stanu końcowego x 3 (1) x 31 oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, 1]. Po redukcji do przestrzeni sterowania problem przybiera postać: zmaksymalizować zredukowany wskaźnik jakości J(u) = x 2 (1) 25
przy nierównościowym ograniczeniu nieliniowym x 3 (1, u) x 31 i nierównościowych ograniczeniach chwilowych sterowania u(t) [u, u + ], t [, 1]. Dyskretyzacja schodkowa sterowania u(t, u k ) = K 1 k= e k(t)u k sprowadza rozpatrywane problemy do zadań optymalizacji skończenie-wymiarowej typu min u R m{j(u k) : ϕ(u), u k [u, u + ], k =, 1, 2,..., K 1, m =. mk}, gdzie sk ladowe odwzorowania ϕ : R m R p s a funkcjami nieliniowymi i niewypuk lymi. Jeśli wskaźnik jakości ogranicza amplitudȩ sterowania, to zadanie powyższe upraszcza siȩ do postaci min u R m{j(u) : ϕ(u) }. Do zadania tego można zastosować metodȩ kwadratowej funkcji kary dla ograniczeń nierównościowych, która prowadzi do zadania optymalizacji bez ograniczeń Φ(u, ρ). = min u R m{j(u) + ρ 2 max2 (, ϕ(u)}, gdzie ρ > jest wspó lczynnikiem funkcji kary. Analiza tej metody pokazuje jednak, że sterowania optymalne dla problemu z funkcj a kary s a zbieżne do rozwi azania problemu wyjściowego tylko wtedy, gdy wspó lczynnik kary ρ jest zwiȩkszany do nieskończoności. Przy dużych wspó lczynnikach kary problem staje siȩ źle uwarunkowany i metoda kwadratowej funkcji kary dla ograniczeń nierównościowych jest ma lo skuteczna. Dlatego zaproponowano ulepszone warianty tej metody. Jednym z nich jest metoda przesuwanej kwadratowej funkcji kary dla ograniczeń nierównościowych Ψ(u, ρ, ν). = min u R m{j(u) + ρ 2 max2 (, ϕ(u) + ν)}, gdzie sk ladowe przesuniȩcia funkcji kary ν R p s a zwiȩkszane w t a stronȩ, w któr a naruszone zosta lo ograniczenie na danym sterowaniu. Zwiȩksza to wartość funkcji kary baz zmiany wspó lczynnika ρ i wymusza zbliżenie sterowania do obszaru dopuszczalnego. 26
Niech nieliniowe ograniczenie nierównościowe ma postać zwi azan a ze stanem końcowym procesu np. jest ograniczeniem zawartości końcowej x n1 produktu ubocznego modelowanego przez ostatni a zmiennca stanu x n ϕ(u), ϕ(u) = x n (1, u)) x n1. Algorytm przesuwanej funkcji kary dla ograniczeń nierównościowych Etap wstȩpny. Wybierz wymiar bazy schodkowej sterowania K i dyskretne sterowanie pocz atkowe u =. {u k } K 1 k=, pocz atkowe dopuszczalne naruszenie ograniczenia d, wspó lczynnik zmniejszania naruszenia ograniczenia α (, 1), pocz atkowy wspó lczynnik kary ρ i wspó lczynnik jego zwiȩkszania β > 1, pocz atkowe przesuniȩcie kary ν = i dok ladność obliczeń ɛ. Etap pierwszy. dyskretnym Wyznacz rozwi azanie równania stanu ze sterowaniem ẋ(t) = f(x(t), u(t, u), t), t [, 1], x() = x oraz równanie sprzȩżone ze sterowaniem dyskretnym η(t) = fx T (x(t), u(t, u), t)η(t) + gx T (x(t), u(t, u), t), t [, 1], η(1) = ρ max(, x n (1) + ν)(,...,, 1) T. Etap drugi. Oblicz gradient zredukowanego wskaźnika jakości J uk (u) = (k+1)δ kδ H u (η(t), x(t), u(t, u), t)dt, δ = 1/K, k =, 1,..., K 1, i podstaw startow a d lugość kroku γ = 1. Etap trzeci. Wyznacz rozwi azanie problemu optymalizacji bez ograniczeń u = arg min u R m Ψ(u, ρ, ν) z dok ladności a ɛ stosuj ac metodȩ typu gradientowego u := u γψ u (u) i oblicz naruszenie ograniczenia c = max 2 (, x n (1) x n1 ). Jeśli c d, to podstaw ν := ν + x n (1) x n1, d := αd. Jeśli c > d, to podstaw ν := 1 (ν + x β n(1) x n1 ), ρ := βρ. 27
Etap czwarty. Jeśli u + u < ɛ, to stop. W przeciwnym razie wróć do Etapu pierwszego. 28