Metody kierunków poprawy dla nieliniowych problemów sterowania optymalnego

Podobne dokumenty
Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Sterowalność liniowych uk ladów sterowania

Metody rzutowania i funkcji barierowych dla problemów sterowania optymalnego

Sterowanie minimalnoczasowe dla uk ladów liniowych. Krzywe prze l aczeń.

Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka

Liniowe uk lady sterowania.

Sterowanie optymalne

Ekonomia matematyczna i dynamiczna optymalizacja

Stabilność liniowych uk ladów sterowania

Wprowadzenie do metod sterowania optymalnego

POCHODNA KIERUNKOWA. DEFINICJA Jeśli istnieje granica lim. to granica ta nazywa siȩ pochodn a kierunkow a funkcji f(m) w kierunku osi l i oznaczamy

Synteza optymalnego regulatora stanu. Uk lady z czasem ci ag lym.

Funkcje wielu zmiennych

Zasada optymalności Bellmana. Uogólniony optymalny regulator stanu.

Liczby zespolone, liniowa zależność i bazy Javier de Lucas. a d b c. ad bc

Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania

Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010

Niesimpleksowe metody rozwia zywania zadań PL. Seminarium Szkoleniowe Edyta Mrówka

liniowych uk ladów sterowania

Funkcje wielu zmiennych

Wprowadzenie do teorii sterowania

Zestaw nr 7 Ekstremum funkcji jednej zmiennej. Punkty przegiȩcia wykresu. Asymptoty

Wyk lad 7 Baza i wymiar przestrzeni liniowej

Wyk lad 14 Formy kwadratowe I

MATEMATYKA REPREZENTACJA LICZB W KOMPUTERZE

Dyskretne modele populacji

y 1 y 2 = f 2 (t, y 1, y 2,..., y n )... y n = f n (t, y 1, y 2,..., y n ) f 1 (t, y 1, y 2,..., y n ) y = f(t, y),, f(t, y) =

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

Analiza dla informatyków 2 DANI LI2 Pawe l Domański szkicowe notatki do wyk ladu

ANALIZA II 15 marca 2014 Semestr letni. Ćwiczenie 1. Czy dan a funkcjȩ da siȩ dookreślić w punkcie (0, 0) tak, żeby otrzymana funkcja by la ci ag la?

ZADANIA OPTYMALIZCJI BEZ OGRANICZEŃ

Cia la i wielomiany Javier de Lucas

CHEMIA KWANTOWA MONIKA MUSIA L. Ćwiczenia. mm

Równania różniczkowe cz astkowe rzȩdu pierwszego

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Suma i przeciȩcie podprzestrzeni, przestrzeń ilorazowa Javier de Lucas

Dyskretne modele populacji

WYKŁAD 9 METODY ZMIENNEJ METRYKI

Wprowadzenie z dynamicznej optymalizacji

Zadania do wykładu Jakościowa Teoria Równań Różniczkowych Zwyczajnych

Elementy analizy funkcjonalnej PRZESTRZENIE LINIOWE

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Pierwsze kolokwium z Matematyki I 4. listopada 2013 r. J. de Lucas

Metody Numeryczne Wykład 4 Wykład 5. Interpolacja wielomianowa

Zestaw nr 6 Pochodna funkcji jednej zmiennej. Styczna do krzywej. Elastyczność funkcji. Regu la de l Hospitala

edzi (local edge detectors) Lokalne operatory wykrywania kraw

Asymptota pozioma: oṡ x, gdy y = 0 Asymptota pionowa: oṡ y, gdy x = 0. Hyperbola 1 x

Optymalizacja ciągła

Suma i przeciȩcie podprzestrzeń, suma prosta, przestrzeń ilorazowa Javier de Lucas

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

Wprowadzenie Metoda bisekcji Metoda regula falsi Metoda siecznych Metoda stycznych RÓWNANIA NIELINIOWE

Statystyka w analizie i planowaniu eksperymentu

Układy równań nieliniowych (wielowymiarowa metoda Newtona-Raphsona) f(x) = 0, gdzie. dla n=2 np.

SZKO LA PODSTAWOWA HELIANTUS WARSZAWA ul. BAŻANCIA 16. Hyperbola 1 x FUNKCJE ELEMENTARNE WYMIERNE POTȨGOWE LOGARYTMICZNE.

1 Równania nieliniowe

Optymalizacja ciągła

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych,

1 Przestrzenie unitarne i przestrzenie Hilberta.

Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego

WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3

ci agi i szeregi funkcji Javier de Lucas Ćwiczenie 1. Zbadać zbieżność (punktow a i jednostajn a) ci agu funkcji nx 2 + x

Wyk lad 5 W lasności wyznaczników. Macierz odwrotna

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

na p laszczyźnie kartezjaṅskiej prowadzimy prost a o rȯwnaniu s 1. (1.1) s 0 + t 1 t 0

KADD Minimalizacja funkcji

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

Rozwiązywanie równań nieliniowych

Monika Musia l. METODA MIESZANIA KONFIGURACJI Configuration Interaction (CI) (ujȩcie wyznacznikowe)

Pierwiastki arytmetyczne n a

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych

INTERPOLACJA I APROKSYMACJA FUNKCJI

PROGRAMOWANIE KWADRATOWE

LOGIKA ALGORYTMICZNA

Wyk lad 7 Metoda eliminacji Gaussa. Wzory Cramera

Wyk lad 11 1 Wektory i wartości w lasne

Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej

w teorii funkcji. Dwa s lynne problemy. Micha l Jasiczak

Po wprowadzeniu zmiennych uzupe lniaj acych otrzymamy równoważny mu problem w postaci kanonicznej:

Metody Rozmyte i Algorytmy Ewolucyjne

Wyk lad 4 Dzia lania na macierzach. Określenie wyznacznika

Wyk lad 13 Funkcjona ly dwuliniowe

Układy równań i równania wyższych rzędów

ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH

stosunek przyrostu funkcji y do odpowiadajacego dy dx = lim y wielkości fizycznej x, y = f(x), to pochodna dy v = ds edkości wzgl edem czasu, a = dv

5. Obliczanie pochodnych funkcji jednej zmiennej

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. mm

0.1 Reprezentacja liczb w komputerze

KADD Minimalizacja funkcji

Metody numeryczne I Równania nieliniowe

Zaawansowane metody numeryczne

P (x, y) + Q(x, y)y = 0. g lym w obszrze G R n+1. Funkcje. zania uk ladu (1) o wykresie przebiegaja

Statystyka w analizie i planowaniu eksperymentu

UKŁADY ALGEBRAICZNYCH RÓWNAŃ LINIOWYCH

1 Metody rozwiązywania równań nieliniowych. Postawienie problemu

Wyk lad 4 Macierz odwrotna i twierdzenie Cramera

Rys Mo liwe postacie funkcji w metodzie regula falsi

Podstawy Automatyki. wykład 1 ( ) mgr inż. Łukasz Dworzak. Politechnika Wrocławska. Instytut Technologii Maszyn i Automatyzacji (I-24)

Transkrypt:

Metody kierunków poprawy dla nieliniowych problemów sterowania optymalnego Problem optymalnego sterowania procesem dynamicznym może polegać na polega na minimalizacji wskaźnika jakości obejmuj acego koszty realizacji procesu i wartość produktu użytecznego z uwzglȩdnieniem G(x, u) = g(x(t), u(t), t)dt + h(x(t 1 )) równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, t 1 ], gdzie x W2 1 ([, t 1 ]; R n ) jest trajektori a stanu procesu bȩd ac a elementem przestrzeni funkcji o pochodnej ca lkowalnej z kwadratem, u L 2 ([, t 1 ]; R m ) jest jego sterowaniem bȩd acym elementem przestrzeni funkcji ca lkowalnych z kwadratem, g : R n R m R R, h : R n R, f : R n R m R R n, s a, ogólnie bior ac, funkcjami nieliniowymi. Na podstawie standardowych twierdzeń o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym można uważać równanie stanu rozważanej klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Pozwala to zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości J(u). = g(x(t, u), u(t), t)dt + h(x(t 1, u)) z uwzglȩdnieniem ograniczeń chwilowych u(t) [u, u + ]. 1

Gradient wskaźnika jakości zredukowanego do przestrzeni sterowania celowo jest obliczać z wykorzystaniem równania sprzȩżonego. Dla określenia tego równania definiowany jest funkcjona l Lagrange a w postaci normalnej L(η, x, u). = g(x(t), u(t), t)dt + h(x(t 1 )) + η T (t)(ẋ(t) f(x(t), u(t), t))dt + η T ( )(x( ) x ), gdzie η(t) W 1 2 ([, t 1 ]; R n ) jest zmienn a sprzȩżon a zwi azan a z analizowanym problemem. Zastosowanie wzoru na ca lkowanie przez czȩści daje w wyniku L(η, x, u). = g(x(t), u(t), t)dt + h(x(t 1 )) + η T (t 1 )x(t 1 ) η T ( )x( ) η T (t)x(t)dt η T (t)f(x(t), u(t), t)dt + η T ( )(x( ) x ). Uproszczenie wyrażeń identycznych i wprowadzenie funkcji Hamiltona postaci H(η(t), x(t), u(t), t). = g(x(t), u(t), t) + η T (t)f(x(t), u(t), t) umożliwia zapisanie funkcjona lu Lagrange a w postaci L(η, x, u) = h(x(t 1 )) ( η T (t)x(t) + H(η(t), x(t), u(t), t))dt +η T (t 1 )x(t 1 ) η T ( )x. Ponieważ dla każdego dopuszczalnego procesu sterowania obowi azuje tożsamość Lagrange a J(u) = L(η, x, u), wiȩc dla wariacji zredukowanego wskaźnika jakości zachodzi zależność J u (u)δu = L η (η, x, u)δη + L x (η, x, u)δx + L u (η, x, u)δu, gdzie δη, δx, δu s a wariacjami odpowiednio zmiennej sprzȩżonej, trajektorii stanu i sterowania. Wariacja funkcjona lu Lagrange a wzglȩdem zmiennej sprzȩżonej L η δη wyzerowuje siȩ na każdym procesie dopuszczalnym, gdyż ma ona postać iloczynu skalarnego wariacji zmiennej sprzȩżonej i równania stanu L η δη = δη T (t)(ẋ(t) f(x(t), u(t), t))dt L η δη =. 2

Wariacja funkcjona lu Lagrange a wzglȩdem trajektorii stanu wyzerowuje siȩ, jeśli zmienna sprzȩżona zostanie dobrana tak, aby by lo spe lnione tzw. równanie sprzȩżone. L x (η, x, u)δx = ( η T (t)δx(t) + H x (η(t), x(t), u(t), t))δx(t)dt. +h x (x(t 1 ))δx ( t 1 ) + η T (t 1 )δx(t 1 ). Zdefiniowanie równania sprzȩżonego w postaci równania różniczkowego z zadanym stanem końcowym η(t) = H T x (η(t), x(t), u(t), t), t [, t 1 ], η(t 1 ) = h T x (x(t 1 )) wyzerowuje wariacjȩ funkcjona lu Lagrange a wzglȩdem trajektorii stanu L x (η, x, u)δx. Tak wiȩc wariacja zredukowanego wskaźnika jakości wzglȩdem sterowania jest równa wariacji funkcjona lu Lagrange a wzglȩdem sterowania J u (u)δu = L u (u)δu. Ponieważ L u δu = H u (η(t), x(t), u(t), t)δu(t)dt wiȩc gradient wskaźnika jakości zredukowanego do przestrzeni sterowania wyraża siȩ wzorem J u (u)δu = J u (u)(t)δu(t)dt, J u (u)(t) = H u (η(t), x(t), u(t), t) t [, t 1 ]. Korzystaj ac z definicji funkcji Hamiltona można równanie sprzȩżone przepisać w postaci η(t) = f T x (x(t), u(t), t)η(t)+g T x (x(t), u(t), t), t [, t 1 ], η(t 1 ) = h T x (x(t 1 )), co oznacza, że równanie sprzȩżone jest liniowym (niestacjonarnym) równaniem różniczkowym z zadanym stanem końcowym. Wyznaczanie gradientu wskaźnika jakości zredukowanego do przestrzeni sterowania za pomoc a równania sprzȩżonego sprowadza siȩ do rozwi azania jednego pomocniczego liniowego równania różniczkowego. Natomiast bezpośrednie obliczanie gradientu zredukowanego do przestrzeni sterowania wymaga pos lugiwania siȩ macierz a fundamentaln a równania stanu X(t) J u (u) = (g x (x(t), u(t), t)δx(t) + g u (x(t), u(t), t)δu(t))dt + h x (x(t 1 ))δx(t 1 ). 3

gdzie wariacja trajektorii stanu δx(t) spe lnia zlinearyzowane równanie stanu δẋ(t) = f x (x(t), u(t), t)δx(t) + f u (x(t), u(t), t)δu(t), δx(t) =, którego rozwi azanie ma postać δx(t) = t X(t)X 1 ( t)f u (x( t), u( t), t)δu( t)d t, przy czym macierz fundamentalna X(t) spe lnia macierzowe równanie różniczkowe Ẋ(t) = f x (x(t), u(t), t)x(t), t [, t 1 ], X( ) = I n. Celem wyznaczenia gradientu zredukowanego metod a bezpośredni a należy wiȩc rozwi azać uk lad n 2 równań różniczkowych, a metod a pośredni a - tylko uk lad n równań różniczkowych. Różnica w czasie obliczeń może być istotna, jeśli obliczanie gradientu zredukowanego dokonywane jest wielokrotnie np. w algorytmach iteracyjnych z tysi acami iteracji. Podstawowy algorytm kierunków poprawy dla problemów sterowania optymalnego bazuje na Gradient wskaźnika jakości zredukowanego do przestrzeni sterowania i stanu pocz atkowego też moiżna oblicza z wykorzystaniem równania sprzȩżonego. Dla określenia tego równania definiowany jest funkcjona l Lagrange a w postaci normalnej η T (t)(ẋ(t) f(x(t), u(t), t))dt + η T ( )(x( ) x ), L(η, x, u, x ) =. g(x(t), u(t), t)dt + h(x(t 1 )) + gdzie η(t) W 1 2 ([, t 1 ]; R n ) jest zmienn a sprzȩżon a zwi azan a z analizowanym problemem. Zastosowanie wzoru na ca lkowanie przez czȩści daje w wyniku L(η, x, u) =. g(x(t), u(t), t)dt + h(x(t 1 )) + η T (t 1 )x(t 1 ) η T ( )x( ) η T (t)x(t)dt η T (t)f(x(t), u(t), t)dt + η T ( )(x( ) x ). Uproszczenie wyrażeń identycznych i wprowadzenie funkcji Hamiltona postaci H(η(t), x(t), u(t), t). = g(x(t), u(t), t) + η T (t)f(x(t), u(t), t) umożliwia zapisanie funkcjona lu Lagrange a w postaci L(η, x, u) = h(x(t 1 )) ( η T (t)x(t) + H(η(t), x(t), u(t), t))dt 4

+η T (t 1 )x(t 1 ) η T ( )x. Ponieważ dla każdego dopuszczalnego procesu sterowania obowi azuje tożsamość Lagrange a J(u, x ) = L(η, x, u, x ), wiȩc dla wariacji zredukowanego wskaźnika jakości zachodzi zależność J u (u, x )δu = L η (η, x, u, x )δη + L x (η, x, u, x )δx +L u (η, x, u, x )δu + L x (η, x, u, x ), gdzie δη, δx, δu oraz δx s a wariacjami odpowiednio zmiennej sprzȩżonej, trajektorii stanu, sterowania i stanu pocz atkowego. Stosuj ac analogiczne rozumowanie jak poprzednio wnioskujemy, że wariacja funkcjona lu Lagrange a wzglȩdem zmiennej sprzȩżonej L η δη wyzerowuje siȩ na każdym procesie dopuszczalnym, gdyż ma ona postać iloczynu skalarnego wariacji zmiennej sprzȩżonej i równania stanu L η δη = δη T (t)(ẋ(t) f(x(t), u(t), t))dt L η δη =. Wariacja funkcjona lu Lagrange a wzglȩdem trajektorii stanu wyzerowuje siȩ, jeśli zmienna sprzȩżona zostanie dobrana tak, aby by lo spe lnione równanie sprzȩżone. L x (η, x, u, x )δx = ( η T (t)δx(t) + H x (η(t), x(t), u(t), t))δx(t)dt. +h x (x(t 1 ))δx ( t 1 ) + η T (t 1 )δx(t 1 ). Zdefiniowanie równania sprzȩżonego w postaci równania różniczkowego z zadanym stanem końcowym η(t) = Hx T (η(t), x(t), u(t), t), t [, t 1 ], η(t 1 ) = h T x (x(t 1 )) wyzerowuje wariacjȩ funkcjona lu Lagrange a wzglȩdem trajektorii stanu L x (η, x, u, x )δx. Tak wiȩc wariacja zredukowanego wskaźnika jakości wzglȩdem sterowania i stanu pocz atkowego jest równa wariacji funkcjona lu Lagrange a wzglȩdem sterowania J u (u, x )δu = L η,x,u,x (u)δu + L x (η, x, u, x ). 5

Ponieważ L u δu = H u (η(t), x(t), u(t), t)δu(t)dt wiȩc gradient wskaźnika jakości zredukowanego do przestrzeni sterowania i stanu pocz atkowego wyraża siȩ wzorami J u (u, x )δu = jeśli chodzi o sterowanie oraz J u (u, x )(t)δu(t)dt, J u (u, x )(t) = H u (η(t), x(t), u(t), t) t [, t 1 ] jeśli chodzi o stan pocz atkowy. J x (u, x ) = η( ) Podstawowy algorytm kierunków poprawy dla problemów minimalizacji wskaźnika jakości zredukowanego do przestrzeni sterowania i stanu pocz atkowego bazuje na poszukiwaniu rozwi azania polepszaj acego ten wskaźnik w kierunku antygradientu u + (t) = u(t) γ + J u (u, x )(t), t [, t 1 ], x + = x γ + J x (u, x ), gdzie γ + > jest d lugości a kroku wyznaczan a w wyniku optymalizacji kierunkowej. Gradient wskaźnika jakości procesów okresowych zredukowanego do przestrzeni sterowań okresowych u L τ 2(R m ) można również obliczać z wykorzystaniem okresowego równania sprzȩżonego. Dla określenia tego równania definiowany jest funkcjona l Lagrange a w postaci normalnej L(η, x, u). = τ g(x(t), u(t), t)dt τ + η T (t)(ẋ(t) f(x(t), u(t), t))dt + η T ( )(x(τ) x()), gdzie η(t) W2 1τ ([, τ], R n ) jest zmienn a sprzȩżon a zwi azan a z analizowanym problemem. Zastosowanie wzoru na ca lkowanie przez czȩści daje w wyniku τ L(η, x, u). = τ η T (t)x(t)dt τ g(x(t), u(t), t)dt + η T (τ)x(τ) η T ()x() η T (t)f(x(t), u(t), t)dt + η T ()(x(τ) x()). 6

Uproszczenie wyrażeń identycznych i wprowadzenie funkcji Hamiltona postaci H(η(t), x(t), u(t), t) =. g(x(t), u(t), t) + η T (t)f(x(t), u(t), t) umożliwia zapisanie funkcjona lu Lagrange a w postaci L(η, x, u) = τ ( η T (t)x(t) + H(η(t), x(t), u(t), t))dt +η T (τ)x(τ) η T ()x(). Ponieważ dla każdego dopuszczalnego procesu sterowania obowi azuje tożsamość Lagrange a J(u) = L(η, x, u), wiȩc dla wariacji wskaźnika jakości zredukowanego do przestrzeni sterowań okresowych zachodzi zależność J u (u)δu = L η (η, x, u)δη + L x (η, x, u)δx + L u (η, x, u)δu, gdzie δη, δx, δu s a wariacjami odpowiednio zmiennej sprzȩżonej, trajektorii stanu i sterowania. Wariacja funkcjona lu Lagrange a wzglȩdem zmiennej sprzȩżonej L η δη wyzerowuje siȩ na każdym procesie dopuszczalnym, gdyż ma ona postać iloczynu skalarnego wariacji zmiennej sprzȩżonej i równania stanu L η δη = τ δη T (t)(ẋ(t) f(x(t), u(t), t))dt L η δη+δη T (τ)x(τ) δη T ()x() =. Wariacja funkcjona lu Lagrange a wzglȩdem trajektorii stanu wyzerowuje siȩ, jeśli zmienna sprzȩżona zostanie dobrana tak, aby by lo spe lnione tzw. równanie sprzȩżone z warunkiem okresowości zmiennych sprzȩżonych. L x (η, x, u)δx = τ ( η T (t)δx(t) + H x (η(t), x(t), u(t), t))δx(t)dt +(η T (τ) η T ())δx(). Zdefiniowanie równania sprzȩżonego w postaci równania różniczkowego z warunkiem okresowości zmiennych sprzȩżonych η(t) = Hx T (η(t), x(t), u(t), t), t [, τ], η(τ) = η() wyzerowuje wariacjȩ funkcjona lu Lagrange a wzglȩdem trajektorii stanu L x (η, x, u)δx. 7

Tak wiȩc wariacja zredukowanego wskaźnika jakości wzglȩdem sterowania okresowego jest równa wariacji funkcjona lu Lagrange a wzglȩdem tego sterowania J u (u)δu = L u (u)δu. Ponieważ τ L u δu = H u (η(t), x(t), u(t), t)δu(t)dt wiȩc gradient wskaźnika jakości zredukowanego do przestrzeni sterowania okresowego wyraża siȩ wzorem J u (u)δu = τ J u (u)(t)δu(t)dt, J u (u)(t) = H u (η(t), x(t), u(t), t) t [, τ]. Korzystaj ac z definicji funkcji Hamiltona można równanie sprzȩżone przepisać w postaci η(t) = f T x (x(t), u(t), t)η(t) + g T x (x(t), u(t), t), t [, t 1 ], η(τ) = η(), co oznacza, że równanie sprzȩżone jest liniowym (niestacjonarnym) równaniem różniczkowym z warunkiem okresowości. Wyznaczanie gradientu wskaźnika jakości zredukowanego do przestrzeni sterowania okresowego za pomoc a równania sprzȩżonego sprowadza siȩ do rozwi azania jednego pomocniczego liniowego równania różniczkowego z warunkiem okresowości zmiennych sprzȩżonych. Praktyczna realizacja wielu algorytmów sterowania optymalnego zwi azana jest z dyskretyzacj a sterowania. Zastosowanie znajduje tu przede wszystkim baza funkcji schodkowych ( =, t 1 = 1) u(t, u) = K 1 k= e k(t)u k, gdzie u k R m and { 1 if t [k/k, (k + 1)/K), e k (t) = if t / [k/k, (k + 1)/K). Gradient wskaźnika jakości zredukowanego do przestrzeni funkcji schodkowych uzyskuje siȩ po podstawieniu do wyrażenia J u (u)δu = 1 H u (x(t), u(t), t)δu(t)dt, schodkowej dyskretyzacji sterowania δu(t, u) = k 1 k= e k(t)δu k J u (u) = (J uk (u)) K 1 k=, gdzie (k+1)δ J uk (u) = H u (x(t), u(t), t)dt, δ =. 1/K, k =, 1,..., K 1. kδ 8

Metody optymalizacji różnicowej procesów sterowania W wielu problemach sterowania dok ladne obliczanie gradientu J (u) wskaznika jakości zredukowanego do przestrzeni sterowania jest utrudnione z uwagi na z lożoność modelu procesu (duża liczba zmiennych stanu, nieliniowy charakter procesu, niestandardowe warunki brzegowe stanu - okresowe, pseudookresowe, mieszane). Zastosowanie równań sprzȩżonych daje dobre wyniki dla zadań z zadanym stanem pocz atkowym i stosunkowo niewielk a liczb a równań stanu. W innych przypadkach celowe może być wykorzystanie gradientu różnicowego, który obliczany jest wy l acznie na podstawie znajomości wartości wskaznika jakości J (u) ( (J(u+de 1 ) J(u))/d, (J(u+de 2 ) J(u))/d,..., (J(u+de k) J(u))/d ), gdzie e k. = (,...,, 1,,..., ) T jest k-tym wersorem uk ladu wspó lrzȩdnych dyskretnego sterowania, a d jest d lugości a kroku ilorazu różnicowego. Lemat: Niech funkcja J : R k R bȩdzie różniczkowalna w sposób ci ag ly w obszarze otwartym i wypuk lym D zawieraj acym punkt u i niech gradient J (u) funkcji J(u) spe lnia w obszarze D warunek Lipschitza J (u + δu) J (u) L δu, u, u + δu D. Dla funkcji posiadaj acych gradient ci ag ly w sensie Lipschitza prawostronna aproksymacja różnicowa sk ladowych gradientu jest zbieżna liniowo do ich dok- ladnych wartości wzglȩdem d lugości kroku ilorazu różnicowego. Dowód. Za lożenie lematu gwarantuje spe lnienie przez funkcjȩ J(u) nierówności J(u + de k) J(u) d J (u)e k L 2 d. J(u + δu) J(u) J (u)δu.5l δu 2. Oszacowanie to wynika z rozwiniȩcia funkcji J(u) w szereg Taylora pierwszego rzȩdu J(u + δu) = J(u) + J (u)δu + 9 1 J (u + θδu)δudθ

czyli J(u + δu) J(u) J (u)δu = 1 (J (u + θδu) J(u))δudθ. Warunek Lipschitza dla gradientu J (u) implikuje zależności J(u + δu) J(u) J (u)δu 1 Podstawienie δu = de k 1 J (u + θδu) J(u) δu dθ 1 L θδu δu dθ = L δu 2 θdθ = L 2 δu 2. J(u + de k ) J(u) J (u)de k L 2 de k 2 = L 2 d 2. Dziel ac powyższ a nierówność przez d uzyskujemy J(u + de k) J(u) d J (u)e k L 2 d. Jeśli wiȩc funkcja posiada gradient ci ag ly w sensie Lipschitza, to prawostronna aproksymacja różnicowa sk ladowych gradientu jest zbieżna do ich dok ladnych wartości liniowo wzglȩdem d lugości kroku ilorazu różnicowego. Zalet a metody gradientu różnicowego jest jej uniwersalność (można j a zastosować do każdej funkcji L-ci ag lej jeśli tylko dostȩpne s a jej wartości) i prostota realizacji metody (stosuje siȩ w tym przypadku elementarne operacje obliczeniowe). Jej wad a jest duża wrażliwość na b lȩdy pojawiaj ace siȩ przy ma lej precyzji obliczeń. Zmniejszenie tej wrażliwości osi agn ać można stosuj ac dok ladniejsze metody aproksymacji różnicowej np. dwustronny centralny iloraz różnicowy: J (u) ( (J(u + de 1 ) J(u de 1 )))/2d, (J(u + de 2 ) J(u de 2 )))/2d,..., (J(u + de k) J(u de k)))/2d ), gdzie obliczane s a wartości wskaznika jakości dla argumentów przesuniȩtych na prawo i na lewo od punktu aktualnego. Niech H(u). = J u k u l (u) oznacza hesjan funkcji J(u) tj. macierz jej drugich pochodnych cz astkowych. Lemat: Niech funkcja J : R k R bȩdzie dwukrotnie różniczkowalna w sposób ci ag ly w obszarze otwartym i wypuk lym D zawieraj acym punkt u i niech hesjan H(u) funkcji J(u) spe lnia w obszarze D warunek Lipschitza H(u + δu) H(u) L δu, u, u + δu D. 1

Dla funkcji posiadaj acych hesjan ci ag ly w sensie Lipschitza dwustronna centralna aproksymacja różnicowa sk ladowych gradientu jest zbieżna kwadratowo do ich dok ladnych wartości wzglȩdem d lugości kroku ilorazu różnicowego. J(u + de k) J(u de k ) 2d J (u)e k L 6 d 2. Dowód wykorzystuje oszacowanie dok ladności rozwiniȩcia funkcji J(u w szereg Taylora drugiego rzȩdu z uwzglȩdnieniem spe lnienia warunku Lipschitza przez hesjan tej funkcji J(u + δu) J(u) J (u)δu +.5δu T H(u)δu L 6 δu 3 ( ). Określa siȩ nastȩpnie prawostronne i lewostronne rozwiniȩcie funkcji J wzd luż wersora u k : α. = J(u + de k ) J(u) dj u k (u) d 2 J u k u k (u), β. = J(u de k ) J(u) + dj u k (u) d 2 J u k u k (u), Zastosowanie oszacowania (*) do wielkości α i β w kierunku ±de k daje w wyniku nierówności α L 6 d3, β L 6 d3. St ad α β α + β L 3 d3. Poszukiwane oszacowanie wynika z równości 1 2d (α β) = J(u + de k) J(u de k ) J (u)e k. d Obliczanie hesjanu wskaznika jakości zredukowanego do przestrzeni sterowania wymaga znacznego nak ladu obliczeń. Dlatego użyteczna jest aproksymacja drugich pochodnych cz astkowych za pomoc a ilorazów różnicowych drugiego rzȩdu J uk u l (u) ( J(u + de k + de l ) J(u + de k ) J(u + de l ) + J(u) ) /d 2. Dla funkcji z hesjanem ci ag lym w sensie Lipschitza aproksymacja powyższa jest zbieżna liniowo do dok ladnej wartości drugiej pochodnej, co wynika z oszacowania J uk u l (u) ( J(u + de k + de l ) J(u + de k ) J(u + de l ) + J(u) ) /d 2 5 3 Ld uzyskiwanego na podstawie dok ladności rozwiniȩcia funkcji J w szereg Taylora drugiego rzȩdu. 11

Jedn a z klas problemów optymalnego sterowania, dla której obliczanie gradientu zredukowanego wskanika jakości jest utrudnione, jest klasa problemów optymalnego sterowania cyklicznego. Równania sprzȩżone s a w tym przypadku z regu ly niestabilne i ich ca lkowanie wymaga zastosowania szczególnie dok ladnych metod. Dlatego celowo jest w tym przypadku wykorzystać metodȩ gradientu różnicowego. Metoda przesuwanej funkcji kary i zmodyfikowanej funkcji Lagrange a dla problemów sterowania optymalnego z równościowymi ograniczeniami nieliniowymi Problem optymalnego sterowania procesem dynamicznym z równościowymi ograniczeniami nieliniowymi może polegać na minimalizacji ca lkowego wskaźnika jakości z uwzglȩdnieniem G(x, u) = g(x(t), u(t), t)dt równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x ograniczeń równościowych niektórych lub wszystkich wspó lrzȩdnych stanu końcowego h(x(t 1 )) = oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, t 1 ], gdzie x W ([t 1, t 1 ]; R n ) jest trajektori a stanu procesu, u L ([, t 1 ]; R m ) jest jego sterowaniem, a g : R n R m R R, f : R n R m R R n, h : R n R p, s a, ogólnie bior ac, funkcjami nieliniowymi. Standardowe twierdzenia o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym pozwalaj a uważać równanie stanu rozważanej 12

klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Na tej podstawie można zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości z uwzglȩdnieniem J(u). = g(x(t, u), u(t), t)dt równościowych ograniczeń nieliniowych stanu końcowego oraz ograniczeń chwilowych sterowania h(x(t 1, u)) = u(t) [u, u + ], t [, t 1 ]. Te ostatnie ograniczenia mog a nie być w l aczone w sposób jawny do sformu lowania niektórych problemów jeśli minimalizacja wskaźnika jakości automatycznie ogranicza amplitudȩ sterowania. Przyk lad: Niech x 1 (t) oznacza po lożenie nieliniowego obiektu oscylacyjnego w chwili t, x 2 (t) - jego prȩdkość w chwili t, zaś u(t) - si lȩ stabilizuj a a obiektu. Minimalnoenergetyczne sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci strat energetycznych na sterowanie G(x, u) = z uwzglȩdnieniem 1 u 2 (t)dt równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, oraz 13

nieliniowych ograniczeń stanu końcowego x 1 (1) =, x 2 (1) =. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 1 u 2 (t)dt przy równościowym ograniczeniu nieliniowym x 1 (1, u) =, x 2 (1, u) =. Minimalnoczasowe sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci czasu realizacji procesu G(x, u) = z uwzglȩdnieniem równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, dt nieliniowych ograniczeń stanu końcowego x 1 (t 1 ) =, x 2 (t 1 ) =, oraz ograniczenia chwilowego sterowania u(t) [u, u + ], t [, t 1 ]. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 14 dt

przy równościowym ograniczeniu nieliniowym x 1 (t 1, u) =, x 2 (t 1, u) =. i nierównościowym ograniczeniu chwilowym sterowania u(t) [u, u + ], t [, t 1 ]. Powyższe przyk lady ilustruj a problemy sterowania docelowego - obiekt należy przeprowadzić z zadanego stanu pocz atkowego (tj. stanu zaburzonego) do zadanego stanu końcowego (tj. stanu równowagi). Z zadaniami tego rodzaju mamy do czynienia przy rozruchu procesów np. należy przeprowadzić obiekt z naturalnego stanu pocz atkowego (wsad pewnej ilości surowca w chwili pocz atkowej, brak produktu użytecznego w chwili pocz atkowej) do docelowego stanu technologicznego (np. stabilnego statycznego punktu równowagi procesu umożliwiaj acego statyczny sposób jego prowadzenia). Przyk lad: Proces produkcyjny prowadzony w zbiornikowym reaktorze chemicznym polega na przemianie surowca A w produkt użyteczny B z wykorzystaniem sterowania temperaturowego. Niech x 1 (t) oznacza stȩżenie A w obiekcie w chwili t, x 2 (t) - stȩżenie B w obiekcie w chwili t, a x 3 (t) - temperaturȩ obiektu w chwili t. Należy zminimalizować koszty sterowania temperaturowego G(x, u) = z uwzglȩdnieniem 1 u(t)dt równań stanu procesu z naturalnymi pocz atkowymi wartościami wspó lrzȩdnych stanu ẋ 1 (t) = a 1 e b/u(t) x 2 1(t), t [, 1], x 1 () = x 1 >, ẋ 2 (t) = a 1 e b/u(t) x 2 2(t), t [, 1], x 2 () =, ẋ 3 (t) = a 2 u(t) a 3 x 2 3(t), t [, 1], x 3 () = x 3 >, ograniczeń stanu docelowego oraz x 1 (1) = x 11, x 2 (1) = x 21, x 3 (1) = x 31 15

ograniczeń chwilowych sterowania u(t) [u, u + ], t [, 1]. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 1 u(t)dt przy równościowym ograniczeniu nieliniowym x 1 (1, u) = x 11, x 2 (1, u) = x 21, x 3 (1, u) = x 31 i nierównościowych ograniczeniach chwilowych sterowania u(t) [u, u + ], t [, 1]. Problemy sterowania optymalnego z nieliniowymi ograniczeniami równościowymi s a charakterystyczne dla niektórych procesów o parametrach roz lożonych. Przyk lad. Sterowanie nagrzewem prȩta metalowego z izolowanymi końcami. x(t, z) z 1 u(t, z) Roz lożonym stanem procesu x(t, z) jest temperatura prȩta w chwili t i w punkcie z. Roz lożonym sterowaniem procesu u(t, z) jest intensywność źród la ciep la w chwili t i w punkcie z. Problem sterowania optymalnego może polegać na minimalizacji strat energetycznych na nagrzewanie 1 u 2 (t, z)dtdz z uwzglȩdnieniem równania stanu jako równania przewodnictwa cieplnego ze sterowaniem temperaturowym x t (t, z) = α(x(t, z), u(t, z))x zz (t, z) ãx(t, z) + bu(t, z), (t, z) [, t 1 ] [, 1] 16

i z warunkami brzegowymi x(t, ) =, x(t, 1) =, t [, t 1 ] (co oznacza, że na izolowanych końcach prȩta utrzymywana jest umowna temperatura zerowa) oraz z warunkiem pocz atkowym tj. z zadanym rozk ladem pocz atkowym temperatury w prȩcie x(, z) = x (z), z [, 1], przy czym określony jest docelowy rozk lad temperatury w prȩcie x(t 1, z) = x 1 (z), z [, 1]. W równaniu stanu wziȩto pod uwagȩ zależność wspó lczynnika przewodnictwa cieplnego α od stanu i sterowania (np. z uwagi na niejednorodność materia lu). Równanie to jest wiȩc nieliniowe i określa nieliniow a zależność stanu od sterowania x(t, z, u). Po redukcji do przestrzeni sterowania zadanie przybiera postać: zminimalizować wskaźnik jakości 1 u 2 (t, z)dtdz przy nieliniowym funkcyjnym ograniczeniu równościowym x(t 1, z, u) = x 1 (z), z [, 1]. Dyskretyzacja schodkowa sterowania u(t, u k ) = K 1 k= e k(t)u k sprowadza rozpatrywane problemy do zadań optymalizacji skończenie-wymiarowej typu min u R m{j(u k) : ϕ(u) =, u k [u, u + ], k =, 1, 2,..., K 1, m =. mk}, gdzie sk ladowe odwzorowania ϕ : R m R p s a funkcjami nieliniowymi i niewypuk lymi. Jeśli wskaźnik jakości ogranicza amplitudȩ sterowania, to zadanie powyższe upraszcza siȩ do postaci min u R m{j(u) : ϕ(u) = }. Do zadania tego można zastosować metodȩ kwadratowej funkcji kary, która prowadzi do zadania optymalizacji bez ograniczeń Φ(u, ρ). = min u R m{j(u) + ρ 2 ϕ(u) 2 }, 17

gdzie ρ > jest wspó lczynnikiem funkcji kary. Analiza tej metody pokazuje jednak, że sterowania optymalne dla problemu z funkcj a kary s a zbieżne do rozwi azania problemu wyjściowego tylko wtedy, gdy wspó lczynnik kary ρ jest zwiȩkszany do nieskończoności. Przy dużych wspó lczynnikach kary problem staje siȩ źle uwarunkowany i metoda kwadratowej funkcji kary jest ma lo skuteczna. Dlatego zaproponowano ulepszone warianty tej metody. Jednym z nich jest metoda przesuwanej kwadratowej funkcji kary Ψ(u, ρ, ν). = min u R mk {J(u) + ρ 2 ϕ(u) + ν 2 }, gdzie sk ladowe przesuniȩcia funkcji kary ν R p s a zwiȩkszane w t a stronȩ, w któr a naruszone zosta lo ograniczenie na danym sterowaniu. Zwiȩksza to wartość funkcji kary baz zmiany wspó lczynnika ρ i wymusza zbliżenie sterowania do obszaru dopuszczalnego. Niech nieliniowe ograniczenie równościowe ma postać zwi azan a ze stanem końcowym procesu tj. ϕ(u) = x(t 1, u) x 1. Algorytm przesuwanej funkcji kary Etap wstȩpny. Wybierz wymiar bazy schodkowej sterowania K i dyskretne sterowanie pocz atkowe u =. {u k } K 1 k=, pocz atkowe dopuszczalne naruszenie ograniczenia d, wspó lczynnik zmniejszania naruszenia ograniczenia α (, 1), pocz atkowy wspó lczynnik kary ρ i wspó lczynnik jego zwiȩkszania β > 1, pocz atkowe przesuniȩcie kary ν = i dok ladność obliczeń ɛ. Etap pierwszy. dyskretnym Wyznacz rozwi azanie równania stanu ze sterowaniem ẋ(t) = f(x(t), u(t, u), t), t [, 1], x() = x oraz równanie sprzȩżone ze sterowaniem dyskretnym η(t) = fx T (x(t), u(t, u), t)η(t) + gx T (x(t), u(t, u), t), t [, 1], η(1) = ρ(x(1) x 1 + ν). 18

Etap drugi. Oblicz gradient zredukowanego wskaźnika jakości (k+1)δ J uk (u) = H u (η(t), x(t), u(t, u), t)dt, δ = 1/K, k =, 1,..., K 1, kδ i podstaw startow a d lugość kroku γ = 1. Etap trzeci. Wyznacz rozwi azanie problemu optymalizacji bez ograniczeń u = arg min u R m Ψ(u, ρ, ν) z dok ladności a ɛ stosuj ac metodȩ typu gradientowego u := u γψ u (u) i oblicz naruszenie ograniczenia c = x(1) x 1. Jeśli c d, to podstaw ν := ν + x(1) x 1, d := αd. Jeśli c > d, to podstaw ν := 1 β (ν + x(1) x 1), ρ := βρ. Etap czwarty. Jeśli u + u < ɛ, to stop. W przeciwnym razie wróć do Etapu pierwszego. Przesuwanie funkcji kary celowo jest powi azać z mnożnikami Lagrange a charakteryzuj acymi rozwi azanie optymalne. Wskaźnik jakości z przesuwan a kwadratow a funkcj a kary można przekszta lcić jak nastȩpuje J(u) + ρ 2 ϕ(u) + ν 2 = J(u) + ρ ( ϕ(u) + ν, ϕ(u) + ν ) 2 = ϕ(u), ϕ(u) + 2 ϕ(u), ν + ν, ν. Po podstawieniu ν = λ/ρ uzyskuje siȩ równoważn a funkcjȩ celu zwan a zmodyfikowan a funkcj a Lagrange a M(u, λ, ρ). = J(u) + λ T ϕ(u) + ρ 2 ϕ(u) 2, gdzie λ R p jest mnożnikiem Lagrange a. Algorytm optymalizacji z wykorzystaniem zmodyfikowanej funkcji Lagrange a przybierze postać u = arg min M(u, ρ, ν), λ := λ + ρϕ(u). u R m 19

Zbieżność i szybkość zbieżności algorytmu zmodyfikowanej funkcji Lagrange a W analizie w lasności algorytmu korzysta siȩ z nastȩpuj acego lematu o minimum lokalnym funkcji zaburzonej. Lemat. Jeśli u jest lokalnym minimum funkcji f(u ) spe lniaj acym warunki optymalności drugiego rzȩdu f (u ) =, f (u ) >, a g(u ) jest różniczkowalna w sposób ci ag ly w otoczeniu u, to funkcja zaburzona f(u ) + εg(u ) posiada dla dostatecznie ma lego ɛ lokalne minimum u ε określone zależności a u ε = u ε(f (u )) 1 g (u ) + o(ε). Niech λ oznacza optymalny mnożnik Lagrange a dla zadania optymalizacji z równościowym ograniczeniem nieliniowym, niech λ κ i u κ oznaczaj a mnożnik Lagrange a i sterowanie na κ-tej iteracji algorytmu i niech f(u) =. M(u, λ, ρ), g(u) =. λ κ λ, ϕ(u). Wtedy f(u) + g(u) = M(u, λ, ρ) + λ κ λ, ϕ(u) = J(u) + λ, ϕ(u) +.5ρ ϕ(u) 2 + λ κ, ϕ(u) λ, ϕ(u) = M(u, λ κ, ρ). Jeśli λ κ jest dobrym przybliżeniem λ, to λ κ λ jest wielkości a ma l a (tj. λ κ λ ε) i można uważać, że u κ+1 jest minimum lokalnym funkcji f(u) + g(u) w otoczeniu u, przy czym u κ+1 u = (f (u )) 1 ϕ T (u )(λ κ λ ) + o(λ κ λ ). ( ) Wprowadzenie oznaczeń C. = ϕ (u ), L(u, λ). = J(u) + λ, ϕ(u), A. = L uu(u, λ ), pozwala zapisać nastȩpuj ace wyrażenia dla pochodnych funkcji f i g: f (u ) = L uu(u, λ ) + ρ(ϕ(u)ϕ (u)) u=u = A + ρc T C, ϕ(u ) =, Ze wzoru ( ) uzyskuje siȩ oszacowanie g (u ) = C T (λ κ λ ). u κ+1 u (A + ρc T C) 1 C T λ κ λ + o( λ κ λ ) c ρ λκ λ + o(λ κ λ ), 2

przy czym stosuje siȩ tu wynikaj ace z teorii macierzowych form kwadratowych oszacowanie Ponieważ wiȩc (A + ρc T C) 1 c/ρ. λ κ+1 = λ κ + ρ(ϕ(u κ+1 ) ϕ(u κ )) = λ κ + ρc(u κ+1 u ) + o(u κ+1 u ) = λ κ ρc(a + ρc T C) 1 C T (λ κ λ ) + o(λ κ λ ), λ κ+1 λ I ρc(a + ρc T C) 1 C T λ κ+1 λ + o(λ κ+1 λ ). Stosuj ac wynikaj ace z teorii macierzowych form kwadratowych oszacowanie ostatecznie uzyskuje siȩ I ρc(a + ρc T C) 1 c/ρ u κ u ( c 1 ρ )κ, λ κ λ ( c 2 ρ )κ, κ =, 1, 2,.... Oznacza to, że metoda zmodyfikowanych funkcji Lagrange a (a co za tym idzie i metoda przesuwanej funkcji kary) jest zbieżna liniowo dla rozważanych problemów sterowania optymalnego. 21

Metoda przesuwanej funkcji kary i zmodyfikowanej funkcji Lagrange a dla problemów sterowania optymalnego z nierównościowymi ograniczeniami nieliniowymi Problem optymalnego sterowania procesem dynamicznym z równościowymi ograniczeniami nieliniowymi może polegać na minimalizacji ca lkowego wskaźnika jakości z uwzglȩdnieniem G(x, u) = g(x(t), u(t), t)dt równania stanu procesu z zadanym stanem pocz atkowym ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x ograniczeń nierównościowych niektórych lub wszystkich wspó lrzȩdnych stanu końcowego h(x(t 1 )) oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, t 1 ], gdzie x W ([t 1, t 1 ]; R n ) jest trajektori a stanu procesu, u L ([, t 1 ]; R m ) jest jego sterowaniem, a g : R n R m R R, f : R n R m R R n, h : R n R p, s a, ogólnie bior ac, funkcjami nieliniowymi. Standardowe twierdzenia o istnieniu rozwi azania równania różniczkowego z zadanym warunkiem pocz atkowym pozwalaj a uważać równanie stanu rozważanej klasy procesów za rozwik lywalne wzglȩdem stanu w funkcji sterowania. Określone jest wiȩc odwzorowanie x(t, u) jednoznacznie wyznaczaj ace stan procesu w chwili t w funkcju sterowania u. Na tej podstawie można zredukować rozważany problem do przestrzeni sterowania: zminimalizować zredukowany wskaźnik jakości z uwzglȩdnieniem J(u). = g(x(t, u), u(t), t)dt 22

nierównościowych ograniczeń nieliniowych stanu końcowego oraz ograniczeń chwilowych sterowania h(x(t 1, u)) u(t) [u, u + ], t [, t 1 ]. Te ostatnie ograniczenia mog a nie być w l aczone w sposób jawny do sformu lowania niektórych problemów jeśli minimalizacja wskaźnika jakości automatycznie ogranicza amplitudȩ sterowania. Przyk lad: Niech x 1 (t) oznacza po lożenie nieliniowego obiektu oscylacyjnego w chwili t, x 2 (t) - jego prȩdkość w chwili t, zaś u(t) - si lȩ stabilizuj a a obiektu. Minimalnoenergetyczne sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci strat energetycznych na sterowanie G(x, u) = z uwzglȩdnieniem 1 u 2 (t)dt równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, oraz nieliniowych ograniczeń stanu końcowego x 2 1(1) ɛ, x 2 2(1) ɛ, ɛ >. W tym przypadku obiekt należy sprowadzić do pewnego otoczenia punktu równowagi. 23

Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = 1 u 2 (t)dt przy równościowym ograniczeniu nieliniowym x 2 1(1, u) ɛ, x 2 2(1, u) ɛ. Minimalnoczasowe sprowadzanie nieliniowego obiektu oscylacyjnego do stanu równowagi polega na minimalizacji wskaźnika jakości w postaci czasu realizacji procesu G(x, u) = z uwzglȩdnieniem równań stanu nieliniowego oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + a 11 x 3 1(t) a 2 x 2 (t) + u(t), t [, 1], z zaburzonym stanem pocz atkowym x 1 () = x 1, x 2 () = x 2, dt nieliniowych ograniczeń nierównościowych stanu końcowego x 2 1(t 1 ) ɛ, x 2 2(t 1 ) ɛ, oraz ograniczenia chwilowego sterowania u(t) [u, u + ], t [, t 1 ]. Po redukcji do przestrzeni sterowania problem przybiera postać: zminimalizować zredukowany wskaźnik jakości J(u) = przy nierównościowych ograniczeniach nieliniowych stanu końcowego x 2 1(t 1, u) ɛ, x 2 2(t 1, u) ɛ. 24 dt

i nierównościowym ograniczeniu chwilowym sterowania u(t) [u, u + ], t [, t 1 ]. Powyższe przyk lady ilustruj a problemy sterowania do obszaru docelowego - obiekt należy przeprowadzić z zadanego stanu pocz atkowego do zadanego obszaru końcowego. Z zadaniami tego rodzaju mamy do czynienia np. przy ograniczeniach na zawartość produktu ubocznego w produkcie końcowym. Przyk lad: Proces produkcyjny prowadzony w zbiornikowym reaktorze chemicznym polega na przemianie surowca A w produkt użyteczny B z uwzglȩdnieniem produktu ubocznego C. Niech x 1 (t) oznacza stȩżenie A w obiekcie w chwili t, x 2 (t) - stȩżenie B w obiekcie w chwili t, a x 3 (t) - stȩżenie C w chwili t. Należy zmaksymalizować ilość produktu użytecznego w chwili końcowej procesu G(x, u) = x 2 (1) przy ograniczeniach w postaci równań stanu procesu z zadanymi pocz atkowymi wartościami wspó lrzȩdnych stanu ẋ 1 (t) = a 1 e b/u(t) x 2 1(t), t [, 1], x 1 () = x 1 >, ẋ 2 (t) = a 1 e b/u(t) x 2 2(t), t [, 1], x 2 () =, ẋ 3 (t) = a 2 u(t) a 3 x 2 3(t), t [, 1], x 3 () = x 3 >, nierównościowego ograniczeńia stanu końcowego x 3 (1) x 31 oraz ograniczeń chwilowych sterowania u(t) [u, u + ], t [, 1]. Po redukcji do przestrzeni sterowania problem przybiera postać: zmaksymalizować zredukowany wskaźnik jakości J(u) = x 2 (1) 25

przy nierównościowym ograniczeniu nieliniowym x 3 (1, u) x 31 i nierównościowych ograniczeniach chwilowych sterowania u(t) [u, u + ], t [, 1]. Dyskretyzacja schodkowa sterowania u(t, u k ) = K 1 k= e k(t)u k sprowadza rozpatrywane problemy do zadań optymalizacji skończenie-wymiarowej typu min u R m{j(u k) : ϕ(u), u k [u, u + ], k =, 1, 2,..., K 1, m =. mk}, gdzie sk ladowe odwzorowania ϕ : R m R p s a funkcjami nieliniowymi i niewypuk lymi. Jeśli wskaźnik jakości ogranicza amplitudȩ sterowania, to zadanie powyższe upraszcza siȩ do postaci min u R m{j(u) : ϕ(u) }. Do zadania tego można zastosować metodȩ kwadratowej funkcji kary dla ograniczeń nierównościowych, która prowadzi do zadania optymalizacji bez ograniczeń Φ(u, ρ). = min u R m{j(u) + ρ 2 max2 (, ϕ(u)}, gdzie ρ > jest wspó lczynnikiem funkcji kary. Analiza tej metody pokazuje jednak, że sterowania optymalne dla problemu z funkcj a kary s a zbieżne do rozwi azania problemu wyjściowego tylko wtedy, gdy wspó lczynnik kary ρ jest zwiȩkszany do nieskończoności. Przy dużych wspó lczynnikach kary problem staje siȩ źle uwarunkowany i metoda kwadratowej funkcji kary dla ograniczeń nierównościowych jest ma lo skuteczna. Dlatego zaproponowano ulepszone warianty tej metody. Jednym z nich jest metoda przesuwanej kwadratowej funkcji kary dla ograniczeń nierównościowych Ψ(u, ρ, ν). = min u R m{j(u) + ρ 2 max2 (, ϕ(u) + ν)}, gdzie sk ladowe przesuniȩcia funkcji kary ν R p s a zwiȩkszane w t a stronȩ, w któr a naruszone zosta lo ograniczenie na danym sterowaniu. Zwiȩksza to wartość funkcji kary baz zmiany wspó lczynnika ρ i wymusza zbliżenie sterowania do obszaru dopuszczalnego. 26

Niech nieliniowe ograniczenie nierównościowe ma postać zwi azan a ze stanem końcowym procesu np. jest ograniczeniem zawartości końcowej x n1 produktu ubocznego modelowanego przez ostatni a zmiennca stanu x n ϕ(u), ϕ(u) = x n (1, u)) x n1. Algorytm przesuwanej funkcji kary dla ograniczeń nierównościowych Etap wstȩpny. Wybierz wymiar bazy schodkowej sterowania K i dyskretne sterowanie pocz atkowe u =. {u k } K 1 k=, pocz atkowe dopuszczalne naruszenie ograniczenia d, wspó lczynnik zmniejszania naruszenia ograniczenia α (, 1), pocz atkowy wspó lczynnik kary ρ i wspó lczynnik jego zwiȩkszania β > 1, pocz atkowe przesuniȩcie kary ν = i dok ladność obliczeń ɛ. Etap pierwszy. dyskretnym Wyznacz rozwi azanie równania stanu ze sterowaniem ẋ(t) = f(x(t), u(t, u), t), t [, 1], x() = x oraz równanie sprzȩżone ze sterowaniem dyskretnym η(t) = fx T (x(t), u(t, u), t)η(t) + gx T (x(t), u(t, u), t), t [, 1], η(1) = ρ max(, x n (1) + ν)(,...,, 1) T. Etap drugi. Oblicz gradient zredukowanego wskaźnika jakości J uk (u) = (k+1)δ kδ H u (η(t), x(t), u(t, u), t)dt, δ = 1/K, k =, 1,..., K 1, i podstaw startow a d lugość kroku γ = 1. Etap trzeci. Wyznacz rozwi azanie problemu optymalizacji bez ograniczeń u = arg min u R m Ψ(u, ρ, ν) z dok ladności a ɛ stosuj ac metodȩ typu gradientowego u := u γψ u (u) i oblicz naruszenie ograniczenia c = max 2 (, x n (1) x n1 ). Jeśli c d, to podstaw ν := ν + x n (1) x n1, d := αd. Jeśli c > d, to podstaw ν := 1 (ν + x β n(1) x n1 ), ρ := βρ. 27

Etap czwarty. Jeśli u + u < ɛ, to stop. W przeciwnym razie wróć do Etapu pierwszego. 28