Wprowadzenie do metod sterowania optymalnego

Podobne dokumenty
Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Sterowanie minimalnoczasowe dla uk ladów liniowych. Krzywe prze l aczeń.

Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Sterowalność liniowych uk ladów sterowania

POCHODNA KIERUNKOWA. DEFINICJA Jeśli istnieje granica lim. to granica ta nazywa siȩ pochodn a kierunkow a funkcji f(m) w kierunku osi l i oznaczamy

Wprowadzenie do metod sterowania optymalnego

Liniowe uk lady sterowania.

Ekonomia matematyczna i dynamiczna optymalizacja

Synteza optymalnego regulatora stanu. Uk lady z czasem ci ag lym.

Liczby zespolone, liniowa zależność i bazy Javier de Lucas. a d b c. ad bc

Stabilność liniowych uk ladów sterowania

Metody kierunków poprawy dla nieliniowych problemów sterowania optymalnego

Funkcje wielu zmiennych

liniowych uk ladów sterowania

y 1 y 2 = f 2 (t, y 1, y 2,..., y n )... y n = f n (t, y 1, y 2,..., y n ) f 1 (t, y 1, y 2,..., y n ) y = f(t, y),, f(t, y) =

Wprowadzenie do teorii sterowania

Sterowanie optymalne

Równania różniczkowe cz astkowe rzȩdu pierwszego

Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka

CHEMIA KWANTOWA MONIKA MUSIA L. Ćwiczenia. mm

Wprowadzenie z dynamicznej optymalizacji

Po wprowadzeniu zmiennych uzupe lniaj acych otrzymamy równoważny mu problem w postaci kanonicznej:

Pierwsze kolokwium z Matematyki I 4. listopada 2013 r. J. de Lucas

Funkcje wielu zmiennych

Elementy analizy funkcjonalnej PRZESTRZENIE LINIOWE

Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010

ANALIZA II 15 marca 2014 Semestr letni. Ćwiczenie 1. Czy dan a funkcjȩ da siȩ dookreślić w punkcie (0, 0) tak, żeby otrzymana funkcja by la ci ag la?

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Wyk lad 14 Formy kwadratowe I

Zestaw nr 7 Ekstremum funkcji jednej zmiennej. Punkty przegiȩcia wykresu. Asymptoty

Wprowadzenie do teorii sterowania. Procesy sterowania o parametrach skupionych.

Zasada optymalności Bellmana. Uogólniony optymalny regulator stanu.

na p laszczyźnie kartezjaṅskiej prowadzimy prost a o rȯwnaniu s 1. (1.1) s 0 + t 1 t 0

Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania

Niezb. ednik matematyczny. Niezb. ednik matematyczny

WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3

Asymptota pozioma: oṡ x, gdy y = 0 Asymptota pionowa: oṡ y, gdy x = 0. Hyperbola 1 x

Analiza dla informatyków 2 DANI LI2 Pawe l Domański szkicowe notatki do wyk ladu

SZKO LA PODSTAWOWA HELIANTUS WARSZAWA ul. BAŻANCIA 16. Hyperbola 1 x FUNKCJE ELEMENTARNE WYMIERNE POTȨGOWE LOGARYTMICZNE.

Suma i przeciȩcie podprzestrzeń, suma prosta, przestrzeń ilorazowa Javier de Lucas

Wprowadzenie do teorii sterowania. Procesy o parametrach skupionych

ci agi i szeregi funkcji Javier de Lucas Ćwiczenie 1. Zbadać zbieżność (punktow a i jednostajn a) ci agu funkcji nx 2 + x

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. mm

Wyk lad 11 1 Wektory i wartości w lasne

Matematyka A, klasówka, 24 maja zania zadań z kolokwium z matematyki A w nadziei, że pope lni lem wielu b le. rozwia

SZKO LA PODSTAWOWA HELIANTUS WARSZAWA ul. BAŻANCIA 16. Szeṡcian w uk ladzie wspȯ lrzȩdnych x, y, z GEOMETRIA PRZESTRZENNA STEREOMETRIA

w = w i ξ i. (1) i=1 w 1 w 2 :

Trigonometria. Funkcje trygonometryczne

Funkcje dwóch zmiennych

Równania różniczkowe. Notatki z wykładu.

Równania różniczkowe liniowe wyższych rzędów o stałych współcz

Niech X bȩdzie dowolnym zbiorem. Dobry porz adek to relacja P X X (bȩdziemy pisać x y zamiast x, y P ) o w lasnościach:

Zestaw nr 6 Pochodna funkcji jednej zmiennej. Styczna do krzywej. Elastyczność funkcji. Regu la de l Hospitala

Wyk lad 7 Baza i wymiar przestrzeni liniowej

Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego

Niesimpleksowe metody rozwia zywania zadań PL. Seminarium Szkoleniowe Edyta Mrówka

g liczb rzeczywistych (a n ) spe lnia warunek

Dyskretne modele populacji

III. Układy liniowe równań różniczkowych. 1. Pojęcie stabilności rozwiązań.

czastkowych Państwo przyk ladowe zadania z rozwiazaniami: karpinw adres strony www, na której znajda

Rozdzia l 2. Najważniejsze typy algebr stosowane w logice

Programowanie nieliniowe. Badania operacyjne Wykład 3 Metoda Lagrange a

1.1 Przegląd wybranych równań i modeli fizycznych. , u x1 x 2

Zadania do wykładu Jakościowa Teoria Równań Różniczkowych Zwyczajnych

II. Równania autonomiczne. 1. Podstawowe pojęcia.

P (x, y) + Q(x, y)y = 0. g lym w obszrze G R n+1. Funkcje. zania uk ladu (1) o wykresie przebiegaja

Metody Numeryczne Wykład 4 Wykład 5. Interpolacja wielomianowa

Opis systemów dynamicznych w przestrzeni stanu. Wojciech Kurek , Gdańsk

LOGIKA ALGORYTMICZNA

1 Przestrzenie unitarne i przestrzenie Hilberta.

Układy równań i równania wyższych rzędów

Projektowanie uk ladów sterowania z wykorzystaniem ich postaci kanonicznych

Geometria odwzorowań inżynierskich rzut środkowy 06A

Dyskretne modele populacji

5 Równania różniczkowe zwyczajne rzędu drugiego

Procesy Stochastyczne - Zestaw 1

Równania różniczkowe liniowe rzędu pierwszego

Programowanie matematyczne

RACHUNEK OPERATOROWY MIKUSIŃSKIEGO I JEGO ZASTOSOWANIE DO RÓWNAŃ

Indeks odwzorowania zmiennej zespolonej wzgl. krzywej zamknietej

Regulator liniowo kwadratowy na przykładzie wahadła odwróconego

Monika Musia l. METODA MIESZANIA KONFIGURACJI Configuration Interaction (CI) (ujȩcie wyznacznikowe)

Seria zadań z Algebry IIR nr kwietnia 2017 r. i V 2 = B 2, B 4 R, gdzie

Cia la i wielomiany Javier de Lucas

Metody rzutowania i funkcji barierowych dla problemów sterowania optymalnego

Funkcje wielu zmiennych

Definicja problemu programowania matematycznego

Równania różniczkowe liniowe drugiego rze

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych

Równania różniczkowe o zmiennych rozdzielonych

Pierwiastki arytmetyczne n a

Inżynieria Systemów Dynamicznych (4)

gdy wielomian p(x) jest podzielny bez reszty przez trójmian kwadratowy x rx q. W takim przypadku (5.10)

Pochodne cz ¾astkowe i ich zastosowanie.

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Zamiast ogólnych wzorów w przestrzeni euklidesowej o dwolnym wymiarze, rozważmy przestrzeń trójwymiarow a. Przypuśćmy, że ktoś podaje nam równanie

Normy wektorów i macierzy

Transkrypt:

Wprowadzenie do metod sterowania optymalnego Pojȩcie procesu sterowania obejmuje zestaw trajektorii stanu i sterowania (x, u) X U, gdzie X jest przestrzeni a trajektorii stanu, a U jest przestrzeni a sterowania. Optymalizacja uk ladów sterowania oznacza poszukiwanie takiego sposobu prowadzenia procesu sterowania, który zapewnia ekstremum wskaźnika jakości procesu (wydajność procesu, koszt prowadzenia procesu, zysk z prowadzenia procesu) i jest dopuszczalny tj. spe lnia ograniczenia odzwierciedlaj ace warunki prowadzenia procesu (ograniczone zużycie surowców i energii, ograniczenia wartości chwilowych zmiennych procesowych). Dopuszczalny proces sterowania ekstremalizuj acy wskaźnik jakości nazywa siȩ optymalnym procesem sterowania, a zwi azane z nim sterowanie nazywa siȩ sterowaniem optymalnym. Różne potrzeby praktyczne prowadz a do wyróżnienia szczególnych zadań sterowania optymalnego np. zadania optymalnego sterowania docelowego, zadania optymalnego sterowania okresowego, czy też zadania optymalnego sterowania stochastycznego.. Niech u(t) = u 1 (t) 2 + u 2 (t) 2 +... + u m (t) 2 oznacza normȩ euklidesow a sterowania chwilowego. optymalnego przestrzeń sterowania określana jest jako unormowany zbiór funkcji ci ag lych W zależności od rodzaju zadania sterowania U. = C([, t 1 ]; R m ), u. = max t [,t 1 ] u(t) ; jako unormowany zbiór funkcji przedzia lami ci ag lych U =. P C([, t 1 ]; R m ), u =. sup t [,t 1 ] u(t) ; jako unormowany zbiór funkcji przedzia lami sta lych U =. P S([, t 1 ]; R m ), u =. max u k ; k 0 k k 1 ] jako unormowany zbiór funkcji istotnie ograniczonych U =. L ([, t 1 ]; R m ), u =. esssup u(t) ; t [,t 1 ] jako unormowany zbiór funkcji ca lkowalnych z kwadratem U =. L 2 ([, t 1 ]; R m ), u =. u(t) 2 dt; jako unormowany zbiór funkcji ca lkowalnych z kwadratem w obszarze wielowymiarowym Ω. = [, t 1 ] [0, 1] 1

U. = L 2 (Ω; R m ), u. = Ω u(t, z) 2 dz dt. Na podstawie wyboru przestrzeni sterowania określana jest przestrzeń trajektorii stanu jako unormowany zbiór funkcji różniczkowalnych w sposób ci ag ly X =. C 1 ([, t 1 ], R n ), x =. max x(t) + max ẋ(t) ; t [,t 1 ] t [,t 1 ] jako unormowany zbiór funkcji przedzia lami różniczkowalnych w sposób ci ag ly X =. P C 1 ([, t 1 ], R n ), x =. sup t [,t 1 ] x(t) + sup t [,t 1 ] ẋ(t) ; jako unormowany zbiór funkcji o pochodnej istotnie ograniczonej U =. W1 ([, t 1 ]; R m ), u =. esssup x(t) + esssup ẋ(t) ; t [,t 1 ] t [,t 1 ] jako unormowany zbiór funkcji o pochodnej ca lkowalnej z kwadratem X =. W1 2 ([, t 1 ], R n ), x =. ( x(t) 2 + ẋ(t) 2 )dt; jako unormowany zbiór funkcji o pochodnej ca lkowalnej z kwadratem w obszarze Ω. = [, t 1 ] [0, 1] X. = W 2 1 (Ω, R n ), x. = Ω ( x(t, z) 2 + ẋ(t, z) 2 ) dz dt. Ważn a klas a zadań sterowania optymalnego s a zadania optymalnego sterowania docelowego formu lowane w odniesieniu do procesów mechanicznych, elektromechanicznych, metalurgicznych, chemicznych, biotechnologicznych i wielu innych. Podstawowe zadanie optymalnego sterowania docelowego polega na minimalizacji ca lkowego wskaźnika jakości G(x, u) = g(x(t), u(t), t)dt z uwzglȩdnieniem równania stanu procesu ẋ(t) = f(x(t), u(t), t), t [, t 1 ], warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1, oraz ograniczeń chwilowych sterowania u(t) U, t [, t 1 ], 2

gdzie x 0, x 1 R n, U R m, zaś u P C([, t 1 ]; R m ), x P C 1 ([, t 1 ]; R n ) lub u C([, t 1 ]; R m ), x C 1 ([, t 1 ]; R n ). Przyk lad. Minimalnoenergetyczne nagrzewanie zbiornika z ciecz a: zminimalizować straty energetyczne G(x, u) = 1 0 u 2 (t)dt procesu nagrzewania opisywanego równaniem stanu ẋ(t) = ax(t) + bu(t), t [0, 1] z warunkami dwugranicznymi x(0) = x 0, x(1) = x 1, gdzie x(t) jest temperatur a cieczy w zbiorniku w chwili t, x 0 jest jego zadan a temperatur a pocz atkow a, x 1 jest jego zadan a temperatur a końcow a, u(t) jest natȩżeniem pr adu obwodu grzejnego, a jest wspó lczynnikiem stygniȩcia cieczy, zaś b jest wspó lczynnikiem nagrzewania cieczy. Przyk lad. Minimalnoenergetyczne sterowanie tarcz a obrotow a: zminimalizować straty energetyczne G(x, u) = u 2 (t)dt procesu przestawiania tarczy obrotowej opisywanej równaniami stanu z warunkami dwugranicznymi ẋ 1 (t) = x 2 (t), ẋ 2 (t) = bu(t), t [, t 1 ], x i ( ) = x i (0), x i (t 1 ) = x i (1) (i = 1, 2), gdzie x 1 (t) oznacza po lożenie k atowe tarczy, x 2 (t) oznacza prȩdkość k atow a tarczy, zaś u(t) jest napiȩciem obwodu steruj acego silnika. W zadaniach tych pominiȩto ograniczenia chwilowe sterowania zak ladaj ac, że postać wskaźnika jakości automatycznie ograniczy chwilow a wartość sterowania. 3

Przyk lad. Minimalnoczasowa stabilizacja oscylatora: sprowadzić oscylator do po lożenia równowagi w minimalnym czasie G(x, u) = z uwzglȩdnieniem równań stanu oscylatora dt = t 1 ẋ 1 (t) = x 2 (t), ẋ 2 (t) = ax 1 (t) + bu(t), t [, t 1 ], warunków dwugranicznych x i ( ) = x i0, x i (t 1 ) = x i1, i = 1, 2, oraz ograniczeń chwilowych sterowania u(t) 1, t [, t 1 ], gdzie x 1 (t) jest po lożeniem oscylatora w chwili t, x 2 (t) jest prȩdkości a oscylatora, u(t) jest jego si l a stabilizuj ac a, a jest wspó lczynnikiem amortyzatora sprȩżynowego, zaś b jest wspó lczynnikiem oddzia lywania si ly stabilizuj acej. Przyk lad. Minimalnoczasowa stabilizacja oscylatora z t lumieniem w lasnym: sprowadzić oscylator do po lożenia równowagi w minimalnym czasie G(x, u) = dt = t 1 z uwzglȩdnieniem równań stanu oscylatora ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) a 2 x 2 (t) + bu(t), t [, t 1 ], warunków dwugranicznych x i ( ) = x i0, x i (t 1 ) = x i1, i = 1, 2, oraz ograniczeń chwilowych sterowania u(t) 1, t [, t 1 ], gdzie x 1 (t) jest po lożeniem oscylatora w chwili t, x 2 (t) jest prȩdkości a oscylatora, u(t) jest jego si l a stabilizuj ac a, a 1 jest wspó lczynnikiem amortyzatora sprȩżynowego, a 2 jest wspó lczynnikiem t lumika, zaś b jest wspó lczynnikiem oddzia lywania si ly stabilizuj acej. 4

Do rozwi azywania zadań optymalnego sterowania docelowego zastosować można klasyczne metody rachunku wariacyjnego, metody analizy funkcjonalnej oraz zaawansowane metody nieliniowego programowania. Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych dla przypadku jednowymiarowego. Rozważymy w pierwszej kolejności przypadek jednowymiarowy pojedynczej krzywej (n = 1, m = 1). Za lóżmy, że równanie stanu pozwala jednoznacznie określić sterowanie u(t) w funkcji stanu x(t), pochodnej stanu ẋ(t) oraz czasu t tj. ẋ(t) = f(x(t), u(t), t) u(t) = F (x(t), ẋ(t), t). Podstawiaj ac uzyskane wyrażenie do wskaźnika jakości sprowadzamy problem optymalnego sterowania docelowego do zadania rachunku wariacyjnego: zminimalizować funkcjona l zależny od krzywej x, jej pochodnej ẋ i czasu t G(x) = g(x(t), ẋ(t), t)dt z wiȩzami ustalaj acymi po lożenie pocz atkowe i końcowe krzywej x( ) = x 0, x(t 1 ) = x 1. Zadanie wariacyjne polega wiȩc na wyborze krzywej x l acz acej punkty (, x 0 ) oraz (t 1, x 1 ) i minimalizuj acej funkcjonal G(x). Aby określić warunki konieczne optymalności krzywej w zadaniu wariacyjnym zak ladamy, że krzywa jest elementem przestrzeni funkcji różniczkowalnych w sposób ci ag ly tj. x C 1 ([, t 1 ]; R n ), x =. max x(t) + max ẋ(t) t [,t 1 ] t [,t 1 ] Definicja: Funkcjona l G(x) osi aga na krzywej ˆx lokalne s labe ekstremum, jeżeli istnieje takie ɛ > 0, że ( x ˆx ɛ) ( G(x) G(ˆx))) tj. dla wszystkich krzywych z C 1 -otoczenia krzywej ˆx wartości funkcjona lu G(x) nie s a mniejsze od G(ˆx). 5

Mówimy w tym przypadku o s labym ekstremum, gdyż rozwi azanie ekstremalne porównujemy z s asiednimi krzywymi różniczkowalnymi w sposób ci ag ly (czyli z krzywymi z C 1 -otoczenia) w odróżnieniu od porównania z s asiednimi krzywymi ci ag lymi (czyli z krzywymi z C-otoczenia). Niech ˆx + αδx C 1 ([, t 1 ]; R n ) bȩdzie zaburzeniem krzywej ekstremalnej ˆx spe lniaj acym równania wiȩzów (warunki graniczne) δx( ) = 0, δx(t 1 ) = 0, przy czym α R jest parametrem rzeczywistym. Funkcjona l G(x) traktowany jako funkcja parametru α przybierze postać G(α) = g(ˆx(t) + αδx(t), ˆx(t) + αδẋ(t), t)dt. Ponieważ funkcja G z za lożenia osi aga dla α = 0 ekstremum, to d G dα α=0 = 0. Zak ladaj ac, że funkcja g ma ci ag le pochodne cz astkowe g x i gẋ uzyskujemy oraz d G(α) t1 dα = ( gx (ˆx + αδx(t), ˆx(t) + αδẋ(t), t)δx(t)+ gẋ(ˆx(t) + αδx(t), ˆx(t) + αδẋ, t)δẋ(t) ) dt gdzie d G(α) t1 dα α=0 = (ˆ g x (t)δx(t) + ˆ gẋ(t)δẋ(t) ) dt, ˆ g x (t). = g x (ˆx(t), ˆx(t), t), ˆ gẋ(t). = gẋ(ˆx(t), ˆx(t), t). Zastosowanie wzoru na ca lkowanie przez czȩści i uwzglȩdnienie wiȩzów krzywej prowadzi do zależności ˆ gẋ(t)δẋ(t)dt = ˆ gẋ(t)δx(t) t 1 t0 = ˆ gẋ(t 1 )δx(t 1 ) ˆ gẋ(t)δx( ) = d dt ˆ gẋ(t)δx(t)dt. d dt ˆ gẋ(t)δx(t)dt d dt ˆ gẋ(t)δx(t)dt 6

Mamy wiȩc d G(α) t1 dα α=0 = (ˆ g x (t) d dt ˆ gẋ(t) ) δx(t)dt = 0. Aby ostatnie wyrażenie by lo równe zeru dla dowolnych wariacji δx(t) krzywej ˆx(t) wyrażenie w nawiasie musi być równe zeru tj. spe lnione musi być równanie Eulera-Lagrange a ˆ g x (t) d dt ˆ gẋ(t) = 0, t [, t 1 ]. Twierdzenie: Warunkiem koniecznym s labego lokalnego ekstremum funkcjona lu G(x) na zbiorze krzywych x C 1 z wiȩzami x( ) = x 0, x(t 1 ) = x 1 jest spe lnienie równania Eulera-Lagrange a na krzywej ekstremalnej ˆx. Krzywe spe lniaj ace równanie Eulera-Lagrange a nazywamy ekstremalami. Aby stwierdzić czy dana ekstremala stanowi minimum funkcjona lu (a nie maksimum lub punkt przegiȩcia) stosujemy warunki optymalności wyższych rzȩdów. W szczególności warunki optymalności drugiego rzȩdu uzyskujemy obliczaj ac drug a pochodn a = d 2 G(α) dα 2 α=0 (ˆ g xx (t)δx 2 (t) + 2ˆ g xẋ (t)δx(t)δẋ(t) + ˆ gẋẋ (t)δẋ 2 (t) ) dt. Ponieważ zawsze można dobrać wariacjȩ δx(t) krzywej ˆx(t) ma l a co do modu lu lecz z dowolnie duż a pochodn a, wiȩc o znaku drugiej pochodnej decyduje wyrażenie ˆ gẋẋ (t). Wynika st ad, że warunkiem koniecznym drugiego rzȩdu osi agania minimum przez ekstremalȩ ˆx jest nierówność Legendre a ˆ gẋẋ (t) 0, t [, t 1 ]. Warunkiem dostatecznym drugiego rzȩdu osi agania minimum przez ekstremalȩ ˆx jest ostra nierówność Legendre a ˆ gẋẋ (t) > 0, t [, t 1 ], pod warunkiem, że ekstremala nie posiada tzw punktów sprzȩżonych. 7

Dla zadania z przyk ladu 1 z parametrami a = 2, b = 1 i wiȩzami x(0) = 1, x(1) = 2 uzyskujemy u(t) = ẋ(t) + 2x(t) i sprowadzamy zadanie optymalnego sterowania docelowego do zadania wariacyjnego postaci: zminimalizować funkcjona l G(x) = uwzglȩdniaj ac wiȩzy krzywej 1 0 (ẋ(t) + 2x(t)) 2 dt x(0) = 1, x(1) = 2. W tym przypadku g(x(t), ẋ(t), t) = (ẋ(t)+2x(t)) 2 i równanie Eulera-Lagrange a przybiera postać ˆ g x (t) d dt ˆ gẋ(t) = 4(ẋ + 2x(t)) d 2(ẋ(t) + 2x(t)) dt = 4ẋ(t) + 8x(t) 2ẍ(t) 4ẋ(t) = 2ẍ(t) + 8x(t) = 0 czyli ẍ(t) 4x(t) = 0. Tak wiȩc równanie Eulera-Lagrange a ma dla badanego przyk ladu postać liniowego stacjonarnego równania różniczkowego, którego rozwi azanie określamy wyznaczaj ac pierwiastki równania charakterystycznego r 2 4 = 0 r 1,2 = ±2 ˆx(t) = c 1 e 2t + c 2 e 2t û(t) = 2c 1 e 2t 2c 2 e 2t + 2c 1 e 2t + 2c 2 e 2t = 4c 1 e 2t. Sterowanie optymalne jest wiȩc dla rozważanego procesu nagrzewania funkcj a eksponencjaln a. Sta le c i określamy z warunków granicznych uzyskuj ac ostatecznie û(t) = 8e2 4 e 4 1 e2t. Sprawdzamy warunek optymalności drugiego rzȩdu ˆ gẋẋ (t) = 2(ẋ(t) + 2x(t)) = 2 > 0. ẋ 8

Wyznaczone sterowanie jest wiȩc lokalnym minimum. Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych dla przypadku wielowymiarowego. Uzyskane warunki optymalności uogólniamy bezpośrednio na przypadek zadania wielowymiarowego n > 1, m > 1. Zak ladamy, że wektorowe sterowanie u(t) R m można jednoznacznie określić z równań stanu w funkcji stanu x(t), jego pochodnej ẋ(t) i czasu t. Przechodzimy nastȩpnie do wielowymiarowego zadania wariacyjnego: zminimalizować funkcjona l zależny od wielowymiarowej krzywej x z wiȩzami G(x) = gdzie x(t) R n, x 0, x 1 R n. g(x(t), ẋ(t), t)dt, x( ) = x 0, x(t 1 ) = x 1, W tym przypadku badamy wariacje wektorowej trajektorii stanu ˆx i (t) + α i δx i (t), δx i ( ) = 0, δx i (t 1 ) = 0, i = 1,..., n, gdzie α i R jest parametrem wariacji i-tej wspó lrzȩdnej stanu. Wskaźnik jakości zadania wariacyjnego przybierze postać funkcji n skalarnych argumentów α 1,..., α n tj. G(α 1,..., α n ). = g(ˆx 1 (t) + α 1 δx 1 (t), ˆx 1 (t) + α 1 δẋ 1 (t),..., ˆx n (t) + α n δx n (t), ˆx n (t) + α n δẋ n (t), t)dt. Ponieważ funkcja G(α1,..., α n ) osi aga z za lożenia minimum, wiȩc musz a być spe lnione warunki konieczne optymalności pierwszego rzȩdu funkcji wielu zmiennych tj. G (0) = 0, i = 1,..., n. α i Uzyskujemy st ad po zastosowaniu wzoru na ca lkowanie przez czȩści G t1 (0) = (ˆ g xi (t)δx i (t) + ˆ gẋi (t)δẋ i (t) ) dt α i = (ˆ g xi (t) d dt ˆ gẋi (t) ) δx i (t) = 0. 9

Warunek konieczny optymalności pierwszego rzȩdu krzywej wielowymiarowego zadania wariacyjnego można wiȩc zapisać w postaci uk ladu równań Eulera- Lagrange a ˆ g xi (t) d dt ˆ gẋi (t) = 0, t [, t 1 ], i = 1,..., n. Celem określenia czy krzywa ekstremalna wyznaczona na podstawie warunków optymalności rzȩdu pierwszego stanowi minimum funkcjona lu G(x) (a nie jego maksimum lub punkt przegiȩcia) stosujemy warunki optymalności drugiego rzȩdu tj. badamy macierz pochodnych cz astkowych drugiego rzȩdu funkcjona lu G(x). Pochodne te przybieraj a postać 2 G(α) t1 α=0 = (ˆ g xi x α i α j (t)δx i (t)δx j (t) j +2ˆ g xi ẋ j (t)δx i (t)δẋ j (t) + ˆ gẋi ẋ j (t)δẋ i (t)δẋ j (t) ) dt. Warunki optymalności drugiego rzȩdu sprowadzaj a siȩ do badania dodatniej pó lokreśloności lub dodatniej określoności macierzy pochodnych cz astkowych drugiego rzȩdu ( 2 G(α) α i α j α=0 ) i,j=1,...,n. Stosuj ac analogiczne rozumowanie jak w przypadku warunków drugiego rzȩdu dla krzywej jednowymiarowej wnioskujemy, że o dodatniej (pó l)określoności analizowanej macierzy decydować bȩdzie macierz drugich pochodnych cz astkowych postaci (ˆ gẋiẋj (t) ) i,j=1,...,n 0 (> 0). Przyk lad. Minimalnoenergetyczne nagrzewanie uk ladu dwóch zbiorników z ciecz a: zminimalizować sumaryczne straty energetyczne G(x, u) = 1 0 (u 2 1(t) + u 2 2(t))dt procesu nagrzewania opisywanego za pomoc a równań stanu z warunkami granicznymi ẋ i (t) = a i x i (t) + u i (t), t [0, 1], i = 1, 2 x i (0) = 1, x i (1) = 2, i = 1, 2. 10

Sprowadzamy zadanie do postaci wariacyjnej a wiȩc oraz 1 2 u i (t) = x i (t) + a i x i (t), G(x) = (ẋ i (t) + a i x i (t)) 2 dt, 0 i=1 2 g = (ẋ i (t) + a i x i (t)) 2, g xi = 2a i (ẋ i (t) + a i x i (t)) i=1 gẋi = 2(ẋ i (t) + a i x i (t)). Zestawiamy uk lad równań Eulera-Lagrange a 2a i (ẋ i (t) + a i x i (t)) d dt 2(ẋ i(t) + a i x i (t)) = 0, i = 1, 2. St ad i a i ẋ i (t) + a 2 i (t)x i (t) ẍ i (t) a i ẋ i (t) = 0 ẍ i (t) = a 2 i x i (t), r 2 i = a 2 i, r i,1,2 = ±a i. Optymalna trajektoria stanu ma wiȩc postać ˆx i (t) = c i1 e ait + c i2 e ait, zaś sterowanie optymalne jest określone jak nastȩpuje û i (t) = 2a i c i1 e ait, t [0, 1], i = 1, 2, przy czym sta le c i1, c i2 określamy z warunków granicznych. Warunki optymalności drugiego rzȩdu sprowadzaj a siȩ do badania macierzy ) ( ) (ˆ gẋ1 ẋ 1 gẋ1 ẋ 2 2 0 = ˆ gẋ2 ẋ 1 gẋ2 ẋ 1 0 2 Wyznaczone rozwi azanie jest rozwi azaniem minimalizuj acym, ponieważ minory g lówne tej macierzy s a dodatnie. Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych z pochodnymi wyższych rzȩdów. W niektórych przypadkach z równań stanu ẋ i (t) = f i (x(t), u(t), t), i = 1,..., n 11

można jednoznacznie wyznaczyć sterowanie w funkcji pewnego podwektora x(t) R k (k < n) wektora stanu x(t) R n i jego pochodnych ẋ(t), ẍ(t),..., x (n) (t) oraz czasu t tj. u(t) = F (x(t), ẋ(t), ẍ(t),..., x (n) (t), t), przy czym warunki graniczne wektora stanu x(t) implikuj a odpowiednie warunki graniczne podwektora stanu x(t) x i (t κ ) = x iκ (i = 1..., n; κ = 0, 1) x (l) (t κ ) = x (l) κ (l = 0, 1,..., n 1; κ = 0, 1). Rozpatrzmy przypadek k = 1, n > 1 i funkcjona l zadania wariacyjnego w postaci G(x) = i wariacjȩ krzywej z parametrem α R g(x(t), ẋ(t),..., x (n) (t), t)dt ˆx(t) + αδx(t), δx (l) (t κ ) = 0 (l = 0, 1,..., n 1; κ = 0, 1). Przechodzimy do α-parametryzacji funkcjona lu G(x) tj. do funkcji G(α) = ( g(ˆx(t) + αδx(t), ˆx(t) + αδẋ(t),..., ˆx (n) (t) + αδx (n) (t), t)dt. Zapisujemy warunek konieczny optymalności rzȩdu pierwszego funkcji G(α) czyli d G(α) dα = 0 (ˆ g x (t)δx(t) + g ˆx (t)δẋ(t) +... + ˆ g x (n)(t)δx (n) (t) ) dt = 0. Do wyrażeń typu t 1 ˆ g x (l)(t)δx (l) (t)dt stosujemy l-krotnie wzór na ca lkowanie przez czȩści z uwzglȩdnieniem zerowania siȩ wariacji krzywej w wiȩzach, co prowadzi do wyrażenia ( (ˆ g x (t) d dt ˆ gẋ(t) + d2 dt 2 ˆ gẍ(t) +... + ( 1) n dn dt n ˆ g x (n)(t))δx(t) ) dt 12

Uzyskujemy w ten sposób warunek konieczny optymalności pierwszego rzȩdu dla s labego ekstremum zadania wariacyjnego z pochodnymi wyższych rzȩdów w postaci równania Eulera-Poissona ˆ g x (t) d dt ˆ gẋ(t) + d2 dt 2 ˆ gẍ(t) +... + ( 1) n dn dt n ˆ g x (n)(t) = 0, t [, t 1 ]. Warunki optymalności drugiego rzȩdu przybieraj a w tym przypadku postać ˆ g x (n) x (n) (t) 0 (> 0). Przyk lad. Minimalnoenergetyczne sterowanie tarcz a obrotow a: zminimalizować straty energetyczne G(x, u) = 1 0 u 2 (t)dt procesu przestawiania tarczy obrotowej opisywanej równaniami stanu z warunkami dwugranicznymi ẋ 1 (t) = x 2 (t), ẋ 2 (t) = bu(t), t [0, 1], x i (1) = 1, x i (1) = 0 (i = 1, 2), gdzie x 1 (t) oznacza po lożenie k atowe tarczy, x 2 (t) oznacza prȩdkość k atow a tarczy, zaś u(t) jest napiȩciem obwodu steruj acego silnika. Przeprowadzamy redukcjȩ problemu zadania wariacyjnego z pochodn a drugiego rzȩdu. Wyróżniamy podwektor wektora stanu w postaci x(t). = x 1 (t) i z równań stanu uzyskujemy ẍ(t) = ẋ 2 (t) = u(t). Zadanie wariacyjne przyjmuje postać: zminimalizować funkcjona l określony na krzywej x o postaci G(x) = z uwzglȩdnieniem wiȩzów krzywej 1 0 ẍ 2 (t)dt x(0) = 1, ẋ(0) = 1, x(1) = 0, ẋ(1) = 0. W tym przypadku g = ẍ 2, g x = 0, gẋ = 0, gẍ = 2ẍ i równanie Eulera-Poissona przybiera postać d 2 dt g 2 ẍ = 0 2 d4 x(t) = 0. dt4 13

Równanie charakterystyczne różniczkowego równania Eulera-Poissona zapisujemy jako r 4 = 0. Posiada ono czterokrotny pierwiastek zerowy. Rozwi azanie tego równania jest postaci ˆx(t) = c 0 + c 1 t + c 2 t 2 + c 3 t 3 sk ad û(t) = 6c 3 t + 2c 2. Sta le wyznaczamy z wiȩzów krzywej uzyskuj ac c 2 = 5, c 3 = 3 oraz û(t) = 18t 10, t [0, 1]. Warunek optymalności drugiego rzȩdu daje w wyniku gẍẍ = 2 > 0, a wiȩc wyznaczone rozwi azanie jest poszukiwanym minimum. Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego z ograniczeniami chwilowymi sterowania i z uwik lanym sterowaniem w równaniach stanu Rozważmy zadanie optymalnego sterowania docelowego z uwik lanym sterowaniem w równaniach stanu i z ograniczeniami chwilowymi sterowania: zminimalizować wskaźnik jakości G(x, u) = uwzglȩdniaj ac równanie stanu g(x(t), u(t), t)dt ẋ(t) = f(x(t), u(t), t), t [, t 1 ], warunki graniczne x( ) = x 0, x(t 1 ) = x 1 14

oraz ograniczenia chwilowe sterowania u(t) U, t [, t 1 ]. Niech chwilowe ograniczenia sterowania bȩd a postaci u(t) u max, t [, t 1 ]. Wprowadzamy funkcjȩ kary za przekroczenie ograniczeń chwilowych { 0 gdy u j (t) u max j K j (u j (t)) = ρ j u j (t) u max j 2 gdy u j (t) > u max j gdzie ρ j > 0 jest wspó lczynnikiem kary. Wraz ze wzrostem wspó lczynnika kary ρ j + funkcja kary staje siȩ coraz bardziej stroma i tym samym coraz dok ladniejsza. Stosuj ac metodȩ funkcyjnych mnożników Lagrange a λ(t) dla równań stanu i funkcjȩ kary K(u(t)). = m j=1 K j(u j (t)) dla ograniczeń chwilowych sterowania w l aczamy te ograniczenia do wskaźnika jakości modyfikuj ac go do postaci G(x, λ, u). = ( g(x(t), u(t), t) +λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) ) dt minimalizowanego przy jedynych pozosta lych ograniczeniach jakimi s a warunki graniczne x( ) = x 0, x(t 1 ) = x 1. Tak wiȩc rozszerzamy zakres zmiennych do postaci wektora zmiennych funkcyjnych (x, λ, u) traktuj ac je jako równoprawne zmienne optymalizacyjne z przestrzeni C 1. Warunki konieczne optymalności określimy definiuj ac funkcjȩ g jak nastȩpuje g(x(t), ẋ(t), λ(t), λ(t), u(t), u(t), t) = g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) i zapisujemy warunki konieczne optymalności w postaci nastȩpuj acego uk ladu równań Eulera-Lagrange a ˆ g x (t) d dt ˆ gẋ(t) = 0, t [, t 1 ], ( ) 15

ˆ g λ (t) d dt ˆ g λ(t) = 0, t [, t 1 ], ( ) ˆ g u (t) d dt ˆ g u (t) = 0, t [, t 1 ], ( ). Jest to uk lad 2n + m równań różniczkowych dla 2n + m zmiennych funkcyjnych. Mnożnik funkcyjny λ(t) nazywany jest także zmienn a sprzȩżon a lub zmienn a kostanu (wektorem kostanu). Równanie (*) nazywane jest równaniem sprzȩżonym lub równaniem kostanu optymalnego, równanie (**) jest równaniem stanu optymalnego, zaś (***) jest równaniem sterowania optymalnego. Uk lad tych równań pozwala dla niektórych klas problemów sterowania optymalnego efektywnie sparametryzować sterowanie optymalne, co u latwia jego dookreślenie za pomoc a prostego dodatkowego algorytmu obliczeniowego. Minimalnoczasowe sterowanie docelowe dla uk ladów liniowych Zadanie polega na minimalizacji czasu realizacji procesu docelowego G(x, u) = dt = t 1 z uwzglȩdnieniem liniowego stacjonarnego równania stanu uk ladu ẋ(t) = Ax(t) + Bu(t), t [, t 1 ], warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1 oraz ograniczeń chwilowych sterowania u(t) u max, t [, t 1 ]. Rozszerzamy zestaw zmiennych i zapisujemy zmodyfikowany wskaźnik jakości G(x, λ, u) = ( 1 + λ T (t)(ẋ(t) Ax(t) Bu(t)) + K(u(t)) ) dt. Mamy wiȩc g x (t) = λ T (t)a, gẋ(t) = λ T (t), 16

g λ (t) = (ẋ(t) Ax(t) Bu(t)) T, g λ(t) = 0, g u (t) = λ T (t)b + K u (u(t)), g u (t) = 0. Uk lad równań Eulera-Lagrange a przyjmie postać równanie kostanu optymalnego λ T (t)a λ T (t) = 0, równanie stanu optymalnego ẋ(t) Ax(t) Bu(t) = 0, równanie sterowania optymalnego λ T (t)b + K u (u(t)) = 0. Przyk lad. Minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia równowagi, jeśli jest on opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1. Schemat rozważanego uk ladu przedstawiony jest na rysunku ściana podstawowa amortyzator sprȩżynowy Maszyna M si la stabilizuj aca W tym przypadku ( ) ( ) 0 1 A =, A T 0 1 = 1 0 1 0 17

Oznacza to, że zmienne kostanu spe lniaj a równania λ 1 (t) = λ 2 (t), λ2 (t) = λ 1 (t), λ 1 (t) = λ 1 (t), r 2 = 1, r 1,2 = ±j, λ 1 (t) = c 1 sin(t + c 2 ), λ 2 (t) = c 1 cos(t + c 2 ), K u (u(t)) = λ 2 (t). Ostatnie równanie jest równaniem sterowania minimalnoczasowego oscylatora idealnego. Implikuje ono, że sterowanie to przyjmuje wy l acznie wartości û(t) = ±1. Podstawienie tego sterowania do równań stanu pozwala określić kszta lt trajektorii stanu dla sterowania minimalnoczasowego. ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) ± 1 ẍ 1 (t) = x 1 (t) ± 1 x 1 (t) = c 1 cos t + c 2 sin t ± 1, x 2 (t) = c 1 sin t + c 2 cos t, x 10 = c 1 ± 1; x 20 = c 2 x 1 (t) = (x 10 1)cos t + x 20 sin t ± 1; x 2 (t) = (x 10 1)sin t + x 20 cos t. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (x 1 (t) 1) 2 = (x 10 1) 2 cos 2 t + x 2 20sin 2 t +2(x 10 1)cos t x 20 sin t, x 2 2(t) = (x 10 1) 2 sin 2 t + x 2 20cos 2 t 2(x 10 1)cos t x 20 sin t czyli (x 1 1) 2 + x 2 2 = (x 10 1) 2 + x 2 20. Tak wiȩc trajektorie stanu oscylatora s a okrȩgami o środku (1, 0) dla sterowania û(t) = +1 i okrȩgami o środku ( 1, 0) dla sterowania û(t) = 1. Promień okrȩgu jest równy ρ = ( ) 1/2. (x 10 1) 2 + x 20 18

Trajektorie stanu oscylatora idealnego dla sterowania û(t) = +1 x 2 1 x 1 19

Trajektorie stanu oscylatora idealnego dla sterowania û(t) = 1 x 2-1 x 1 Wnioski z równania sterowania optymalnego: Sterowanie minimalnoczasowe przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π jednostek czasu (okres drgań badanego oscylatora wynosi 2π, a czas przebiegu po lowy okrȩgu wynosi π). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π. Przyk lad 7. Minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia 20

równowagi z dowoln a czȩstotliwości a drgań w lasnych ściana podstawowa amortyzator sprȩżynowy Maszyna M si la stabilizuj aca Uk lad o charakterze oscylatora idealnego jest opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 (t) = a 1 x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1, gdzie a 1 jest wspó lczynnikiem amortyzatora sprȩżynowego. Dla celów analizy w lasności matematycznych modelu uk ladu użyteczna jest symetryzacja równań stanu uzyskiwana przez podstawienia ω = a 1, x 1 (t) := x 1 (t)/ω. Równania stanu oscylatora idealnego ze sterowaniem po symetryzacji przybieraj a postać ẋ 1 (t) = ωx 2 (t), ẋ 2 = ωx 1 (t) + u(t), t [0, t 1 ]. W tym przypadku macierze stanu, kostanu i sterowania można zapisać nastȩpuj aco: ( ) ( ) ( ) 0 ω A =, A T 0 ω 0 =, B = ω 0 ω 0 1 Równanie optymalnego kostanu λ(t) = A T λ T (t) 21

implikuje dla zmiennych sprzȩżonych równania λ 1 (t) = ωλ 2 (t), λ2 (t) = ωλ 1 (t). Uk lad ten można zredukować do pojedynczego równania drugiego rzȩdu z równaniem charakterystycznym λ 1 (t) = ω 2 λ 1 (t) r 2 = ω 2, r 1,2 = ±jω. Oznacza to, że zmienne sprzȩżone s a w tym przypadku okresowymi funkcjami czasu i w szczególności λ 2 (t) = αsin(ωt + β). Z równania optymalnego sterowania uzyskujemy K u (u(t)) = λ 2 (t). Wynika st ad, że przebieg sterowania minimalnoczasowego jest określony zależności a û(t) = sign(αsin(ωt + β)). Wnioski z równania sterowania minimalnoczasowego: Sterowanie minimalnoczasowe oscylatora idealnego przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π/ω jednostek czasu (okres drgań badanego oscylatora wynosi 2π/ω, a czas przebiegu po lowy okrȩgu wynosi π/ω). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π/ω, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π/ω. Liczba prze l aczeń sterowania minimalnoczasowego może nieograniczenie narastać wraz ze wzrostem czȩstotliwości sterowania. Kszta lt trajektorii stanu oscylatora idealnego ze sterowaniem û(t) = +1: ẋ 1 (t) = ωx 2 (t), ẋ 2 (t) = ωx 1 (t) + 1 22

ẍ 1 (t) = ω 2 x 1 (t) + ω x 1 (t) = 1/ω + c 1 cos ωt + (c 2 /ω)sin ωt, x 2 (t) = c 1 ωsin ωt + c 2 cos ωt x 10 = c 1 + 1/ω; x 20 = c 2 ω x 1 (t) = 1/ω + (x 10 1/ω)cos ωt + x 20 sin ωt, x 2 (t) = (x 10 1/ω)sin ωt + x 20 cos ωt ωx 1 (t) 1 = (ωx 10 1)cos ωt + ωx 20 sin ωt, ωx 2 (t) = (ωx 1 (t) 1)sin ωt + ωx 20 cos ωt. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (ωx 1 1) 2 + (ωx 2 ) 2 = (ωx 10 1) 2 + (ωx 20 ) 2. Stosuj ac analogiczne przekszta lcenia uzyskujemy dla sterowania u = 1 (ωx 1 + 1) 2 + (ωx 2 ) 2 = (ωx 10 1) 2 + (ωx 20 ) 2. Tak wiȩc trajektorie stanu oscylatora idealnego s a, we wspó lrzȩdnych (ωx 1, ωx 2 ), okrȩgami o środku (1, 0) dla sterowania û(t) = +1 i okrȩgami o środku ( 1, 0) dla sterowania û(t) = 1. Promień okrȩgu jest równy ρ = ((ωx10 1) 2 + (ωx 20 ) 2). 23

ωx 2 ωx 1 ωx 2 ωx 1 24

Przyk lad. Minimalnoczasowe sprowadzanie oscylatora z t lumieniem w lasnym do po lożenia równowagi. ściana podstawowa amortyzator sprȩżynowy Obiekt sterowania M si la stabilizuj aca t lumik Uk lad o charakterze oscylatora z t lumieniem w lasnym jest opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) 2ξx 2 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ) = 0, i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1, gdzie ξ (0, 1) jest wspó lczynnikiem t lumienia oscylatora. Dla celów analizy w lasności matematycznych modelu uk ladu dokonujemy symetryzacji równań stanu wprowadzaj ac nowe wspó lrzȩdne stanu za pomoc a przekszta lcenia ( x 1 x 2 ) = 1 0 1 ξ 2 1 ξ ξ 1 2 ( z 1 z 2 ) czyli ( z 1 z 2 ) = ( ) ( 1 ξ 2 0 ξ 1 x 1 x 2 ) 25

Równania stanu w nowych wspó lrzȩdnych przybior a postać ( ) ( ) ( ) ż 1 (t) 1 ξ 2 0 0 1 = ż 2 (t) ξ 1 1 2ξ 1 0 1 ξ 2 1 ξ ξ 1 2 ( ) z 1 (t) z 2 (t) ( ) + 0 1 u(t) czyli ( ) ( ) ( ) ( ) ż 1 (t) ξ 1 ξ 2 = ż 2 (t) z 1 (t) 0 + u(t). 1 ξ 2 ξ z 2 (t) 1 Zadanie minimalnoczasowego sterowania dla oscylatora z t lumieniem w lasnym w nowych wspó lrzȩdnych stanu przybierze postać: zminimalizować wskaźnik jakości G(z, u) = uwzglȩdniaj ac ograniczenia w postaci przekszta lconych równań stanu ż(t) = Az(t) + Bu(t), t [0, t 1 ], z(0) = z 0, z(t 1 ) = z 1 oraz w postaci maksymalnej dopuszczalnej amplitudy sterowania u(t) 1, t [0, t 1 ], gdzie ( ) ( ) ξ 1 ξ 2 A = 0, B = u(t). 1 ξ 2 ξ 1 Zapisujemy zmodyfikowany funkcjona l Lagrange a G(z, λ, u) = oraz równania Eulera-Lagrange a 0 0 dt ( 1 + λ T (t)(ż(t) Az(t) Bu(t)) + K(u(t)) ) dt λ(t) = A T λ(t), ż(t) = Az(t) + Bu(t), K u (u(t)) = λ T (t)b, gdzie ( A T ξ = 1 ξ 2 26 ) 1 ξ 2 ξ

Z równania optymalnego sterowania wynika, że û(t) = sign(λ 2 (t)). W zwi azku z tym analizujemy rozwi azanie równań sprzȩżonych przyjmuj acych w zapisie skalarnym postać λ 1 (t) = ξλ 1 (t) + 1 ξ 2 λ 2 (t), λ 2 (t) = 1 ξ 2 λ 1 (t) + ξλ 2 (t). Wyznaczamy rozwi azanie uk ladu równań sprzȩżonych jako uk ladu stacjonarnych jednorodnych równań różniczkowych λ 1 (t) = C 1 e ξt sin( 1 ξ 2 t + C 2, λ 2 (t) = C 1 e ξt cos( 1 ξ 2 t + C 2. Tak wiȩc sterowanie minimalnoczasowe określone jest przez znak funkcji typu cosαt (modulowanej przez eksponentȩ) û(t) = sign(c 1 e ξt cos( 1 ξ 2 t + C 2 ). Wynika st ad, że sterowanie minimalnoczasowe dla oscylatora z t lumieniem w lasnym przyjmuje wartości +1 lub -1 i zachowuje sta l awartość nie d lużej niż π 1 ξ 2 jednostek czasu. Aby określić krzyw a prze l aczeń sterowania minimalnoczasowego zapisujemy równania stanu dla u(t) = ±1: i ich rozwi azanie dla û = +1 ż 1 (t) = ξz 1 (t) + 1 ξ 2 z 2 (t), ż 2 (t) = ξz 1 (t) ξz 2 (t) ± 1. oraz dla û = 1 z 1 (t) = 1 ξ 2 + C 1 e ξt cos( 1 ξ 2 t + C 2 ), z 2 (t) = ξ C 1 e ξt sin( 1 ξ 2 t + C 2 ) z 1 (t) = 1 ξ 2 + C 1 e ξt cos( 1 ξ 2 t + C 2 ), 27

z 2 (t) = ξ C 1 e ξt sin( 1 ξ 2 t + C 2 ). Wprowadzaj ac wspó lrzȩdna biegunowe uzyskujemy dla û(t) = +1 ρ(t). = C 1 e ξt, ϕ(t). = 1 ξ 2 t C 2 z 1 (t) 1 ξ 2 = ρ(t)cos ϕ(t), z 2 (t) ξ = ρ(t)sin ϕ(t). Trajektoria stanu opisywana tymi równaniami jest spiral a logarytmiczn a o środku ( 1 ξ 2, ξ). Natomiast dla û(t) = 1 uzyskujemy z 1 (t) + 1 ξ 2 = ρ(t)cos ϕ(t), z 2 (t) + ξ = ρ(t)sin ϕ(t). Trajektoria stanu opisywana tymi równaniami jest spiral a logarytmiczn a o środku ( 1 ξ 2, ξ). Po lowa zwoju każdej ze wskazanych spirali odpowiada π 1 ξ jednostkom 2 czasu. Pierwsze dwa kawa lki krzywej prze l aczeń określone s a spiralami przechodz acymi przez pocz atek uk ladu wspó lrzȩdnych. Kolejne kawa lki krzywej prze l aczeń określane s a przez osi aganie tych pierwszych kawa lków za pomoc a po lowy zwoju spirali jako przebiegu trajektorii stanu uk ladu odpowiadaj acego π 1 ξ 2 jednostkom czasu. Każdemu stanowi pocz atkowemu po lożonemu nad krzyw a prze l aczeń odpowiada sterowanie optymalne û(t) = 1, a pod krzyw a - sterowanie optymalne û(t) = +1. 28