1. Podstawowe pojęcia

1. Podstawowe pojęcia Sterowanie optymalne obiektu polega na znajdowaniu najkorzystniejszej decyzji dotyczącej zamierzonego wpływu na obiekt przy zadanych ograniczeniach. Niech dany jest obiekt opisany za pomocą modelu matematycznego: x &( = f ( x(,, (1) gdzie: x jest n-wymiarowym wektorem stanu, u p-wymiarowym wektorem sterowania, a t czasem rzeczywistym. Dany jest wskaźnik jakości: t k J ( u) = L( x(,, dt () t0 gdzie: t 0 oznacza czas początkowym sterowania, t k czas końcowy sterowania, a funkcja L to tzw. funkcja strat. Dane są równieŝ dodatkowe ograniczenia na wektor stanu i wektor sterowania: - składowe f i, i=1,...,n wektora f są funkcjami ciągłymi zmiennych x,u,t oraz mają ciągłe pochodne cząstkowe f i x j, i,j=1,...,n. - wszystkie zmienne stanu x 1,...,x n są dostępne - zbiór U nazywamy zbiorem sterowań dopuszczalnych, u i U, i =1,..., p - funkcja u jest funkcją przedziałami ciągłą w przedziale [t 0, t k ]. - określone zostają warunki początkowy x(t 0 )=x 0, x(t k )=x k Definicja: Sterowaniem optymalnym u * nazywane będzie sterowanie dopuszczalne, które minimalizuje wskaźnik jakości J: Zakład Automatyki E-3 1

u * = min J ( u) (3) u U Definicja: Syntezą regulatora (układu sterowania) optymalnego nazywać będziemy zadanie polegające na wyznaczeniu sterowania optymalnego u * od wektora stanu x tj. u * = u * (x). Układem optymalnym będziemy nazywać układ realizujący takie sterowanie.. Wskaźniki jakości sterowania optymalnego Definicja: Zagadnienie syntezy regulatora minimalizującego wskaźnik jakości: tk J ( u) = dt = t t (4) t0 (tj. dla L 1) nazywamy syntezą regulatora czasooptymalnego, a sterowanie wskaźnik ten minimalizujące sterowaniem czasooptymalnym. k 0 Niech: e( = z( y( wektor uchybu regulacji (z( to wektor Ŝądanych sygnałów wyjściowych) F macierz dodatnio półokreślona o wymiarach m m Q( macierz dodatnio półokreślona o wymiarze m m, której elementy są ciągłymi ograniczonymi funkcjami czasu t R( macierz dodatnio półokreślona o wymiarze p p, której elementy są ciągłymi ograniczonymi funkcjami czasu t Definicja: t k 1 T 1 T T J ( u) = e ( tk ) Fe( tk ) + [ e ( Q( e( + R( ] dt (5) t0 Zakład Automatyki E-3

nazywamy kwadratowym wskaźnikiem jakości, a sterowanie ten wskaźnik minimalizujące: sterowaniem optymalnym z kwadratowym wskaźnikiem jakości. 1 T Pierwsza część kwadratowego wskaźnika jakości e ( tk ) Fe( tk ) określa się jako koszt końcowy, a jej zadaniem jest zapewnienie małej wartości uchybu e( w chwili końcowej t k. Macierz F określa wagę przykładaną do uzyskania minimalnego uchybu dla poszczególnych wyjść obiektu. Z wyraŝeniem ( Q( e( e T wiąŝe się pojęcie jakości sterowania jest ona wysoka gdy uchyb e( w rozwaŝanym przedziale czasu jest niewielki. Z kolei T R( traktuje się jako koszt (zuŝytą energię) potrzebną dla realizacji sterowania. Macierze Q( i R( określają wagi dla obu w/w. aspektów sterowania optymalnego. 3. Synteza układu sterowania czasooptymalnego Przedmiotem rozwaŝań będzie synteza regulatora czasooptymalnego dla układu podwójnego integratora. Najczęściej jego spotykaną praktyczną realizacją jest masa m poddana działaniu siły zewnętrznej zgodnie z II-gą zasadą dynamiki Newtona. Układ ten opisywany jest równaniami: x& x& 1 ( = x ( ( = m z ograniczeniem: 1. M NaleŜy znaleźć sterowanie dopuszczalne, które przeprowadzi układ ze stanu x 0 do x k w skończonym, minimalnym czasie. (6) Zakład Automatyki E-3 3

Problem rozwiązany będzie przy pomocy zasady maksimum Pontriagina często stosowanej przy podobnych zagadnieniach. Twierdzenie (zasada maksimum Pontriagina): JeŜeli u * jest sterowaniem czasooptymalnym natomiast x * generowanym przez nie rozwiązaniem, to istnieje wtedy n-wymiarowa funkcja ψ, taka, Ŝe: a) ψ 0 (nie jest toŝsamościowo równa 0) b) ψ jest rozwiązaniem równania róŝniczkowego: H ( x(,, ψ (, ψ& = (7) x( gdzie: H jest hamiltonianem skalarną funkcją: n i= 1 = u*( x( = x*( H ( x(,, ψ (, = 1 + f ( x(, ) ψ ( (8) (f i i ψ i są i-tymi współrzędnymi n-wymiarowych funkcji f oraz ψ). c) ψ spełnia warunek: i H ( x * (, u * (, ψ (, = max H ( x * (,, ψ (, ) (9) t t [ t 0, tk ] u U i Zasada maksimum formułuje jedynie warunek konieczny optymalności sterowania. Zastosujmy ją dla rozwaŝanego układu. Hamiltonian wyznaczony dla (6) ma postać: n u H ( x, u, ψ, = 1 + fi ψ i = 1 + ψ 1x + ψ (10) m i= 1 Maksimum Hamiltonianu (10) jest osiągane dla u*( = M jeśli ψ > 0 i dla u*( = -M jeśli ψ < 0. Gdy ψ =0 sterowanie moŝe przyjmować dowolną wartość z dopuszczalnego przedziału. Zakład Automatyki E-3 4

Równania (7) dla rozwaŝanego układu mają postać: H ψ & 1 = = 0 x1 ( (11) H ψ& = = ψ 1 x ( stąd uwzględniając warunki początkowe po scałkowaniu dostajemy: ψ 1 = ψ 1( t0) ψ = ψ 1( t t 0 ) + ψ ( t 0 ) (1) Uwzględniając warunki na maksimum Hamiltonianu i (1) moŝemy podać następujące moŝliwe postacie sterowania czasooptymalnego: a) u * ( = M dla t t, t ] [ 0 k M -M Zakład Automatyki E-3 5

b) u * ( = M dla t t, t ] [ 0 p M -M c) u * ( = M dla t t, t ] [ 0 p u * ( = M dla t t p, t ] [ k M -M Zakład Automatyki E-3 6

d) u * ( = M dla t t, t ] [ 0 p u * ( = M dla t t p, t ] [ k M -M Dzięki zastosowaniu zasady maksimum Pontriagina zbiór sterowań czasooptymalnych został zawęŝony do w/w. wariantów. Przy przyjęciu warunków początkowych: x1( t0 ) = x x ( t0 ) = x rozwiązanie równań stanu (6) ma postać: x x 1 u = ( t t0 ) + x m u = ( t t0 ) + x0 m 10 0 0 ( t t 0 ) + x 10 (13) (14) Przyjmijmy t 0 = 0. Po wyrugowaniu czasu z równań (14) otrzymuje się równanie trajektorii układu postaci: Zakład Automatyki E-3 7

m m x 1 = x x0 + x10 (15) u u Sterowanie czasooptymalne u* moŝe przyjmować wartości M lub M - rodzinę trajektorii układu przy tym załoŝeniu (oraz przy M=1) zaprezentowano poniŝej: Definicja: Krzywa γ + jest miejscem geometrycznym punktów, które mogą być doprowadzone do punktu końcowego x k = [x 1k, x k ] przez sterowanie u=m: m γ + = ( x1, x ) : x1 = ( x xk ) + xk1, x < xk (16) M Definicja: Krzywa γ - jest miejscem geometrycznym punktów, które mogą być doprowadzone do punktu końcowego x k = [x 1k, x k ] przez sterowanie u=-m: m γ = ( x1, x ) : x1 = ( x xk ) + xk1, x > xk (17) M Definicja: Krzywa γ jest sumą mnogościową krzywych γ + i γ -. Jest to tzw. krzywa przełączeń: γ = γ γ (18) + Definicja: Przez R + oznaczany będzie zbiór stanów takich, Ŝe: {( x, x ) : ( x, x ) x x } 1 1 γ γ γ : 1 1 γ R + = < (19) czyli znajdujących się na lewo od krzywej przełączeń γ. Zakład Automatyki E-3 8

Definicja: Przez R - oznaczany będzie zbiór stanów takich, Ŝe: {( x, x ) : ( x, x ) x x } R + = > (0) 1 1 γ γ γ : 1 1 γ czyli znajdujących się na prawo od krzywej przełączeń γ. u=-m u=m Dla punktów znajdujących się na krzywej przełączeń γ jedynym sterowaniem gwarantującym dotarcie do zbioru docelowego bez przełączeń jest sterowanie u = M. Dla punktów znajdujących się na krzywej przełączeń γ + jedynym sterowaniem gwarantującym dotarcie do zbioru docelowego bez przełączeń jest sterowanie u = M. u=m,-m u=-m u=m,-m u=m Zakład Automatyki E-3 9

JeŜeli stan układu znajduje się w obszarze R, najpierw sterowany jest on z wykorzystaniem sterowania u = M, po napotkaniu krzywej przełączeń γ + następuje zmiana wartości sterowania na u = M. JeŜeli punkt początkowy znajduje się z kolei w obszarze R +, to obiekt najpierw sterowany jest z wykorzystaniem sterowania u = M, a po napotkaniu krzywej przełączeń γ następuje zmiana wartości sterowania na u = M. Reasumując wartość sterowania czasooptymalnego dla układu (6) moŝna wyrazić wzorem: u * M, gdy x( γ + R+ ( = 0, gdy x( { xk} M, gdy x( γ R (1) 4. Przebieg ćwiczenia Ćwiczenie wykonywane jest przy uŝyciu programu symulacyjnego napisanego przez mgr inŝ. Piotra Kowalskiego i mgr inŝ. Karola Krawca w ramach ich pracy magisterskiej Własności silnego i słabego trybu sterowania poślizgowego. Program pozwala na symulację sterowania czasooptymalnego i poślizgowego dla układu podwójnego integratora, z uwzględnieniem ograniczeń prędkości, zakłóceń i opóźnienia w sterowaniu. Parametry moŝliwe do ustawienia w głównym oknie programu to: m rzeczywista masa obiektu m1,m,m3,m1,m3 estymatory minimalnej i Maksymalnej masy dla obszarów kolejno: x > x k, 0<x <x k, x <0 n1,n rozszerzenie krzywych przy zbiorze docelowym x01,x0, - warunek początkowy połoŝenia i prędkości xk1,xk, - warunek końcowy połoŝenia i prędkości krok kwantyzacja czasu symulacji promień pozycjonowanie zbioru docelowego Zakład Automatyki E-3 10

opóźnienie ilość kroków bez zmiany sterowania alfa_m, alfa_w współczynniki kształtu funkcji sterowania w ograniczenie prędkości W margines bezpieczeństwa A amplituda zakłóceń sinusoidalnych B częstotliwość zakłóceń sinusoidalnych x1max,x1min,xmax,xmin zakres pola wykresu W kolejnych krokach naleŝy zbadać zachowanie się układu dla: a) zmieniających się połoŝeń początkowych i końcowych b) obecności róŝnic w wartościach masy rzeczywistej, a masy uŝywanej do syntezy regulatora c) występowania opóźnień w przełączeniach regulatora d) sinusoidalnych zakłóceń masy obiektu Zakład Automatyki E-3 11

5. Sprawozdanie Sprawozdanie z wykonywanego ćwiczenia powinno zawierać wstęp teoretyczny dotyczący sterowania optymalnego i czasooptymalnego dla układu podwójnego integratora. Następnie naleŝy załączyć wyniki przeprowadzonych symulacji oraz przeanalizować uzyskane wyniki pod kątem: czasu i przebiegu regulacji oraz ilości przełączeń. Poczynione obserwacje naleŝy skomentować formułując wnioski o charakterze technicznym. Zakład Automatyki E-3 1