Sterowanie predykcyjne systemami nieliniowymi Algorytmy z adaptacją wskaźnika jakości

Sterowanie predykcyjne systemami nieliniowymi Algorytmy z adaptacją wskaźnika jakości Piotr Bania Akademia Górniczo-Hutnicza Katedra Automatyki pba@ia.agh.edu.pl http://home.agh.edu.pl/~pba Seminarium Polskiego Towarzystwa Matematycznego, Kraków Maj 2007

Sterowanie predykcyjne stanowi przedmiot bardzo intensywnych badań Google Model predictive control (MPC) 343000 odnośników Nonlinear model predictive control (NMPC) 58500 odnośników Receding horizon control (RHC) 58900 odnośników Sterowanie predykcyjne" 264 odnośniki Regulacja predykcyjna" 243 odnośniki Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Czym jest sterowanie predykcyjne? Sterowanie predykcyjne (MPC model predictive control lub RHC receding horizon control) jest metodą sterowania systemami dynamicznymi, polegającą na cyklicznym rozwiązywaniu odpowiednio sformułowanego zadania sterowania optymalnego (ZSO). Początkowa część rozwiązania (funkcji sterującej) podawana jest na wejścia obiektu, po czym całą procedurę powtarza się dla nowego aktualnie wyznaczonego stanu obiektu. x &( t) = f ( x( t), u( t)) U System x( t) m = { u R ; u u umax, umin < 0, umax X n R u( t) U min > 0} 0 X Prawa strona ciągła, spełnia globalny warunek Lipschitza, f(0,0)=0, Wskaźnik jakości J i t + T i i i i i ( u, Ti, x( ti )) = L( x, u ) dt + q( x ( ti + Ti )) t i i Ograniczenia na stan końcowy x ( i t i + T ) Ω Zbiór dopuszczalnych stanów końcowych Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Uzasadnienie sterowania predykcyjnego Regulator optymalny u=k(x) moŝna wyznaczyć na drodze rozwiązania równania Hamiltona-Jacobiego-Bellmana, jednakŝe znalezienie rozwiązania jest praktycznie niemoŝliwe dla bardziej skomplikowanych zadań z ograniczeniami. (Mayne et. al. 2000) Znacznie łatwiejsze jest cykliczne rozwiązywanie zadania sterowania optymalnego ze skończonym horyzontem przy zadanym warunku początkowym. (Mayne et. al. 2000) Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Rozwój algorytmów predykcyjnych Pierwsze wzmianki Lee and Markus1967 Foundations of optimal control theory Kalman1960 optimality does not imply stability ale po wprowadzeniu twardych ograniczeń na stan końcowy moŝna uzyskać stabilny regulator Pakiet IDCOM (identification and command) model linowy dyskretny w postaci odpowiedzi imulsowej i kwadratowa funkcja kosztu Richalet et al. 1976 DMC Dynamic Matrix Control; Culter&Ramaker 1980, Prett&Gilette 1980 model liniowy dyskretny w postaci odpowiedzi skokowej, ograniczenia stanu i sterowania QDMC Quadratic Dynamic Matrix Control, zadanie programowania kwadratowego z uwzględnieniem ograniczeń stanu i sterowania, model liniowy dyskretny w czasie Garcia & Morshedi 1986 GPC generalized predictive control Clarke & Mothadi 1987 model linowy dyskretny w postaci transmitancji z uwzględnieniem zakłóceń i estymacją parametrów na bieŝąco Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

W systemach z czasem ciagłym przełom nastapił po opublikowaniu w 1990 r. artykułu Mayne & Michalska 1990 Receding Horizon Control of Non-linear Systems ograniczenia stanu końcowego, nieliniowy model obiektu w postaci układu równań róŝniczkowych, Quasi infinity horizon model predictive control Chen & Algöwer 1998 Model nielinowy w postaci równań róŝniczkowych, kwadratowy wskaźnik jakości, funkcja kary za niespełnienie warunku końcowego, wskaźnik jakości wybrany tak aby dobrze oszacować koszt dla zadania z nieskończonym horyzontem Suboptimal Model Predictive Control (Feasibility Implies Stability) Scokaert, Mayne, Rao 1999 nielinowe systemy dyskretne, suboptymalne sterowania dopuszczalne pozwalają uzyskać stabilność Bania 2007 QTO-RHC Quasi Time Optimal Receding Horizon Control suboptymalny algorytm predykcyjny dla systemów ciągłych w czasie dla zadań czasooptymalnych Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Zastosowania algorytmów predykcyjnych Przemysł chemiczny, petrochemiczny, metalurgia Lotnictwo Robotyka Loty kosmiczne Qin & Badgwel 1997 An overview of industrial model predictive control technology Morari & Lee 1999 Model predictive control : Past, present and and future Mayne et al. 2000 Constrained model predictive control: Stability and optimality Tatjewski P. 2002 Sterowanie zawansowane obiektów przemysłowych Maciejowski J. M. 2002 Predictive control Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Przykład 1.1.2. Utrata stabilności. Weźmy prosty system liniowy (niestabilny) Niestabilność w sterowaniu predykcyjnym x& ( t) = x( t) + u( t), x( t), u( t) R, x(0) = x0, t 0. (1.1.5) Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Wnioski z przykładów 1. Sterowanie i trajektoria składają się z kawałków sterowań i trajektorii będących rozwiązaniami kolejnych ZSO. 2. Rozwiązanie uzyskane po zamknięciu sprzęŝenia zwrotnego moŝe być istotnie róŝne od rozwiązania problemu sterowania w chwili początkowej. 3. WydłuŜenie horyzontu sterowania powoduje, Ŝe trajektoria systemu zamkniętego zbliŝa się do optymalnej trajektorii uzyskanej w chwili początkowej 4. Skracanie horyzontu z lewej strony powoduje Ŝe trajektoria systemu zamkniętego jest równa optymalnej trajektorii uzyskanej w chwili początkowej (przy braku zakłóceń). 5. Rozwiązania kolejnych problemów ZSO mogą się od siebie znacznie róŝnić RóŜnice pomiędzy rozwiązaniami kolejnych ZSO stają się pomijalnie małe przy odpowiednim wyborze horyzontu T i liczby ρ. 6. Zbyt krótki horyzont moŝe spowodować utratę stabilności. 7. Wprowadzenie funkcji kary za niespełnienie warunku końcowego pozwala ustabilizować system nawet przy krótkich horyzontach. Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Cel badań Skonstruować uniwersalny stabilny i odporny algorytm sterowania predykcyjnego umoŝliwiający realizację zadań: Sterowania czasooptymalnego, Sterowania docelowego, Stabilizacji po osiągnięciu otoczenia celu, przy moŝliwie niskim nakładzie obliczeń. Uzasadnienie Algorytmy predykcyjne były zwykle stosowane do stabilizacji systemów nieliniowych. Przedstawiony cel badań stanowi znaczące poszerzenie zakresu stosowalności algorytmów predykcyjnych i nie był dotychczas analizowany w literaturze. Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

A. Wymagania sztywne 1. Stabilność ( w odpowiednim sensie) 2. Odporność (w odpowiednim sensie) B. Sterowanie czasooptymalne (docelowe) i stabilizacja są trudne do pogodzenia w jednym algorytmie Sterowanie optymalne i docelowe 1. Celem jest osiągnięcie zadanego stanu końcowego 2. DuŜa wraŝliwość rozwiązań optymalnych 3. Zadanie ze skończonym horyzontem 4. Na ogół nie implikuje stabilności AP (Kalman 1960) optimality does not implies stability) Stabilizacja Celem jest minimalizacja odchyłek stanu w otoczeniu punktu równowagi Synteza regulatora na podstawie lokalnego modelu linowego, mniejsza wraŝliwość na zakłócenia Na ogół nieskończony horyzont sterowania Przy nieskończonym horyzoncie implikuje stabilność AP. Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Adaptacja wskaźnika jakości: Doprowadzić system do otoczenia celu i stopniowo zmieniać strategię sterowania włączając do wskaźnika jakości składnik stabilizujący (np. całka z kwadratu odchyłek stanu) Start adaptacji gdy trajektoria osiąga zbiór B Strategia stabilizacji i X(t+ T) i i Ω * X(t) i * X(t ) B Strategia czasooptymalna lub docelowa Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007 i-1

C. Minimalizacja nakładu obliczeń PODSTAWOWY PROBLEM Zadanie sterowania optymalnego musi być rozwiązywane on-line co czas δ!!! Wniosek NaleŜy wykorzystać rozwiązania suboptymalne do redukcji nakładu obliczeń oraz maksymalnie uprościć zadanie sterowania optymalnego Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Zadanie oryginalne Sterowanie optymalne z punktu do punktu Zadanie przekształcone Suboptymalne sterowanie dopuszczalne, z punktu do zbioru końcowego. DuŜy nakład obliczeń, zadanie nieskończenie wymiarowe niepotrzebne iteracje pod koniec procesu optymalizacji, ale gwarantowana stabilność. Redukcja nakładu obliczeń, prostszy problem sterowania, moŝliwość przerwania obliczeń po znalezieniu rozwiązania dopuszczalnego. Niskowymiarowa parametryzacja sterowania za pomocą wielomianów trzeciego stopnia. Czy sterowania suboptymalne zachowują stabilność i odporność? Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Lemat 2.3.1. Zachodzi implikacja WS1 WS3. Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Wpływ zakłóceń Przewidywana poprawa przy braku zakłóceń Rozwiązania zmierzają do kuli K(0,R(ε)) i pozostają w tej kuli, Promień kuli jest tym mniejszy im mniejsze są zakłócenia Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Wnioski Stosowanie rozwiązań suboptymalnych nie narusza stabilności i odporności algorytmu predykcyjnego Procedura Π moŝe zakończyć obliczenia gdy W praktyce optymalizujemy aŝ do wyczerpania limitu czasu Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Algorytm QTO-RHC (Quasi Time Optimal Receding Horizon Control ) Zmienna strategia sterowania Ograniczenie stanu końcowego jest realizowane przez dobór współczynnika kary ρ. Adaptacja wskaźnika jakości, regularne przejście od sterowania czasooptymalnego do stabilizacji Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

W początkowej fazie sterowanie jest zbliŝone do czasooptymalnego; Po osiągnięciu zbioru B (zadawanego przez uŝytkownika) rozpoczyna się adaptacja wskaźnika jakości, algorytm przechodzi do fazy stabilizacji zwiększając współczynnik εi i włączając do wskaźnika jakości człon stabilizujący; Horyzont zmierza do wartości minimalnej Tmin; Wskaźnik jakości zmierza do zera; Współczynnik kary ρ ulega zmianie co najwyŝej raz; JeŜeli funkcja podcałkowa we wskaźniku jakości jest kwadratowa i prawa strona równań stanu jest afiniczna względem sterowania, to sterowania generowane przez algorytm zmierzają do rozwiązań problemu liniowo kwadratowego ze skończonym horyzontem sterowania dla systemu zlinearyzowanego w otoczeniu zera. Regulator zmierza asymptotycznie do regulatora LQ Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Algorytm optymalizacji MSE - Monotone Structural Evolution (Korytowski, Szymkat, Turnau) Algorytm MSE jest bezpośrednią metodą rozwiązywania zadań sterowania optymalnego dla systemów opisywanych równaniami róŝniczkowymi zwyczajnymi przy ograniczeniach stanu i sterowania. Struktura sterowania: łuki graniczne, wewnętrzne, singularne oraz punkty podziału Łuk graniczny : wartość sterowania i końce przedziału, 2 parametry; Łuk wewnętrzny: wielomian stopnia 1 lub 3 oraz końce przedziału max. 6 parametów; Łuk singularny: us(x,ψ) końce przedziału, dwa parametry ; Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Przy ustalonej strukturze sterowania poszukuje się metodami gradientowymi (BFGS) minimum wskaźnika jakości Q(p), gdzie p jest wektorem parametrów sterowania Gradient wskaźnika jakości wylicza się na drodze numerycznego całkowania równań stanu i równań sprzęŝonych W trakcie optymalizacji wywoływane są procedury generacji i redukcji Generacja szpilkowa wstawienie nowego krótkiego łuku Generacja jednowęzłowa wstawienie nowego węzła Generacja płaska wstawienie łuku wewnętrznego na łuku granicznym Generacja wielomianowa zwiększenie o 2 stopnia wielomianu opisującego dany łuk wewnętrzny Efektywność generacji: Przyrost kwadratu normy gradientu przed i po generacji Warunki generacji czy dana generacja jest dopuszczalna i minimalnie efektywna Po generacji następuje zmiana struktury sterowania i zmiana wymiaru przestrzeni decyzyjnej Proces poszukiwania kontynuuje się w nowej przestrzeni aŝ do następnej generacji bądź spełnienia warunków koniecznych optymalności Procedury redukcji usuwanie łuków o zerowej długości zmiana struktury Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Przykład generacji szpilkowej 1. Sterowanie początkowe oraz antygradient wskaźnika jakości 2. Generacja szpilkowa na drugim sterowaniu 3. W następnej iteracji nowy łuk poszerza się 4. Po kilkunastu iteracjach wystąpiła redukcja pierwszego łuku oraz generacja nowego łuku granicznego na końcu Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Przykład generacji jednowęzłowej 1. Sterowanie tuŝ przed generacją 2. Efektywność generacji jednowęzłowej 3. Wstawienie nowego węzła w punkcie o maksymalnej efktywności Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Własności metody MSE Niski wymiar przestrzeni decyzyjnej zwykle <100 dobierany dynamicznie w trakcie procesu optymalizacji Szybka zbieŝność w porównaniu z metodą strzałów Wskaźnik jakości monotonicznie maleje w kolejnych iteracjach MoŜliwość zastosowania w czasie rzeczywistym Wada duŝy nakład pracy analitycznej wyznaczenie równań sprzęŝonych i wzorów na sterowania singularne Przy większej liczbie sterowań (>4) znacząco rośnie nakład obliczeń Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Kąt wahadła PołoŜenie wózka Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Porównanie z regulatorem LQ Pokaz Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Maksymalizacja stosunku masy końcowej do początkowej Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007

Dziękuję za uwagę Piotr Bania - Sterowanie predykcyjne systemami nieliniowymi - Seminarium PTM Kraków Maj 2007