Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego z ograniczeniami chwilowymi sterowania i z uwik lanym sterowaniem w równaniach stanu Rozważmy zadanie optymalnego sterowania docelowego z uwik lanym sterowaniem w równaniach stanu i z ograniczeniami chwilowymi sterowania: zminimalizować wskaźnik jakości G(x, u) = uwzglȩdniaj ac równanie stanu warunki graniczne oraz ograniczenia chwilowe sterowania g(x(t), u(t), t)dt ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x 0, x(t 1 ) = x 1 u(t) U, t [, t 1 ]. Za lóżmy chwilowe ograniczenia w postaci u(t) u max, t [, t 1 ]. Wprowadzamy funkcjȩ kary za przekroczenie ograniczeń chwilowych K j (u j (t)) = 0 jeśli u j (t) u max j i K j (u j (t)) = ρ j ( u j (t) u max j ) 2 jeśli u j (t) > u max j, gdzie ρ j > 0 jest wspó lczynnikiem kary. Wraz ze wzrostem wspó lczynnika kary ρ j > + funkcja kary staje siȩ coraz bardziej stroma i tym samym coraz dok ladniejsza. Stosuj ac metodȩ funkcyjnych mnożników Lagrange a λ(t) dla równań stanu i funkcjȩ kary K(u(t)) =. m j=1 K j(u j (t)) dla ograniczeń chwilowych sterowania w l aczamy te ograniczenia do wskaźnika jakości G(x, λ, u). = ( g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) ) dt 1

minimalizowanego przy jedynych pozosta lych ograniczeniach jakimi s a warunki graniczne x( ) = x 0, x(t 1 ) = x 1. Tak wiȩc rozszerzamy zakres zmiennych do postaci wektora zmiennych funkcyjnych (x, λ, u) traktuj ac je jako równoprawne zmienne optymalizacyjne z przestrzeni C 1. Warunki konieczne optymalności określimy definiuj ac funkcjȩ g jak nastȩpuje g(x(t), ẋ(t), λ(t), λ(t), u(t), u(t), t) = g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) i zapisujemy warunki konieczne optymalności w postaci nastȩpuj acego uk ladu równań Eulera-Lagrange a g o x(t) d dt gȯ x(t) = 0, t [, t 1 ], ( ) g o λ(t) d dt gȯ λ (t) = 0, t [, t 1 ], ( ) g u(t) o d dt gȯ u(t) = 0, t [, t 1 ], ( ). Jest to uk lad 2n+m równań różniczkowych dla 2n+m zmiennych funkcyjnych. Mnożnik funkcyjny λ(t) nazywany jest także zmienn a sprzȩżon a lub zmienn a kostanu (wektorem kostanu). Równanie (*) nazywane jest równaniem sprzȩżonym lub równaniem kostanu optymalnego, równanie (**) jest równaniem stanu optymalnego, zaś (***) jest równaniem sterowania optymalnego. Uk lad tych równań pozwala dla niektórych klas problemów sterowania optymalnego efektywnie sparametryzować sterowanie optymalne, co u latwia jego dookreślenie za pomoc a prostego dodatkowego algorytmu obliczeniowego. Minimalnoczasowe sterowanie docelowe dla uk ladów liniowych Zadanie polega na minimalizacji czasu realizacji procesu docelowego G(x, u) = dt = t 1 z uwzglȩdnieniem liniowego stacjonarnego równania stanu uk ladu ẋ(t) = Ax(t) + Bu(t), t [, t 1 ], 2

warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1 oraz ograniczeń chwilowych sterowania u(t) u max, t [, t 1 ]. Rozszerzamy zestaw zmiennych i zapisujemy zmodyfikowany wskaźnik jakości G(x, λ, u) = ( 1 + λ T (t)(ẋ(t) Ax(t) Bu(t)) + K(u(t)) ) dt. Mamy wiȩc g x = λ T (t)a, gẋ = λ T (t), g λ = (ẋ(t) Ax(t) Bu(t)) T, g λ = 0, g u λ T (t)b + K u (u(t)), g u = 0. Uk lad równań Eulera-Lagrange a przyjmie postać równanie kostanu optymalnego λ T (t)a λ T (t) = 0, równanie stanu optymalnego ẋ(t) Ax(t) Bu(t) = 0, równanie sterowania optymalnego λ T (t) + K u (u(t)) = 0. Przyk lad: minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia równowagi, jeśli jest on opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 = x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ), i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1. 3

W tym przypadku ( ) ( ) 0 1 A =, A T 0 1 = 1 0 1 0 Oznacza to, że zmienne kostanu spe lniaj a równania λ 1 (t) = λ 2 (t), λ2 (t) = λ 1 (t), λ 1 (t) = λ 1 (t), r 2 = 1, r 1,2 = ±j, λ 1 (t) = c 1 sin(t + c 2 ), λ 2 (t) = c 1 cos(t + c 2 ), K u (u(t)) = λ 2 (t). ściana podstawowa amortyzator Obiekt sterowania M si la stabilizuj aca Urz adzenie steruj ace Obiekt sterowania US sterowanie OS wyjście 4

Kszta lt trajektorii stanu oscylatora ze sterowaniem u = ±1: ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) ± 1 ẍ 1 (t) = x 1 (t) ± 1 x 1 (t) = c 1 cos t+c 2 sin t±1, x 2 (t) = c 1 sin t+c 2 cos t, x 10 = c 1 ±1; x 20 = c 2 x 1 (t) = (x 10 1)cos t + x 20 sin t ± 1; x 2 (t) = (x 10 1)sin t + x 20 cos t. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (x 1 (t) 1) 2 = (x 10 1) 2 cos 2 t + x 2 20sin 2 t + 2(x 10 1)cos t x 20 sin t, x 2 2(t) = (x 10 1) 2 sin 2 t + x 2 20cos 2 t 2(x 10 1)cos t x 20 sin t czyli (x 1 1) 2 + x 2 2 = (x 10 1) 2 + x 2 20. Tak wiȩc trajektorie stanu oscylatora s a okrȩgami o środku (1, 0) dla sterowania u = +1 i okrȩgami o środku ( 1, 0) dla sterowania u = 1. Promień okrȩgu jest równy ρ = ( ) 1/2. (x 10 1) 2 + x 20 5

x 2 x 1 x 2 x 1 6

Sterowanie minimalnoczasowe przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π jednostek czasu (okres drgań badanego oscylatora wynosi 2π, a czas przebiegu po lowy okrȩgu wynosi π). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π. Innym przyk ladem uk ladu, dla którego minimalnoczasowe sterowanie jest typu bang-bang jest uk lad z lożony z dwóch powi azanych oscylatorów opisywany równaniami stanu ẋ 1 ẋ 2 ẋ 3 ẋ 4 0 1 0 0 = 1 0 1 0 0 0 0 1 4 0 4 0 x 1 x 2 x 3 x 4 0 0 ( + 1 0 0 0 0 1 Jednak każde ze sterowań u 1 (t) i u 2 (t) może mieć w tym przypadku inne przedzia ly sta lości sterowania określone przez parametry poduk ladów. u 1 u 2 ) 7