Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Podobne dokumenty
Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

Sterowanie minimalnoczasowe dla uk ladów liniowych. Krzywe prze l aczeń.

Wprowadzenie do metod sterowania optymalnego

Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Sterowalność liniowych uk ladów sterowania

Wprowadzenie do teorii sterowania

Sterowanie optymalne

Ekonomia matematyczna i dynamiczna optymalizacja

Synteza optymalnego regulatora stanu. Uk lady z czasem ci ag lym.

Liczby zespolone, liniowa zależność i bazy Javier de Lucas. a d b c. ad bc

Liniowe uk lady sterowania.

Zagadnienie Dualne Zadania Programowania Liniowego. Seminarium Szkoleniowe Edyta Mrówka

Metody kierunków poprawy dla nieliniowych problemów sterowania optymalnego

Opis systemów dynamicznych w przestrzeni stanu. Wojciech Kurek , Gdańsk

liniowych uk ladów sterowania

Politechnika Wrocławska, Wydział Informatyki i Zarządzania. Modelowanie

y 1 y 2 = f 2 (t, y 1, y 2,..., y n )... y n = f n (t, y 1, y 2,..., y n ) f 1 (t, y 1, y 2,..., y n ) y = f(t, y),, f(t, y) =

POCHODNA KIERUNKOWA. DEFINICJA Jeśli istnieje granica lim. to granica ta nazywa siȩ pochodn a kierunkow a funkcji f(m) w kierunku osi l i oznaczamy

Inżynieria Systemów Dynamicznych (4)

STATYSTYKA MATEMATYCZNA dla ZPM I dr inż Krzysztof Bryś wyk lad 1,2 KLASYCZNY RACHUNEK PRAWDOPODOBIEŃSTWA

STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1

Suma i przeciȩcie podprzestrzeń, suma prosta, przestrzeń ilorazowa Javier de Lucas

Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010

Równania różniczkowe o zmiennych rozdzielonych

Regulator liniowo kwadratowy na przykładzie wahadła odwróconego

Pierwsze kolokwium z Matematyki I 4. listopada 2013 r. J. de Lucas

CHEMIA KWANTOWA MONIKA MUSIA L METODA HÜCKLA. Ćwiczenia. mm

Stabilność liniowych uk ladów sterowania

Po wprowadzeniu zmiennych uzupe lniaj acych otrzymamy równoważny mu problem w postaci kanonicznej:

Zadania do wykładu Jakościowa Teoria Równań Różniczkowych Zwyczajnych

Wyk lad 14 Formy kwadratowe I

Funkcje wielu zmiennych

edzi (local edge detectors) Lokalne operatory wykrywania kraw

ANALIZA II 15 marca 2014 Semestr letni. Ćwiczenie 1. Czy dan a funkcjȩ da siȩ dookreślić w punkcie (0, 0) tak, żeby otrzymana funkcja by la ci ag la?

CHEMIA KWANTOWA MONIKA MUSIA L. Ćwiczenia. mm

Wprowadzenie do teorii sterowania. Procesy sterowania o parametrach skupionych.

SZKO LA PODSTAWOWA HELIANTUS WARSZAWA ul. BAŻANCIA 16. Szeṡcian w uk ladzie wspȯ lrzȩdnych x, y, z GEOMETRIA PRZESTRZENNA STEREOMETRIA

Matematyka A, klasówka, 24 maja zania zadań z kolokwium z matematyki A w nadziei, że pope lni lem wielu b le. rozwia

Wprowadzenie z dynamicznej optymalizacji

Wprowadzenie do teorii sterowania. Procesy o parametrach skupionych

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Modelowanie układów dynamicznych

LOGIKA ALGORYTMICZNA

na p laszczyźnie kartezjaṅskiej prowadzimy prost a o rȯwnaniu s 1. (1.1) s 0 + t 1 t 0

WYK LAD 5: GEOMETRIA ANALITYCZNA W R 3, PROSTA I P LASZCZYZNA W PRZESTRZENI R 3

g liczb rzeczywistych (a n ) spe lnia warunek

Zasada optymalności Bellmana. Uogólniony optymalny regulator stanu.

1 Przestrzenie unitarne i przestrzenie Hilberta.

Równania różniczkowe liniowe drugiego rze

Asymptota pozioma: oṡ x, gdy y = 0 Asymptota pionowa: oṡ y, gdy x = 0. Hyperbola 1 x

RÓWNANIA RÓŻNICZKOWE ZWYCZAJNE zadania z odpowiedziami

w = w i ξ i. (1) i=1 w 1 w 2 :

RACHUNEK OPERATOROWY MIKUSIŃSKIEGO I JEGO ZASTOSOWANIE DO RÓWNAŃ

MATEMATYKA REPREZENTACJA LICZB W KOMPUTERZE

Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2012/2013. Forma studiów: Stacjonarne Kod kierunku: 06.

SZKO LA PODSTAWOWA HELIANTUS WARSZAWA ul. BAŻANCIA 16. Hyperbola 1 x FUNKCJE ELEMENTARNE WYMIERNE POTȨGOWE LOGARYTMICZNE.

Aproksymacja kraw. Od wielu lokalnych cech (edge elements) do spójnej, jednowymiarowej. epnej aproksymacji

Zestaw nr 6 Pochodna funkcji jednej zmiennej. Styczna do krzywej. Elastyczność funkcji. Regu la de l Hospitala

Równania różniczkowe zwyczajne Zadania z odpowiedziami

Równania różniczkowe liniowe rzędu pierwszego

Równania różniczkowe zwyczajne zadania z odpowiedziami

Elementy analizy funkcjonalnej PRZESTRZENIE LINIOWE

Wyk lad 11 1 Wektory i wartości w lasne

Wprowadzenie do równań ró znicowych i ró zniczkowych.

Rozdzia l 11. Przestrzenie Euklidesowe Definicja, iloczyn skalarny i norma. iloczynem skalarnym.

Matematyka A, egzamin, 17 czerwca 2005 rozwia zania

Metody rzutowania i funkcji barierowych dla problemów sterowania optymalnego

Dyskretne modele populacji

Dyskretne modele populacji

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA. Spis pojȩċ teoretycznych

Politechnika Wrocławska, Wydział Informatyki i Zarządzania. Modelowanie

Procesy Stochastyczne - Zestaw 1

SVM: Maszyny Wektorów Podpieraja cych

Wykład z modelowania matematycznego.

Metody obliczeniowe chemii kwantowej oparte na funkcji falowej. Dla uk ladu N elektronów i K j ader atomowych hamiltonian przyjmuje postać:

po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)

Wyk lad 7 Baza i wymiar przestrzeni liniowej

po lożenie cz astki i od czasu (t). Dla cz astki, która może poruszać siȩ tylko w jednym wymiarze (tu x)

Zastosowanie metod matematycznych w fizyce i technice - zagadnienia

Przestrzenie wektorowe, liniowa niezależność Javier de Lucas

Niezb. ednik matematyczny. Niezb. ednik matematyczny

Sterowanie napędów maszyn i robotów

Analiza dla informatyków 2 DANI LI2 Pawe l Domański szkicowe notatki do wyk ladu

Uzgadnianie wyrażeń rachunku predykatów. Adam i orzeszki. Joanna Józefowska. Poznań, rok akademicki 2009/2010

Seria zadań z Algebry IIR nr kwietnia 2017 r. i V 2 = B 2, B 4 R, gdzie

ZAGADNIENIE DUALNE Rozważmy zagadnienie liniowe(zagadnienie to nazywamy prymalnym) o postaci kanonicznej:

Funkcje wielu zmiennych

Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015. Forma studiów: Stacjonarne Kod kierunku: 06.

Laboratorium Mechaniki Technicznej

P (x, y) + Q(x, y)y = 0. g lym w obszrze G R n+1. Funkcje. zania uk ladu (1) o wykresie przebiegaja

Zestaw nr 7 Ekstremum funkcji jednej zmiennej. Punkty przegiȩcia wykresu. Asymptoty

Równania różniczkowe cz astkowe rzȩdu pierwszego

Uogólnione modele uk ladów sterowania

Wprowadzenie do metod sterowania optymalnego

Monika Musia l. METODA MIESZANIA KONFIGURACJI Configuration Interaction (CI) (ujȩcie wyznacznikowe)

celu przyjmijmy: min x 0 = n t Zadanie transportowe nazywamy zbilansowanym gdy podaż = popyt, czyli n

TEORIA FUNKCJONA LÓW. (Density Functional Theory - DFT) Monika Musia l

y(t) = y 0 + R sin t, t R. z(t) = h 2π t

Podstawy Automatyki. wykład 1 ( ) mgr inż. Łukasz Dworzak. Politechnika Wrocławska. Instytut Technologii Maszyn i Automatyzacji (I-24)

Funkcje wielu zmiennych

Transkrypt:

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym Sprowadzanie zadań sterowania optymalnego do zadań wariacyjnych metod a funkcji kary i mnożników Lagrange a - zadania sterowania optymalnego z ograniczeniami chwilowymi sterowania i z uwik lanym sterowaniem w równaniach stanu Rozważmy zadanie optymalnego sterowania docelowego z uwik lanym sterowaniem w równaniach stanu i z ograniczeniami chwilowymi sterowania: zminimalizować wskaźnik jakości G(x, u) = uwzglȩdniaj ac równanie stanu warunki graniczne oraz ograniczenia chwilowe sterowania g(x(t), u(t), t)dt ẋ(t) = f(x(t), u(t), t), t [, t 1 ], x( ) = x 0, x(t 1 ) = x 1 u(t) U, t [, t 1 ]. Za lóżmy chwilowe ograniczenia w postaci u(t) u max, t [, t 1 ]. Wprowadzamy funkcjȩ kary za przekroczenie ograniczeń chwilowych K j (u j (t)) = 0 jeśli u j (t) u max j i K j (u j (t)) = ρ j ( u j (t) u max j ) 2 jeśli u j (t) > u max j, gdzie ρ j > 0 jest wspó lczynnikiem kary. Wraz ze wzrostem wspó lczynnika kary ρ j > + funkcja kary staje siȩ coraz bardziej stroma i tym samym coraz dok ladniejsza. Stosuj ac metodȩ funkcyjnych mnożników Lagrange a λ(t) dla równań stanu i funkcjȩ kary K(u(t)) =. m j=1 K j(u j (t)) dla ograniczeń chwilowych sterowania w l aczamy te ograniczenia do wskaźnika jakości G(x, λ, u). = ( g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) ) dt 1

minimalizowanego przy jedynych pozosta lych ograniczeniach jakimi s a warunki graniczne x( ) = x 0, x(t 1 ) = x 1. Tak wiȩc rozszerzamy zakres zmiennych do postaci wektora zmiennych funkcyjnych (x, λ, u) traktuj ac je jako równoprawne zmienne optymalizacyjne z przestrzeni C 1. Warunki konieczne optymalności określimy definiuj ac funkcjȩ g jak nastȩpuje g(x(t), ẋ(t), λ(t), λ(t), u(t), u(t), t) = g(x(t), u(t), t) + λ T (t)(ẋ(t) f(x(t), u(t), t)) + K(u(t)) i zapisujemy warunki konieczne optymalności w postaci nastȩpuj acego uk ladu równań Eulera-Lagrange a g o x(t) d dt gȯ x(t) = 0, t [, t 1 ], ( ) g o λ(t) d dt gȯ λ (t) = 0, t [, t 1 ], ( ) g u(t) o d dt gȯ u(t) = 0, t [, t 1 ], ( ). Jest to uk lad 2n+m równań różniczkowych dla 2n+m zmiennych funkcyjnych. Mnożnik funkcyjny λ(t) nazywany jest także zmienn a sprzȩżon a lub zmienn a kostanu (wektorem kostanu). Równanie (*) nazywane jest równaniem sprzȩżonym lub równaniem kostanu optymalnego, równanie (**) jest równaniem stanu optymalnego, zaś (***) jest równaniem sterowania optymalnego. Uk lad tych równań pozwala dla niektórych klas problemów sterowania optymalnego efektywnie sparametryzować sterowanie optymalne, co u latwia jego dookreślenie za pomoc a prostego dodatkowego algorytmu obliczeniowego. Minimalnoczasowe sterowanie docelowe dla uk ladów liniowych Zadanie polega na minimalizacji czasu realizacji procesu docelowego G(x, u) = dt = t 1 z uwzglȩdnieniem liniowego stacjonarnego równania stanu uk ladu ẋ(t) = Ax(t) + Bu(t), t [, t 1 ], 2

warunków dwugranicznych x( ) = x 0, x(t 1 ) = x 1 oraz ograniczeń chwilowych sterowania u(t) u max, t [, t 1 ]. Rozszerzamy zestaw zmiennych i zapisujemy zmodyfikowany wskaźnik jakości G(x, λ, u) = ( 1 + λ T (t)(ẋ(t) Ax(t) Bu(t)) + K(u(t)) ) dt. Mamy wiȩc g x = λ T (t)a, gẋ = λ T (t), g λ = (ẋ(t) Ax(t) Bu(t)) T, g λ = 0, g u λ T (t)b + K u (u(t)), g u = 0. Uk lad równań Eulera-Lagrange a przyjmie postać równanie kostanu optymalnego λ T (t)a λ T (t) = 0, równanie stanu optymalnego ẋ(t) Ax(t) Bu(t) = 0, równanie sterowania optymalnego λ T (t) + K u (u(t)) = 0. Przyk lad: minimalnoczasowe sprowadzanie oscylatora idealnego do po lożenia równowagi, jeśli jest on opisywany równaniami stanu ẋ 1 (t) = x 2 (t), ẋ 2 = x 1 (t) + u(t), t [0, t 1 ], z warunkami granicznymi x i (0) = x i0, x i (t 1 ), i = 1, 2 i z ograniczeniami chwilowymi sterowania u(t) 1. 3

W tym przypadku ( ) ( ) 0 1 A =, A T 0 1 = 1 0 1 0 Oznacza to, że zmienne kostanu spe lniaj a równania λ 1 (t) = λ 2 (t), λ2 (t) = λ 1 (t), λ 1 (t) = λ 1 (t), r 2 = 1, r 1,2 = ±j, λ 1 (t) = c 1 sin(t + c 2 ), λ 2 (t) = c 1 cos(t + c 2 ), K u (u(t)) = λ 2 (t). ściana podstawowa amortyzator Obiekt sterowania M si la stabilizuj aca Urz adzenie steruj ace Obiekt sterowania US sterowanie OS wyjście 4

Kszta lt trajektorii stanu oscylatora ze sterowaniem u = ±1: ẋ 1 (t) = x 2 (t), ẋ 2 (t) = x 1 (t) ± 1 ẍ 1 (t) = x 1 (t) ± 1 x 1 (t) = c 1 cos t+c 2 sin t±1, x 2 (t) = c 1 sin t+c 2 cos t, x 10 = c 1 ±1; x 20 = c 2 x 1 (t) = (x 10 1)cos t + x 20 sin t ± 1; x 2 (t) = (x 10 1)sin t + x 20 cos t. Na tej podstawie ustalamy zwi azek miȩdzy zmiennymi x 1 (t) i x 2 (t) podnosz ac do kwadratu ostatnie zależności (x 1 (t) 1) 2 = (x 10 1) 2 cos 2 t + x 2 20sin 2 t + 2(x 10 1)cos t x 20 sin t, x 2 2(t) = (x 10 1) 2 sin 2 t + x 2 20cos 2 t 2(x 10 1)cos t x 20 sin t czyli (x 1 1) 2 + x 2 2 = (x 10 1) 2 + x 2 20. Tak wiȩc trajektorie stanu oscylatora s a okrȩgami o środku (1, 0) dla sterowania u = +1 i okrȩgami o środku ( 1, 0) dla sterowania u = 1. Promień okrȩgu jest równy ρ = ( ) 1/2. (x 10 1) 2 + x 20 5

x 2 x 1 x 2 x 1 6

Sterowanie minimalnoczasowe przyjmuje wartości +1 lub 1 (jest typu bang-bang). Czas sta lości sterowania minimalnoczasowego na poziomie +1 lub 1 nie może być d luższy niż π jednostek czasu (okres drgań badanego oscylatora wynosi 2π, a czas przebiegu po lowy okrȩgu wynosi π). Tylko pierwszy i ostatni przedzia l sta lości sterowania może być mniejszy od π, a wszystkie pośrednie przedzia ly (jeśli wszystkich przedzia lów sta lości sterowania jest wiȩcej niż dwa) musz a być równe π. Innym przyk ladem uk ladu, dla którego minimalnoczasowe sterowanie jest typu bang-bang jest uk lad z lożony z dwóch powi azanych oscylatorów opisywany równaniami stanu ẋ 1 ẋ 2 ẋ 3 ẋ 4 0 1 0 0 = 1 0 1 0 0 0 0 1 4 0 4 0 x 1 x 2 x 3 x 4 0 0 ( + 1 0 0 0 0 1 Jednak każde ze sterowań u 1 (t) i u 2 (t) może mieć w tym przypadku inne przedzia ly sta lości sterowania określone przez parametry poduk ladów. u 1 u 2 ) 7