Zasada maksimum Pontriagina

Podobne dokumenty
ZASTOSOWANIE ZASADY MAKSIMUM PONTRIAGINA DO ZAGADNIENIA

Sterowanie optymalne

Optymalne inwestowanie w rozwój firmy. Zastosowanie teorii sterowania.

Dystrybucje, wiadomości wstępne (I)

Optymalne inwestowanie w rozwój firmy - zastosowanie teorii sterowania

Fakty wstępne Problem brachistochrony Literatura. Rachunek wariacyjny. Bartosz Wróblewski

Opis systemów dynamicznych w przestrzeni stanu. Wojciech Kurek , Gdańsk

Optymalne zarządzanie rozwojem stacji telewizyjnej. Zastosowanie teorii optymalnego sterowania

Definicje i przykłady

ZAGADNIENIA PROGRAMOWANIA LINIOWEGO

Zastosowania twierdzeń o punktach stałych

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

II. Równania autonomiczne. 1. Podstawowe pojęcia.

Równania różniczkowe liniowe wyższych rzędów o stałych współcz

5 Równania różniczkowe zwyczajne rzędu drugiego

ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ

Model pajęczyny: Równania modelu: Q d (t)=α-βp(t) Q s (t)=-γ+δp(t-1) Q d (t)= Q s (t) t=0,1,2. α,β,γ,δ>0

Zadania do wykładu Jakościowa Teoria Równań Różniczkowych Zwyczajnych

RÓWNANIA RÓŻNICZKOWE WYKŁAD 2

Analiza portfelowa w czasie ciagłym dla ogólnych cen zakupu i sp. ze stałymi kosztami za transakcje

O pewnych klasach funkcji prawie okresowych (niekoniecznie ograniczonych)

13 Równanie struny drgającej. Równanie przewodnictwa ciepła.

5. Równania różniczkowe zwyczajne pierwszego rzędu

Wykład z równań różnicowych

Podstawy Automatyki. wykład 1 ( ) mgr inż. Łukasz Dworzak. Politechnika Wrocławska. Instytut Technologii Maszyn i Automatyzacji (I-24)

Z52: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania, zagadnienie brzegowe.

Podstawy Automatyki. Wykład 2 - podstawy matematyczne. dr inż. Jakub Możaryn. Warszawa, Instytut Automatyki i Robotyki

Wykład 14 i 15. Równania różniczkowe. Równanie o zmiennych rozdzielonych. Definicja 1. Równaniem różniczkowym zwyczajnym rzędu n nazywamy równanie

Elementy Modelowania Matematycznego Wykład 7 Programowanie nieliniowe i całkowitoliczbowe

Definicja problemu programowania matematycznego

ϕ(t k ; p) dla pewnego cigu t k }.

Własność iteracyjności składek ubezpieczeniowych wyznaczonych w oparciu o teorię skumulowanej perspektywy Kahnemana-Tversky

VI. Równania różniczkowe liniowe wyższych rzędów

Porównanie różnych podejść typu ODE do modelowania sieci regu

Sposoby modelowania układów dynamicznych. Pytania

Układy równań i równania wyższych rzędów

Wstęp do równań różniczkowych

Plan. Zakres badań teorii optymalizacji. Teoria optymalizacji. Teoria optymalizacji a badania operacyjne. Badania operacyjne i teoria optymalizacji

Regulator liniowo kwadratowy na przykładzie wahadła odwróconego

Inżynieria Systemów Dynamicznych (4)

Sterowanie optymalne dla uk ladów nieliniowych. Zasada maksimum Pontriagina.

Spacery losowe generowanie realizacji procesu losowego

TEORIA OBWODÓW I SYGNAŁÓW LABORATORIUM

III. Układy liniowe równań różniczkowych. 1. Pojęcie stabilności rozwiązań.

Programowanie liniowe

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.

Wykład z modelowania matematycznego.

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

Ekonometria - ćwiczenia 10

Analiza funkcjonalna 1.

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

Biotechnologia, Chemia, Chemia Budowlana - Wydział Chemiczny - 1

RÓŻNICZKOWANIE FUNKCJI WIELU ZMIENNYCH: rachunek pochodnych dla funkcji wektorowych. Pochodne cząstkowe funkcji rzeczywistej wielu zmiennych

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

1. Podstawowe pojęcia

Programowanie nieliniowe

Teoria sterowania i optymalizacji

2 Równania różniczkowe zwyczajne o rozdzielonych zmiennych

ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH

ODWZOROWANIA JEDNO- I WIELOWARTOŚCIOWE. PODOBIEŃSTWA, RÓŻNICE I PROBLEMY Z TEGO WYNIKAJĄCE.

Ekonomia matematyczna i dynamiczna optymalizacja

Matematyka 2. Równania różniczkowe zwyczajne rzędu drugiego

Ćwiczenia laboratoryjne - Dobór optymalnego asortymentu produkcji programowanie liniowe. Logistyka w Hutnictwie Ćw. L.

Mnożniki funkcyjne Lagrange a i funkcje kary w sterowaniu optymalnym

MODELOWANIE RZECZYWISTOŚCI

ROZDZIAŁ 8 POLITYKA FISKALNA A OPTYMALNE STOPY OSZCZĘDNOŚCI W MODELU WZROSTU GOSPODARCZEGO Z CZYNNIKIEM MIGRACJI LUDNOŚCI

Podstawy Automatyki. Wykład 2 - matematyczne modelowanie układów dynamicznych. dr inż. Jakub Możaryn. Warszawa, Instytut Automatyki i Robotyki

Notatki do tematu Metody poszukiwania rozwiązań jednokryterialnych problemów decyzyjnych metody dla zagadnień liniowego programowania matematycznego

Równania różniczkowe. Dariusz Uciński. Wykład 7. Instytut Sterowania i Systemów Informatycznych Universytet Zielonogórski

Analiza cen duopolu Stackelbera

Quantile hedging. czyli jak tanio i dobrze zabezpieczyć opcję. Michał Krawiec, Piotr Piestrzyński

TOZ -Techniki optymalizacji w zarządzaniu

Laboratorium Mechaniki Technicznej

Stabilność II Metody Lapunowa badania stabilności

doc. dr Beata Pułska-Turyna Zarządzanie B506 mail: mgr Piotr J. Gadecki Zakład Badań Operacyjnych Zarządzania B 505.

Algebra liniowa. Macierze i układy równań liniowych

Dystrybucje. Marcin Orchel. 1 Wstęp Dystrybucje Pochodna dystrybucyjna Przestrzenie... 5

Analiza matematyczna dla informatyków 3 Zajęcia 14

- prędkość masy wynikająca z innych procesów, np. adwekcji, naprężeń itd.

Lokalna odwracalność odwzorowań, odwzorowania uwikłane

Równanie przewodnictwa cieplnego (I)

Proces Poissona. Proces {N(t), t 0} nazywamy procesem zliczającym jeśli N(t) oznacza całkowitą liczbę badanych zdarzeń zaobserwowanych do chwili t.

1 Równania różniczkowe zwyczajne

OPTYMALIZACJA KONSTRUKCJI

Wielokryteriowa optymalizacja liniowa

Ćwiczenia laboratoryjne - 7. Problem (diety) mieszanek w hutnictwie programowanie liniowe. Logistyka w Hutnictwie Ćw. L. 7

PEWNE ZASTOSOWANIA TEORII DYSTRYBUCJI I RACHUNKU OPERATOROWEGO W TEORII RÓWNAŃ RÓŻNICZKOWYCH

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych,

Pojęcie funkcji. Funkcja liniowa

Przekształcanie równań stanu do postaci kanonicznej diagonalnej

Sterowanie napędów maszyn i robotów

Automatyka i robotyka ETP2005L. Laboratorium semestr zimowy

Elementy Modelowania Matematycznego

Wstęp do równań różniczkowych

Wykład 4 Udowodnimy teraz, że jeśli U, W są podprzetrzeniami skończenie wymiarowej przestrzeni V to zachodzi wzór: dim(u + W ) = dim U + dim W dim(u

Równania różniczkowe. Notatki z wykładu.

RÓWNANIA RÓŻNICZKOWE ZWYCZAJNE. Marta Zelmańska

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

A. Kasperski, M. Kulej Badania Operacyjne- programowanie liniowe 1

Równanie przewodnictwa cieplnego (II)

Transkrypt:

25.04.2015

Abstrakt Wiele zagadnień praktycznych dotyczących układów dynamicznych wymaga optymalizacji pewnych wielkości. Jednakże zwykła teoria gładkich układów dynamicznych zajmuje się jednak tylko opisem ewolucji układu w czasie. Zakłada, że jesteśmy jedynie biernymi obserwatorami. Aby móc szukać odpowiedzi na problemy w których możemy wpływać na rozwój wydarzeń wprowadzamy funkcję kontroli α(t) za pomocą której wpływamy na rozwój wydarzeń i rozważamy układ ẋ = f (x, α). Dziedzina zajmująca się badaniem tego typu zagadnień nazywa się teorią sterowania. Gdy z pomocą kontroli α mamy na celu optymalizację pewnej wielkości zależnej od trajektorii układu to mówimy o sterowaniu optymalnym. W referacie przedstawię podstawowe idee teorii sterowania optymalnego, przykłady rozważanych problemów i zagadnień. Głównym punktem prezentacji będzie zasada maksimum Pontryagina wyrażająca warunki konieczne jakie spełniać musi kontrola optymalna.

Możliwe do rozważenia sytuacje praktyczne: Jak dojechać do stacji benzynowej przy najmniejszym zużyciu paliwa? Jak wylądować sondą na Marsie w najkrótszym czasie? Jak zarządzać produkcją w fabryce aby uzyskać największy zysk?

Gładkim układem dynamicznym nazywamy równanie różniczkowe w postaci: Układ dynamiczny { ẋ(t) = f ( x(t) ) x(0) = x 0 Gdzie t 0 a f jest funkcją ciągłą f : R n R n. Zauważmy, że w postaci tej można zapisać równanie różniczkowe dowolnego rzędu. Układy dynamiczne dobrze sprawdzają się jako modele matematyczne zjawisk fizycznych.

Przykład: Kamień spadający na Marsa Modelujemy upadek kamienia w atmosferze Marsa. Upuszczamy go swobodnie z wysokości H nad powierzchnią. Niech h(t) będzie wysokością nad powierzchnią Marsa w chwili t. { m ḧ = mg + kḣ h(0) = H ḣ(0) = 0

Przyjmujemy możliwość kontrolowania zachowania układu dynamicznego. Załóżmy, że funkcja f zależy od dodatkowego parametru α A R n który możemy zmieniać w czasie: Układ sterowalny { ẋ(t) = f ( x(t), α(t) ) x(0) = x 0 gdzie α A {α : [0, ) A : α mierzalna}. Funkcję α nazywamy funkcją kontroli a zbiór A zbiorem funkcji dopuszczalnych. Trajektorię układu dla ustalonej kontroli α oznaczamy przez x α.

Przykład: Lądowanie na Marsie Modelujemy lądowanie statku kosmicznego na powierzchni Marsa. Upuszczamy go swobodnie z wysokości H nad powierzchnią. Niech: h(t) wysokość nad powierzchnią Marsa w chwili t m(t) masa statku w chwili t α(t) procent wykorzystania mocy odrzutu silnika w chwili t mḧ = mg + kḣ + W α ṁ = kα x(0) = H ḣ(0) = v m(0) = m 0 gdzie α[0, ) [0, 1], h(t) 0, m(t) m 0 m s.

Przykładowe problemy w teorii sterowania: Chcemy znaleźć kontrolę α taką, aby zmusić układ do przybrania ustalonej trajektorii (sterowalność układu). Mamy zadany podzbiór C przestrzeni fazowej. Chcemy sprawdzić, czy istnieje kontrola α, sprowadzająca układ w zbiór C w skończonym czasie (wyznaczanie zbioru osiągalnego). Mamy zadany funkcjonał, zależny od trajektorii układu. Szukamy kontroli α będącej punktem ekstremalnym tego układu (sterowanie optymalne).

Wprowadzamy dodatkowy funkcjonał P : A R (nieliniowy) w postaci P[α] = F [x α ] dla pewnego odwzorowania, określonego na możliwych trajektoriach układu. Funkcjonał ten nazywamy funkcjonałem zysku (payoff functional). Rozważać będziemy funkcjonały postaci: Funkcjonał zysku P[α] = Tα 0 r(x α, α) dt + g(x α (T α )) Funkcję r nazywamy zyskiem bieżącym (running payoff ) a g zyskiem końcowym (terminal payoff ). Naszym celem jest znalezienie kontroli α maksymalizującej zysk (jesteśmy chciwi/przedsiębiorczy). Funkcję α nazywamy kontrolą optymalną. W przykładach często można spotkać się z problemem maksymalizacji kosztów dla ustalenia terminologii - w takim przypadku zyskiem nazywamy brak starty.

Przykład: Lądowanie na Marsie przy ograniczonym budżecie Chcemy zminimalizować zużyte paliwo, a zatem zmaksymalizować jego ilość pozostałą po lądowaniu. Wprowadzamy zatem funkcjonał: P[α] = m(τ α ) gdzie τ α jest pierwszym momentem w którym x α (t) = 0. Szukamy kontroli α, będącej punktem minimalnym funkcjonału.

Rysunek : Spadek budżetu NASA od czasów złotej ery kosmicznej pokazuje, jak ważny jest to problem.

Omówimy teraz warunek konieczny na to, aby kontrola była kontrolą optymalną Zasadę Maksimum Pontriagina Lew Semenowicz Pontriagin (1908-1988) W roku 1922 roku, w wieku 14 lat, uległ wypadkowi, w wyniku którego stracił wzrok. Mimo to, dzięki pomocy matki, skończył w wieku 21 lat Uniwersytet Moskiewski i stał się jednym z najwybitniejszych matematyków XX wieku. Zajmował się głównie topologią i równaniami różniczkowymi. Rozważać będziemy przypadek, gdy T α = T jest ustalone, ale zmienia się punkt końcowy x α (t) (fixed time, free endpoint problem). Hamiltonianem teorii sterowania nazwiemy funkcję: H(x, p, a) = f (x, a), p + r(x, a))

Zasada Maksimum Pontriagina Niech α będzie kontrola optymalną dla układu sterowalnego z funkcjonałem zysku i x = x α. Istnieje funkcja p : [0, T ] R n taka, że: { (ODE) ẋ = p H(x, p, α ) (ADJ) ṗ = x H(x, p, α ) Ponadto spełniona jest zasada maksimum: (MAX ) H(x, p, α ) = max{h(x, p, a) : a A} 0 t T oraz hamiltonian jest całką pierwszą trajektorii x. Wartość końcowa funkcji p wyznaczona jest przez: (TR) p (T ) = g(x (T )) Równania (ODE) i (ADJ) nazywamy równaniami sprzężonymi a (TR) warunkiem transwersalności. Funkcję p nazywamy kostanem.

Kontrola produkcji i konsumpcji Produkujemy pewne dobro. W każdej chwili zużywamy część produkcji na bieżące potrzeby, a resztę inwestujemy. Tempo wzrostu produkcji jest proporcjonalne do inwestowanej części. Chcemy zmaksymalizować konsumpcję na przedziale czasowym [0, T ]. x(t) ilość wyprodukowana w czasie t α(t) część środków przeznaczana na inwestycję w chwili t Ewolucją układu rządzi równanie: ẋ = αx z warunkiem początkowym x(0) = x 0. Maksymalizujemy funkcjonał zysku w postaci: P[α] = T 0 (1 α)x(t) dt

Hamiltonian ma postać: H(x, p, a) = f (x, a)p + r(x, a) = axp + (1 a)x = x + ax(p 1) Zasada maksimum wygląda następująco: H(x, p, α) = max{x + ax(p 1) : 0 a 1} Zatem funkcja kontroli jest postaci: { 1 gdy p(t) > 1 α(t) = 0 gdy p(t) 1 Układ opisujący kostan: { ṗ = 1 α(p 1) p(t ) = 0

Zatem kostan jest w postaci: { e T 1 t gdy 0 t T 1 p(t) = T t gdy T 1 < t T Ostatecznie otrzymujemy funkcję kontroli: { 1 gdy 0 t T 1 α(t) = 0 gdy T 1 < t T Pamiętajmy, że zasada maksimum pozwala nam wyznaczyć jedynie kandydatów na kontrolę optymalną. W tym przypadku jednak, z pomocą innych metod, dowodzi się że funkcja α jest kontrolą optymalną. Funkcje kontroli w tej postaci nazywamy kontrolami typu bang-bang.

Literatura Teoria sterowania optymalnego Zdzisław Wyderka An Introduction to Mathematical Optimal Control Theory Lawrence C. Evans