ZASTOSOWANIE ZASADY MAKSIMUM PONTRIAGINA DO ZAGADNIENIA DYNAMICZNYCH LOKAT KAPITAŁOWYCH Krzysztof Gąsior Uniwersytet Rzeszowski Streszczenie Celem referatu jest zaprezentowanie praktycznego zastosowania zasady maksimum Pontriagina. Dla matematycznego formułowania problemu korzystamy ze znanego modelu dynamicznych lokat kapitałowych, który w badanym przez nas zagadnieniu jest liniowym układem równań różniczkowych. W naszych rozważaniach będziemy się starać wyznaczyć warunki w jaki sposób podzielić nasze zasoby tak, aby przy zadanych ograniczeniach finansowych w końcowym momencie czasu uzyskać maksymalny zysk z inwestycji. 1. Wprowadzenie Niech =, oznacza przedział osi liczbowej czasu o elementach t. Niech X oznacza n wymiarową przestrzeń Euklidesa. Element tej przestrzeni () R nazywamy wektorem stanu. Niech U oznacza r wymiarową przestrzeń sterowania. Element tej przestrzeni () R nazywamy wektorem sterowania. Dany jest zbiór będący iloczynem kartezjańskim. Przekrój tego zbioru oznaczamy przez () dla każdego. Odpowiednio rzut () na przestrzeń X oznaczamy przez (), a przekrój () przy ustalonym przez (,). Niech pary funkcji ((),()) określone na przedziale, spełniają następujące warunki: 1. Wektor stanu () jest ciągły i przedziałami różniczkowalny. 2. Wektor sterowania () jest przedziałami ciągły. 3. Dla każdego ustalonego funkcja ((),()) przyjmuje wartości ze zbioru (), to jest (),() (), czyli (), (,()). (1) W szczególności przy =, = ( ) ( ),( ) ( ) (2) www.think.wsiz.rzeszow.pl, ISSN 2082-1107, Nr 1 (1) 2009, s. 63-69
4. W przestrzeni sterowań określony jest obszar dopuszczalnych sterowań wypukły, ograniczony i domknięty. 5. Funkcja wektorowa określona na oraz ma ciągłe pochodne względem. 6. Pary (),() są określone na przedziale prawie wszędzie, to jest z wyjątkiem być może skończonej liczby punktów i spełniają równanie różniczkowe w postaci wektorowej =(,,) (3) 7. Na funkcjach, spełniających (3) oraz dana jest całka,(),(). Definicja (por. [2], str. 329). Zbiór par (),() spełniających wymienione założenia nazywamy zbiorem dopuszczalnych procesów sterowania D i odpowiednio () nazywamy zbiorem dopuszczalnych trajektorii, zaś () nazywamy zbiorem dopuszczalnych sterowań. Związki (1) nazywamy zwykle ograniczeniami odpowiednio na wektor stanu oraz wektor sterowania, a ograniczenia (2) warunkami granicznymi. Definicja (por.[2], str. 329). Na obszarze dopuszczalnym D dany jest funkcjonał =,,+ ( ),( ). Funkcja ( ),( ) jest określona w przestrzeni. Problem sterowania optymalnego () polega na znalezieniu takich ( (), ()) dla których powyższy funkcjonał osiąga minimalną wartość: (), (). 1. Zasada maksimum Pontriagina Twierdzenie 1 (por. [2], str. 379,Twierdzenie 8.1, Zasada maksimum Pontriagina). Jeżeli para ( (), ()) jest odpowiednio sterowaniem optymalnym i trajektorią optymalną stanu i jeżeli zbiór nie zależy od x oraz t, to prawie wszędzie w przedziale, spełniony jest warunek maksimum funkcji H dla każdego : (), (), (), (), (),,, (4) gdzie ( ):, R jest rozwiązaniem równania z warunkiem końcowym (),(),(), (),(),, () = (),, (), () ( )= (). ( ) 64
Wniosek (por. [2], str. 384). Jeżeli istnieje sterowanie optymalne znajdujące się w zbiorze sterowań dopuszczalnych, to spełnione są warunki: () = (),(),(),, ( () )=, () = (),(),(),, ( () )= ( ) ( ), (5) oraz spełniony jest warunek (4) dla prawie wszystkich,. Uwaga. Powyższe warunki nazywamy równaniami kanonicznymi Hamiltona. Funkcje H nazywamy funkcją Hamiltona (hamiltonianem), a zmiennymi sprzężonymi (dualnymi). 2. Zastosowanie zasady maksimum do analizy optymalności dynamiki lokat kapitałowych Niech będą dane dwa konta bankowe dla których możemy zaplanować pewną inwestycję kapitałową. Należy w jak najbardziej ekonomiczny sposób podzielić nasze zasoby tak, aby w końcowym momencie czasu uzyskać maksymalny zysk. Dla matematycznego formułowania zagadnienia korzystamy z modelu dynamicznych lokat kapitałowych (por. [3], str. 210): = +,=1,2, (6) przy warunkach brzegowych (0)=, (0)=, (7) ( ), ( ) swobodne, dane, oraz ograniczeniach na sterowanie: +,,, (8) gdzie:, jest oprocentowaniem na koncie (, R \0 oraz ),, jest saldem wpływów i wydatków (, R),, jest stanem konta w momencie czasu t (, R ), jest ilością wolnych środków możliwych do zainwestowania w chwili t ( R ). Aby zbadać jakość analizowanego zjawiska określimy funkcjonał celu, postaci: = ( + ) ( ( )+ ( )) Pierwszy składnik jest sumą przepływów pieniężnych dokonywanych pomiędzy kontami, zaś drugi sumą pieniędzy ulokowanych na kontach w momencie zakończenia procesu. Zatem minimalizacja funkcjonału będzie polegała na minimalizacji pierwszego składnika, a maksymalizacji drugiego. Współczynnik 0, uwzględnia preferencje składnika w funkcjonale. Gdyby drugi człon funkcjonału był stały i nie zależał od ( ), ( ), moglibyśmy go pominąć w obliczeniach. Jego równoważna forma ma postać: 65
= (0) (0) (9) O ile powyższy funkcjonał zawiera dodatkowe wyrażenie poza całką, to jednak to wyrażenie jest stałe. Wpływa ono na optymalną wartość J, ale nie na optymalne ścieżki k,k oraz optymalną wartość k (t ), k (t ). Korzystając z zasady maksimum Pontriagina, problem sprowadza się do maksymalizacji funkcji H, gdzie, zastępujemy równaniami procesu (6): =(λ +1)( + ) s (10) na obszarze wyznaczonym przez zależności (8). Oznaczmy przez = = λ +1,=1,2, (11) Otrzymujemy, że znalezienie wartości optymalnych s,s polega na maksymalizacji funkcji: = s + s, na obszarze dopuszczalnym. D W zależności od przyjmowanych wartości przez zmienne, otrzymujemy: =, =,, <0, (12) =, = +, 0, (13) = +, =, 0. (14) W warunkach (13 ) i (14 ) zakładamy, że co najmniej jedna zmienna (), () jest dodatnia. Wyznaczmy teraz zmienne sprzężone. Korzystając z (5) oraz (10) otrzymujemy: λ = = μ (λ +1),=1,2. 66
Rozwiązanie szczegółowe po uwzględnieniu warunku (5) dla funkcjonału (9) ma postać: λ ()= ( ) 1,=1,2. Podstawiając otrzymany wynik do (11) mamy: ()= ( ),=1,2. Wstawiając powyższe zależności do warunków (12) (14), uwzględniając warunek, że, a dodatkowo w warunkach (13) i (14) logarytmując oraz rugując czas, otrzymujemy następujące zależności: =, =,, (12 ) = +, =, <, (13 ) =, = +, <, (14 ) Z warunku (12 ) otrzymujemy, że dla =, które wynosi: = 1 obie zmienne (), () są ujemne, czyli następuje zmiana sterowania z (13 ) lub (14 ) na (12 ). Rozważmy przypadki sterowania ze względu na wartość współczynnika preferencji w funkcjonale (9): Przypadek 1. Dla 0<<1, gdy zachodzi zależność (13 ) równania procesu są postaci: = + +, =0 a rozwiązania tego układu z warunkami początkowymi (7) wyrażają się wzorami: ()= + + +. (15) ()= Natomiast, gdy spełniony jest warunek (14 ) poprzez analogie, otrzymujemy: ()= gdzie w obu przypadkach 0,. ()= + + +, Przypadek 2. Gdy =, wtedy spełniony jest warunek (12 ), a proces kapitalizacji opisany jest w następujący sposób: ()=, 0,. ()= Przypadek 3. Gdy 1 <, wtedy zamiana procesu następuje podczas jego trwania. Niech w I etapie procesu spełniony jest warunek (13 ). Optymalne trajektorie przy warunkach początkowych (7) wyrażone są przez zależności (15), gdzie 0, ). Natomiast w II etapie opisane są równaniami: 67
()=,,, ()= gdzie wartości, nie możemy wyznaczyć z warunków początkowych (7), ponieważ nie jesteśmy w momencie czasu =0. Korzystając z faktu, że proces musi być ciągły i wartości w momencie czasu = etapu I i II muszą być równe, otrzymujemy: = + + +. = Połączenie tych dwóch ścieżek daje nam, na całym przedziale czasu 0,. W analogiczny sposób możemy uzyskać ścieżkę, gdy zmiana sterowania następuje z (14 ) na (12 ). 3. Interpretacja ekonomiczna Analiza ekonomiczna wyodrębnionych przez nas przypadków jest następująca: Przypadek 1. System inwestowania polega na wybieraniu przez cały okres 0, z konta o niższym oprocentowaniu, kwot równych iloczynowi oprocentowania razy wartość kapitału początkowego ulokowanych na koncie i wpłacaniu wraz z maksymalną możliwą wartością pieniędzy równą na konto o wyższym oprocentowaniu. Przypadek 2. Strategia polega na wybieraniu z kont przez cały okres trwania procesu kwot równych iloczynowi oprocentowania i kwoty początkowej z obu kont. Również na konta nie wpłacamy żadnych nadwyżek finansowych. Przypadek 3. System polega na prowadzeniu strategii inwestowania jak w przypadku 1 przez okres czasu 0, ), a w przedziale czasu, strategii z przypadku 2. Uwaga. Maksymalny zysk z inwestowania możemy uzyskać, gdy stosujemy strategie z przypadku 1, a najmniejszy w przypadku 2. Robert Dorfman w swoim artykule podaje, że każdemu elementowi zasady maksimum możemy przypisać znaczenie ekonomiczne odwołujące się do naszej intuicji(zob. [1]). W porównaniu do omawianego w artykule, nasz Hamiltonian przyjmuje postać: (),(),(),= (),(),+ (),(),, (16) gdzie F jest wyrażeniem podcałkowym z funkcjonału (9), a drugi człon jest iloczynem skalarnym zmiennych dualnych oraz równań procesu(6). Zasada maksimum wymaga maksymalizacji funkcji H względem,. Znaczy, to że musimy w każdej chwili starać się maksymalizować łączne perspektywy zysku poprzez optymalny wybór salda. W szczególności wymaga to równoważenia spodziewanego bieżącego zysku, ze spodziewanym zwiększeniem przyszłego. Dla jaśniejszego przedstawienia, zbadamy słabą wersję zasady maksimum: = + () =0,=1,2. Po sprowadzeniu do postaci: = (),=1,2, 68
warunek ten pokazuje, że optymalnie wybrane, muszą równoważyć każdy krańcowy wzrost bieżącego zysku umożliwiony przez tę strategię(lewa strona równania) z krańcowym zwiększeniem przyszłego zysku, która będzie wołane tą strategią poprzez zwiększanie zasobów kapitału. Zasada Pontriagina korzysta z dwóch równań ruchu. Jedno równanie, dla zmiennej stanu jest bezpośrednio opisane równaniami (6). Charakteryzuje ono sposób, w jaki nasze decyzje wpływają na stopę zmiany kapitału. Równania ruchu dla zmiennej dualnej opisują wzory: = = () =1,2, lub też po przemnożeniu przez 1: = + () =1,2, Lewa strona powyższego równania określa stopę deprecjacji(spadku) w czasie ceny dualnej. Z równań ruchu wynika, że stopa ta jest równa co do wielkości różnicy dwóch składowych po prawej stronie. Pierwszy z nich reprezentuje krańcowy wpływ kapitału na bieżący zysk. Natomiast drugi, krańcowy wzrost kapitału na zwiększenie wartości kapitału. Zasada maksimum w tym przypadku oznacza, że stopa deprecjacji ceny dualnej jest równa stopie wzrostu różnicy bieżącego i przyszłego zysku, dzięki gromadzeniu kapitału. Na zakończenie wyjaśnimy znaczenie warunku zakończenia procesu w twierdzeniu 1. Przy sztywnym horyzoncie zakładamy, że liczą się tylko zyski uzyskane w okresie 0,. W naszym przypadku λ ( )=0,=1,2. Oznacza, to że cena dualna kapitału powinna spaść do zera w końcowym momencie. Dzieje się tak, ponieważ wartość kapitału zależy wyłącznie od tego, ile może nam przynieść zysku. Wynika stąd, że zajmowanie się gromadzenie kapitału pod koniec okresu planowania nie przyniesie nam znaczących korzyści. Zatem powinniśmy starać się zgromadzić jak najwięcej kapitału do chwili. 4. Bibliografia 1. Dorfman R., An Economic Interpretation of Optimal Control Theory, The American Economic Review, Vol. 59, No. 5., Grudzień 1969r. 2. Górecki H., Optymalizacja systemów dynamicznych, PWN, Warszawa 1993. 3. Panek E., Elementy ekonomii matematycznej równowaga i wzrost, PWN, Warszawa 1997. 69