Podstwy Teorii Sterowni Optymlnego Wojciech Kryszewski Wstęp Celem wykłdu jest przedstwienie metod mtemtycznych niezbędnych do rozwiązywni tzw. zdń ekstremlnych i związnych z nimi zdń sterowni optymlnego. Tego rodzju zdni lub problemy wiążą się z szeregiem zjwisk fizycznych, dl których mmy do czynieni z tzw. zsdą njmniejszego dziłni orz z problemmi decyzyjnymi rozmitych typów, w których chodzi o podjęcie optymlnej (z określonego punktu widzeni) decyzji. Zsd njmniejszego dziłni ( włściwie nleżłoby powiedzieć zsd dziłni stcjonrnego), mówiąc niezbyt precyzyjnie, orzek, że zminy ukłdu fizycznego pozostjącego pod wpływem określonych czynników dokonują się w tki sposób, by energi ukłdu był jk njmniejsz. Tk więc w celu zbdni fktycznej dynmiki zmin ukłdu nleży zbdć minimum tzw. funkcjonłu energii, tj. pewnej funkcji zleżącej od owej dynmiki. Podobnie jeśli mmy do czynieni z procesem, którego przebieg zleży od określonych prmetrów, i którego wynik (efekt) możn mierzyć przy pomocy pewnej funkcji sklrnej (zwnej niekiedy funkcjonłem kosztu lub funkcją celu), to rcjonln jest optymlizcj doboru prmetrów odzwierciedlon minimlizcją funkcjonłu kosztu (lub mksymlizcją funkcji celu). N przykłd podczs podróży z mist A do mist B nleży podjąć tką decyzję odnośnie wyboru środków komunikcji, przy których koszt podróży jest njmniejszy. Zdni ekstremlne i problemy optymlnego sterowni obecne są w prgmtyce dziłni i w mtemtyce, któr pomg przy ich rozwiązywniu od dwn. Jednym z tkich zgdnień jest tzw. problem izoperymetryczny, w którym chodzi o znlezienie figury płskiej o zdnym obwodzie, któr m njwiększe pole powierzchni (lub też figury przestrzennej o zdnym polu powierzchni bocznej, któr m njwiększą objętość). Rozwiąznie tego zgdnieni opier się n nstępującym twierdzeniu: Jeśli krzyw prostowln o długości L ogrnicz figurę płską o polu S, to zchodzi nierówność: L 2 4πS, przy czym równość zchodzi wtedy i tylko wtedy, gdy krzyw jest okręgiem. Innymi słynnymi zgdnienimi ekstremlnymi były np. zdnie Euklides, w którym chodziło o znlezienie równoległoboku o njwiększym polu wpisnego w dny trójkąt; zdnie Archimedes, w którym chodziło o znlezienie wśród wszystkich czsz sferycznych o zdnej powierzchni tką, któr zmyk njwiększą objętość; zdnie Heron, w którym dne są dw punkty A, B leżące po jednej stronie prostej l i chodzi o znlezienie punktu D l tkiego, by długość łmnej łączącej A, D i B był njmniejsz; zdnie Ptolemeusz polegjące n znlezieniu drogi przejści świtł z punktu A leżącego w jednym ośrodku do punktu B leżącego w innym ośrodku. Aż do XIV wieku zdni ekstremlne rozwiązywno przy pomocy metod d hoc. Dopiero potem, dzięki odkryciom Kepler, Fermt, Leibniz i Newton, oprcowno pewne ogólne techniki pozwljące n jednolite podejście do tego typu zgdnień. Jednym z njwżniejszych osiągnięć w tym kierunku był tzw. zsd wricyjn Fermt dotycząc 1
optyki geometrycznej. Stwierdził on, że promień świtł przebieg tką drogę o punktu A do punktu B, by czs potrzebny n jej pokonnie był njmniejszy (przy złożeniu, że w środowisku jednorodnym świtło rozchodzi się prostoliniowo). Konsekwencją zsdy tej był, wspomnin wyżej zsd njmniejszego dziłni sformułown przez Mupertuis. Omówimy pokrótce inne klsyczne zdni sterowni. 1. Zdnie trnsportowe. Złóżmy, że zps pewnego mteriłu rozmieszczony jest w różnych bzch. Pondto złóżmy, że mterił ten powinien być dostrczony w różne miejsc; przy czym widomo jki jest koszt przewozu jednostki mteriłu i jkie jest jego zpotrzebownie. Zdnie trnsportowe (wżne n przykłd w logistyce wojskowej) poleg n sporządzeniu optymlnego plnu przewozu, tzn. plnu, którego relizcj pochłonie njmniejszy koszt przy jednoczesnej relizcji wymgnych celów. Funkcjonłem kosztu jest w tym przypdku koszt opercji. 2. Zdnie minimlno-czsowe. Zdni tego typu pojwiją się wtedy, gdy nleży optymlizowć czs niezbędny do relizcji konkretnego celu. Funkcjonłem kosztu (celu) jest w tym wypdku czs relizcji celu. Aby zstosowć metody mtemtyczne w celu rozwiązni zdni ekstremlnego lub zdni sterowni optymlnego nleży wyrzić do zdnie w formlnym języku mtemtyki. Ogólnie mówiąc wiąże się to z: zdefiniowniem funkcji f : X R określonej n pewnym zbiorze X; wyznczeniem podzbioru C X, który stnowi ogrniczeni zdni, którego elementy nzyw się dopuszczlnymi. Gdy C = X, to mówimy o zdniu ekstremlnym bez ogrniczeń. Wybór funkcji f związny jest z wspomninym funkcjonłem energii (lub kosztu), zś zbiór C jest, n ogół, związny z celem formlizownego procesu. W tym języku zdnie ekstremlne poleg n znlezieniu tkiego x 0 C, by f(x 0 ) = inf x C f(x) (lub f(x 0 ) = sup x C f(x)). Innymi słowy nleży znleźć element (punkt) x 0 C, w którym funkcj f osiąg minimum (lub mksimum) globlne względem zbioru C, tzn. dl dowolnego x C, f(x) f(x 0 ) (lub f(x) f(x 0 )). Punkt, w którym osiągnięte jest ekstremum nzyw się czsem optimum. W omwinych sytucjch stosuje się nstępujące zpisy: { f(x) inf, x C (lub f(x) sup, x C). Jest przy tym jsne, że zdni mksymlizcji i minimlizcji są (w pewnym sensie) równowżne. Aby rozwiązć zdnie f(x) sup, x C, wystrczy rozwiązć zdnie g(x) inf, x C, gdzie g(x) = f(x) dl x X i n odwrót. Z tego też względu n ogół zjmowć się będziemy zgdnienimi minimlizcji (nie mniej jednk wrto też umieć rozwiązywć zdni mksymlizcji). N ogół zbiór X jest przestrzenią metryczną (lub, ogólniej, przestrzenią topologiczną). W tej sytucji niekiedy, zmist poszukiwć ekstremów globlnych, możn poszukiwć ekstremów loklnych, tzn. punktów x 0 C tkich, że dl wszystkich x C nleżących do pewnego otoczeni x 0, zchodzą powyższe nierówności. 2
O konkretnych modelch służących formlizcji wspomnimy poniżej i n ćwiczenich. Klsy zdń ekstremlnych Różne klsy zdń ekstremlnych wyróżni się w oprciu chrkter zbioru ogrniczeń lub chrkter i włsności funkcji celu f. Często też tego rodzju klsyfikcje sprzężją się: wynik to z, obecnie powszechnie przyjętego, podejści ktegoryjnego. A. Zdni głdkie z głdkimi ogrniczenimi. Niech X = R n lub, ogólniej, niech X będzie przestrzenią Bnch, f : X R funkcjonłem przynjmniej klsy C 1, zś C := {x X g(x) = 0}, gdzie g : X Y jest inną głdką funkcją o wrtościch w przestrzeni Bnch Y (np. Y = R m, m n). Wtedy, przy pewnych dodtkowych złożenich, C jest głdką podrozmitością w X. W klsycznej nlizie mtemtycznej nietrudno jest podć wrunki konieczne i dostteczne istnieni rozwiązń zgdnieni f(x) inf, x C przy pomocy metody tzw. nieoznczonych mnożników Lgrnge. Ogólniej X może być otwrtym podzbiorem przestrzeni Bnch. N przykłd, gdy X = (, b) R (orz C = X) orz w punkcie x 0 (, b) funkcj różniczkowln f : (, b) R osiąg ekstremum loklne (np. minimum), to f (x 0 ) = 0 ( 1 ). Jest to tzw. wrunek konieczny Fermt istnieni loklnego ekstremum funkcji różniczkowlnej. Wrunek konieczny istnieni ekstremum w punkcie krytycznym możn wysłowić przy pomocy znku drugiej pochodnej. B. Zdni progrmowni. Niech jk poprzednio f : X R będzie (dosttecznie) głdką funkcją, zś C = {x X g(x) = 0, h(x) 0} gdzie g : X Y orz h : X R m ( 2 ). W tej sytucji zdnie f(x) inf, x C nzywmy zdniem progrmowni nieliniowego. Przy tym przymiotnik nieliniowy odnosi się do sytucji, w której funkcje f, g i h mją wybitnie nieliniowy chrkter. Jeśli funkcje te są np. wypukłe, kwdrtowe, liniowe itp., to mówi się o zdnich progrmowni wypukłego, kwdrtowego lub liniowego. Szczególnie te osttnie mją istotne znczenie prktyczne. C. Zdni klsycznego rchunku wricyjnego. Rozwżmy dosttecznie głdką funkcję L : [, b] R R R i niech f będzie funkcjonłem określonym w przestrzeni X = C 1 ([, b, R) funkcji głdkich [, b] R wzorem f(x( )) = L(t, x(t), x (t)) dt dl x X. Pondto niech C = {x X x() = A, x(b) = B} gdzie A, B R są ustlonymi liczbmi (punktmi n prostej rzeczywistej). Zdnie f(x) inf, x C nzywne jest zdniem klsycznego rchunku wricyjnego. Sporo miejsc poświęcimy strnnej nlizie zdń tego typu. D. Zdni sterowni optymlnego. W problemch tego typu chodzi o znlezienie minimum funkcjonłu f(x( ), u( )) = L(t, x(t), u(t)) dt 1 Punkt x (, b), w którym znik pochodn nzyw się punktem krytycznym. 2 Nierówność h(x) 0 nleży rozumieć nstępująco: h(x) 0, gdzie h = (h 1,..., h m ), wtedy i tylko wtedy, gdy h i (x) 0 dl wszystkich i = 1, 2,..., m. 3
przy ogrniczenich postci x (t) = g(t, x(t), u(t)) x() = A, x(b) = B u U, u(t) M R m, gdzie x : [, b] R n, u : [, b] R m. W zgdnieniu tym zbiór U jest pewnym zbiorem dopuszczlnych funkcji zwnych sterownimi, które dodtkowo przyjmują wrtości w zbiorze M. Rozwiązniem tego typu zgdnieni jest pr funkcji (x, u), które spełniją w/w ogrniczeni i, dl których funkcjonł f przyjmuje wrtość njmniejszą. Zdnie tkie możn interpretowć nstępująco: zgdnienie brzegowe { x (t) = g(t, x(t), u(t) x() = A, x(b) = B opisuje pewien proces fizyczny zleżny od prmetru funkcyjnego u( ), którego wybór kontrolujemy. Przy tym dopuszczlne są tylko te sterowni u, które przebiegją określony zbiór funkcji przyjmujących wrtości w zbiorze M. Dodtkowo f pełni rolę kosztu (lub celu), który płcimy (relizujemy) podczs przebiegu procesu pod dziłniem sterowni u. Znlezieni pry funkcji (x, u) spełnijącej zdne ogrniczeni i jednocześnie relizującej minimum (lub mksimum) dl f wiąże się z optymlizcją procesu. Wrunki konieczne istnieni tkiej pry zwrte są w tzw. zsdzie Pontrigin. Nieco dokłdniej przyjrzymy się osttniemu zdniu z uwgi jego ogólność. 1. Aby wyjśnić rolę równni różniczkowego występującego w powyżej sformułownych ogrniczenich nleży wyjśnić jkiego rodzju zjwisk równni tkie modelują. Spróbujmy rozwżyć możliwie njprostsze zjwisko fizyczne jkim jest ruch punktu mterilnego o msie m w przestrzeni trójwymirowej R 3. Jeśli położenie nszego punktu w czsie t [0, T ] oznczyć x(t) R 3 (eksperyment rozpoczynmy w czsie t =, zś kończymy w czsie t = b), to widzimy, że x(t) = (x 1 (t), x 2 (t), x 3 (t)) gdzie x i (t) R. Tym smym, położenie punktu opisuje funkcj wektorow x : [, b] R 3. Przypuśćmy terz, że w kżdym punkcie przestrzeni dził pewn sił (jk pmiętmy z fizyki sił to wektor, mówimy więc o polu wektorowym g(t, x) R 3 ) zleżn od czsu i punktu przyłożeni. Tym smym mmy określoną funkcję g : [, b] R 3 R 3. Oczywiście g = (g 1, g 2, g 3 ) gdzie g i : [, b] R 3 R, i = 1, 2, 3 są funkcjmi sklrnymi zleżnymi od zmiennych z czso-przestrzeni [, b] R 3. Problem mtemtyczny inspirowny zjwiskiem fizycznym poleg terz n możliwie precyzyjnym opisie ruchu punktu w dnym polu siłowym g. Znjąc to pole orz wrunki początkowe eksperymentu, tzn. położenie początkowe A = ( 1, 2, 3 ) R 3 punktu i jego prędkość początkową V = (v 1, v 2, v 3 ) R 3, nleży znleźć funkcję x(t), t [, b] określjącą położenie punktu w dnym czsie t [, b]. Zuwżmy, że zgodnie z interpretcją fizyczną, prędkość punktu to pochodn funkcji x, więc wektor x (t) = (x 1(t), x 2(t), x 3(t)) interpretujemy jko prędkość punktu. Tk więc, w szczególności, A = x() orz V = x (). 4
Poszukiwn funkcj x( ) ukryt jest w odpowiednim równniu różniczkowym, którego ksztłt jest rezulttem przyjętej teorii fizycznej, któr z kolei powstje wskutek doświdczeni i jest swoistym modelem odzwierciedljącym rzeczywistość. W nszym zgdnieniu mmy do czynieni z tzw. mechniką Newton, zgodnie z którą poszukiwn funkcj x( ) spełni nstępującą zleżność: mx 1(t) = g 1 (t, x(t)) mx 2(t) = g 2 (t, x(t)) lub (w tzw. zpisie wektorowym) mx 3(t) = g 3 (t, x(t)) x() = A x (0) = V. mx (t) = g(t, x(t)) x(0) = A x (0) = V. ( ). ( ) Równnie to jest tzw. prwem Newton dl punktu mterilnego poddnego dziłniu siły g = (g 1, g 2, g 3 ). Zuwżmy jeszcze, że npisne równnie opisuje sytucję poniekąd idelną bowiem zniedbujemy możliwość wystąpieni dodtkowych sił wynikjących z istnieni n przykłd trci. W podnej sytucji (o ile sił g spełni pewne nturlne złożeni, np. g jest funkcją głdką), trjektori, tzn. funkcj x( ), któr spełni równnie ( ) orz stn końcowy, tzn. wrtość x(b) są wyznczone jednozncznie. Sytucj zmieni się rdyklnie jeśli przyjmiemy, że pole siłowe g zleży również od pewnych dodtkowych prmetrów, n przykłd g : [, b] R 3 M R 3. Jeśli terz u : [, b] M jest funkcją (z określonego wcześniej, dopuszczlnego, zbioru funkcji), to w miejsce równni ( ) powinniśmy rozwżyć równnie mx (t) = g(t, x(t), u(t)) x(0) = A. ( ) x (0) = v. Problemy tkiego typu nzyw się ukłdmi sterowni. Wprowdzenie zleżności od u może zsdniczo zmienić dynmikę ruchu. Njlepiej wyobrzić sobie, że punkt mterilny zostł wyposżony w silnik, którego ciąg u(t) w chwili t [, b] wpływ n ruch. Nietrudno zobczyć, że w tej sytucji ruch nie m chrkteru deterministycznego: zleży od bowiem od zmienności funkcji u. Oczywiście powyżej mówiliśmy o równniu II-go rzędu (większość równń fizyki mtemtycznej to równni tego typu; w prktyce równni tm występujące to w istocie równni cząstkowe). Nie jest to jednk dl nszych rozwżń żden problem: potrfimy tk przeksztłcić równnie, by zstąpić je równniem rzędu pierwszego. 2. Zjmiemy się terz wyjśnieniem roli ogrniczeń dotyczących sterowń. Jest jsne, że wrtości funkcji u podlegją nturlnym i wynikjącym z nturlnych przyczyn ogrniczeniom. N przykłd, moc silnik u(t), o którym wspomnieliśmy wyżej nie może przyjmowć dowolnych wrtości. Stąd pojwi się konieczność określeni zbioru M. Dodtkowo sterowni mogą być funkcjmi określonego typu: n przykłd funkcjmi kwłkmi głdkimi, liniowymi itp. (przecież nie kżd funkcj może relizowć omwiną moc silnik). Stąd konieczność sprecyzowni zbioru U sterowń. 5
3. N ogół istnieje wiele sterowń u, które relizują ogrniczeni (poprzez wybór różnych funkcji u możn przeprowdzić punkt z punktu A do punktu B). Ruch wzdłuż trjektorii x( ) podczs zstosowni sterowni u( ) wiąże się z pewnym kosztem, który chcemy zminimlizowć (lbo rezygnując z ktegorii ekonomicznych: pr (x, u) podleg pewnemu kryterium jkości chcemy tk dobrć tę prę, by owo kryterium otymlizowć). N przykłd: funkcjonł jkości (lub kosztu) może mieć postć cłkową f(x, u) = L(t, x(t), u(t)) dt. Konkretne (prktyczne) zdnie ekstremlne wymg przede wszystkim strnnego modelu mtemtycznego, tzn. wyznczeni funkcji L (lub, ogólniej, funkcjonłu f) orz obiektów niezbędnych do opisu ogrniczeń, tzn. funkcji g, punktów A, B orz zbiorów M i U. Problem ten jest przedmiotem teorii modelowni mtemtycznego i stnowi trudne i wżne zgdnienie smo w sobie. Teori sterowni optymlnego dotyczy rczej metod poszukiwni rozwiązń zdń ekstremlnych, które już zostły poprwnie postwione i sformlizowne. Jednk, jk to często byw, problemy te są ściśle związne. Dl przykłdu podmy model pewnej nturlnej sytucji. Przykłd. Rozwżmy punkt mterilny o msie m, którego ruch prostoliniowy sterowny jest poprzez siłę zewnętrzną u(t), któr zmieni się w czsie t 0 i przyjmuje wrtości w pewnym przedzile [u 0, u 1 ]. Jeśli ruch zczyn się o czsie t = 0 w punkcie A R z prędkością v 0, jego położenie określ liczb x(t) R, to zgodnie z prwem Newton, mx (t) = u(t). Złóżmy, że chcemy, poprzez przyłożenie odpowiedniej siły u, przeprowdzić obiekt z punktu A do punktu B (B > A). Określmy funkcjonł f, który prze (x, u) tkiej, że u : R [u 0, u 1 ], mx (t) = u(t), x(0) = A orz x(t ) = B dl pewnego czsu T > 0, przyporządkowuje włśnie ten czs T = T (x, u). Celem zdni jest minimlizcj czsu, tzn. tki dobór siły (czyli sterowni), żeby czs T był możliwie njmniejszy. Nleży terz wyrźnie opisć zleżność (x, u) T (x, u). Jest to zdnie trudne jeśli dopuszczlne sterownie są funkcjmi skomplikownymi. Rozwżmy njprostszy przypdek, w którym sterownimi są po prostu (funkcje) stłe z przedziłu [u 0, u 1 ]. Złóżmy, że u 1 > 0 ( 3 ). Wybierjąc u [u 0, u 1 ] ruch punkt odbyw się wzdłuż funkcji x : [0, T ] R będącej rozwiązniem równni x (t) = u m, przy czym x(0) = A orz x (0) = v 0. Ztem Stąd, poniewż x(t ) = B, Tk więc x(t) = A + v 0 t + 1 2m ut2. 1 2m T 2 + v 0 T + (A B) = 0. T (x, u) = T (u) = m( v0 2 + 4(B A) v 0 ). u Stąd, rozwiązniem podnego zdni jest u = u 1 (co zresztą jest zgodne z oczekiwnimi). 3 Złożenie to odpowid temu, że w ogóle możliwy jest ruch do przodu. 6
Rozwżony przykłd zwny jest zgdnieniem optymlno-czsowym. Z innymi przykłdmi tego rodzju zgdnień spotkmy się później. Z rozwżonym przykłdem wiąże się problem tzw. sterowlności. 4. Powyżej złożyliśmy, że u 1 > 0. Chodziło o to, by umożliwić ruch do przodu, tzn. spowodowć możność dotrci do punktu B strtując z punktu A < B. Możność tę, w ogólnym przypdku, nzyw się sterowlnością. Mówiąc niezbyt precyzyjnie (bowiem rozróżni się rozmite rodzje sterowlności) powidmy, że ukłd sterowni x = g(t, x, u), t [, b] jest sterowlny jeśli, dl dowolnych punktów A, B (z przestrzeni fzowej, tzn. przestrzeni, w której odbyw się ruch ) istnieje sterownie u U tkie, że u(t) M i równnie różniczkowe x (t) = g(t, x(t), u(t)) posid rozwiąznie spełnijące x() = A, x(b) = B. W problemch sterowlności nie pytmy o kryteri jkości, tzn. nie interesuje ns wrtość f(x, u). 5. Jednym z wżniejszych środków poszukiwni rozwiązń optymlnych zgdnień sformułownych wyżej stnowią tzw. wrunki konieczne. Mówiliśmy już o tym w kontekście twierdzeni Fermt. W zsdzie chodzi o to, żeby znleźć wrunki, które kżde rozwiąznie optymlne musi spełnić. Rozwiązni optymlnego nleży poszukiwć tylko pośród elementów dopuszczlnych je spełnijących. Może się to okzć nietrudnym problemem, bowiem często jedynie skończon ilość elementów spełni te wrunki. 6. W sytucjch brdziej skomplikownych, w celu znlezieni rozwiązni optymlnego wykorzystuje się tkże wrunki dostteczne, które z ntury są o wiele brdziej złożone. Pozwlją one n wyznczeni spośród rozwiązń spełnijących wrunki konieczne znleźć optymlne. Elementy Rchunku Wricyjnego Klsyczny rchunek wricyjny zjmuje się minimlizcją wyrżeń postci I(u) := L(t, u(t), u(t)) dt, gdzie L : [, b] R n R n R jest dną funkcją (o odpowiedniej regulrności gwrntującej poprwność wyrżeni I(u)), zś u przebieg pewien z wczsu określony zbiór Y funkcji typu [, b] R n. W istocie chodzi o znlezienie funkcji u 0 w zbiorze Y, dl której I przyjmuje wrtość minimlną. Chodzi tu zrówno o (ścisłe) minimum globlne (tzn. dl dowolnego u Y, u u 0, I(u 0 ) I(u) lub I(u 0 ) < I(u)) jk i o (ścisłe) minimum loklne (tzn. dl funkcji u Y, u u 0 dosttecznie bliskich u 0, I(u 0 ) I(u) lub I(u 0 ) < I(u)). Ogólnie mówiąc interesujące jest również poszukiwnie innych punktów krytycznych pojęcie to zostnie zdefiniowne później. Zbiór Y, o którym mow jest zbiorem funkcji dopuszczlnych, spośród których poszukuje się optimum u 0 ; n przykłd zbiór Y może skłdć się z funkcji głdkich (tzn. klsy 7
C 1 ), funkcji kwłkmi głdkich lub funkcji spełnijących określone wrunki brzegowe, tzn. tkich, że u() = A orz u(b) = B gdzie A, B są ustlonymi z wczsu punktmi w R n. Poniżej podmy kilk przykłdów typowych zgdnień wricyjnych. Przykłd. (i) Znleźć krzywą u : [, b] R 2 łączącą punkty A, B R 2 o njmniejszej długości. Widomo, że jeśli u : [, b] R 2 jest krzywą klsy C 1, u = (u 1, u 2 ) gdzie u i : [, b] R dl i = 1, 2, to jej długość wyrż się wzorem I(u) = u(t) dt gdzie x ozncz normę wektor x = (x 1, x 2 ) R 2, tzn. x = x 2 1 + x 2 2. Tk więc I(u) = u1 (t) 2 + u 2 (t) 2 dt. Postwione zdnie prowdzi do nstępującego zgdnieni wricyjnego I(u) = u(t) dt min. z ogrniczeniem: poszukujemy krzywej w zbiorze krzywych tkich, że u() = A orz u(b) = B. Oczywiście znmy odpowiedź: poszukiwn krzyw to odcinek linii prostej przechodzącej przez punkty A, B. (ii) Historycznie rzecz biorąc pierwszym problemem wricyjnym był tzw. problem brchistochrony postwiony przez J. Bernoulliego. Dw punkty (x 1, y 2 ), (x 2, y 2 ) R 2 tkie, że x 1 < x 2 orz y 1 > y 2 nleży połączyć krzywą u : [x 1, x 2 ] R, u(x i ) = y i dl i = 1, 2 tką, by punkt mterilny poruszjący się wzdłuż niej bez trci pod wpływem siły grwitcyjnej stoczył się w njkrótszym czsie. Problem ten zostł rozwiązny przez brci Bernoullich i Isc Newton. Zuwżmy, że n ogół postwiony problem wricyjny skłd się w istocie z dwóch zgdnień: po pierwsze nleży wyznczyć odpowiedni zbiór funkcji dopuszczlnych (często w rbitrlny sposób) i znleźć wyrżenie I(u) (np. posługując się wcześniejszą wiedzą lub określonym modelem, np. fizycznym), nstępnie nleży rozstrzygnąć zgdnienie minimlizcji. Przykłd. Przykłdowo zrelizujemy pierwszą część tk postwionego problemu w zdniu brchistochrony. Dl ustleni uwgi złóżmy, że y 1 = 0 i wybierzmy głdką funkcję u : [x 1, x 2 ] R tką, że u(x 1 ) = 0, u(x 2 ) = y 2. Podczs ruchu (strtującego w chwili t = 0) wzdłuż wykresu funkcji u punkt mterilny o msie m w chwili t 0 m prędkość v(t) (tzn. prędkość jest tu sklrem), pokonuje drogę s(t) orz, po pokonniu cłości drogi (o długości równej długości wykresu funkcji u), osiąg punkt (x 2, y 2 ) w chwili T. Ruch odbyw się więc w czsie [0, T ]. Jest jsne, że czs T zleży od wyboru funkcji u, tzn. T = T (u). Zdnie nsze to problem wricyjny postci T (u) min. 8
Energi E ruchu jest sumą energii kinetycznej i potencjlnej E = 1 2 mv(t)2 + mgy(t), gdzie y(t) jest rzędną położeni punktu w chwili t, zś g ozncz przyspieszenie ziemskie. Jk wynik z zsdy zchowni energii, E = const. Wynik stąd, że v(t) = 2gy(t). Niech x(t), t [0, T ], ozncz odcięt punktu położeni w chwili t. Jest jsne, że y(t) = u(x(t)) dl t [0, T ]. Pondto, niech t(x), x [x 1, x 2 ], ozncz czs potrzebny n znlezienie się punktu w położeniu (x, u(x)). Jest znowu oczywiste, że t(x(t)) = t dl t [0, T ] orz x(t(x)) = x dl x [x 1, x 2 ]; innymi słowy funkcje t(x) orz x(t) są wzjemnie odwrotne. Pondto T = x2 x 1 t (x) dx. Nleży ztem obliczyć t (x) dl dowolnego x [x 1, x 2 ]. Z twierdzeni o funkcji odwrotnej, dl dowolnego x [x 1, x 2 ], gdzie t 0 = t(x 0 ). Jest jsne, że dl kżdego t [0, T ], s(t) = t (x 0 ) = 1 x (t 0 ) x(t) x 1 1 + u(x) dx orz v(t) = ṡ(t); wobec tego, n mocy twierdzeni o różniczkowniu funkcji górnej grnicy cłkowni i twierdzeni o pochodnej funkcji złożonej orz mtemtycznej interpretcji pochodnej, v(t) = ṡ(t) = 1 + u(x(t)) 2 x (t). Ztem, dl kżdego x [x 1, x 2 ], t (x) = 1 + u(x) 2 2gu(x). W konsekwencji T (u) = T = x2 x 1 1 + u(t) 2 2gu(x) dx. Używjąc metod mtemtycznych (o których poniżej) dowodzi się, że funkcj u 0, dl której czs T (u 0 ) jest njmniejszy to cykloid o określonych prmetrch (zleżnych od x 1, x 2 orz y 2 ). Przytoczone rozumownie wskzuje, że podczs rozwiązywni zgdnień wricyjnych postci I(u) min 9
gdzie, tk jk wyżej, I(u) = L(t, u(t), u(t)) dt zsdnicze znczenie może mieć wyznczenie odpowiedniej funkcji L i, co z tym idzie, wyrżeni I(u). Jest to jednk n ogół problem innego typu i poniżej będziemy zwsze zkłdć, że znmy postć funkcji L. Wprowdźmy niezbędną terminologię: Niech (X, ) ozncz przestrzeń Bnch, M X; dowolną funkcję rzeczywistą I : M R nzywmy funkcjonłem. Zwykle, w prktyce, zbiór M jest pewną rozmitością znurzoną w X. W rozdzile tym będziemy mieć do czynieni z rozmitościmi liniowymi, tzn. M := y 0 +Y gdzie y 0 X jest ustlonym punktem, zś Y jest domkniętą podprzestrzenią liniową w X. O zbiorze M mówi się czsem, że jest zbiorem dopuszczlnych punktów (wektorów, funkcji itp) dl funkcjonłu I. Nleży zuwżyć, że przestrzeń X skłd się z punktów mjących konkretną nturę: mogą to być punkty przestrzeni euklidesowej, przestrzeni Hilbert, Bnch lub odpowiedniej przestrzeni funkcyjnej itp. W zleżności od ntury punktów, będziemy tk je nzywli. Niekiedy też rozwż się funkcjonły I : U R określone n pewnym otwrtym podzbiorze U M ( 4 ). Przykłd. Złóżmy n przykłd, że X := C 1 ([, b], R n ) jest przestrzenią funkcji głdkich [, b] R n. Przypomnijmy, że funkcj u = (u 1,..., u n ) : [, b] R n jest głdk jeśli, dl dowolnego i = 1, 2,..., n orz t [, b] istnieje u i (t) (dl t = lub t = b rozwżmy odpowiednie pochodne jednostronne u i+ () orz u i (b)) orz funkcj [, b] t u(t) := ( u 1 (t),..., u n (t)) R n jest ciągł. Oczywiście X jest przestrzenią liniową; jeśli dl u X położyć u = mx{ sup u(t), sup u(t) }, t [,b] t [,b] to łtwo sprwdzić, że jest normą; pondto norm t jest zupełn. Tk więc X jest przestrzenią Bnch. Niech u 0 X będzie dowolną (lecz ustloną) funkcją tką, że u 0 () = A, u 0 (b) = B, Y = {u X u() = 0 = u(b)} i niech M := u 0 + Y. Wtedy, jk łtwo sprwdzić, Y jest domkniętą podprzestrzenią w X orz M = {u X u() = A, u(b) = B}. Przykłdem funkcjonłu I : M R jest I(u) = L(t, u(t), u(t)) dt, u M 4 Przypomnijmy, ze zbiór U M jest otwrty jeśli, dl dowolnego x U, istnieje r > 0 tkie, że kul otwrt B(x, r) M M. 10
gdzie L : [, b] R n R n R jest ustloną funkcją ciągłą, tzw. lngrnginem ( 5 ). Zuwżmy, że funkcj podcłkow [, b] t L(t, u(t), u(t)) R jest, jko funkcj ciągł, cłkowln w sensie Riemnn; ztem wyrżenie I(u) jest określone poprwnie. Wrto w tym miejscu zuwżyć, że wyrżenie I(u) może mieć sens dl punktów z innej (obszerniejszej) przestrzeni Bnch lub zbioru większego niż wybrny zbiór M. Przykłd. W powyższym przykłdzie wyrżenie I(u) może mieć sens dl funkcji L spełnijących mniej restryktywne złożeni orz różnych od X = C 1 przestrzeni funkcyjnych. Jeśli, dl przykłdu, złożymy, że funkcj L spełni wrunki Crthéodory ego, tzn. jest ciągł ze względu n zmienne u, p orz mierzln ze względu n zmienną t, to dl bsolutnie ciągłej funkcji u : [, b] R n ( 6 ), funkcj [, b] t L(t, u(t), u(t)) jest cłkowln w sensie Lebesgue o ile m miejsce oszcownie L(t, u, p) (t) + b( u + p ) gdzie L 1 ([, b], R) i b 0 (jest to treścią tzw. twierdzeni Krsnosielskiego). T możność rozszerzeni zbioru rgumentów funkcjonłu I, jk się później okże, stnowi wżną okoliczność: pozwl on n odpowiednie powiększenie zbioru funkcji dopuszczlnych. Poszukując minimów głdkiej funkcji f : Ω R, gdzie Ω jest otwrtym podzbiorem R n wiemy, że jeśli f osiąg minimum (lub ogólniej ekstremum) loklne w punkcie x 0 Ω, to f (x 0 ) = 0. Powyżej chodzi o pochodną funkcji wielu zmiennych, tzn. dl x Ω, f (x) jest mcierzą [ 1,..., n ] o jednym wierszu i n kolumnch: i = x i f(x), i = 1,..., n. Dodtkowo widomo, że jeśli f jest dwukrotnie różniczkowln w punkcie x 0, to mcierz Hess (tzn. w istocie drug pochodn) f (x 0 ) funkcji f w punkcie x 0 jest nieujemnie określon: f (x 0 )(h, h) 0 dl dowolnego h R n. N odwrót, jeśli x 0 jest punktem krytycznym dl f, tzn. f (x 0 ) = 0, pochodn f (x 0 ) istnieje orz jest dodtnio określon, tzn. f (x 0 )(h, h) > 0 dl dowolnego h R n, h 0 ( 7 ), to w punkcie x 0 funkcj f przyjmuje minimum. 5 Zwykle zmienne funkcji L dzieli się n grupy i pisze się L(t, u, p), gdzie t [, b], u R n orz p R n. Dobre rozeznnie zmiennych jest istotne dl dlszego ciągu. 6 Mówimy, że funkcj u : [, b] R n jest bsolutnie ciągł jeżeli istnieje cłkowln (w sensie Lebesgue ) funkcj v (tj. v L 1 ([, b], R n )) tk, że u(t) = t v(z) dz. Widomo, że jeśli funkcj u jest bsolutnie ciągł, to jest różniczkowln prwie wszędzie orz u(t) = v(t) dl p.w. t [, b]. Piszemy wtedy u(t) := v(t) i nzywmy (uogólnioną) pochodną. 7 Dl funkcji wielu zmiennych tk rozumin dodtni określoność równowżn jest wrunkowi: f (x 0 )(h, h) c h 2 dl pewnego c > 0. 11
Podne dw fkty (pierwszy nzywny wrunkiem koniecznym istnieni ekstremum, zś drugi wrunkiem dosttecznym), wrz z twierdzeniem Sylvester pomgjącym sprwdzić dodtnią określoność mcierzy, są podstwowymi środkmi umożliwijącymi poszukiwnie ekstremów ( 8 ). W przypdku, gdy mmy do czynieni z funkcjonłem I : U R, gdzie U jest otwrtym podzbiorem rozmitości liniowej M, to również pojwi się potrzeb podobnych wrunków koniecznych i dosttecznych. N ten użytek rozwij się, w nlogii do funkcji wielu zmiennych, rchunek różniczkowy funkcjonłów określonych n (podzbiorch) przestrzeni Bnch. Jest to obszerny dził współczesnej mtemtyki: brk jest obecnie miejsc i czsu n jego rozwinięcie. Ogrniczymy się wobec tego do zdefiniowni jedynie kilku pojęć pomocniczych (i to w dość stroświecki sposób). Ustlmy x 0 U orz wektor h Y. Otwrtość zbioru U implikuje, że istnieje r > 0 tkie, że dl t ( r, r), x 0 + th U. Rozwżmy funkcję ϕ h : ( r, r) R dną wzorem ϕ h (t) := I(x 0 + th), t ( r, r). Przez wricję δi(x 0 ; h) funkcjonłu I w punkcie x 0 w kierunku h rozumiemy wyrżenie gdzie δi(x 0 ; h) := ϕ h(0), ϕ h(0) = d dt ϕ h(0) jest pochodną funkcji ϕ h w punkcie t = 0, o ile t pochodn istnieje, tzn. funkcj ϕ h jest różniczkowln w t = 0. Tk więc ϕ h (t) ϕ h (0) δi(x 0 ; h) = lim. t 0 h Dodtkowo powidmy, że funkcjonł I jest różniczkowlny w sensie Gteux w punkcie x 0 jeśli, dl dowolnego h Y, istnieje wricj δi(x 0 ; h) orz funkcjonł Y h δi(x 0 ; h) jest liniowy i ciągły ( 9 ). Funkcjonł ten ozncz się symbolem I (x 0 ) i nzyw pochodną Gteux w punkcie x 0. Funkcjonł I jest różniczkowlny w sensie Fréchet w punkcie x 0 jeśli jest tm różniczkowlny w sensie Gteux i I(x 0 + h) I(x 0 ) = I (x 0 )(h) + h ε(h) dl dowolnych h z pewnego otoczeni 0, gdzie ε(h) 0 gdy h 0 ( 10 ). Mówimy, że funkcjonł I osiąg w x 0 minimum (odp. mksimum) loklne jeśli istnieje liczb ε > 0 tk, że dl dowolnego x B(x 0, ε) M, I(x) I(x 0 ) (odp. I(x) I(x 0 )). 8 Jeśli f posid mximum w punkcie x 0, to również f (x 0 ) = 0; jeśli f (x 0 ) = 0 orz mcierz Hess f (x 0 ) jest ujemnie określon, to w punkcie x 0 funkcj przyjmuje mksimum. 9 Bez trudu widć, że jeśli δi(x 0 ; h) istnieje orz λ R, to istnieje δi(x 0 ; λh) = λδi(x 0 ; h). 10 N ogół istnienie wricji nie implikuje różniczkowlności w sensie Gteux; podobnie różniczkowlność w sensie Gteux nie implikuje różniczkowlności w sensie Fréchet. Co więcej istnienie wricji, ni nwet różniczkowlność w sensie Gteux nie implikuje ciągłości w punkcie x 0 ; m to miejsce w przypdku różniczkowlności w sensie Fréchet. 12
Mówimy o ekstremum (tzn. minimum lub mksimum) globlnym jeśli powyższe nierówności zchodzą dl dowolnych u U. Zuwżmy, że jeżeli I przyjmuje ekstremum loklne w punkcie x 0, to, dl dowolnego h Y, funkcj ϕ h (t) = I(x 0 + th) również osiąg ekstremum loklne (tego smego typu) w punkcie t = 0. Istotnie, jeśli mmy do czynieni np. z minimum, to dl h Y orz t 0 dosttecznie bliskich 0, mmy Fkt odwrotny może nie mieć miejsc. ϕ h (t) = I(x 0 + th) I(x 0 ) = ϕ h (0). Powidmy, że x 0 jest punktem krytycznym funkcjonłu I jeśli, dl dowolnego h Y, wricj δi(x 0 ; h) istnieje orz δi(x 0 ; h) = 0. Oczywiście, jeśli funkcjonł I jest różniczkowlny (w sensie Gteux lub Fréchet) w punkcie x 0, to punkt x 0 jest krytyczny wtedy i tylko wtedy, gdy I (x 0 ) = 0, tzn. I (x 0 )(h) = 0 dl wszystkich h Y. Przykłd. (i) Rozwżmy, tk jk poprzednio, funkcję f : Ω R, gdzie Ω jest zbiorem otwrtym w X = R n. Wtedy oczywiście Y = X. Jeśli h R n, to jk łtwo widć, wricj δf(x 0 ; h), o ile istnieje, jest niczym innym jk pochodną kierunkową funkcji f w punkcie x 0 w kierunku h, tzn.: δf(x 0 ; h) = f h(x f(x 0 + th) f(x 0 ) 0 ) = lim. t 0 t W szczególności, dl i-tego wersor osi h = e i, i = 1,..., n, mmy δf(x 0 ; e i ) = f e i (x 0 ) = x i f(x 0 ), tzn. wricją f w punkcie x 0 w kierunku i-tego wersor osi jest jej i-tą pochodną cząstkową. Funkcj f jest (jko funkcj wielu zmiennych) różniczkowln ( 11 ) wtedy i tylko wtedy, gdy jest on różniczkowln w sensie Fréchet orz, dl dowolnego h = (h 1,..., h n ) R n, δf(x 0 ; h) = f (x 0 )(h) = n i=1 x i f(x 0 )h i. W tkim rzie punkt x 0 jest krytyczny wtedy i tylko wtedy, gdy dl dowolnego i = 1,..., n, x i f(x 0 ) = 0. (ii) Przypuśćmy, że (X,, ) jest rzeczywistą przestrzenią Hilbert. Niech Y będzie domkniętą podprzestrzenią w X; ustlmy wektory y 0, y X i niech, dl x M := y 0 +Y, I(x) = 1 2 x 2 y, x = 1 x, x. 2 11 Przypomnijmy dodtkowo, że jeśli dl wszystkich x z otoczeni punktu x 0 istnieją wszystkie pochodne cząstkowe i są one funkcjmi ciągłymi w tym otoczeniu, to f jest różniczkowln w x 0. 13
Wówczs, dl dowolnych x M orz h Y mmy: δi(x; h) = x, h y, h. Istotnie niech ϕ h (t) = I(x + th) dl t R orz ustlonych x M i h Y. Ztem ϕ h (t) = 1 2 x, x + t x, h + 1 2 t2 h, h y, x t y, h. Z definicji δi(x; h) = ϕ h (0). Stąd wynik ntychmist żądn równość (zwróćmy uwgę, że zmienną dl ϕ h jest t: ztem wszystkie pozostłe wyrżeni są stłymi umożliwi to łtwe różniczkownie). Twierdzenie (wrunki konieczne istnieni ekstremów loklnych w klsycznym rchunku wricyjnym). Niech dny będzie funkcjonł I : U R określony n otwrtym podzbiorze rozmitości liniowej M zwrtej w przestrzeni Bnch X i x 0 U. Jeżeli I przyjmuje loklne ekstremum w punkcie x 0, to, dl dowolnego h Y tkiego, że istnieje wricj δi(x 0 ; h) mmy δi(x 0 ; h) = 0. W szczególności, jeżeli dl kżdego h Y, istnieje δi(x 0 ; h), to h Y δi(x 0 ; h) = 0 czyli, innymi słowy, x 0 jest punktem krytycznym funkcjonłu I. Jeśli dodtkowo funkcjonł I jest różniczkowlny w sensie Gteux, to I (x 0 ) = 0. Dowód. Dl h Y, połóżmy ϕ h (t) = I(x 0 + th). gdzie t przebieg pewien przedził ( r, r), r > 0. Niech h Y będzie wektorem tkim, że wricj δi(x 0 ; h) istnieje. Wówczs istnieje ϕ h (0) orz w funkcj ϕ h przyjmuje w 0 ekstremum loklne. Ztem δi(x 0 ; h) = ϕ h(0) = 0 n mocy zwykłego wrunku koniecznego. Równnie h Y δi(x; h) = 0, w którym szukną jest x U, nzywmy równniem Euler-Lgrnge dl funkcjonłu I. Rozwiązni tego równni, tzn. punkty krytyczne funkcjonłu I są podejrzne o to, że w nich przyjmowne jest ekstremum loklne. Omówimy po krótce wrunki dostteczne istnieni ekstremów. Jk wspomnieliśmy powyżej zgdnienie to jest proste dl funkcji f : Ω R gdzie Ω jest zbiorem otwrtym w R n. Wypowiedzine wrunki dostteczne związne są z pojęciem drugiej pochodnej funkcji wielu zmiennych. Jest ono niełtwe. W przypdku funkcjonłów określonych w przestrzenich Bnch jest ono jeszcze brdziej skomplikowne. Możn mówić o drugiej wricji, o drugiej pochodnej w sensie Gteux lub Fréchet. Ogrniczymy się tutj do nstępującego syntetycznego podejści: powiemy, że funkcjonł I : U R posid w punkcie x 0 U, gdzie U jest otwrtym podzbiorem rozmitości liniowej M = y 0 + Y w przestrzeni Bnch X, drugą wricję δ 2 I(x 0 ; ) jeśli istnieje 14
form (funkcjonł) liniow b : Y R orz form kwdrtow B : Y R tkie, że, dl h Y, jeśli x 0 + h U, to I(x 0 + h) = I(x 0 ) + b(h) + 1 2 B(h) = ε(h) h 2, gdzie tzw. reszt ε(h) 0 przy h 0 w Y, tzn. dl dowolnego α > 0, istnieje β > 0 tk, że ε(h) < η o ile h < β. Dl h Y, piszemy δ 2 I(x 0 ; h) = B(h). Zuwżmy, że istnienie drugiej wricji implikuje, że dl dowolnego h Y istnieje δ(x 0 ; h) i zleży w sposób liniowy od h Y : ϕ h (t) ϕ(0) I(x 0 + th) I(x 0 ) δi(x 0 ; h) = lim = lim t 0 t t 0 h = lim (b(h) + 12 ) tb(h) + ε(th) h 2 = b(h). t 0 Niestety istnienie drugiej wricji δ 2 I(x 0 ; ) nie gwrntuje ciągłości funkcjonłu I w punkcie x 0 ; ciągłość tm jest zpewnion jeśli formy b orz B są ciągłe. Podobnie istnienie drugiej wricji nie implikuje różniczkowlności funkcji ϕ (poz 0). Tk więc wrunek istnieni drugiej wricji jest brdzo słby. W prktyce drugiej wricji poszukuje się w nstępujący sposób. Przykłd. Niech X będzie przestrzenią Hilbert, y X i rozwżmy I(x) = 1 2 x 2 y, x dl x X. Wtedy, dl dowolnego h X, I(x + h) I(x) = 1 2 x + h, x + h + y, x + h 1 2 x, x y, x = x, h + 1 h, h + y, h. 2 Kłdąc B(h) = h 2, b(h) = x y, h mmy przedstwienie I(x h ) = b(h) + 1 2 B(h). Ztem δ 2 I(x; h) = h 2. Sztuk więc poleg n znlezieniu części liniowej b(h) i kwdrtowej B(h) przyrostu I(x + h) I(x) i sprwdzeniu, że gdy h 0. Wtedy δ 2 I(x; h) = B(h). I(x + h) I(x) b(h) 1 2 B(h) h 2 0 Widomo, że jeśli I posid pochodn Gteux I (x) w punktch z otoczeni U punktu x 0 orz pochodn t jest ciągł w x 0 ( 12 ), to drug wricj istnieje. 12 Tzn. dl dowolnego ε > 0 istnieje η > 0 tk, ze dl dowolnego h Y, o ile x x 0 < η. I (x) I (x 0 ) ε h 15
Twierdzenie (II wrunek konieczny istnieni ekstremum) Niech I będzie funkcjonłem tkim jk w poprzednim twierdzeniu. Jeśli w x 0 funkcjonł I osiąg minimum (odp. mksimum) orz istnieje drug wricj δ 2 I(x 0 ; ), to dl dowolnego h Y δ 2 I(x 0 ; h) 0 (odp. 0). Dowód. Dl ustleni uwgi przypuśćmy, że w punkcie x 0 mmy do czynieni z minimum loklnym funkcjonłu I. Istnienie drugiej wricji δ 2 I(x 0 ; h) ozncz, że dl dowolnego h Y, δi(x 0 ; h) = 0 orz mmy przedstwienie Ztem, dl dowolnych (młych) h Y 0 I(x 0 + h) I(x 0 ) = 1 2 δ2 I(x 0 ; h) + ε(h) h 2. δ 2 I(x 0 ; h) 2ε(h) h 2. Wynik stąd, że istotnie δ 2 I(x 0 ; h) 0. Twierdzenie (wrunek dostteczny istnieni ekstremów) Funkcjonł I osiąg minimum (odp. mksimum) włściwe w punkcie x 0 o ile spełnione są wrunki: (i) x 0 jest punktem krytycznym; (ii) istnieje drug wricj ( 13 ) δ 2 I(x 0 ; ) orz stł c > 0 tk, że h Y δ 2 I(x 0 ; h) c h 2 (odp. c h 2 ). Dowód. Zgodnie z definicją drugiej wricji i wrunku (i) wynik, że dl dowolnego h Y, jeśli x 0 + h U, to I(x 0 + h) I(x 0 ) = 1 2 δ2 I(x 0 ; h) + ε(h) h 2 1 2 h 2 (c + 2ε(h)). Poniewż ε(h) 0, gdy h 0 w T Y, to istnieje η > 0 tkie, że ε(h) < c 2 Ztem dl x B(x 0, η) M mmy (o ile h < η. I(x) I(x 0 ) = I(x 0 + (x x 0 )) 1 2 x x 0 2 (c + 2ε(x x 0 )) > 0. Stąd I(x) > I(x 0 ). Równnie Euler-Lgrnge w klsycznym rchunku wricyjnym Wróćmy obecnie do wyjściowego funkcjonłu I(u) = L(s, u(s), u (s)) ds 13 Z istnieni drugiej wricji wynik istnienie pierwszej wricji, w ten sposób wrunek (i) m sens. 16
zdnego n rozmitości liniowej M := {u C 1 ([, b], R n ) u() = A, u(b) = B} zwrtej w X = C 1 ([, b], R n ) i zbdjmy wrunki konieczne (i dostteczne) istnieni rozwiązń problemu { I(u) min; (KW ) u M. Złóżmy, że u 0 jest rozwiązniem tego zgdnieni, tzn. funkcjonł I osiąg w tym punkcie minimum (przynjmniej) loklne. Wiemy już, że jeżeli, dl pewnego h, istnieje wricj δi(u 0 ; h), to δi(u 0 ; h) = 0. Nleży ztem, przede wszystkim, sprwdzić przy jkich złożenich wricj w punkcie u 0 istnieje; nstępnie sprwdzić jk jest jej konkretn postć: pozwoli to ndć konkretny sens równniu Euler-Lgrnge. W poniższym rozumowniu będziemy wykonywli rchunki w przekonniu, że je wykonć możn, złożeni do tego niezbędne przedstwimy w twierdzeniu poniżej. Wricji poszukujemy zgodnie z omówionymi poprzednio zsdmi. Niech h Y = C 1 ([, b], R n ) u() = u(b) = 0}. Dl dowolnego t R Ztem ϕ h (t) = L(s, u 0 (s) + th(s), u 0(s)th (s)) ds. δi(u 0 ) = d dt ϕ h(t) t=0 Z twierdzeni o różniczkowniu cłek δi(u 0 ; h) = d L(s, U 0 (s) + th(s), u dt 0(s) + th (s)) ds = t=0 d dt [L(s, u 0(s) + th(s), u 0(s) + th (s))] ds = ( u L(s, u 0 (s), u 0(s)), h(s) + p L(s, u 0 (s), u 0(s)), h (s) ) ds. Prwą stronę tego wzoru możn zpisć w postci równowżnej: pierwszy skłdnik minowicie cłkujemy przez części [ h(s), s ] b u L(z, u 0 (z), u 0(z)) dz ( p L(s, u 0 (s), u 0(s)) s s u L(z, u 0 (z), u 0(z)) dz, h (s) ds + p L(s, u 0 (s), u 0(s)), h (s) ds = ) u L(z, u 0 (z), u 0(z)) dz, h (s) ds. Jeżeli u 0 jest minimum problemu (KW ), to δi(u 0 ; h) = 0 dl kżdego h Y. Z lemtu o nultorze (który sformułujemy i udowodnimy z chwilę) wynik, że jeżeli h Y w(s), h (s) ds = 0, 17
to w jest funkcją stłą. W szczególności otrzymujemy, że funkcj [, b] s p L(s, u 0 (s), u 0(s)) s u L(z, u 0 (z), u 0(z)) dz jest stł. Stąd wnosimy, że funkcj s p (s, u 0 (s), u 0(s)) jest klsy C 1 ( 14 ) orz d ds pl(s, u 0 (s), u 0(s)) u L(s, u 0 (s), u 0(s)) = 0. (E L) Równnie (E L) nzywmy równniem Euler-Lgrnge e dl klsycznego problemu wricyjnego (KW ). Równnie to jest równniem różniczkowym, które musi spełnić funkcj u 0 będąc optimum dl problemu (KW ). Udowodniliśmy ztem nstępujące ; Twierdzenie. Złóżmy, że L jest funkcją klsy C 1. Jeśli u 0 C 1 ([, b], R n ) jest optimum dl problemu (KW ), to u 0 spełni równnie różniczkowe d ds pl(s, u 0 (s), u 0(s)) = u L(s, u 0 (s), u 0(s)). Dodtkowo u 0 spełni nstępujący wrunek regulrności; funkcj s p L(s, u 0 (s), u 0(s)) jest klsy C 1. Osttni część jest podstwą do tzw. rozwżń o regulrności. W tym kierunku idzie np. nstępujący wniosek. Wniosek Przy złożenich z poprzedniego twierdzeni, złóżmy dodtkowo, że p L jest klsy C 1 orz, dl dowolnego t [, b], hesjn det L pi p j (t, u 0 (t), u 0(t)) 0. Wówczs u 0 jest klsy C 2. Dowód. Zdefiniujmy ψ : [, b] R n R n R n R n wzorem ψ(t, u, p, q) = p L(t, u, p) q. Złożenie o hesjnie orz osttni uwg z Twierdzeni powyższego pozwl n użycie twierdzeni o funkcji uwikłnej: równnie ψ(t, u, p, q) = 0 może być jednozncznie rozwiązne względem zmiennej p w otoczeniu punktów u = u 0 (t 0 ), p 0 = u 0(t 0 ), q 0 = L(t 0, u 0, p 0 ) dl dowolnego t 0 [, b]. Ustlmy t 0 [, b]. Istnieje więc otoczenie U punktu (t 0, u 0, q 0 ) orz funkcj g : U R n klsy C 1 tk, że ψ(t, u, g(t, u, q), q) = 0 dl (t, u, q) U. Wiemy, że rozwiązniem równni ψ = 0 jest funkcj t (t, u 0 (t), p L(t, u 0 (t), u 0(t))), to z jednoznczności istnieni g, mmy, że dl dowolnego t w pobliżu t 0 u 0(t) = g(t, u(t), p L(t, u 0 (t), u 0(t))). 14 Zuwżmy jednk, że pochodnej d ds p(s, u 0 (s), u 0(s)) nie możn policzyć korzystjąc z reguły łńcuch. 18
Poniewż g jest klsy c 1, to u 0 jest klsy C 1 ; stąd wynik tez. Uwg. W poprzednich twierdzeń zkłdliśmy, że funkcjonł I m optimum u 0 C 1 ([, b], R n ). W tej sytucji u 0 musi spełnić równnie (E L). Może się jednk okzć, że funkcjonł I nie m optimów tej klsy głdkości mimo, że funkcj Lgrnge jest brdzo regulrn. Argumenty potrzebne do wyprowdzeni równni (E L) wymgły: by funkcj u 0 był bsolutnie ciągł, zś lngrngin L był klsy C 1 względem u, p i ciągły względem t. Wówczs okzuje się, że funkcj s p L(s, u 0 (s), u 0(s)) jest bsolutnie ciągł i równnie (E L) zchodzi prwie wszędzie. Jednk przy złożeniu, że hesjn det L pp jest niezdegenerowny możn poprwić głdkość u 0 podobnie jk we wniosku. [ptrz J. Jost: Theorem 1.2.3] Drug wricj; pol Jcobiego Niech jk poprzednio, dl u C 1 ([, b], R n ), I(u) = L(t, u(t), u (t) dt. Złóżmy terz, że L C 2. Dl dowolnego u M i h Y, I(u + h) I(u) = [L(t, u(t) + h(t), u (t) + h (t)) l(t, u(t), u (t))] dt. Dl uproszczeni zpisu opuszczmy zmienną t (tzn. piszemy u, u, h, h w miejsce u(t), u (t), h(t) i h (t)). Skorzystmy z twierdzeni Tylor w postci Peno dl funkcji L: dl dowolnego t [, b], L(t, u + h, u + h ) L(t, u, u ) = ( u L(t, u, u ), h + p L(t, u, u ), h ) = 1 2 ( 2 uul(t, u, u )h, h + 2 2 upl(t, u, u )h, h + 2 ppl(t, u, u )h, h ) + gdzie η(t, h, h ) 0 jeśli h 0 w Y. Ztem gdzie orz B(h) = b(h) = I(u h ) I(u) = b(h) + 1 B(h) + r(h), 2 η(t, h, h )( h, h + h, h ), ( u L(t, u, u ), h + p L(t, u, u ), h ) dt; ( 2 uul(t, u, u )h, h + 2 2 upl(t, u, u )h, h + 2 ppl(t, u, u )h, h ) dt r(h) = η(t, h, h )( h, h + h, h ) dt. 19
Zuwżmy, że r(h) = ( η(t, h, h )( h, h + h, h ) dt gdzie, przypomnijmy h = sup t [,b] mx{ h(t), h (t) }. Czynnik η(t, h, h ) dt ) η(t, h, h ) dt h 2 jest dowolnie mły jeżeli tylko wyrżeni h = h(t), h = h(t) są dosttecznie młe. W tkim rzie widzimy, że nsz funkcjonł, dl dowolnego u, posid drugą wricję δ 2 I(u; ) orz, dl dowolnego h Y, δ 2 (u; h) = B(h) = ( 2 uul(t, u, u )h, h + 2 2 upl(t, u, u )h, h + 2 ppl(t, u, u )h, h ) dt. Wyrżeniu temu ndmy wygodniejszą formę. Minowicie cłkując przez części i biorąc pod uwgę, że h() = 0 = h(b). d 2 up(t, 2 u, u )h, h dt = dt upl(t, u, u )h, h dt. Tk więc gdzie δ 2 I(u; h) = Q(t, u, u ) = 1 2 ( Q(t, u, u )h, h + P (t, u, u )h, h ) dt, ( uu L(t, u, u ) d ) dt upl(t, u, u ), P (t, u, u ) = 1 2 pp(t, u, u ). Złóżmy, że u jest optimum dl problemu (KW ) i rozwżymy funkcjonł J(h) = K(t, h(t), h (t)) dt, h Y gdzie K : [, b] R n R n R dne jest wzorem K(t, z, y) = Q(t, u(t), u (t))z, z + P (t, u(t), u (t))y, y, z, y R n. Tk więc J(h) = δ 2 (u; h). Dl funkcjonłu J rozwżmy problem stowrzyszony { J(h) inf h Y. (S) Oczywiście wiemy, że skoro u jest optimum dl (KW ), to J(h) 0 dl dowolnego h Y i oczywistym rozwiązniem powyższego problemu (S) jest funkcj h 0 n [, b]. Zbdmy czy istnieją jeszcze inne optim dl (S). Funkcj K jest oczywiście ciągł względem t i klsy C względem z, y. Wobec tego 20
zkłdjąc, że funkcj h Y jest optimum dl problemu (S) musi spełnić równnie Euler-Lgrnge dl tego problemu. Równnie to m postć: d dt yk(t, h(t), h (t)) = z (t, h(t), h (t)). Podstwijąc konkretne wrtości do funkcji K otrzymmy (w języku funkcji L), że d dt (P (t, u(t), u (t))h (t) = Q(t, u(t), u (t))h(t). Jest to równnie, które musi spełnić kżde optimum problemu (S). Równnie to nzyw się równniem Jcobiego kżde rozwiąznie klsy tego równni C 2 jest nzywne polem Jcobiego. Twierdzenie (wrunki Legendre ) Przy powyzszych złożenich, jeśli u 0 C jest optimum dl problemu (KW ), to dl dowolnego ξ = (ξ 1,..., ξ n ) R N. P (t, u 0 (t), u 0(t))ξ, ξ 0 Dowód. Przypuśćmy, że t 0 (, b). Niech 0 < ε min{t 0, b t 0 } i, dl dnego ξ R N, zdefiniujmy funkcję η Y wzorem 0 gdy t t 0 ε, t 0 + ε t b η(t) = εξ gdy t = t 0 liner gdy t 0 ε t t 0, t 0 t t 0 + ε. Wtedy Wówczs 0 gdy t t 0 ε, t 0 + ε t b η (t) = ξ gdy t 0 ε < t < t 0 ξ gdy t 0 < t < t 0 + ε. 0 δ 2 I(u 0 ; η) = t0 +ε t 0 ε P (t, u 0 (t), u 0(t))ξ, ξ dt + O(ε 2 ) dl ε 0 poniewż wszystkie inne skłdniki zwierją czynnik ε i cłkujemy po przedzile długości 2ε. Ztem P (t 0, u 0 (t 0 ), u 1 0(t 0 ))ξ, ξ = lim ε 0 2ε t0 +ε t 0 ε N zkończenie udowodnimy jeszcze lemt o nultorze: P (t, u 0 (t), u 0(t))ξ, ξ dt 0. Lemt. Jeśli dl dowolnego h Y i funkcji cigłej w : [, b] R N zchodzi to w(t) = const. w(t), h (t) dt = 0, 21
Dowód. Połóżmy orz niech c := 1 b h(t) := t w(t) dt (w(s) c) ds. Wtedy h() = 0 orz h(b) = h (t) dt = 0. Ztem h Y. My równiez 0 = w(t), h (t) dt = Stąd w(t) = c dl dowolnego t [, b]. w(t) c, w(t) dt = w(t) c 2 dt. Progrmownie wypukłe; twierdzenie Kuhn-Tucker Nim przystąpimy do dokłdniejszej nlizy zdń progrmowni wypukłego przypomnimy podstwowe definicje i fkty dotyczące funkcji wypukłych. Kilk informcji o funkcjch wypukłych Niech X będzie przestrzenią liniową. Rozwżmy funkcję g : X R {± }. Efektywną dziedziną funkcji g nzywmy zbiór Dom(g) := {x X g(x) < + }. Rozwżć będziemy tylko tkie funkcje g, które nie są tożsmościowo równe + ; tzn. zwsze zkłdmy, że Dom(g). Mówimy, że funkcj g jest włściw jeśli g(x) > dl wszystkich x X. Ndwykresem funkcji g nzywmy zbiór Epi (g) := {(x, r) X R f(x) r}. Zuwżmy, że jeśli (x, r) Epi (g) dl pewnego r R, to x Dom(g). Mówimy, że funkcj g : X R jest wypukł jeśli Epi (g) jest zbiorem wypukłym. Nietrudno sprwdzić, że jeśli g jest funkcją wypukłą, to Dom(g) jest zbiorem wypukłym. Przykłdem niewłściwej funkcji wypukłej jest np. funkcj g : R R {± } zdn wzorem gdy x < 0 g(x) = 0 gdy x = 0 + gdy x > 0. Przykłdy włściwych funkcji wypukłych łtwo sobie wyobrzić. Uwg. Przypuśćmy, że A X i g : A R {± }. W tej sytucji również powiemy, że g jest wypukł, gdy Epi (g) jest zbiorem wypukłym. Niech g : X R {± } zdn będzie wzorem { g(x) gdy x Dom(g) g(x) = + gdy x Dom(g). 22
Jest rczej jsne, że wówczs g jest wypukł wtedy i tylko wtedy, gdy wypukł jest funkcj g. Z uwgi tej wynik, że mówiąc o funkcjch wypukłych wystrczy rozwżć funkcje zdne n cłej przestrzeni. Lemt 1. Funkcj g : X R {± } jest wypukł wtedy i tylko wtedy, gdy dl dowolnego λ (0, 1) i punktów x 0, x 1 Dom(g) zchodzi nierówność g((1 λ)x 0 + λx 1 ) (1 λ)g(x 0 ) + λg(x 1 ). Dowód. (Konieczność) Niech Epi (g) będzie zbiorem wypukłym. Weźmy punkty x 0, x 1 Dom(g); ztem g(x 0 ), g(x 1 ) < +. Jeśli g(x 0 ) = (podobnie jeśli g(x 1 ) = ), to po prwej stronie mmy. Nleży terz pokzć, że i po lewej stronie jest bez względu n λ (0, 1). Przypuśćmy, że tk nie jest, tzn. znjdzie się λ (0, 1) tkie, że r λ = g((1 λ)x 0 + λx 1 ) >. Niech r 1 g(x 1 ). Tk liczb r 1 R zwsze istnieje bo g(x 1 ) < +. Łtwo dostrzec, że istnieje r 0 R tkie, że (1 λ)r 0 + λr 1 < r λ. Punkty (x 0, r 0 ), (x 1, r 1 ) Epi (g) bo r 0 > g(x 0 ) orz r 1 g(x 1 ). Ztem, z wypukłości ndwykresu, ((1 λ)x 0 +λx 0, (1 λ)r 0 +λr 1 ) Epi (g). Tk więc r λ = g((1 λ)x 0 +λx 1 ) (1 λ)r 0 +λr 1 : sprzeczność. Pozostł przypdek, gdy g(x 0 ), g(x 1 ) R. Łtwe sprwdzenie pozostwi się czytelnikowi. (Dostteczność) N odwrót: wybierzmy punkty (x 0, r 0 ), (x 1, r 1 ) Epi (g), tzn. g(x 0 ) r 0 orz g(x 1 ) r 1. Jest jsne, że wtedy x 0, x 1 Dom(g), tzn. g(x 0 ), g(x 1 ) < +. Weźmy λ (0, 1) i rozwżmy punkt ((1 λ)x 0 + λx 1, (1 λ)r 0 + λr 1 ). Z wypukłości Dom(g) wynik, że (1 λ)x 0 + λx 1 Dom(g). Zgodnie z złożoną nierównością, f((1 λ)x 0 + λx 1 ) (1 λ)g(x 0 ) + λg(x 1 ) (1 λ)r 0 + λr 1. Ozncz, to że ((1 λ)x 0 + λx 1, (1 λ)r 0 + λr 1 ) Epi (g). Tk więc zbiór ten jest wypukły. Uwg. (i) Czytelnik zechce udowodnić, że jeśli g : X R {± } jest funkcją wypukłą wtedy i tylko wtedy, gdy dl dowolnych x 1,..., x m Dom(g), ( m ) m g λ i x i λ + ig(x i ) i=1 o ile λ i 0 dl wszystkich i = 1,..., m orz m i=1 λ i = 1. Jest to tzw. nierówność Jensen. (ii) Złóżmy, że X jest przestrzenią unormowną (np. X = R N ) niech g : X R {± } będzie funkcją wypukłą tką, że wnętrze int Dom(g) dziedziny efektywnej jest niepuste. Przypuśćmy, że g nie jest funkcj włściwą, tzn. istnieje punkt x 0 Dom(g) tki, że g(x 0 ) =. Możn łtwo udowodnić, że dl dowolnego x int Dom(g), g(x) =. Ztem jeśli w pewnym punkcie z int Dom(g) przyjęt jest wrtość >, to g jest funkcją włściwą (nie przyjmuje wrtości ). Jeszcze inczej: jeżeli dl pewnego x X, g(xz) =, to wrtość skończon może być przyjęt tylko n brzegu Dom(g). Wymienimy terz bez dowodu kilk podstwowych włsności funkcji wypukłych: Włsności. (i) Jeśli g i : X R {± }, i I, są funkcjmi wypukłymi, to g := sup i I g i jest funkcją wypukłą. (ii) Jeśli g 1, g 2 : X R {± } są funkcjmi wypukłymi tkimi, że dl żdnego 23 i=1
x X, g 1 (x) = orz g 2 (x) = + (lub n odwrót) ( 15 ), to funkcj αg 1 + βg 2 jest wypukł o ile α, β 0. Łtwy dowód pozostwi się czytelnikowi jko ćwiczenie. Kryteri wypukłości. (i) Funkcj g : X R {± } jest wypukł wtedy i tylko wtedy, gdy dl dowolnych x Dom(g) orz v X funkcj ϕ : R R {± } dn wzorem ϕ(t) = g(x + tv) dl t R jest wypukł. (ii) Niech X będzie przestrzenią unormowną, A zbiorem wypukłym i otwrtym orz g : A R funkcją różniczkowlną. Wówczs nstępujące wrunki są równowżne: (1) g jest funkcją wypukłą; (2) dl dowolnych x 1, x 2 A, f(x 2 ) f(x 1 ) + g (x 1 ), x 2 x 1 ; (3) dl dowolnych x A orz v X, funkcj t g (x + tv), v R określon, dl t R bliskich 0, jest niemlejąc. (4) (przy dodtkowym złożeniu, że g jest dwukrotnie różniczkowln w A) dl dowolnego x, drug pochodn jest nieujemnie określoną form dwuliniową ciągłą ( 16 ). Nietrudny (klsyczny) dowód pozostwi się czytelnikowi Brdzo wżne jest zgdnienie ciągłości funkcji wypukłych. Niech, jk wyżej X będzie przestrzenią unormowną (np. X = R N ), zś g : X R {± } funkcją wypukłą. Twierdzenie 1. Niech x 0 Dom(g). Równowżne są wrunki: (i) g jest ogrniczon z góry w pewnym otoczeniu punktu x 0 (wtedy x 0, wrz z pewnym otoczeniem, zwier się w Dom(g); tzn. x 0 int Dom(g)); (ii) g spełni loklnie wrunek Lipschitz w int Dom(g) (i jest tm loklnie ogrniczon). Pondto istnieje α 0 tkie, że dl dowolnych x, x W, g(x) g(x ) α x x. Co więcej, w tym wypdku funkcj g nie przyjmuje wrtości, tk więc g jest funkcj włściwą. Dowód. Dowód równowżności wrunków (i) orz (ii) jest nietrudny lecz dość technicznie złożony i dltego go opuszczmy (zlec się czytelnikowi przeprowdzenie tego rozumowni). Uzsdnimy tylko osttnią uwgę. N pewnej kuli otwrtej B = B(x 0, r) X funkcj g jest ogrniczon; ztem B Dom(g). Przypuśćmy, że dl pewnego x X, g(x) =. Wtedy oczywiście x Dom(g). Ztem, dl dowolnego λ (0, 1), (1 λ)x+λx 0 Dom(g). Jk to już ustliliśmy w dowodzie lemtu 1, g((1 λ)x + λx 0 ) = dl wszystkich λ (0, 1). Jest to sprzeczne bowiem dl λ bliskich 1, punkt (1 λ)x + λx 0 B tm funkcj g jest ogrniczon.. Wrto jeszcze odnotowć pewien wniosek. Wniosek. Jeśli X = R N i wnętrze W = int Dom(g) efektywnej dziedziny funkcji wypukłej g : A R {± } jest niepuste orz istnieje x 0 W tki, że g(x 0 ) >, to g jest loklnie lipschitzowsk n zbiorze W i nie przyjmuje wrtości. Pondto, podobnie 15 Tk będzie, w szczególności, gdy g 1, g 2 są funkcjmi włściwymi. 16 Czytelnik znjący jedynie rchunek różniczkowy funkcji wielu zmiennych powinien myśleć, że X = R N. 24