89 Wykład VIII (22XI2012) Zbioryifunkcje wypukłe
90 Definicja i przykłady zbiorów wypukłych Jeślix,y V sądwomapunktamiprzestrzeniwektorowej,tozbiór [x,y]={tx+(1 t)y t [0,1]}nazywamyodcinkiemłączącym punkty x, y. Punkty tego odcinka, które mają przedstawienie w postacitx+(1 t)ydla0<t<1nazywamyjegopunktami wewnętrznymi, a punkty x, y jego krańcami lub punktami brzegowymi. Definicja 14 Zbiór K zawarty w przestrzeni wektorowej V nazywamy zbiorem wypukłym, jeśli wraz z każdymi dwoma punktamix,y Kłączącyjeodcinek[x,y]jesttakżezawartyw K. Zbiór C zawarty w przestrzeni wektorowej V nazywamy stożkiem, jeśliwrazzkażdympunktemx Czawieraotwartąpółprostą {t x t R,t>0}przechodzącaprzezx. Lemat 3 Każda podprzestrzeń wektorowa W V jest zbiorem wypukłym i stożkiem. Każda podprzestrzeń afiniczna postaci a+w={v V v=a+w,w W,W podprzestrzeńwektorowa} jestzbioremwypukłym,alejeststożkiemtylkowtedy,gdya W. Przypomnijmy, że odcinkami niewłaściwymi w R nazywane są półproste i cała prosta R. Lemat4 K Rjestwypukływtedyitylkowtedy,gdyjest odcinkiem, być może niewłaściwym. Lemat5 NiechH={x R n a x=α}będziehiperpłaszczyzną w R n iniechh + ={x R n a x α}, H ={x R n a x α}będąpółprzestrzeniamidomkniętymi, naktórehdzieliprzestrzeń R n.każdyzezbiorówh,h +,H jestzbioremwypukłymwr n.
Przykłady zbiorów wypukłych w przestrzeni kartezjańskiej a)niechl={x R n x=x 0 +tv, t R}będzieprostą przechodzącąprzezx 0 zkierunkiemv 0.KażdypodzbiórL postaci{x L x=x 0 +tv,t [a,b] R}jestzbiorem wypukłym(odcinkiem prostej L). b) ={(x 1,x 2 ) R 2 0 x 1 1,0 x 2 1,x 1 +x 2 1} jestzbioremwypukłymwr 2. c) Zbiór n ={(x 1,x 2,...,x n ) R n 0 x j 1,j= 1,...,n, x j 1}nazywanysympleksemjednostkowymwR n jest wypukły. d) JeśliK R n jestwypukły,at: R n R m jestliniowe,to T(K) R m jestwypukły. e)jeśliτ: R n R n jestprzesunięciemowektorv R n ik R n jestwypukły,toτ(k)=k+vjestwypukły. f) WypukłewielokątyforemnewR 2. Napłaszczyźnieeuklidesowej R 2 dlakażdegon 3istnieje wypukły wielokąt foremny o n bokach. 91 Wypukłen-kątyforemnedlan=5,7,9,17. g) KulajednostkowawR n względemnormyeuklidesowej K n ={(x 1,x 2,...,x n ) R n wypukłym. x 2 j 1}jestzbiorem
92 Bryły platońskie są jedynymi foremnymi wielościanami wypukłymiwr 3 ForemnewielościanywypukłewR 3 Bryłyplatońskie Podstawowe własności brył platońskich Nazwa Ściany 2- krotne Osie symetrii obrotowej 3- krotne 4- krotne Czworościan 4 6 4(trójkąt) 3 4 Sześcian 8 12 6 (kwadrat) 6 4 3 Ośmiościan 6 12 8(trójkąt) 6 4 3 Wierzchołki Krawędzie Dwunastościan Dwudziestościan 20 30 12(pięciokąt) 15 10 6 12 30 20 (trójkąt) 15 10 6 5- krotne
Wypukłość w zastosowaniach ekonomicznych Podamy przykład wskazujący na to, że zbiory wypukłe pewnego typuwprzestrzenikartezjańskiej R n powstająwnaturalnysposób przy rozważaniu zagadnień ekonomicznych. Przykład 5 Fabryka tekstylna ma wyprodukować w ustalonym czasie trzy rodzaje tkaniny, mając do dyspozycji trzy gatunki wełny, które wykorzystywane są w metrze bieżącym produkowanych tkanin zgodnie z następującą tabelą: tkanina1 tkanina2 tkanina3 wełna A 0, 375 0, 500 0, 500 wełna B 0, 125 0, 0500 0, 200 wełna C 0, 100 0, 200 0, 150 Zapasy wełny wynoszą odpowiednio 4000, 800, 1500 kg. Sprzedaż produkcjiprzynosizysk,odpowiednio2,6,4i3,6kredytkizametr bieżący tkanin. Maszyny tkackie mają wydajność, niezależnie od gatunku tkaniny produkowanej, 10 m na godzinę pracy i moga być wykorzystywane przez nie więcej niż 800 godz. Należy zaplanować produkcję przynoszącą jak największy dochód. Niechx 1,x 2,x 3 będąnieznanymiwielkościamiprodukcji. Ograniczenia na produkcję mają postać nierówności bilansowych wełnaa 0,375x 1 +0,500x 2 +0,500x 3 4000 (87) wełnab 0,125x 1 +0,0500x 2 +0,200x 3 800 (88) wełnac 0,100x 1 +0,200x 2 +0,150x 3 1500 (89) a ponadto mamy do uwzględnienia ograniczenie na maksymalny okres pracy maszyn, x 1 +x 2 +x 3 8000 i oczywiście nierówności wyrażające nieujemność produkcji, x 1 0,x 2 0,x 3 0. 93
94 Zbiórpunktów(x 1,x 2,x 3 )wyrażającymożliweprzytych ograniczeniachplanyprodukcjijestwypukłymwielościanemwr 3 nazywa się go zbiorem punktów dopuszczalnych. Przyjmując, że celem działalności jest maksymalizacja funkcji dochodu w zadanych warunkach, tj. wyznaczenie maksimum funkcji x(x 1,x 2,x 3 )=2,6x 1 +4x 2 +3,6x 3 w zbiorze punktów dopuszczalnych, widzimy, że rozważany problem należy do kategorii zagadnień programowania liniowego wyznaczenia maksimum funkcji liniowej na zbiorze wypukłym. W tym przykładzie w naturalny sposób pojawia się często występujący, nie tylko w zastosowaniach, sposób określania zbioru wypukłego. Można je sprowadzić do następującego schematu. Dane sąmacierza=[a ij ]rozmiarum niwektor b=[b 1,...,b m ] t R m.zapomocątychdanychwyznaczonyjest podzbiórprzestrzeni R n,zwanyzbiorempunktówdopuszczalnych, D=D(A,b)={x R n Ax b,x 0}, (90) przy czym nierówności dla wektorów interpretujemy po współrzędnych, tj. przyjmujemy dlau,v R k u v i {1,...,k} u i v i. W tych oznaczeniach na podstawie bezpośrednio następującego Stwierdzenia 9 i wypukłości półprzestrzeni(lemat 5) otrzymujemy Wniosek7 DladowolnejmacierzyA=[a ij ]rozmiarum ni wektorab=[b 1,...,b m ] t R m zbiórd(a,b)określony warunkami(90) jest wypukły(jednakże w pewnych przypadkach zbiór ten może okazać się pusty).
Stwierdzenie9 Dladowolnejrodziny{K j } j J zbiorów wypukłychwv przecięcie K j jestzbioremwypukłym. j J W szczególności, dla dowolnego zbioru F V najmniejszy zbiór wypukły zawierający zbiór F jest przecięciem wszystkich zbiorów wypukłych zawierających F. Nazywamy go powłoką wypukłą zbiorufioznaczamyconvf. Definicja15 Jeśli{v 1,...,v p } V,aλ 1,...,λ p Rsą nieujemne i spełniają p λ j =1,towektorv= p λ j v j nazywamykombinacjąwypukłąwektorów{v 1,...,v p }o współczynnikach{λ 1,...,λ p }. Kombinacjewypukłedwóchpunktówv 1,v 2 możnazapisaćw postaci λ 1 v 1 +λ 2 v 2 =λ 1 v 1 +(1 λ 1 )v 2, przyczymλ 1 [0,1],awięckombinacjamiwypukłymitych punktówsąwszystkiepunktyodcinkałączącegov 1 zv 2 itylko one. Warto samemu rozważyć przykład trzech punktów płaszczyzny R 2 iwyjaśnić,jakieznaczeniemawtymprzypadku pojęcie kombinacji wypukłych. Konstrukcję kombinacji wypukłej można porównać do znanej z geometrii i fizyki procedury wyznaczania środka masy(ciężkości) układucząstekomasach{m 1,...,m p }rozmieszczonychw punktach{x 1,...,x p }przestrzeni.rzeczywiście,środkiemmasy takiego układu jest punkt X= p i=1 m i M xi, gdziem= p i=1 m i, któryjestkombinacjąwypukłąowspółczynnikachλ i =m i /M punktów{x 1,...,x p }. 95
96 Lemat6 ZbiórwypukłyK V zawierakażdąkombinację wypukłą p λ j v j punktów{v 1,...,v p }doniegonależących. Nieskomplikowany dowód tego faktu oparty na indukcji względem liczbypunktów{v 1,...,v p },zktórychtworzysiękombinację wypukłą,zilustrujemynaprzypadkutrzechpunktów{v 1,v 2,v 3 }. Kombinację wypukłą postaci 3 λ 1 v 1 +λ 2 v 2 +λ 3 v 3 =(λ 1 +λ 2 ) λ j v j przedstawimywnastępującej ( λ1 λ 1 +λ 2 v 1 + λ 2 λ 1 +λ 2 v 2 ) +λ 3 v 3 Punktv 0 = λ 1 λ 1 +λ 2 v 1 + λ 2 λ 1 +λ 2 v 2 jestelementemodcinkałączącego punktyv 1,v 2 zezbioruk,więcnależydotegozbiorunamocy wypukłościk.oznaczmyλ 0 =λ 1 +λ 2 izauważmy,że0 λ 0 1 orazλ 0 +λ 3 =1.Azatemotrzymujemy,równieżnamocy wypukłościzbioruk,żeλ 1 v 1 +λ 2 v 2 +λ 3 v 3 =λ 0 v 0 +λ 3 v 3 K, co potrzebowaliśmy wykazać. Stwierdzenie 10 Powłoka wypukła zbioru F V jest zbiorem kombinacjiwypukłychciągówskończonych{v 1,...,v p }o dowolnej liczbie elementów ze zbioru F. Szczególne miejsce w teorii zbiorów wypukłych zajmują wielościany wypukłe, określone w następujący sposób. Definicja 16 Powłoka wypukła skończonego podzbioru F V zawartego w skończenie wymiarowej rzeczywistej przestrzeni wektorowej V nazywa się wielościanem wypukłym.
97 Ważnym wynikiem dotyczącym powłoki wypukłej podzbiorów przestrzeni kartezjańskiej jest następujące klasyczne twierdzenie. Twierdzenie 22(Twierdzenie C. Carathéodory ego) Jeśli F R n,todowolnypunktx convfmożnazapisaćjako kombinacjęwypukłąconajwyżejn+1elementówzf. Definicja 17 Punkt x należący do zbioru wypukłego K nazywa się punktem ekstremalnym lub wierzchołkiem tego zbioru, jeśli nie jest punktem wewnętrznym żadnego odcinka całkowicie zawartego wk. Inaczej mówiąc, punkt x K jest punktem ektremalnym zbioru K, jeśli nie jest możliwe przedstawienie go w postaci x=αx 1 +(1 α)x 2,gdziex 1 x 2,x 1,x 2 Ki0<α<1. Definicję tę można też sformułować w następujący równoważny sposób: Lemat7 JeśliK V jestzbioremwypukłym,tox Kjest punktemekstremalnymkwtedyitylkowtedy,gdy K\{x}jest zbiorem wypukłym. Innym charakterystycznym elementem struktury zbioru wypukłego sa jego ściany. Definicja 18 Ścianą zbioru wypukłego K nazywa się podzbiór F Kowłasnościach:Fjestwypukły;żadenpunktzbioruFnie jest punktem wewnętrznym odcinka o końcach należących do K i nienależącychdof. Krawędzią zbioru wypukłego K nazywa się jego jednowymiarową ścianę(ścianę będącą odcinkiem lub(pół)prostą). Inaczej mówiąc, wypukły podzbiór F wypukłego zbioru K jest jego ścianą,jeślizachodziimplikacja:jeślidlajakichśx,y Kijakiegoś t ]0,1[punktx=tx+(1 t)ynależydof,totakżex,y K.
98 Czytelnikowi pozostawiamy sprawdzenie prawdziwości stwierdzeń zawartych w podanych poniżej przykładach. Punktyekstremalneiścianypodzbiorówwypukłych R n. Przykład 6 a) Punktami ekstremalnymi trójkąta T={(x 1,x 2 ) R 2 0 x 1,0 x 1,x 1 +x 2 1}sąjego wierzchołki(0,0),(1,0),(0,1),aścianamisąjegoboki. b) Punktami ekstremalnymi sześcianu K={(x 1,x 2,x 3 ) R 3 0 x i 1,i=1,2,3}sąpunkty (0,0,0), (1,0,0), (0,1,0), (1,1,0), (0,0,1), (1,0,1), (0,1,1), (1,1,1), w których czytelnik z łatwością rozpozna wierzchołki sześcianu. Ścianami są ściany w zwykłym sensie geometrii, tj. zbiory K ǫ i ={(x 1,x 2,x 3 ) R 3 x i =ǫ,gdzieǫ=0,lub1}. c) Otwarte koło jednostkowe na płaszczyźnie B={(x 1,x 2 ) R 2 x 2 1 +x2 2 <1}niemażadnegopunktu ekstremalnego, a dla koła domkniętego B={(x 1,x 2 ) R 2 x 2 1 +x2 2 1}każdypunktpołożonyna okręgujednostkowymx 2 1 +x2 2 =1jestpunktemekstremalnym. Żadenztychzbiorówniemaścian.
99 Dla opisania własności zbiorów wypukłych kluczowe są następujące pojęcia. Definicja19 a)niechbędziedanyzbiórkipunktu K.Jeśli istniejetakahiperpłaszczyznah,żezbiórkipunktunależądo różnych półprzestrzeni wyznaczonych przez tę hiperpłaszczyznę, to mówimy, że punkt u można oddzielić hiperpłaszczyzną od zbioru K.Jeślirównanietejhiperpłaszczyznyzapisaćwpostacic x=λ, tobędziewówczasc u>λic k<λdlakażdegok K. b)niechkbędziedomkniętymzbioremwypukłymwr n iniech Hbędziehiperpłaszczyznąorównaniuc x=λ.jeślihprzechodzi przezpunktznależącydokizbiórkzawartyjestwjednejz półprzestrzeni domkniętych wyznaczonych przez H, to mówimy, że HpodpierazbiórKwpunkciez,lubkrócej,żeHjest hiperpłaszczyzną podpierającą dla K. Możnasprawdzićbeztrudu,żehiperpłaszczyznawR n orównaniu normalnymx a=r(tj.przyzałożeniu a =1)jest hiperpłaszczyzną podpierającą w punkcie ra dla domkniętej kuli o środkuw0ipromieniur. Twierdzenie 23 NiechKbędziewypukłymidomkniętympodzbioremwR n. a)jeśliu R n nienależydok,toistniejeróżnyodzerawektor c R n iliczbaλ R,takieżec u>λ>c ydlakażdegoy K. b)każdyróżnyod R n maprzynajmniejjednąhiperpłaszczyznę podpierającą. O generowaniu zbiorów wypukłych przez hiperpłaszczyzny Twierdzenie 24 KażdydomkniętyzbiórwypukłyK R n zbiórkjestprzecięciem wszystkich półprzestrzeni domkniętych zawierających K. Ponadto przez każdy punkt brzegu K przechodzi hiperpłaszczyzna podpierająca.
100 Funkcje wypukłe definicja i najprostsze własności Definicja 20 Niech K V będzie niepustym podzbiorem wypukłymprzestrzeniwektorowejv.funkcjęf:k R nazywamy funkcją wypukłą, jeśli zbiór E(f)={(x,t) K R f(x) t} zwany epigrafem lub nadwykresem funkcji f, jest zbiorem wypukłym. Funkcjęf:K Rnazywamyfunkcjąwklęsłą,jeślifunkcja( f) jest wypukła. Wypukłość funkcji najwygodniej badać stosując następujące sformułowanie równoważne powyższej definicji. Stwierdzenie 11 Niech K V będzie niepustym podzbiorem wypukłymprzestrzeniwektorowejv.funkcjaf:k Rjest funkcją wypukłą wtedy i tylko wtedy, gdy dla każdej pary x 1,x 2 Kikażdejliczbyλ [0,1]zachodzinierówność f(λx 1 +(1 λ)x 2 ) λf(x 1 )+(1 λ)f(x 2 ) (91) a jest funkcją wklęsłą wtedy i tylko wtedy, gdy w analogicznych warunkach zachodzi nierówność odwrotna. Funkcję, dla której zachodzi w(91) ostra nierówność dla wszystkichλ ]0,1[,nazywamyfunkcjąściślewypukłą.Funkcjaf jest sciśle wklęsła jeśli( f) jest ściśle wypukła. Geometryczne znaczenie nierówności(91) jest jasne z poniższego rysunku wypukłość funkcji oznacza, że jej wykres leży zawsze poniżej odcinka siecznej łączącej dowolne dwa punkty wykresu.
101 8 6 4 2-3 -2-1 1 2 3 Położenie siecznej względem wykresu funkcji: wypukła po prawej, wklęsła po lewej 3 2 1 0-1 -2 3 4 5 6 7 Wklęsłośćfunkcjix ln(x 2) Wypukłość funkcji podanych w poniższym przykładzie wynika wprost z kryterium w postaci: Na to, aby dwukrotnie różniczkowalna funkcja jednej zmiennej zadana na odcinku J była wypukła(odpowiednio, ściśle wypukła) wystarcza, aby jej druga pochodna była nieujemna(odpowiednio, dodatnia)wewnętrzuj.
102 Przykład 7 (Wypukłość funkcji jednej zmiennej) a) Funkcja kwadratowa postaci R x w 2 (x)=ax 2 +bx+c R,przya 0jestwypukła,przy tymściślewypukłagdya>0,ijestwklęsławprzypadkua 0, ściślewklęsła,gdya<0 funkcjaafinicznax bx+cjest jednoczesnie wypukła i wklęsła; b) Funkcjawykładnicza R x e ax R,jestwypukładla dowolnegoa R,przytymściślewypukła,jeślia 0; c) Funkcjapotęgowa R + x x α Rjestściślewypukła,gdy α>1,wypukła,gdyα 1,ijestwklęsłagdyα 1.(Funkcja tożsamościowa R x x Rjestwklęsłaiwypukła.) d) Funkcjalogarytmiczna R + x lnx Rjestwklęsła. Warunku koniecznego i dostatecznego wypukłości dostarcza następująca fundamentalnie ważna nierówność Jensena: Stwierdzenie12(nierównośćJensena) Funkcjaf:K R jest wypukła wtedy i tylko wtedy, gdy dla dowolnego skończonego zbioru{x 1,...,x k } Kidowolnychliczbnieujemnych {λ 1,...,λ k }spełniającychwarunek k λ j =1zachodzi f(λ 1 x j +λ 2 x 2 +...+λ k x k ) k λ j f(x j ) (92) Jeśli funkcja f jest ściśle wypukła, to równość w nierówności Jensenazachodzitylkowtedy,gdywszystkiex j sąjednakowe.
103 Z nierówności Jensena(92) wynika bez trudu wiele ważnych i skądinąd znanych nierówności, z których tutaj wymienimy dwie: Nierówność między średnią arytmetyczną a średnią geometryczną: Dla każdego skończonego układu dodatnich liczb rzeczywistych a 1,...,a k jestspełnionanierówność k a 1 a 2 a k a 1+a 2 + +a k k. (93) Ponadto jedynym przypadkiem, w którym wyrażenia stojące po obustronachznaku sąrówne,jestten,gdywszystkieliczby a 1,...,a k sąrówne. Nierówność dla średnich ważonych: Dla każdego skończonego układu dodatnich liczb rzeczywistych a 1,...,a k iliczbnieujemnychλ 1,...,λ k spełniającychwarunek k λ j =1jestspełnionanierówność a λ 1 1 aλ 2 2 aλ k k λ 1a 1 +λ 2 a 2 +...+λ k a k. (94) Ponadto jedynym przypadkiem, w którym wyrażenia stojące po obustronachznaku sąrówne,jestten,gdywszystkieliczby a 1,...,a k sąrówne.ponieważpierwszaztychnierównościjest szczególnymprzypadkiemdrugiej(przyλ 1 =λ 2 =...=λ k = 1 k ), wystarczy wykazać nierówność(94). W tym celu zastosujmy nierówność Jensena dla funkcji wykładniczej przyjmując x 1 =lna 1,x 2 =lna 2,...,x k =lna k iskorzystajmyzwłasności funkcji wykładniczej.
Jeśliwnierówności(94)obraćk=2,tomożemyzapisać λ 1 = 1 p,λ 2= 1 q,gdzieliczbyp,qsą1<p,1<qispełniają 1 p +1 q =1.Przyjmującjakoa 1,a 2 liczbya p,b q (a,bdowolne nieujemne) nadamy nierówności(94) przejrzystą postać 104 ab ap p +bq q. (95) Zwróćmyuwagęnanajprostszyprzypadekp=q=2 2ab a 2 +b 2. Z tej nierówności wyprowadzić można bez trudności następujące uogólnienie nierówności Cauchy ego Schwarza(17). Twierdzenie 25(Nierówność Höldera) Niechx 1,...,x n,y 1,...,y n będądowolnymiukładaminliczb rzeczywistych,p,qliczbamidodatnimispełniającymi 1 p +1 q =1. Wtedy x j y j ( )1 x i p p ( i=1 y j q )1 q. (96) Dowód.Rzeczywiście,oznaczmyczynnikipoprawejstronie nierówności(96)kolejnoprzezaib jeśliktóryśznichjest zerem, to nierówność jest spełniona trywialnie, możemy więc przyjąć,żeobasąróżneodzera.wtakimprzypadkudo nierówności(95)podstawmya= x i /A,b= y i /Bizsumujmy stronami otrzymane nierówności względem i. Otrzymamy w ten sposób 1 AB i=1 x i y i 1 pa p i=1 x i p + 1 qb q i=1 y i q =1, skąd dowodzona nierówność wynika przez przemnożenie obu stron przez AB.
105 Formy kwadratowe określenie i ogólne własności Jednorodnewielomianystopnia2naprzestrzeni R n nazywamy formami kwadratowymi. Każdą formę kwadratową można zapisać wpostacisumyq(x)= i, a ij x i x j.współczynnikia ij przy jednomianachx i x j,nazywanewspółczynnikamiformy kwadratowej,wygodnietraktowaćjakwyrazymacierzy[a ij ] nazywanej macierzą formy q. Dla wyeliminowania niejednoznaczności współczynników powodowanej równością x i x j =x j x i przyjmujemy,żea ij =a ji dlawszystkichi,jinnymi słowy przyjmujemy, że macierz A formy q jest macierzą symetryczną A=A t ustanawiającwtensposóbwzajemnie jednoznaczną odpowiedniość między macierzami symetrycznymi A=(a ij ) M s n(r)iformamikwadratowymina R n.wyrażamyto przypisując macierzy A forme kwadratową Q A (x)= i, a ij x i x j =x t Ax. Równoważność form kwadratowych Formy kwadratowe Q A (x),q B (x)nazywamyrównoważnymi,jeślidlapewnej macierzy ortogonalnej P o współczynnikach z R zachodzi A=P t BP. (97) Wzór(97) ma następującą interpretację. Macierzy ortogonalnej P M n (R)przyporządkowujemybazęortonormalnąwR n złożoną z kolumn macierzy P, którą wykorzystujemy do przedstawieniawektorówprzestrzeni R n.dziękitemumożna wyrazićwektoryprzestrzeni R n nadwasposoby:
106 zapomocąbazystandardowej{e i } x= i=1 x i e i ; (98) zapomocąbazy{p i }złożonejzkolumnmacierzyp x= i=1 x i p i. (99) Współrzędnex i ix i wektoraxwtychbazachzwiązanesą zależnościąx=px,wzapisiekolumnowym Zatem x 1. x n = p 11... p 1n... p n1... p nn Q B (x)=x t Bx=(Px ) t BPx=(x ) t P t BPx =(x ) t Ax =Q A (x ). A więc formy równoważne są wyrażeniem jednej funkcji w różnych układach współrzędnych! W wykładzie algebry liniowej dowodzi się,żekażdaformakwadratowaq A (x)jestrównoważnaformie kwadratowej o diagonalnej macierzy współczynników D=diag(λ 1,...,λ n ), Q D (x)= λ j x 2 j, x 1. x n. gdzieλ 1,λ 2,...sąwartościamiwłasnymimacierzyA.
107 Określone lub półokreślone formy kwadratowe Definicja21 FormękwadratowąQ A (x)nazywamyformą dodatnio(odpowiednio, ujemnie) określoną, jeśli dla każdego wektora R n x 0mamy Q A (x)>0(odpowiednioq A (x)<0). JeślimamytylkoQ A (x) 0( a )(odpowiednioq A (x) 0), tomówimy,żeq A (x)jestpółokreślonadodatniolubujemnie. Formy, które nie są określone ani półokreślone nazywają się formami nieokreślonymi. MacierzsymetrycznąA M s n (R)będziemynazywaćmacierzą dodatnio(odpowiednio, ujemnie) określoną(półokreśloną), jeśli odpowiadającajejformakwadratowaq A (x)matęwłasność. W algebrze dowodzi się następującego ogólnego kryterium określoności form kwadratowych. Twierdzenie26 NiechQ A (x)= i, a ij x i x j będzieformą kwadratowąomacierzya M s n (R).Oznaczmyprzez d j =det[a kl ] 1 k,l j,dla,...,n,minorygłównestopniaj macierzy A, tj. minory odpowiadające podmacierzom stopnia j o wierzchołku umieszczonym w lewym górnym rogu macierzy A. FormaQ A (x)jest: dodatniookreślona d j >0, dla,...,n; ujemnieokreślona ( 1) j d j >0, dla,...,n. a ToznaczydlawszystkichxzachodziQ A (x) 0idlapewnego x 0zachodziQ A (x)=0.
108 Przykłady Niestety, nie można rozszerzyć podanego w Stwierdzeniu 26 kryterium określoności macierzy(dodatniej lub ujemnej) na przypadek form półokreślonych przez prostą zamianę nierówności ostrej na nieostrą. Przykłady1 Znakiformkwadratowychdlan=3Poniższe macierzespełniają( 1) j d j 0dla,2,3: A= 1 0 0 0 1 0, d 1 0,d 2 0,d 3 0, 0 0 0 macierz ujemnie półokreślona, A= A= 1 0 0 0 0 0, d 1 0,d 2 0,d 3 0, 0 0 1 macierz nieokreślona, 0 0 0 0 1 0, d 1 0,d 2 0,d 3 0, 0 0 1 macierz dodatnio półokreślona.
109 Półokreśloność form kwadratowych dwóch zmiennych Dlaprzypadkun=2możnasformułowaćprostąipełną charakteryzację półokreśloności form kwadratowych w następującej postaci. Niech A będzie niezerową macierzą symetryczną stopnia 2 o współczynnikachrzeczywistych,a= ( a 11 a 12 a 12 a 22 ).Przypomnijmy,że wyznacznik i ślad macierzy A są dane wzorami deta=a 11 a 22 (a 12 ) 2,trA=a 11 +a 22. Twierdzenie 27 Na to by forma kwadratowa Q A (x)=a 11 x 2 1 +2a 12x 1 x 2 +a 22 x 2 2 (100) omacierzya= ( a 11 a 12 a 12 a 22 ) byłapółokreślonapotrzebaiwystarcza, bydeta=0.wtakimprzypadkuformaq A (x)jestdodatnio półokreślona,gdytra>0,aujemniepółokreślona,gdytra<0. Zbierając razem powyższe warunki dostajemy następującą pełną charakteryzację form kwadratowych dwóch zmiennych: Twierdzenie28 FormakwadratowaQ A (x)zadanawzorem(100) jest: Określonawtedyitylkowtedy,gdydetA>0, aprzytym: dodatniookreślona,gdytra>0; ujemnieokreślona,gdytra<0. Półokreślonawtedyitylkowtedy,gdydetA=0, aprzytym: dodatniopółokreślona,gdytra>0; ujemniepółokreślona,gdytra<0.
110 Kryteria wypukłości(wklęsłości) funkcji Do badania wypukłości(wklęsłości) funkcji wielu zmiennych wykorzystuje się najczęściej następujący rezultat znany z wykładów analizy matematycznej. Stwierdzenie13 Niechf:W RbędziefunkcjąklasyC 2 określonąnaotwartymiwypukłymzbiorzew R n.niechhf(x) oznacza macierz jej drugich pochodnych cząstkowych(macierz Hessego funkcji f), Hf(x)= 2 f(x) x 2 1... 2 f(x) x 1 x n.... 2 f(x) x n x 1... 2 f(x) x 2 n a)nato,abyfbyławypukłanawpotrzebaiwystarcza,abyjej macierz Hessego Hf(x) była dodatnio półokreślona w każdym punkciex W.JeśliHf(x)jestwkażdympunkciedodatnio określona, to f jest ściśle wypukła. b)nato,abyfbyławklęsłanawpotrzebaiwystarcza,abyjej macierz Hessego Hf(x) była ujemnie półokreślona w każdym punkciex W.JeśliHf(x)jestwkażdympunkcieujemnie określona, to f jest ściśle wklęsła. W zastosowaniach ekonomicznych własnośc wypukłości funkcji odgrywa kapitalna rolę. Podstawowymi funkcjami wykorzystywanymi w modelach ekonomicznych są tzw. funkcje Cobba-Douglasa, zadane wzorem i im pokrewne. u(x 1,x 2,...,x n )=ax α 1 1 xα 2 2...xα n n
111 Wniosek 8 Przy wartościach parametrów spełniającyh podane warunkinastępującefunkcjesąwklęsłena R n + : a) FunkcjeCobba-Douglasa:dla0<a,0<α j, u(x 1,x 2,...,x n )=ax α 1 1 xα 2 2...xα n n, b) LogarytmicznefunkcjeC.-D:dla0<a,0<α j, u(x 1,x 2,...,x n )=a α j lnx j, c) Funkcjeseparowalne:dla0<α j,0<β j <1. u(x 1,x 2,...,x n )= α j x β j j. α j <1, α j <1 Wykresy funkcji Cobba-Douglasa z różnych punktów widzenia