Lokalne ektrema, formy kwadratowe

Podobne dokumenty
1 Pochodne wyższych rzędów

Formy kwadratowe. Rozdział 10

Wyk lad 11 1 Wektory i wartości w lasne

3. Funkcje wielu zmiennych

Układy równań i równania wyższych rzędów

Przestrzeń unitarna. Jacek Kłopotowski. 23 października Katedra Matematyki i Ekonomii Matematycznej SGH

Wyk lad 7 Baza i wymiar przestrzeni liniowej

Wektory i wartości własne

Formy kwadratowe. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 14. wykład z algebry liniowej Warszawa, styczeń 2017

Wykład 4 Udowodnimy teraz, że jeśli U, W są podprzetrzeniami skończenie wymiarowej przestrzeni V to zachodzi wzór: dim(u + W ) = dim U + dim W dim(u

Wektory i wartości własne

Wyk lad 14 Formy kwadratowe I

SIMR 2016/2017, Analiza 2, wykład 1, Przestrzeń wektorowa

2. Definicja pochodnej w R n

II. FUNKCJE WIELU ZMIENNYCH

Analiza funkcjonalna 1.

Wyk lad 9 Przekszta lcenia liniowe i ich zastosowania

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

Jak łatwo zauważyć, zbiór form symetrycznych (podobnie antysymetrycznych) stanowi podprzestrzeń przestrzeni L(V, V, K). Oznaczamy ją Sym(V ).

1 Formy hermitowskie. GAL (Informatyka) Wykład - formy hermitowskie. Paweł Bechler

Zadania egzaminacyjne

Wykład 14. Elementy algebry macierzy

Wykład 12 i 13 Macierz w postaci kanonicznej Jordana , 0 A 2

Rachunek różniczkowy i całkowy w przestrzeniach R n

Zaawansowane metody numeryczne

Układy równań i nierówności liniowych

Seria zadań z Algebry IIR nr kwietnia 2017 r. i V 2 = B 2, B 4 R, gdzie

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

Przestrzenie wektorowe

Formy kwadratowe. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. wykład z algebry liniowej Warszawa, styczeń 2009

Metody optymalizacji. notatki dla studentów matematyki semestr zimowy 2015/2016

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Programowanie liniowe

Wyk lad 8 macierzy i twierdzenie Kroneckera-Capellego

A. Strojnowski - Twierdzenie Jordana 1

F t+ := s>t. F s = F t.

. : a 1,..., a n F. . a n Wówczas (F n, F, +, ) jest przestrzenią liniową, gdzie + oraz są działaniami zdefiniowanymi wzorami:

Zaawansowane metody numeryczne

Funkcje dwóch zmiennych

2. ZASTOSOWANIA POCHODNYCH. (a) f(x) = ln 3 x ln x, (b) f(x) = e2x x 2 2.

Zadania z Algebry liniowej 4 Semestr letni 2009

Funkcja jednej zmiennej - przykładowe rozwiązania 1. Badając przebieg zmienności funkcji postępujemy według poniższego schematu:

Dwa równania kwadratowe z częścią całkowitą

Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji

1 Pochodne wyższych rzędów

ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ

jest ciągiem elementów z przestrzeni B(R, R)

AM1.2 zadania 14. Zadania z numerami opatrzonymi gwiazdka

Algebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań

Układy równań liniowych

Baza w jądrze i baza obrazu ( )

9 Przekształcenia liniowe

Analiza Funkcjonalna - Zadania

Lokalna odwracalność odwzorowań, odwzorowania uwikłane

1 Przestrzenie Hilberta

Zestaw zadań 14: Wektory i wartości własne. ) =

Praca domowa - seria 6

wszystkich kombinacji liniowych wektorów układu, nazywa się powłoką liniową uk ładu wektorów

Funkcja kwadratowa. f(x) = ax 2 + bx + c,

2 Rodziny zbiorów. 2.1 Algebry i σ - algebry zbiorów. M. Beśka, Wstęp do teorii miary, rozdz. 2 11

Funkcja kwadratowa. f(x) = ax 2 + bx + c = a

1 Podobieństwo macierzy

Formy kwadratowe. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 14. wykład z algebry liniowej Warszawa, styczeń 2011

1 Metody rozwiązywania równań nieliniowych. Postawienie problemu

Zestaw zadań 5: Sumy i sumy proste podprzestrzeni. Baza i wymiar. Rzędy macierzy. Struktura zbioru rozwiązań układu równań.

Algebra liniowa z geometrią

(warunkowe), mnożniki Lagrange a

III. Układy liniowe równań różniczkowych. 1. Pojęcie stabilności rozwiązań.

1 Ciągłe operatory liniowe

Wykład 6. Matematyka 2, semestr letni 2010/2011 Brak fragmentu dotyczącego twierdzenia o odwzorowaniu odwrotnym

Geometria analityczna

n=0 Dla zbioru Cantora prawdziwe są wersje lematu 3.6 oraz lematu 3.8 przy założeniu α = :

Zbiory wypukłe i stożki

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych,

W. Guzicki Zadanie IV z Informatora Maturalnego poziom rozszerzony 1

Metoda mnożników Lagrange'a

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.

ALGEBRA LINIOWA Z ELEMENTAMI GEOMETRII ANALITYCZNEJ

Algebra liniowa. 1. Macierze.

Iloczyn skalarny. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 10. wykład z algebry liniowej Warszawa, grudzień 2013

Notatki z Analizy Matematycznej 2. Jacek M. Jędrzejewski

Wykład 21 Funkcje mierzalne. Kostrukcja i własności całki wzglȩdem miary przeliczalnie addytywnej

O geometrii semialgebraicznej

Zadania z Algebry liniowej 3 semestr zimowy 2008/2009

Matematyka II. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr letni 2018/2019 wykład 13 (27 maja)

Ekstrema globalne funkcji

Dystrybucje, wiadomości wstępne (I)

Matematyka A kolokwium, 27 maja 2015, godz. 18:15 20:10

1 Funkcje dwóch zmiennych podstawowe pojęcia

Przestrzenie liniowe

1 Macierz odwrotna metoda operacji elementarnych

FUNKCJA KWADRATOWA. 1. Definicje i przydatne wzory. lub trójmianem kwadratowym nazywamy funkcję postaci: f(x) = ax 2 + bx + c

Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.

PROGRAMOWANIE KWADRATOWE

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie:

φ(x 1,..., x n ) = a i x 2 i +

Wykład 9. Matematyka 3, semestr zimowy 2011/ listopada 2011

Wyk lad 11 Przekszta lcenia liniowe a macierze

Funkcje analityczne. Wykład 4. Odwzorowania wiernokątne. Paweł Mleczko. Funkcje analityczne (rok akademicki 2016/2017) dla każdego s = (s.

Transkrypt:

Lokalne ektrema, formy kwadratowe Ostatnio poprawiłem 6 grudnia 214 r. Wypada raz jeszcze wrócić do ekstremów warunkowych. W przypadku ekstremów funkcji rozpatrywanych na zbiorach otwartych podaliśmy warunek wystarczajacy na to, aby funkcja miała w pewnym punkcie ekstremum lokalne. Zrobimy teraz to samo w przypadku funkcji rozpatrywanej na zbiorze zdefiniowanym za pomoca równań, określonej na wiekszym zbiorze otwartym, czyli podamy warunek wystarczajacy na to, by funkcja miała w pewnym punkcie lokalne ekstremum zwiazane warunkowe). Twierdzenie 6.1 o lokalnych ekstremach warunkowych, war. dostateczny) Niech F : G R l bedzie odwzorowaniem klasy C 2 ze zbioru G otwartego w R k+l zaś f : G R funkcja klasy C 2. Załóżmy, że R l jest wartościa regularna odwzorowania F, tzn. że jeżeli F x) =, to DF x): R k+l R l jest epimorfizmem. Niech p M = F 1 bedzie takim punktem, że istnieja takie liczby λ 1, λ 2,..., λ l, że grad fp) = j λ j grad F j p). Niech Lx) = fx) j λ jf j x) L nazywana jest funkcja Lagrange a). W tej sytuacji DLp) = oraz a. jeżeli D 2 Lp)v 2 > dla każdego wektora v T p M \ {} D 2 Lp) jest dodatnio określona na przestrzeni stycznej w punkcie p do zbioru M), to funkcja f M ma lokalne minimum właściwe w punkcie p; b. jeżeli D 2 Lp)v 2 < dla każdego wektora v T p M \ {} D 2 Lp) jest ujemnie określona na przestrzeni stycznej w punkcie p do zbioru M), to funkcja f M ma lokalne maksimum właściwe w punkcie p; c. jeżeli D 2 Lp)v 2 > > D 2 Lp)w 2 dla pewnych wektorów v, w T p M, to funkcja f M nie ma lokalnego ekstremum w punkcie p. Dowód. Zauważmy, że L M = f M. Wobec tego możemy zajmować sie w dalszym ciagu funkcja L. Z twierdzenia o funkcji uwikłanej wynika, że istnieja: takie k wymiarowe otoczenie U punktu R k oraz k + l wymiarowe otoczenie V punktu p R k+l i taki homeomorfizm ϕ zbioru U na zbiór V M, że dla każdego x U różniczka Dϕx) jest włożeniem monomorfizmem) oraz ϕ = p. Mamy DL ϕ) = DL ϕ Dϕ i wobec tego D 2 L ϕ)x)v 2 = D 2 Lϕx)) Dϕx)v ) 2 + DLϕx)) D 2 ϕx)v 2). Dla x = mamy wiec D 2 L ϕ)v 2 = D 2 Lϕ) Dϕv ) 2 + DLϕ) D 2 ϕv 2) = = D 2 Lp) Dϕv ) 2 + DLp) D 2 ϕv 2) = D 2 Lp) Dϕv ) 2, bo L zdefiniowaliśmy tak, by DLp) =. Teza wynika teraz od razu z twierdzenia o lokalnych ekstremach zastosowanego do funkcji L ϕ określonej na zbiorze U otwartym w R k. Uwaga 6.2 W twierdzeniu o lokalnych ekstremach warunkowych trzeba koniecznie rozpatrywać funkcje Lagrange a L zamiast funkcji f, chociaż te dwie funkcje pokrywaja sie na 13

zbiorze M. Podamy przykład. Niech F x y) = x + x 2y) 2 2, f x y) = x y 2. Mamy F =, grad F = 1, grad f = 1, zatem w punkcie jest spełniony warunek Lagrange a dla funkcji f na zbiorze M = F 1. T M = ker DF { ) = x } y) : x =. Mamy wiec D 2 f 2 y) = 2y 2, co sugeruje, że funkcja f M ma w punkcie lokalne maksimum. To jednak nie jest prawda. Niech ϕt) = ) 4t 2 t+t. Mamy wi ec, 2 F ϕt)) = = 4t 2 + 2t 2 2t 2t 2) 2 = i Dϕ = 1), zatem ϕ parametryzuje pewne otoczenie punktu w M. Mamy również fϕt)) = 4t 2 t + t 2) 2 = 3t 2 2t 3 t 4. Jasne jest wiec, że funkcja f ϕ ma w punkcie lokalne minimum właściwe, wiec również funkcja f M ma w punkcie lokalne minimum właściwe. Przyczyna tego pozornego paradoksu jest to, że wektory postaci D 2 ϕv 2 nie musi nie musza być styczne do M w punkcie p, wiec ich obrazy przy Df nie musza być zerowe. W przypadku funkcji Lagrange a ta kwestia nie wystepuje, bo jej różniczka w punkcie p jest przekształceniem zerowym, funkcja Lagrange a jest tak właśnie dobrana! Zadanie 6.1 Znaleźć lokalne ekstrema oraz oba kresy funkcji x 2 + y 2 + z 2 na zbiorze zdefiniowanym równaniem x 4 + 1 16 y4 + 1 81 z4 = 1 H.Cartan). Twierdzenie 6.3 o niemal jednostajnej zbieżności) Załóżmy, że zbiór G jest otwarty i spójny. Niech f n ) bedzie ciagiem funkcji klasy C 1 określonych na G. Załóżmy, że ciag Df n ) jest zbieżny jednostajnie na każdym zbiorze zwartym C G do pewnej funkcji g oraz że istnieje punkt p G taki, że ciag f n p)) jest zbieżny. Wtedy ciag f n ) jest zbieżny jednostajnie na każdym zbiorze zwartym do pewnej funkcji f C 1 G) i zachodzi równość Df = g. Dowód. szkic) Jeśli C jest zbiorem zwartym wypukłym, to dowód tego twierdzenia jest powtórzeniem dowodu podanego w zeszłym roku w przypadku funkcji jednej zmiennej określonych na przedziale z jedna drobna różnica: teraz twierdzenie o wartości średniej to nierówność, wiec trzeba dokonać kosmetycznych zmian w oszacowaniach, by pasowały do wielowymiarowej wersji twierdzenia o wartości średniej. Nastepnie należy skorzystać z tego, że każde dwa punkty zbioru otwartego i spójnego można połaczyć łamana w nim zawarta, taka łamana można pokryć skończona liczba kul otwartych, których domkniecia sa zawarte w zbiorze G, ponumerować je tak, by pierwsza zawierała punkt p, druga przecinała pierwsza, trzecia druga itd. Nastepnie z tego, że twierdzenie jest prawdziwe w przypadku zbioru zwartego wypukłego wywnioskować teze dla dowolnej łamanej zawartej w G zaczynajacej sie w punkcie p, a stad już bez trudności da sie uzyskać teze twierdzenia. Jest jasne, że jeśli założymy, że funkcje f 1, f 2,... sa klasy C m oraz ciag D m f n ) jest jednostajnie zbieżny na każdym zbiorze zwartym zawartym w zbiorze G oraz że dla j =, 1,..., m 1 ciag D j f n )p) jest zbieżny w pewnym punkcie p G, to okaże sie, że ciag f n ) jest jednostajnie zbieżny na każdym zbiorze zwartym zawartym w G oraz że funkcja graniczna f jest klasy C m i lim D j f n = D j f przy czym zbieżność jest n jednostajna na zwartych podzbiorach zbioru G. 14

Przypomnijmy, że na analizie I wykazaliśmy, ze funkcja α zdefiniowana wzorami αt) = dla t i αt) = e 1/t dla t > jest funkcja klasy C na całej prostej. Wynika stad, że funkcja β zdefiniowana wzorem α1 x 2 ) jest klasy C na całej przestrzeni przy czym na kuli otwartej B, 1) przyjmuje wartości dodatnie a poza kula otwarta B, 1) jest równa. Załóżmy, że C R k jest zbiorem domknietym. Niech G = R k \C. Zbiór G jest otwarty, wiec jest suma kul otwartych. Z tej rodziny kul można wybrać rodzine przeliczalna {Bp n, r n )}, której suma równa jest G. Definiujemy funkcje fx) = n ε nβ x p n ) r n, przy czym liczby dodatnie ε1, ε 2,... sa tak małe, że ε n sup D j x) 2 n dla j =, 1,..., n. Oczywiście oznacza to nałożenie na każda z j,x liczb ε 1, ε 2,... skończenie wielu warunków, zatem można je tak dobrać, że postulowane nierówności bed a zachodzić w całej przestrzeni. Oznacza to, że szeregi n ε nd j β x p n ) r n sa zbieżne jednostajnie w całej przestrzeni R k dla j =, 1, 2,.... Wobec tego funkcja f jest klasy C. Jest ona dodatnia poza zbiorem domknietym C, a na zbiorze C jest tożsamościowo równa. Wykazaliśmy wiec Twierdzenie 6.4 o najpaskudniejszej poziomicy) Dla każdego zbioru domknietego C istnieje funkcja f klasy C taka, że C = f 1. Dodajmy, że wielu matematyków usiłuje opisać poziomice typowych funkcji klasy C. Wiele przypadków już opisano, ale jest wysoce prawdopodobne, że badania te jeszcze przez wiele lat bed a dostarczać rozrywki matematykom. Tematyka jest ważna również dzieki temu, że osiagni ete wyniki zazwyczaj znajduja zastosowanie również poza matematyka. Uwaga 6.5 o lokalnych ekstremach warunkowych) Ten temat interesuje z różnych przyczyn ekonomistów. Omówimy teraz twierdzenie, które pojawia sie w ksiażce Foundation of Economics Analysis, 1947, P.A.Samuelsona nagroda Nobla z ekonomii, 197 z błedem poprawionym w 1952 w pracy G.Debreu nagroda Nobla z ekonomii, 1983). Twierdzenie nie jest specjalnie trudne, a informacje historyczne służa jedynie podkreśleniu jego wagi w ekonomii, na której autor tego tekstu zna sie tak jak wszyscy w RP z wyjatkiem ekonomistów z prawdziwego zdarzenia). Ten fragment tekstu oparty jest na pracy G.Debreu. Przypomnimy najpierw najbardziej podstawowych własności form kwadratowych. Niech A = a i,j ) bedzie macierza symetryczna wymiaru k, tzn. a i,j = a j,i. Wtedy funkcja Q zdefiniowana wzorem Qx) = Ax x nazywana jest forma kwadratowa. Niech x = Dy dla pewnej macierzy nieosobliwej D D jest macierza izomorfizmu). Wtedy QDy) = ADy Dy = D T ADy y = Qy) też jest forma kwadratowa, ale zmiennej y. Formy Q i Q s a równoważne to definicja. W dalszym ciagu macierz A jest symetryczna. Funkcja Q na sferze jednostkowej osiaga swe kresy. Niech m = inf x =1 Qx). Istnieje punkt p taki, że m = Qp) i p = 1. Na mocy twierdzenia Lagrange a o ekstremach warunkowych istnieje taka liczba λ, że grad Qx) = λ grad x 2 ) = 2λx. Dzieki symetrii macierzy A mamy również grad Qx) = 2Ax. Wobec tego Ap = λp. Stad wynika, że m = Qp) = Ap p = λ. Wykazaliśmy wiec, że macierz A ma co najmniej jedna wartość własna rzeczywista oraz 15

że najmniejsza wartość formy kwadratowej Q przyjmowana w punktach sfery jednostkowej o środku w punkcie jest jej wartościa własna. Załóżmy teraz, że λ 1 jest wartościa własna macierzy A a v 1 jest odpowiadajacym jej wektorem własnym, tzn. Av 1 = λ 1 v 1, v 1. Jeśli w jest wektorem prostopadłym do wektora v 1, to zachodza równości Aw v 1 = w Av 1 = w λ 1 v 1 ) = λ 1 w v 1 =, zatem również wektor Aw jest prostopadły do wektora v 1. Niech V oznacza zbiór wszystkich wektorów prostopadłych do wektora v 1. V jest podprzestrzenia liniowa wymiaru k 1, niezmiennicza ze wzgledu na A: w V Aw V. Rozumujac dokładnie tak jak w przypadku całej przestrzeni przekonujemy sie, że przekształcenie liniowe A V ma rzeczywista wartość własna λ 2, odpowiadajacy jej wektor własny v 2 V jest oczywiście prostopadły do wektora v 1. Teraz można zastosować to samo rozumowanie do zbioru złożonego ze wszystkich wektorów prostopadłych do obu wektorów v 1, v 2. Otrzymamy trzeci wektor własny prostopadły do v 1 i do v 2. Prowadzi do do bazy złożonej z wzajemnie prostopadłych wektorów własnych. Wykazaliśmy wiec, że wartości własne macierzy symetrycznej sa rzeczywiste i że istnieje baza złożona z wzajemnie prostopadłych wektorów własnych, w szczególności macierz symetryczna jest diagonalizowalna. Niech V +, V i V oznaczaja podprzestrzenie liniowe niezmiennicze odpowiadajace wartościom dodatnim własnym macierzy A, zerowej wartości własnej macierzy A i wartościom ujemnym. Na V + \{} forma Q przyjmuje wartości dodatnie, na V jest tożsamościowo równa, na V \ {} wartości ujemne. W szczególności: macierz symetryczna A jest dodatnio określona wtedy i tylko wtedy, gdy jej wszystkie jej wartości własne sa dodatnie. Zastepuj ac forme Q wyznaczona przez macierz A równoważna forma Q wyznaczona przez macierz D T AD, D macierz o wyznaczniku, stwierdzamy, że wymiary analogicznie zdefiniowanych podprzestrzeni Ṽ +, Ṽ i Ṽ sa takie same jak w przypadku macierzy A, chociaż wartości własne moga być inne wynika to stad, że V + jest maksymalna podprzestrzenia liniowa, na której forma Q jest dodatnio określona, V to maksymalna podprzestrzeń liniowa, na której forma Q jest ujemnie określona, zaś V to maksymalna podprzestrzeń liniowa, na której forma Q jest zerowa. Zastepuj ac macierz A macierza D T AD mamy odpowiedni rozkład na podprzestrzenie D 1 V +, D 1 V i D 1 V, które moga nie być niezmiennicze dla przekształcenia li11niowego zdefiniowanego za pomoca macierzy D T AD. Oznacza to, że rozkład R k na sume prosta podprzestrzeni Ṽ+, Ṽ i Ṽ określonych jako podprzestrzenie, na których forma kwadratowa jest dodatnio określona, zerowa, ujemnie określona nie jest jednoznaczny konkretne przykłady ci studenci, którzy nie zdaja sobie sprawy z tego powinni wymyśleć sami, bo to bardzo proste). Niech B = b i,j ) bedzie macierza kwadratowa wymiaru k. Niech B r oznacza dla r = 1, 2,..., k macierz ) wymiaru r znajdujac a sie w lewym górnym rogu macierzy B, np. b1,1 b B 2 = 1,2, B oznacza wyznacznik macierzy kwadratowej B, B = 1. Przez y r b 2,1 b 2,2 oznaczamy funkcje liniowa zmiennych x r, x r+1,..., x k postaci x r +d r+1 x r+1 + +d k x k. 16

Twierdzenie 6.6 o postaci kanonicznej niektórych form kwadratowych) Niech A = a i,j ) bedzie macierza symetryczna wymiaru k, tzn. a i,j = a j,i. W tej k sytuacji wzór Ax x = c r yr, 2 c r zachodzi wtedy i tylko wtedy, gdy A r = dla r=1 r = 1, 2,..., k. Mamy wtedy c r = A r A r 1.1 Dowód. Jeśli forme kwadratowa Qx) := Ax x można zapisać w postaci k c r yr, 2 c r, to oczywiście a 1,1, bo c 1 a zmienna x 1 wystepuje tylko w y 1. Jeśli A 1 = a 1,1, to możemy napisać Qx) = a i,j x i x j = a 1,1 x1 + a 1,2 a 1,1 x 2 + a 1,3 a 1,1 x 3 + + a ) 1,k 2 a 1,1 x k + Q2 x 2, x 3,..., x k ), gdzie przez Q 2 x) oznaczyliśmy odpowiednia forme kwadratowa k 1 zmiennych x 2, x 3,..., x k. Spróbujmy przekształcić nasza forme raz jeszcze, by zapisać ja w postaci c 1 y1 2 + c 2 y2 2 + Q 3 x 3,..., x k ). Zróżniczkujmy stronami równość Qx) = a i,j x i x j = c 1 y1 2 + c 2 y2 2 + Q 3 x 3,..., x k ) wzgledem x 1 i wzgledem x 2. Otrzymujemy równości 1 Q 2 x 1 x) = k j=1 a y 1,jx j = c 1 y 1 1 Q oraz 1 2 x) = k j=1 a 2,j x j = c 1 y 1 y 1 + c 2 y 2 y 2. Z wzoru y 2 = x 2 + d 3 x 3 + + d k x k wynika, że y 2 = 1. Niech y 1 = i x 3 = x 4 = = x k =. Otrzymujemy wiec równania a 1,1 x 1 + a 1,2 x 2 = i a 2,1 x 1 + a 2,2 x 2 = c 2 x 2. Podprzestrzeń opisana równaniami y 1 = i x 3 = x 4 = = x k = ma oczywiście wymiar 1. Wobec tego układ dwóch równań a 1,1 x 1 + a 1,2 x 2 =, a 2,1 x 1 + a 2,2 c 2 )x 2 = ma niezerowe rozwiazanie, zatem jego wyznacznik jest równy, czyli = a 1,1 a 1,2 a 2,1 a 2,2 c 2 = a 1,1 a 1,2 a 2,1 a 2,2 a 1,1 a 2,1 c 2 = A 2 c 2 A 1. Stad wynika, że c 2 = A 2, zatem przy założeniu, że A A 1 1 stwierdzamy, że c 2 = A 2 =. Kolej na c 3. Chcemy, aby była spełniona równość Qx) = a i,j x i x j = c 1 y1 2 + c 2 y2 2 + c 3 y3 2 + Q 4 x 4, x 5,..., x k ). Różniczkujac ja stronami wzgledem x 1, x 2, x 3 otrzymujemy równości 1 Q 2 1 Q 2 1 Q 2 x 1 = j a 1,jx j = c 1 y 1 y 1 x 1 = j a y 2,jx j = c 1 y 1 y 1 + c 2 y 2 2 = j a y 3,jx j = c 1 y 1 y 1 + c 2 y 2 y 2 + c 3 y 3 3 Przyjmijmy teraz y 1 = y 2 =, x 4 = x 5 = = x k =. Te równania definiuja jednowymiarowa podprzestrzeń liniowa w R k, zatem poniższy układ równań wiemy, że y 1 = y 2 =, y 3 = 1) a 1,1 x 1 + a 1,2 x 2 + a 1,3 x 3 = a 2,1 x 1 + a 2,2 x 2 + a 2,3 x 3 = a 3,1 x 1 + a 3,2 x 2 + a 3,3 x 3 = c 3 x 3 1 To nie jest ogólne twierdzenie o postaci kanonicznej, bo przekształcenie, za pomoca którego sprowadzamy forme kwadratowa do postaci kanonicznej, ma szczególna postać, jasne jest też, że mowa jest jedynie o formach kwadratowych niezdegenerowanych 17 r=1 x 1

ma niezerowe rozwiazanie. Wobec tego jego wyznacznik równy jest, czyli a 1,1 a 1,2 a 1,3 = a 2,1 a 2,2 a 2,3 a 3,1 a 3,2 a 3,3 c = a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,3 3 a 3,1 a 3,2 a a 1,1 a 1,2 a 2,1 a 2,2 3,3 a 3,1 a 3,2 c = A 3 c 3 A 2. 3 Podobnie jak poprzednio jest oczywiste, że c 3 = A 3 =. Te procedure można kontynuować. Dowód został zakończony. Z twierdzenia tego wynika twierdzenie Sylvestera: macierz A jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie wyznaczniki A r sa dodatnie. Jasne jest też, że jest ujemnie określona wtedy i tylko wtedy, gdy c 1, c 2,..., c k <, czyli gdy A 1 <, A 2 >, A 3 <, A 4 >,... Zbliżamy sie do głównej cześci tej opowieści. A jest w dalszym ciagu macierza symetryczna, ale od tej pory wymiaru k +l. Zakładamy też, że B jest macierza o l wierszach i k + l kolumnach. Zajmować sie bedziemy dodatnia określonościa formy kwadratowej Q, Qx) = Ax x ale na podprzestrzeni M zdefiniowanej równaniem Bx =, czyli układem l równań liniowych z k niewiadomymi. Chodzi o to, by warunek typu Sylvestera wyrazić w terminach macierzy A i B. Lemat 6.7 Forma kwadratowa Q jest dodatnio określona na podprzestrzeni M wtedy i tylko wtedy, gdy istnieje liczba λ taka, że dla każdego x zachodzi Qx) + λbx Bx >. Dowód. Warunek wystarcza, bo jeśli x M, to < Qx) + λbx Bx = Qx). Wykażemy, że jest również konieczny. Załóżmy wiec, że Qx) > dla każdego x M. Ponieważ Bx = i Q jest funkcja ciagł a, wiec istnieje takie otoczenie U zbioru zwartego {x R k+l : x = 1, Bx = }, że jeśli x U, to Qx) >. Funkcja ciagła określona zbiorze zwartym osiaga swój kres dolny, wiec istnieje takie x, że x = 1 i Ax x Ax x dla każdego x, dla którego x = 1. Z tego samego powodu istnieje taki punkt x 1, że x 1 = 1 i Bx Bx Bx 1 Bx 1 > dla każdego x / U, dla którego x = 1. Teraz pozostaje wybrać λ > tak duże, by λbx 1 Bx 1 + Ax x >, co oczywiście jest możliwe. Z określenia λ wynika od razu, że Qx) + λbx Bx > : w zbiorze U tak jest, bo pierwszy składnik jest dodatni, a drugi nieujemny, poza U drugi składnik majoryzuje pierwszy. Wniosek 6.8 Forma Q jest dodatnio określona na podprzestrzeni M, wtedy i tylko wtedy, gdy istnieje liczba λ taka, że dla każdej liczby λ λ i dla każdego x zachodzi nierówność Qx) + λbx Bx >. Lemat 6.9 A + λb T B jest wielomianem zmiennej λ. którego współczynnik przy najwyższej potedze zmiennej tzn. przy λ l ) równy jest 1) l A B T B l. W tym miejscu l to macierz kwadratowa wymiaru l.) 18

Dowód. Z oczywistej równości ) ) ) A λb T Ik+l A + λb T B λb T = B I l B I l I l wynika, że λbt B I l = 1)l A + λb T B. Trzeba wiec obliczyć współczynnik przy λ l w wielomianie λbt B I l. Ten współczynnik to wartość l tej pochodnej tej funkcji podzielona przez l!. Pochodna wyznacznika możemy obliczyć np. zastepuj ac jedna z k + 2l kolumn, kolumna złożona z pochodnych funkcji wystepuj acych w tej kolumnie i sumujac tych k + 2l składników; w rzeczywistości l składników, bo w k + l kolumnach λ nie wystepuje. Różniczkujac po raz drugi otrzymamy z każdego z l składników l 1 składników, bo teraz λ wystepuje tylko w l 1 kolumnach. W rezultacie po l różniczkowaniach otrzymamy l! składników, każdy z nich równy BT B. Dowód został zakończony. Twierdzenie 6.1 o dodatniej określoności formy kwadratowej na podprzestrzeni) Jeśli A jest macierza symetryczna wymiaru k + l, B macierza o k + l kolumnach i l wierszach, Bl, to Ax x > dla każdego x, dla którego Bx =, wtedy i tylko wtedy, gdy 1) l A r B l,r ) T B l,r > dla l + 1 r k + l. B l,r := b i,j ), gdzie 1 i l, 1 j r) Dowód. Wykażemy najpierw, że z dodatniej określoności na podprzestrzeni M złożonej z tych punktów x, dla których Bx = wynika, że k wyznaczników z tezy twierdzenia to liczby dodatnie. Najpierw udowodnimy, że BT B. Rozważmy dowolne punkty x Rk+l, y R l takie, że Ax + B T y = i jednocześnie Bx =. Wtedy zachodzi równość = Ax x + B T y x = Ax x + y Bx = Ax x. Wynika stad, że x =, zatem B T y =, co w świetle tego, że B l =, oznacza, że y =. Wobec tego jedynym rozwiazaniem układu Ax + B T y =, Bx = jest rozwiazanie zerowe, a stad wnioskujemy, że BT B. W taki sam sposób wykazujemy, że dla r = l + 1, l + 2,..., l + k 1 zachodzi r B l,r ) T B l,r rozpatrujemy po prostu takie wektory x, że = x r+1 = x r+2 = =... = x k+l. Z wniosku 6.8 wynika, że dla dostatecznie dużych liczb λ macierz A + λ B T B jest dodatnio określona. Z twierdzenia Sylvestera wynika wiec, że dla r = 1, 2,..., k + l wyznaczniki macierzy A + λb T B ) = A r r + λb l,r ) T B l,r sa dodatnie. Wyznacznik r + λ B l,r ) T B l,r jest dodatni dla r = l + 1, l + 2,..., l + k dla dostatecznie dużych 19

liczb λ, a ponieważ jest to wielomian stopnia r l, wiec współczynnik przy λ r l jest dodatni. Stad i z lematu 6.9 wynika wiec, że 1) l A r B l,r ) T B l,r >. Zakończyliśmy dowód pierwszej implikacji. Teraz założymy, że wyznaczniki maja odpowiednie znaki i wykażemy, że forma zdefiniowana macierza A jest dodatnio określona na podprzestrzeni zdefiniowanej równaniem Bx =. Wystarczy wykazać, że dla dostatecznie dużych λ macierz A + λb T B jest dodatnio określona. Wykażemy, że dla dostatecznie dużych liczb λ wyznaczniki A + λb T B ) r s a dodatnie dla r = 1, 2,..., k + l. Jest tak dla r = 1, 2,..., l, bo wtedy macierz B T B ) jest dodatnio określona jako r macierz Grama układu r liniowo niezależnych wektorów. Jej wyznacznik jest wiec dodatni, zatem dla dostatecznie dużych λ > wyznacznik macierzy A+λB T B ) też jest r dodatni wyznacznik jest funkcja ciagł a macierzy). Dla r > l jest to po prostu założenie. Stad i z lematu 6.7 wynika, że macierz A jest dodatnio określona na podprzestrzeni M złożonej z tych wektorów x, dla których Bx =. Dowód został zakończony. 11