Wykład 2 Matematyka 2, semestr letni 2/2 Kontynuujemy przygotowanie do studiowania rachunku różniczkowego funkcji wielu zmiennychwiedząjużpaństwo,żepochodnafunkcjif: R n Rwpunkciex R n jestodwzorowaniemliniowymdziałającymnawektorachzaczepionychwx owartościachwrjesttoobiekt nieco innego rodzaju niż wyjściowa funkcja Podobnie rzecz się ma z drugą pochodną Okazuje się, że druga pochodna funkcji wielu zmiennych jest formą dwuliniową na tej samej przestrzeni wektorowej, na której działa pochodna Zanim zatem na dobre zajmiemy się różniczkowaniem funkcji wielu zmiennych, powinniśmy dowiedzieć się kilku rzeczy o formach dwuliniowych Podobnie jak w rachunku różniczkowym funkcji jednej zmiennej, badanie drugiej pochodnej(a czasami i wyższych) jest potrzebne na przykład do określania rodzaju punktów ekstremalnych Definicja Niech V będzie przestrzenią wektorową nad ciałem R Formą dwuliniową na przestrzeni V nazywamy odwzorowanie Q:V V R którejestliniowezewzględunakażdyzeswoichargumentów,tzndlawszystkichv,v 2,v V orazλ,λ 2 Rspełniawarunki Q(λ v +λ 2 v 2,v)=λ Q(v,v)+λ 2 Q(v 2,v) Q(v,λ v +λ 2 v 2 )=λ Q(v,v )+λ 2 Q(v,v 2 ) Mówimy,żeformajestsymetryczna,jeśliponadtodlawszystkichv,v 2 V a antysymetryczna, jeśli Q(v,v 2 )=Q(v 2,v ), Q(v,v 2 )= Q(v 2,v ) Przykład Formą dwuliniową jest iloczyn skalarny( ), o którym mówili państwo w poprzednimsemestrzeniektóreprzestrzeniewektorowe,naprzykład R n,wyposażonesąwkanoniczny iloczyn skalarny Jeśli v= x x 2 x n, w= y y 2 y n to (v w)=[x x 2 x n ] y y 2 y n = n x k y k k= Przykład 2 W ruchu obrotowym bryły sztywnej związek między prędkością kątową a energią kinetyczną bryły wyraża się wzorem E= 2 I (p, n)ω 2, gdzieeoznaczaenergię,ωwartośćprędkościkątowej,ai (p, n) takzwanymomentbezwładności względemosiowektorzekierunkowym n przechodzącejprzezpunktpmomentbezwładności związany jest z rozkładem masy wewnątrz bryły, zależy również od położenia osi obrotu względem bryły Należy obliczać go oddzielnie dla każdej osi obrotu Okazuje się jednak, że informację o momentach bezwładności danej bryły względem osi o dowolnym kierunku, przechodzącej przez ustalony punkt przestrzeni p przedstawić można w postaci formie dwuliniowej symetrycznejnazywanejtensorembezwładnościzamiastwielkościi (p, n) ω 2 dowzorunaenergię
2 wstawićnależyi p ( ω, ω),gdzietymrazemi p oznaczaodpowiedniąformędwuliniowąprzykład konkretnej formy dla konkretnej bryły sztywnej pojawi się w dalszej części wykładu, kiedy poznamy już sposoby zapisywania form dwuliniowych MacierzformydwuliniowejWybierzmybazęe=(e,e 2,,e n )wprzestrzeniwektorowej V Zauważmy, że z warunku dwuliniowości wynika, że forma Q jest jednoznacznie określona przez swoje wartości na bazie Istotnie, jeśli to v=λ e +λ 2 e 2 + +λ n e n, w=µ e +µ 2 e 2 + +µ n e n Q(v,w)=Q(λ e +λ 2 e 2 + +λ n e n,µ e +µ 2 e 2 + +µ n e n )= λ Q(e,µ e +µ 2 e 2 + +µ n e n )+λ 2 Q(e 2,µ e +µ 2 e 2 + +µ n e n )+ + +λ n Q(e n,µ e +µ 2 e 2 + +µ n e n )= n λ i Q(e i,µ e +µ 2 e 2 + +µ n e n )= i= n λ i( µ Q(e i,e )+µ 2 Q(e i,e 2 )+ µ n Q(e i,e n ) ) n n = λ i µ k Q(e i,e k ) i= i=k= Widzimywięc,żeżebywyznaczyćwartośćQ(v,w)trzebaznaćwspółrzędnewektorówviww bazieorazwartościqnawektorachbazowych:q(e i,e k )FormaQchrakteryzowanajestwięc przezn 2 liczbjeśliwartościq(e i,e k )oznaczymyq ik możemynapisać: n n Q(v,w)= λ i µ k Q ik i=k= LiczbyQ ik wygodniejestustawićwmacierzn n: Q Q 2 Q n Q 2 Q 22 Q 2n [Q] e = Q n Q n2 Q nn Jeśli forma jest symetryczna, jej macierz jest symetryczna względem głównej przekątnej, tzn Q ik =Q ki,jeślijestantysymetryczna,towyrazynagłównejprzekątnejmusząbyćrównezero oraz macierz jest być antysymetryczna ze względu na główną przekątną Zwróćmyuwagęnato,że elementmacierzowy Q ik maobawskaźnikinadole,anie,jak było w przypadku macierzy odwzorowania liniowego, jeden wskaźnik na górze a drugi na dole Różnica ta odzwierciedla różnicę między obiektami geometrycznymi reprezentowanymi przez macierz Mimo, że macierz odwzorowania i macierz formy wyglądają jednakowo, to jednak działają inaczej i mają różne własności Wzór n n Q(v,w)= λ i µ k Q ik i=k=
w zapisie macierzowym wyglądałby tak: Q Q 2 Q n () Q(v,w)= [ λ λ 2 λ n] Q 2 Q 22 Q 2n Q n Q n2 Q nn µ µ 2 µ n =([v]e ) T [Q] e [w] e Przykład3Macierzkanonicznegoiloczynuskalarnegona R n względembazystandardowej jest macierzą jednostkową Przykład Rozważamy bryłę sztywną B składającą się z ośmiu jednakowych mas m umieszczonychwwierzchołkachsześcianurozpiętegonawektorachbazystandardowejwr 3 3 m Wyrazy macierzowe momentu bezwładności wyznaczamy zgodnie ze wzorem: 8 I ii = m [ 8 (x α )2 +(x 3 α )2 +(x 3 α )2 (x i α )2], I ij = mx i α xj α dlai j, α= gdzie α numeruje wierzchołki sześcianu Łatwo sprawdzić, że 8 2 2 I=m 2 8 2 2 2 8 Korzystajączmacierzy[I] e obliczyćmożemymomentbezwładnościwobrociewzględemdowolnej osi przechodzącej przez początek układu współrzędnych Na przykład względem osi, której wektorem kierunkowym jest n= 3, I n =m 3 [] =m 3 [] =m 8 2 2 2 8 2 2 2 8 Przykład 5 Macierz momentu bezwładności jednorodnego czworościanu B o masie M rozpiętego na wektorach bazy standardowej względem początku układu współrzędnych jest postaci [I] e = M 2 2 2 α=
Elementy macierzowe I wyznaczamy zgodnie ze wzorem I ik = ρ(x,x 2,x 3 ) ( (x ) 2 +(x 2 ) 2 +(x 3 ) 2 )δ ik x i x k) dx dx 2 dx 3, B gdzie ρ jest gęstością bryły Tego rodzaju całki obliczać będziemy w drugiej części semestru Korzystajączmacierzy[I] e obliczyćmożemymomentbezwładnościwobrociewzględemdowolnej osi przechodzącej przez początek układu współrzędnych Na przykład względem osi, której wektorem kierunkowym jest n= 3, I n = 3 M [] 2 2 2 Do rozwiązania mamy teraz następujące zadanie: = M 3 [] = M 3 2=2M 5 Zadanie Niech Q będzie formą dwuliniową na przestrzeni wektorowej V Znając macierz formy[q] e wbazieeimacierzeprzejścia[id] f e,[id] e fmiędzybazamieifznaleźćmacierz formy[q] f wbazief Rozwiązanie: Startujemy ze wzoru() Q(v,w)=([v] e ) T [Q] e [w] e Wiemy w jaki sposób dokonuje się zmiany reprezentacji wektora w bazie za pomocą macierzy przejścia: [v] e =[id] e f[v] f, [w] e =[id] e f[w] f Musimy też pamiętać, że transpozycja zamienia kolejność mnożenia macierzy, to znaczy Wstawiamy zgodnie z kolorem: ([v] e ) T =([id] e f[v] f ) T =([v] f ) T ([id] e f) T Q(v,w)=([v] e ) T [Q] e [w] e =([v] f ) T ([id] e f) T [Q] e [id] e f[w] f W ostatnim wzorze warto wyróżnić następujący fragment: iporównaćtoz Wniosek: Q(v,w)=([v] f ) T ([id] e f) T [Q] e [id] e f[w] f Q(v,w)=([v] f ) T [Q] f [w] f (2) [Q] f =([id] e f) T [Q] e [id] e f Wzór(2) warto porównać z odpowiednim wzorem dla macierzy odwzorowań liniowych Niech F będzie odwzorowaniem z przestrzeni V do przestrzeni V Wtedy do zapisania odwzorowania w postaci macierzy wystarczy jedna baza, której możemy użyć dwa razy: w dziedzinie i w obrazie, otrzymującmacierz[f] e eprzejścieodmacierzy[f] e edomacierzy[f] f fodbywasięwedług wzoru (3) [F] f f=[id] f e[f] e e[id] e f Zwróćmy uwagę na różnicę: [Q] f =([id] e f) T [Q] e [id] e f [F] f f=[id] f e[f] e e[id] e f
Z prawej strony starą macierz mnożymy przez tę samą macierz przejścia w obu przypadkach, ale z lewej jest macierz transponowana dla formy i odwrotna dla macierzy odwzorowania O tej różnicy trzeba pamiętać! Przykład6Naprzestrzeni R 2 [ ]wielomianówstopnianiewiększegoniż2rozważmyteraz formę dwuliniową daną wzorem () Q(v,w)=6 v (t)w(t)dt Użyjemy bazy standardowej do zapisania macierzy tej formy: Wyznaczamy wyrazy macierzowe: na przykład Podobnie: Q(e 3,e 2 )=6 e (t)=, e 2 (t)=t, e 3 (t)=t 2 e 3 (t)e 2(t)=6 (2t)(t)dt=6 Q(e,e )=, Q(e,e 2 )=3, Q(e,e 3 )=2, Q(e 2,e )=6, Q(e 2,e 2 )=2, Q(e 2,e 3 )=2, Q(e 3,e )=6, Q(e 3,e 2 )=, Q(e 3,e 3 )=3 Macierz tej formy ma więc postać 3 2 (5) [Q] e = 6 2 2 6 3 Używając współrzędnych(c, b, a) związanych z bazą e, tzn takich, że możemy zapisać (6) Q(v,w)=[c v b v a v ] v(t)=at 2 +bt+c=ae 3 (t)+be 2 (t)+ce (t), [v] e = 3 2 6 2 2 6 3 c w b w a w =[c v b v a v ] [ ] 2 2t 2 dt=6 3 t3 = c b a 3b w +2a w 6c w +2b w +2a w 6c w +b w +3a w, = 3c v b w +2c v a w +6b v c w +2b v b w +2b v a w +6a v c w +a v b w +3a v a w Powyższe wzory(),(5),(6) przedstawiają trzy sposoby opisania tej samej formy dwuliniowej: przy pomocy abstrakcyjnego wzoru(), przy pomocy macierzy w wybranej bazie(5), przy pomocy wzoru z użyciem współrzędnych(6) O ogólnych formach dwuliniowych to wszystko Dalej będziemy zajmować się tylko formami dwuliniowymi symetrycznymi, ponieważ takie właśnie formy pojawiają się w rachunku różniczkowym funkcji wielu zmiennych jako drugie pochodne funkcji Formy dwuliniowe symetryczne i formy kwadratowe W przykładach(2),() widzieliśmy, że formy dwuliniowej używamy często wstawiając ten sam wektor w oba miejsca przeznaczone na argument Odwzorowanie, które wówczas dostajemy: (7) V v q(v)=q(v,v) 5
6 nazywane jest formą kwadratową Nazwa bierze się stąd, że jeśli wektor pomnożymy przez stałą λ,wartośćformypomnożysięprzezλ 2 : q(λv)=q(λv,λv)=λ 2 Q(v,v)=λ 2 q(v) Forma kwadratowa związana z iloczynem skalarnym to kwadrat długości wektora: (v v)= v 2 Forma dwuliniowa symetryczna definiuje formę kwadratową wzorem(7) Okazuje się, że jeśli znamy jedynie formę kwadratową, możemy odtworzyć formę dwuliniową od której pochodzi Istotnie, obliczmy q(v+w)=q(v+w,v+w)=q(v,v)+q(v,w)+q(w,v)+q(w,w)= Q(v,v)+2Q(v,w)+Q(w,w)=q(v)+q(w)+2Q(v,w) Możemy zatem wyznaczyć Q(v, w) używając jedynie formy kwadratowej q: (8) Q(v,w)= 2 (q(v+w) q(v) q(w)) Wzór(8) nosi nazwę formuły polaryzacyjnej Formy kwadratowe i formy dwuliniowe symetryczne są we wzajemnie jednoznacznej odpowiedniości Macierzą formy kwadratowej nazywamy macierz formy dwuliniowej od której forma pochodzi Przyjrzyjmy się jak wygląda forma kwadratowa zapisana we współrzędnych Jeśli forma symetryczna Q i wektor v w bazie e mają postać Q Q 2 Q n λ Q 2 Q 22 Q 2n [Q] e =, λ 2 [v]e =, Q n Q n2 Q nn λ n to we współrzędnych Q Q 2 Q n λ q(v)=[λ λ 2 λ n Q 2 Q 22 Q 2n λ 2 ] = Q n Q n2 Q nn λ n n n λ i λ j Q ij = ii (λ i=q i ) 2 + 2Q ij λ i λ j i<j Wostatniejrównościwykorzystaliśmysymetrięmacierzy[Q] e,cospowodowałopojawieniesię czynników 2 Przykład 7 Forma kwadratowa odpowiadająca tensorowi bezwładności z przykładu() we współrzędnych(x,x 2,x 3 )związanychzbaząkanonicznąmapostać: 8 2 2 x ı(x,x 2,x 3 )=m[x x 2 x 2 ] 2 8 2 x 2 = 2 2 8 x 3 i,j= m ( 8(x ) 2 +8(x 2 ) 2 +8(x 3 ) 2 x x 2 x 2 x 3 x x 3)
Diagonalizacja Niech Q będzie formą dwuliniową symetryczną na przestrzeni V Mówimy, żebazaediagonalizujeformęqjeślimacierz[q] e jestmacierządiagonalną Twierdzenie (Lagrange) Każda forma dwuliniowa symetryczna ma bazę diagonalizującą Szkic dowodu: Dowód twierdzenia() jest konstruktywny, to znaczy polega na skonstruowaniu przykładowej bazy diagonalizującej W tym kontekście wygodniej jest pracować z formą kwadratową zamiast z formą dwuliniową Zacznijmy od konkretnego przykładu- rozważmy formęızprzykładu(7)(dlawygodyprzyjmijmym=): ı(x,x 2,x 3 )=8(x ) 2 +8(x 2 ) 2 +8(x 3 ) 2 x x 2 x 2 x 3 x x 3 Spróbujemy doprowadzić formę ı do takiej postaci, aby we wzorze występowały tylko wyrazy kwadratowe, bez mieszanych: ı(x,x 2,x 3 )=8(x ) 2 +8(x 2 ) 2 +8(x 3 ) 2 x x 2 x 2 x 3 x x 3 = 8(x ) 2 x (x 2 +x 3 )+8(x 2 ) 2 +8(x 3 ) 2 x 2 x 3 = [ 8 (x ) 2 ] 2 x (x 2 +x 3 ) +8(x 2 ) 2 +8(x 3 ) 2 x 2 x 3 Wyrażenie w nawiasie kwadatowym traktujemy jak początek rozwinięcia pełnego kwadratu: 8 [(x x2 x3 ) 2 ] 6 (x2 +x 3 ) 2 +8(x 2 ) 2 +8(x 3 ) 2 x 2 x 3 = 8(x x2 x3 ) 2 2 (x2 +x 3 ) 2 +8(x 2 ) 2 +8(x 3 ) 2 x 2 x 3 = 8(x x2 x3 ) 2 + ( (x 2 +x 3 ) 2 +6(x 2 ) 2 +6(x 3 ) 2 8x 2 x 3) 2 Zauważmy,żeczęśćzaznaczonanaczerwononiezawierawogólewspółrzędnejx Pouporządkowaniu możemy poddać ją takiej samej operacji sprowadzania do pełnych kwadratów Dla ułatwienia rachunków zajmiemy się na razie tylko częścią czerwoną: (x 2 +x 3 ) 2 +6(x 2 ) 2 +6(x 3 ) 2 8x 2 x 3 = (x 2 ) 2 2x 2 x 3 (x 3 ) 2 +6(x 2 ) 2 +6(x 3 ) 2 8x 2 x 3 = 5(x 2 ) 2 +5(x 3 ) 2 x 2 x 3 =5 [(x 2 ) 2 2 ] 3 x2 x 3 +5(x 3 ) 2 = 5 [(x 2 + 5 x3 ) 2 ] 9 (x3 ) 2 +5(x 3 ) 2 = 5(x 2 3 x3 ) 2 5 3 (x3 ) 2 +5(x 3 ) 2 =5(x 2 3 x3 ) 2 3 (x3 ) 2 Otrzymany wynik wstawiamy do wyrażenia na ı: ı(x,x 2,x 3 )=8(x x2 x3 ) 2 + 5 2 (x2 3 x3 ) 2 2 3 (x3 ) 2 Nowe współrzędne oznaczamy literą α: α =x x2 x3, 7 (9) α 2 =x 2 3 x3, α 3 =x 3
8 Jakiej bazie odpowiadają te współrzędne? Na razie jeszcze nie wiemy Jeśli jednak tę nieznaną bazęoznaczymyliterąf,towiemy,że 8 [I] f = 5 2 2 3 Jak znaleźć wektory bazowe mając odpowiadające im współrzędne? Potrzebna nam będzie zależność odwrotna do(9): x =α + α2 + 3 α3, () x 2 =α 2 + 3 α3, x 3 =α 3 Wektorv,którywbazieezapisujesięjako v=x e +x 2 e 2 +x 3 e 3 można teraz łatwo zapisać w nowej bazie, której odpowiadają współrzędne α: v=x e +x 2 e 2 +x 3 e 3 = (α + α2 + ) 3 α3 e + (α 2 + ) 3 α3 e 2 +α 3 e 3 = Wektory bazy f to wektory f =e α e +α 2 ( e +e 2 ) +α 3 ( 3 e 3 e 2+e 3 ) () f 2 = e +e 2, f 3 = 3 e 3 e 2+e 3 Znaleźliśmy jakąś bazę diagonalizującą dla formy I(oraz ı) Oczywiście taka baza nie jest jedyna Nie będziemy podawać ogólnego przepisu na diagonalizację metodą Lagranża Z przeprowadzonych dopiero co rachunków na konkretnym przykładzie wynika także algorytm dla dowolnej formy Pewien problem mogą nam sprawić tylko formy w których nie ma żadnych wyrazów kwadratowych- nie ma więc od czego zacząć algorytmu W takim przypadku należy wybraćwyrazmieszanyx i x j ipodstawić x i =α+β, x j =α β, wtedy x i x j =(α+β)(α β)=α 2 β 2 i już mamy potrzebne wyrażenia kwadratowe Wspomnieliśmy już, że baza diagonalizująca nie jest wyznaczona jednoznacznie Współczynniki, które pojawiają się na diagonali macierzy formy też mogą być bardzo różne(zależą oczywiście od bazy) Okazuje się jednak, że jest coś co od wyboru bazy diagonalizującej nie zależy Mówi o tym następujące twierdzenie
Twierdzenie2(Sylvesteraobezwładnościform)Jeśli(α,,α n )i(β,β n )sąukładami współrzędnych odpowiadających dwum bazom diagonalizującym formę kwadratową q i jeśli n n q(α,,α n )= a i (α i ) 2, q(β,,β n )= b i (β i ) 2 k= to w zbiorach A={a,α 2,a n }, B={b,b 2,b n } jest tyle samo współczynników dodatnich, tyle samo ujemnych i tyle samo zerowych Dowód:Zauważmynapoczątku,żewartośćbezwzględnąwspółczynnikówa i można wciągnąć do definicji współrzędnych(i oczywiście tym samym bazy diagonalizującej) Możemy więczałożyć,żezbioryaibskładająsięzplusiminusjedynekwspółrzędnemożnateż uporządkować tak, aby pierwsze były te ze współczynnikami +, dalej a następnie te, które mająwspółczynnikzerojeśliwspółrzędnewukładzieαwektoravoznaczymyα i (v),podobnie ze współrzędnymi β, to forma kwadratowa q we współrzędnych odpowiadających obu bazom ma postać: p α r α p q(v)= (α i (v)) 2 β r β (α pα+i (v)) 2 = (β i (v)) 2 (β pβ+i (v)) 2 i= i= Naszymzadaniemjestpokazać,żep α =p β ir α =r β Jasnejest,żep α +r α =p β +r β Jeśli jądrem q nazwiemy podprzestrzeń zdefiniowaną warunkiem i= k= i= kerq=kerq={v V: w VQ(v,w)=}, to p α +r α =p β +r β =n dimkerq Załóżmyteraz,żep β <p α,tzn Warunki p β p α < = n+p β p α <n (2) β i (v)= dla i=,,p β, α j (v)= dla j=p α +,,n zapisane w jednym z układów współrzędnych(α lub β) przyjmą postać układu równań liniowych, który składa się z mniej niż n równań Ma więc niezerowe rozwiązanie(układ równań liniowych, jednorodny, liczba równań mniejsza od wymiaru przestrzeni) Oznaczmy to rozwiązaniev Wartośćformynawektorzev wukładziewspółrzędnychαto: (3) q(v) = p α i= (α i (v )) 2 r α i= (α pα+i (v )) 2 = p α i= (α i (v )) 2 Awartośćformynawektorzev wukładziewspółrzędnychαto: p β r β r β () q(v) = (β i (v)) 2 (β pβ+i (v)) 2 = (β pβ+i (v)) 2 i= Zewzorów(3)i()wynika,że i= (5) q(v )=, Równanie(5) w połączeniu z(3) oznacza, że p α i= (α i (v )) 2 = czyli α i (v )= dla i=p α i= 9
Pamiętamyjednak(układrównań(5)),żetakżedlapozostałychindeksówα i (v )=Wygląda więcnato,żewszystkiewspółrzędnewektorav wukładzieαsąrównezerotojednakoznacza, żev =DoprowadziliśmydosprzecznościOkazujesię,żeniemożebyćp β <p α Ponieważ żadenzukładówwspółrzędnychniejestwyróżniony,niemożebyćtakżep β >p α Pozostaje zatemp β =p α,atojużgwarantuje,żer β =r α JeśliliczbęwspółczynnikówdodatnichwzbiorzeAoznaczymypaujemnychr,toparę(p,q) nazywamysygnaturąformyq(lubq)aliczbęr=p+qrzędemformyznajdowaniesygnatury formy jest ważną umiejętnością potrzebną przy badaniu ekstremów funkcji wielu zmiennych Istnieje jeszcze jedna metoda znajdowania sygnatury, nie wymagająca diagonalizowania formy Najpierw jednak trzeba przyzwoicie nauczyć się co to jest wyznacznik!