Rozdział 7 Wartości i wektor własne Niech X będzie skończenie wmiarową przestrzenią liniową nad ciałem F = R lub F = C. Niech f : X X będzie endomorfizmem, tj. odwzorowaniem liniowm przekształającm przestrzeń liniową w nią samą. Definicja 7.1. Skalar λ F nazwam wartością własną endomorfizmu f jeżeli istnieje niezerow wektor v X, taki że f (v) = λv; (7.1) wektor v nazwam wektorem własnm odpowiadającm wartości własnej λ. Zachodzi następujące Twierdzenie 7.1. Dla endomorfizmu f : X X następujące warunki są równoważne: (a) λ jest wartością własną f; (b) ker(f λid X ) {}; (c) det(a f λi) =, gdzie A f jest macierzą endomorfizmu f (w dowolnej bazie przestrzeni X). Niech teraza = [a ij ] F n n będzie dowolną macierzą, ax n wmiarową przestrzenią liniową o bazie e 1,...,e n. Możem skonstruować endomorfizm f : X X, którego macierzą w ustalonej bazie e 1,...,e n jest macierz A. Endomorfizm ten wstarcz zdefiniować na wektorach bazowch (co z innmi wektorami?) w następując sposób: n f (e i ) = a ji e j j=1 (i = 1,...,n). Pojęcia wartości własnej oraz wektora własnego w sposób naturaln przenoszą się więc na macierze. 46
Wartości i wektor własne Definicja 7.2. Skalar λ F nazwam wartością własną macierz A F n n jeżeli istnieje niezerow wektor v F n, taki że Av = λv; wektor v nazwam wektorem własnm odpowiadającm wartości własnej λ. Zbiór wszstkich wartości własnch macierz A oznaczam σ(a) i nazwam widmem macierz A. Prawdziwe jest następujące twierdzenie. Twierdzenie 7.2. Dla macierz A F n n następujące warunki są równoważne: (a) λ jest wartością własną A; (b) układ równań (A λi)v = ma niezerowe rozwiązanie; (c) det(a λi) =. Dla dowolnej macierz A F n n odwzorowanie ϕ A (λ) = det(a λi) jest wielomianem stopnia n (ćwiczenie), którego pierwiastkami są wartości własne macierz A. Wielomian ϕ A nazwam wielomianem charakterstcznm macierz A. Uwaga 7.1. Jeżeli element macierz A F n n należą do ciała F, które jest algebraicznie domknięte (tzn. każd wielomian stopnia n o współcznnikach z ciała F ma n pierwiastków w ciele F) to macierz A posiada n wartości własnch (liczonch z krotnościami). Jeżeli natomiast element macierz są elementami ciała, które nie jest algebraicznie domknięte (takim ciałem jest na przkład ciało liczb rzeczwistch!), to macierz ta może nie mieć wartości własnch (zob. przkład 7.4 poniżej). Przpuśćm, że λ 1,...,λ n σ(a) są wartościami własnmi macierz A F n n. Wówczas, wielomian charakterstczn ϕ A macierz A możem zapisać w postaci ϕ A (λ) = a n λ n +a n 1 λ n 1 +...+a 1 λ+a = a n (λ λ 1 ) (λ λ n ). Łatwo wkazać, że a n = ( 1) n oraz, uwzglęniając wzor Viète a, λ 1... λ n = a = deta, λ 1 +...+λ n = ( 1) n+1 a n 1 = tr(a), gdzie tr(a) = a 11 +...+a nn to ślad macierz A. Własności widma macierz (A F n n ): a) λ σ(a), k N λ k σ ( A k) ; b) λ σ(a), deta λ 1 σ ( A 1) ; c) λ σ(a), α F αλ σ(αa); d) λ σ(a) λ σ(a ) (w szczególności: λ σ(a) λ σ ( A T) ). Ćwiczenie Uzasadnić powższe własności. Przkład 7.1. Wznaczm wartości oraz wektor własne macierz 1 2 A = 2. 2 2 1 47
7.1. Twierdzenie Calea-Hamiltona Ponieważ ϕ A (λ) = det(a λi) = (1 λ)(2 λ)(1+λ), zatem macierz A ma trz różne wartości własne: λ 1 = 1,λ 2 = 1,λ 3 = 2. Dla każdej z nich wznaczm wektor własn: dla λ 1 = 1 mam: 2 2 3 2 2 x z 2x+2 3 2x 2 skąd otrzmujem (x,,z) = (,,t), t R; przkładow wektor własn v λ1 = (,,1); dla λ 2 = 1 mam: 2 1 2 2 2 x z 2 2x 2 2z skąd otrzmujem (x,,z) = (t,, t), t R; przkładow wektor własn v λ2 = (1,, 1); dla λ 3 = 2 mam: 1 2 2 2 3 x z x+2 2x 2 3z skąd otrzmujem (x,,z) = (2t,t, 2t), t R; przkładow wektor własn v λ3 = (2,1, 2). 7.1. Twierdzenie Calea-Hamiltona Rozważm macierz kwadratową A C n n oraz wielomian w postaci w(s) = a m s m +...+a 1 s+a. Możem wówczas utworzć macierz w(a) określoną jako w(a) = a m A m +...+a 1 A+a I n. Definicja 7.3 (wielomian zerując). Jeżeli w(a) = n to wielomian w nazwam wielomianem zerującm (wielomianem anulującm) macierz A. Ptanie jakie może się nasunąć jest następujące cz dla każdej macierz istnieje wielomian zerując? Odpowiedź jest zawarta w poniższm twierdzeniu. Twierdzenie 7.3 (Cale Hamilton). Wielomian charakterstczn macierz kwadratowej jest jej wielomianem zerującm. Przkład 7.2 (odwracanie macierz). Rozważm macierz A R 3 3 postaci A = 1 2 1 2 3 2. 48
7.2. Podprzestrzeń własna Jej wielomian charakterstczn ma postać 1 λ 2 1 ϕ(λ) = 2 λ 3 2 λ = λ3 +λ 2 6λ+12. Ponieważ ϕ() = 12 zatem macierz A jest nieosobliwa. Wznaczm teraz jej odwrotność. Na podstawie twierdzenie Calea Hamiltona możem napisać A 3 +A 2 6A+12I 3 = 3 lub równoważnie 1 12 A( A 2 ) A+6I 3 = I3. Oznacza to, na podstawie definicji macierz odwrotnej, że A 1 = 1 ( A 2 ) 1 A+6I 3 = 12 12 = 1 12 6 6 2 1 4 4. 5 2 5 4 4 2 2 4 2 1 2 1 2 3 2 + 6 6 6 7.2. Podprzestrzeń własna Niech A F n n oraz niech λ σ(a). Zbiór V λ = {v F n : Av = λv} składa się z oraz wszstkich wektorów własnch odpowiadającch wartości własnej λ. Ponieważ V λ = ker{x (A λi)x} zatem zbiór ten jako jądro endomorfizmu jest podprzestrzenią liniową przestrzenif n ; jest to tak zwana podprzestrzeń własna macierza (ew. podprzestrzeń własna endomorfizmu wznaczonego przez macierz A) odpowiadająca wartości własnej λ. Przkład 7.3. Ponieważ macierz z przkładu 7.1 ma trz różne wartości własne, zatem możem dla niej wznaczć trz podprzestrzenie własne: V λ1 = { (x,,z) R 3 : x = =,z = t,t R } ; V λ2 = { (x,,z) R 3 : x = t, =,z = t,t R } ; V λ3 = { (x,,z) R 3 : x = 2t, = t,z = 2t,t R }. Udowodnim teraz twierdzenie, z którego wnika bardzo ważna własność podprzestrzeni własnch odpowiadającch różnm wartościom własnm. Twierdzenie 7.4. Różnm wartościom własnm macierz A F n n odpowiadają liniowo niezależne wektor własne. Dowód: Niech λ 1,...,λ k (k n) będą różnmi wartościami własnmi macierz A, a v i V λi (i = 1,...,k) odpowiadającmi im wektorami własnmi. Należ wkazać warunek α 1 v 1 +...+α k v k = α 1 =... = α k =. (7.2) 49
7.3. Diagonalizowalność Dowód poprowadzim przez indukcję względem k. Dla k = 1 teza zachodzi (wektor zerow, mimo że należ do każdej podprzestrzeni własnej, nie jest wektorem własnm). Załóżm, że teza zachodzi dla dowolnch k 1 wektorów własnch odpowiadającch różnm wartościom własnm oraz, dla dowodu nie wprost, przpuśćm, że warunek (7.2) nie jest spełnion. Oznacza to, że dla pewnego i {1,...,k} : Dla dowolnego r i mam α 1 v 1 +...+α k v k = oraz α i. =(A λ r I)(α 1 v 1 +...+α k v k ) = α 1 (A λ r I)v 1 +...+α k (A λ r I)v k = =α 1 (λ 1 λ r )v 1 +...+α r 1 (λ r 1 λ r )v r 1 +α r+1 (λ r+1 λ r )v r+1 + +...+α k (λ k λ r )v k skąd, na podstawie założenia indukcjnego, wnika, że wszstkie współcznniki α m (λ m λ r ) są zerami; w szczególnościα i (λ i λ r ) =. Ponieważλ i λ r, zatemα i =, wbrew założeniu. 7.3. Diagonalizowalność Niech f : X X będzie endomorfizmem. Definicja 7.4. Endomorfizm f jest diagonalizowaln, jeżeli istnieje baza przestrzeni X w której macierz tego endomorfizmu jest diagonalna. Pojęcie diagonalizowalności można również wprowadzić w zbiorze macierz. Zanim to zrobim wprowadzim w zbiorze macierz relację podobieństwa. Definicja 7.5. Niech A,B F n n. Mówim, że macierz A jest podobna do macierz B (ozn. A B) jeżeli istnieje macierz nieosobliwa P F n n, taka że A = PBP 1. (7.3) Łatwo wkazać (ćwiczenie), że relacja podobieństwa macierz jest relacją równoważności, tzn. jest: zwrotna, tj. A A; smetrczna, tj. A B B A; przechodnia, tj. A B,B C A C. Przpuśćm teraz, że A B. Oznacza to, że A = PBP 1, dla pewnej macierz nieosobliwej P. Mam: ϕ A (λ) = det(a λi) = det ( PBP 1 λi ) = detp (B λi)p 1 = = detp det(b λi)detp 1 = ϕ B (λ) co oznacza, że macierze podobne mają ten sam wielomian charakterstczn; w konsekwencji mają one również identczne wartości własne. Definicja 7.6. Macierz A F n n jest macierzą diagonalizowalną, jeżeli jest podobna do macierz diagonalnej. Zanim podam twierdzenie charakterzujące macierze diagonalizowalne rozważm następując przkład. 5
7.3. Diagonalizowalność Przkład 7.4. Niech A 1,A 2 R n n będą macierzami postaci 1 1 1 1. A 1 = I =............., A. 2 =............. 1... 1... 1. Macierze te mają ten sam wielomian charakterstczn ϕ A1 (λ) = ϕ A2 (λ) = (1 λ) n. Ponieważ widma macierz A 1 oraz A 2 są jednoelementowe σ(a 1 ) = σ(a 2 ) = {1}, możem dla każdej z nich wznaczć po jednej przestrzeni własnej. Dla macierz A 1 mam: V (1) λ=1 = {x Rn : x = x} = R n. Ponieważ dimv (1) λ=1 = n, więc możem wbrać dokładnie n liniowo niezależnch wektorów własnch macierz A 1 odpowiadającch jej jednej wartości własnej λ = 1. Dodatkowo, macierz A 1 jako macierz diagonalna jest w sposób oczwist macierzą diagonalizowalną. Z kolei dla macierz A 2 mam V (2) λ=1 = {x Rn : A 2 x = x} = {x R n : (A 2 I)x = }. Ponieważ rank(a 2 I) = n 1, zatem na podstawie twierdzenia Kroneckera Capellego wnioskujem, że układ równań (A 2 I)x = ma nieskończenie wiele rozwiązań zależnch od jednego parametru; tm samm dimv (2) λ=1 = 1. Oznacza to, że dla macierz A 2 znajdziem tlko jeden liniowo niezależn wektor własn odpowiadając jej jednej wartości własnej λ = 1. Ponadto, macierz A 2 nie jest diagonalizowalna. Jedną macierzą diagonalną, do której macierz A 2 mogłab bć podobna, jest macierz jednostkowa (macierze podobne mają te same wartości własne). Musiałab więc istnieć macierz nieosobliwa P spełniająca warunek któr nie jest prawdziw. A 2 = PIP 1 = I, Możliwość diagonalizacji macierz A 1 oraz brak możliwości diagonalizacji macierz A 2 jest wnikiem tego, że dla macierz A 1 możem wbrać tle liniowo niezależnch wektorów własnch, ile wnosi krotność wartości własnej jako pierwiastka wielomianu charakterstcznego; dla macierz A 2 warunek ten nie jest spełnion. Prawdziwe jest następujące Twierdzenie 7.5. Macierz A F n n jest diagonalizowalna wted i tlko wted, gd (a) jej wielomian charakterstczn ma n pierwiastków w ciele F (liczonch z krotnościami); 51
(b) dla każdej wartości własnej macierz A można wbrać tle liniowo niezależnch wektorów własnch, ile wnosi krotność tej wartości własnej jako pierwiastka wielomianu charakterstcznego. Dowód: Przpuśćm, że macierz A jest diagonalizowalna. Oznacza to, że istnieją macierz diagonalna B = diag(b 1,...,b n ), b i F oraz macierz nieosobliwa P F n n, dla którch A = PBP 1, lub równoważnie AP = PB. (7.4) Niech P = [p 1,...,p n ], gdzie p i F n (i = 1,...,n). Ponieważ oraz AP = A[p 1,...,p n ] = [Ap 1,...,Ap n ] PB = [p 1,...,p n ]diag(b 1,...,b n ) = [b 1 p 1,...,b n p n ], zatem z warunku (7.4) otrzmujem, że Ap i = b i p i (i = 1,...,n). (7.5) Z warunku (7.5) wnika, że wektor p 1,...,p n są liniowo niezależnmi wektorami własnmi macierz A odpowiadającmi wartościom własnm b 1,...,b n. Przpuśćm teraz, że macierz A posiada n liniowo niezależnch wektorów własnch v 1,...,v n F n odpowiadającch wartościom własnm λ 1,...,λ n F. Niech V = [v 1,...,v n ] F n n. Macierz V jest nieosobliwa (dlaczego?). Ponadto: AV = A[v 1,...,v n ] = [Av 1,...,Av n ] = [λ 1 v 1,...,λ n v n ] = V diag(λ 1,...,λ n ), skąd wnika, że A = V diag(λ 1,...,λ n )V 1. Macierz A jest więc diagonalizowalna. Zanotujm na koniec, że twierdzenie 7.4, mimo że sformułowane dla macierz, pozostaje słuszne również dla dowolnego endomorfizmu f : X X, gdzie X jest skończenie wmiarową przestrzenią wektorową nad ciałem F. W szczególności, jeżeli f jest endomorfizmem diagonalizowalnm to istnieje baza przestrzeni X złożona z wektorów własnch endomorfizmu f, prz której macierz tego endomorfizmu jest diagonalna. Przkład 7.5. Niech A R 2 2 będzie macierzą postaci [ ] 1 A =. 1 Ponieważ ϕ A (λ) = λ 2 + 1, zatem macierz A nie ma rzeczwistch wartości własnch nie jest więc diagonalizowalna w klasie macierz R 2 2. Ta sama macierz traktowana jako element przestrzeni C 2 2 ma dwie różne wartości własne λ 1 = i, λ 2 = i, którm odpowiadają liniowo niezależne wektor własne równe odpowiednio v 1 = ( i,1) oraz v 2 = (i,1). Z dowodu twierdzenia 7.4 wnika, że A = P diag(i, i)p 1, gdzie [ ] i i P = [v 1,v 2 ] =. 1 1 [ ] Faktcznie, ponieważ P 1 = 1 i 1 2, zatem i 1 P diag(i, i)p 1 = 1 2 [ i i 1 1 ][ i i ][ i 1 i 1 ] = [ 1 1 ] = A.