GAL (Informatyka) Wykład - formy hermitowskie Wersja z dnia 23 stycznia 2014 Paweł Bechler 1 Formy hermitowskie Niech X oznacza przestrzeń liniową nad ciałem K. Definicja 1. Funkcję φ : X X K nazywamy formą hermitowską na X, jeżeli (i) dla dowolnych x, y 1, y 2 X oraz α 1, α 2 K (ii) dla dowolnych x, y X φ(x, α 1 y 1 + α 2 y 2 ) = α 1 φ(x, y 1 ) + α 2 φ(x, y 2 ), φ(x, y) = φ(y, x). Uwaga 1. Widzimy, że forma hermitowska to taki iloczyn skalarny bez warunku dodatniej określoności, czyli nie żądamy, aby φ(x, x) > 0 dla x 0. Zauważamy jednak, że, analogicznie jak w przypadku iloczynu skalarnego: dla dowolnych x 1,, x 2, y X oraz α 1, α 2 K φ(α 1 x 1 + α 2 x 2, y) = ᾱ 1 φ(x 1, y) + ᾱ 2 φ(x 2, y); jeżeli K = R, to forma φ jest liniowa względem obu argumentów i symetryczna (φ(x, y) = φ(y, x)). Takie funkcje są nazywane formami dwuliniowymi symetrycznymi. Dla uproszczenie, tutaj będziemy posługiwać się terminem forma hermitowska także w przypadku K = R; z warunku (ii) definicji wynika, że φ(x, x) R dla każdego x X. Przykład 1. Każdy iloczyn skalarny na przestrzeni liniowej X jest formą hermitowską. Przykład 2. Dla x, y C 3 niech φ( x, y) = x 1 y 2 + x 2 y 1 i x 2 y 3 + i x 3 y 2. Funkcja φ : C 3 C 3 C jest formą hermitowską. Przykład 3. Dla x, y R 4 niech To jest forma hermitowska na R 4. φ( x, y) = x 1 y 1 2x 2 y 2 + 3x 3 y 3 4x 4 y 4. 1
2 Macierz formy hermitowskiej Definicja 2. Macierz formy hermitowskiej φ : X X K w bazie x 1, x 2,..., x n przestrzeni X jest zdefiniowana jako M = [φ(x i, x j )] n i,j=1. Przykład 4. Macierz formy φ( x, y) = x 1 y 2 + x 2 y 1 i x 2 y 3 + i x 3 y 2 na C 3 w bazie e 1, e 2, e 3 to 0 1 0 1 0 i 0 i 0 Macierz formy φ( x, y) = x 1 y 1 2x 2 y 2 + 3x 3 y 3 4x 4 y 4 na R 4 w bazie standardowej to diag(1, 2, 3, 4). Uwaga 2. Z warunku (ii) w definicji formy hermitowskiej wynika, że macierz M jest hermitowska, czyli M H = M (lub symetryczna w przypadku rzeczywistym) Stwierdzenie 1. M jest macierzą formy hermitowskiej φ : X X R w bazie x 1,..., x n wtedy i tylko wtedy, gdy dla dowolnych x, y X, n x = α i x i, n y = β n x n, i=1 j=1 gdzie α = [α 1,..., α n ] T, β = [β 1,..., β n ] T, zachodzi φ(x, y) = α H M β. (1) Dowód. Załóżmy, że M jest macierzą formy φ. Obliczamy φ(x, y) = φ ( α i x i, i j ) β j x j = ᾱ i β j φ(x i, x j ) = α H Mβ. Z drugiej strony, jeżeli zachodzi (1), to φ(x i, x j ) = e H i M e j jest to element w i-tym wierszu i j-tej kolumnie macierzy M. Stwierdzenie 2. Jeżeli M jest macierzą formy hermitowskiej φ : X X R w bazie x 1,..., x n, natomiast y 1,..., y n jest inną bazą przestrzeni X, to macierz formy φ w tej bazie jest równa C H MC, gdzie C to macierz zmiany bazy z y 1,..., y n na x 1,..., x n i,j Dowód. Jeżeli x = n i=1 ξ i y i, y = n j=1 η i y i, to x = n i=1 α i x i, y = n j=1 β n x n dla α = C ξ, β = C η oraz φ(x, y) = α H M β = (C ξ) H M(C η) = ξ H (C H MC) η. 2
Przykład 5. Jeżeli A = A H K n,n, to φ( x, y) = x H A y jest formą hermitowską na K n. Zarazem A to macierz formy φ w bazie standardowej. Aby powiedzieć później coś więcej o formach, zbadamy teraz własności macierzy hermitowskich. Twierdzenie 3. Dla dowolnej macierz hermitowskiej A = A H K n,n istnieje macierz ortogonalna/unitarna C K n,n oraz macierz diagonalna D R n,n taka, że A = C H DC. Uwaga 3. Inaczej mówiąc, macierz A jest podobna do macierzy diagonalnej, a macierz podobieństwa jest ortogonalna/unitarna. Możemy też powidzieć, że macierz Jordana macierzy A jest rzeczywistą macierzą diagonalną i istnieje ortonormalna baza Jordana, złożona z wektorów własnych macierzy A. Dowód. Macierz A traktujemy jako element C n,n. Niech x, y = x H y oznacza standardowy iloczyn skalarny na C n. Rozważamy endomorfizm F L(C n ) dany wzorem F ( x) = A x. Zauważmy, że 1. Dla dowolnych wektorów x, y X zachodzi równość F ( x), y = x, F ( y). Uzasadnienie: F ( x), y = (A x) H y = x H A y = x, F ( y). 2. Jeżeli λ 1 jest wartością własną przekształcenia F, to λ 1 R. Uzasadnienie: Niech x 1 K n będzie takim wektorem, że x 1 = 1 i F ( x 1 ) = λ 1 x 1. Wtedy λ 1 = λ 1 x 1, x 1 = x 1, λ 1 x 1 = x 1, F ( x 1 ) czyli λ 1 R. = F ( x 1 ), x 1 = λ 1 x 1, x 1 = λ 1 x 1, x 1 = λ 1, 3. Jeżeli λ 1 i λ 2 to dwie różne wartości własne przekształcenia F, to odpowiadające im podprzestrzenie własne V λ1 i V λ2 są ortogonalne, czyli dla v 1 V λ1, v 2 V λ2 mamy v 1, v 2 = 0. Uzasadnienie: Możemy założyć, że λ 1 0. Mamy, Wobec punktów 1 i 2 v 1, v 2 = 1 λ 1 λ 1 v 1, v 2 = 1 λ 1 F ( v 1 ), v 2 = 1 λ 1 v 1, F ( v 2 ) = 1 λ 1 v 1, λ 2 v 2 = λ 2 λ 1 v 1, v 2. Zatem ( 1 λ 2 λ 1 ) v1, v 2 = 0. Ponieważ λ 1 λ 2, więc v 1, v 2 = 0. 3
4. Jeżeli V jest podprzestrzenią niezmiennniczą dls F (czyli F (V ) V ), to V też jest podprzestrzenią niezmienniczą dla F Uzasadnienie: Niech v V, w V. Mamy 0 = v, w = F ( v), w = v, F ( w), czyli F ( w) V. Niech λ 1,..., λ k to wszystkie wartości własne F, a V λ1,... V λk to odpowiadające im podprzestrzenie własne. Z punktu 3. wynika, że możemy rozpatrywać ich sumę prostą V = V λ1 V λ2... V λk K n. Pokażemy, że V = K n. Podprzestrzeń V jest niezmiennicza dla F i K n = V V. Z punktu 4, V też jest podprzestrzenią niezmienniczą dla F, więc f = F V L(V ). Wielomian charakterystyczny przekształcenia f jest dzielnikiem wielomianu charakterystycznego F 1, więc każda wartość własna f jest też wartością własną F i każdy wektor własny f jest wektorem własnym F, a więc należy do jednej z przestrzeni V λj. To jest możliwe tylko wtedy, gdy V = {0}. Zatem V = K n, czyli K n = V λ1 V λ2... V λk. Niech teraz x 1,..., x n będzie bazą ortonormalna K n, otrzymaną z baz ortonormalnych wszystkich podprzestrzeni V λj. Niech C oznacza macierz zmiany bazy z e 1,..., e n na x 1,... x n. C jest macierzą ortogonalną (lub unitarną), jako macierz zmiany bazy ortonormalnej na bazę ortonormalną, i C 1 = C H = [ x 1,..., x n ]. Określmy λ 1 I r1 D = λ 2 I r2... λkirk, r j = dim V λj. D to macierz przekształcenia F w bazie x 1,..., x n. Zatem A = C 1 DC = C H DC. Na koniec zauważmy, że skoro wszystkie wartości własne F są rzeczywiste, to, gdy K = R, możemy znaleźć bazy odpowiednich podprzestrzeni własnych złożone również z wektorów rzeczywistych, więc gdy A = A T R n, to znajdziemy macierz ortogonalną C. Wniosek 4. Jeżeli φ : X X K jest formą hermitowską na X, to istnieje baza x 1,..., x n przestrzeni X, w której macierz formy φ jest diagonalna i rzeczywista. Dowód. Niech A to macierz formy φ w pewnej bazie y 1,..., y n. Wtedy A = C H DC, gdzie D jest diagonalna i rzeczywista, natomiast C to macierz zmiany bazy z y 1,..., y n na x 1,..., x n. 1 zob. stw. 7. w wykładzie o zagadnieniu własnym 4
3 Określoność form hermitowskich Definicja 3. Powiemy, że forma hermitowska φ : X X K jest (i) dodatnio określona, jeżeli φ(x, x) > 0 dla każdego x X \ {0}, (ii) ujemnie określona, jeżeli φ(x, x) < 0 dla każdego x X \ {0}, (iii) nieokreślona, jeżeli φ(x, x) > 0 dla pewnego x X oraz φ(y, y) < 0 dla pewnego y X. Uwaga 4. Każda dodatnio określona forma hermitowska φ : X X K jest iloczynem skalarnym na X. Przykład 6. Na R 2 forma φ( x, y) = αx 1 y 1 + βx 2 y 2 jest dodatnio określona dla α, β > 0, ujemnie określona dla α, β < 0, nieokreślona dla α > 0 i β < 0. Natomiast gdy α = 0 lub β = 0, to forma φ nie jest ani dodatnio, ani ujemnie określona, i również nie jest nieokreślona. Uwaga 5. Jeżeli φ jest formą hermitowską na X, to funkcja f(x) = φ(x, x) jest nazywana formą kwadratową na X. Można więc równoważnie mówić o dodatnio określonych / ujemnie określonych / nieokreślonych formach kwadratowych. Definicja 4. Macierz hermitowska A = A H K n,n jest dodatnio (ujemnie) określona jeżeli forma hermitowska φ( x, y) = x H A y jest dodatnio (ujemnie) określona. Uwaga 6. Forma hermitowska φ jest dodatnio (ujemnie) określona wtedy i tylko wtedy, gdy jej macierz w pewnej (każdej) bazie jest dodatnio (ujemnie) określona. Stwierdzenie 5. Jeżeli macierz A = A H K n,n jest dodatnio określona, to det n A > 0. Dowód. Niech φ( x, y) = x H A y. Forma φ jest dodtanio określona. Istnieje baza ortonormalna x 1,..., x n, w której macierz φ jest diagonalna i rzeczywista: D = diag(λ 1,..., λ n ). Mamy λ j = φ( x j, x j ) > 0. Dla C = [ x 1,... x n ] mamy A = C H DC i det A = det(c H DC) = det(c H ) det C det D = det C det C det D = det C 2 det D = det C 2 λ 1... λ n > 0. Twierdzenie 6 (Kryterium Sylvestera). Załóżmy, że φ : X X K jest formą hermitowską na przestrzeni liniowej X, x 1,..., x n to baza X i A k = [φ(x i, x j )] k i,j=1 dla k = 1,..., n. Wówczas forma φ jest (a) dodatnio określona wtedy i tylko wtedy, gdy det k A k > 0 dla k = 1,..., n, (b) ujemnie określona wtedy i tylko wtedy, gdy ( 1) k det k A k > 0 dla k = 1,..., n. 5
Dowód. (a): Niech V k = span(x 1,..., x k ) Jeżeli forma φ jest dodatnio określona, to każda z form φ k = φ Vk V k, k = 1,..., n jest dodatnio określona, natomiast A k to macierz formy φ k w bazie x 1,..., x k. Ze stw. 5 wynika, że det k A k > 0. Załóżmy teraz, że det k A k > 0 dla k = 1,..., n. Stosujemy indukcję po n = dim X. Dla n = 1 mamy det 1 A 1 = φ(x 1, x 1 ) > 0, co oznacza dodatnią określoność formy φ na X = span(x 1 ). Załóżmy teraz, że dowodzona implikacja zachodzi dla dowolnej przestrzeni wymiaru n 1. Skonstrujemy w X bazę y 1,..., y n, w której macierz φ jest diagonalna, z dodatnimi wyrazami na przekątnej. Niech V n 1 = span(x 1,..., x n 1 ). A n 1 to macierz formy φ w bazie x 1,..., x n. Na mocy założenia indukcyjnego forma φ n 1 = φ Vn 1 V n 1 jest dodatnio określona, czyli zadaje ona iloczyn skalarny u, v = φ(u, v) na podprzestrzeni V n 1. Niech y 1,... y n 1 to dowolna baza ortonormalna podprzestrzeni V n 1 (np. otrzymana z bazy x 1,... x n 1 przez ortogonalizację Grama-Schmidta). Macierz formy φ n 1 w bazie y 1,..., y n 1 to I n 1. Niech y n = x n n 1 j=1 φ(y j, x n )y j. Zauważmy, że y n X \V n 1, wiec układ y 1,..., y n 1, y n jest bazą przestrzeni X. Ponadto, dla j = 1,..., n 1, z ortogonalności układu y 1,..., y n 1 φ(y j, y n ) = φ ( φ j, x n = φ(y j, x n ) n 1 i=1 n 1 i=1 = φ(y j, x n ) φ(y j, x n ) = 0, Zatem macierz formy φ w bazie y 1,..., y n to φ(y)i, x n )y j ) φ(y j, x n )φ(y i, y j ) D = [φ(y 1, y j )] n i,j=1 = diag(1,..., 1, φ(y n, y n )). Ponieważ A n to macierz φ w bazie x 1,..., x n, więc A n = C H DC, gdzie C jest macierzą zmiany bazy z x 1,..., x n na y 1,..., y n. Ponadto 0 < det A n = det(c H DC) = det(c H ) det C det D = det C det C det D = det C 2 φ(y n, y n ), więc φ(y n, y n ) > 0, czyli wszystkie wyrazy na przekątnej macierzy D są dodatnie. (b): Jeżeli forma φ jest ujemnie określona, to forma ψ(x, y) = φ(x, y) jest dodatnio określona; jeżeli forma φ ma macierz A, to forma ψ ma macierz A. Teraz stosujemy punkt (a) do formy ψ i korzystamy z własności wyznacznika. 6