Dość często przy rozwiązywaniu problemów naukowych czy technicznych pojawia się konieczność rozwiązania dość specyficznego układu równań: Zależnego od n nieznanych zmiennych i pewnego parametru. Rozwiązaniem układu równań jest tzw. wektor własny : przynależny do wartości własnej Rozwiązanie sprowadz się do znalezienia rozwiązania problemu własnego. Powyższy układ równań wygodniej jest zapisać w postaci macierzowej: gdzie: A jest macierzą nxn zawierającą współczynniki układu. 1
Nie zawsze układ równań, którego chcemy znaleźć rozwiązanie, przyjmuje tak prostą postać. Nierzadko mamy do czynienia z tzw. uogólnionym problemem własnym: gdzie: B jest macierzą nxn. Jeśli macierz B jest nieosobliwa to problem uogólniony można przekształcić do postaci: czyli do problemu własnego w podstawowej wersji. Konwersja problemu uogólniego do standardowego problemu wiąże się z koniecznością znalezienia macierzy B -1 czyli wykonaniem dodatkowych obliczeń. 2
Pojęcia podstawowe. Def. Liczbę nazywamy wartością własną macierzy jeśli istnieje taki niezerowy wektor x dla którego zachodzi: Wektor x nazywamy (prawostronnym) wektorem własnym przynależnym do wartości własnej. Ciąg wszystkich wartości własnych nazywamy widmem macierzy A -Sp(A). Z powyższej definicji wynika: Macierz (A- I) jest osobliwa, więc: Wyznacznik ten jest wielomianem stopnia n zmiennej : Każda wartość własna jest pierwiastkiem wielomianu charakterystycznego macierzy A. 3
Def. Wartości i wektroy własne macierzy transponowanej A T nazywamy lewostronnymi wartościami i lewostronnymi wektorami własnymi macierzy A. Wyznacznik macierzy po jej transponowaniu nie ulega zmianie. Dlatego widmo macierzy A jest równe widmu lewostronnemu. Tw. Jeżeli p jest wartością własną macierzy, a l jest jej lewostronną wartością własną oraz gdy Wówczas wektor własny x l jest ortogonalny do lewostronnego wektora własnego x p. Dla macierzy symetrycznej A=A T wektory własne są zarazem wektorami lewostronnymi. Jeżeli więc wektory własne przynależą do różnych wartości własnych to są do siebie ortogonalne. 4
Def. Macierze A i B są podobne jeśli istnieje nieosobliwa macierz podobieństwa P, że: Tw. Jeżeli macierze A i B są podobne to mają identyczne widmo wartości własnych. Tw. Macierz Q mxn (m n) nazywamy ortogonalną jeśli: Tw. Jeżeli macierz Q nxn jest ortogonalna to: Tw. Macierz symetryczna A jest ortogonalnie podobna do macierzy diagonalnej D: Tw. Wartości własne macierzy symetrycznej są rzeczywiste. 5
Tw. (Schura) Suma kwadratów modułów wartości własnych jest ograniczona od góry przez kwadrat normy euklidesowej: Tw. Widmo macierzy ulega przesunięciu po dodaniu do niej macierzy jednostkowej pomnożonej przez liczbę: Widmo: zostaje zastąpione przez: 6
Tw. (Gershgorina) Niech C i oznaczają koła domkniete na płaszczyźnie zespolonej o środkach w punktach a ii (elementy diagonalne macierzy A) i promieniach równych sumie modułów elementów z danego wiersza diagonali: wówczas: Jeżeli k kół C i tworzy zbiór rozłączny z pozostałymi kołami, to w zbiorze tym leży dokładnie k wartości wlasnych macierzy A. Wnioski: 1) Jeżeli macierz jest symetryczna i diagonalnie dominująca o nieujemnych elementach na diagonali, to jest nieujemnie okreslona, a jeśli jest ona dodatkowo nieosobliwa to jest dodatnio określona. Macierz symetryczna silnie diagonalnie dominująca jest dodatnio okreslona wtedy i tylko wtedy gdy elementy na diagonali są dodatnie. 2) W każdym kole rozłącznym z pozostałymi leży dokładnie jedna wartość własna. 7
Lokalizacja i obliczanie wartości własnych. Wartości własne macierzy A leżą na płaszczyźnie zespolonej i zawarte są w kole o środku w 0 i promieniu równym promieniowi spektralnemu tej macierzy. Ponieważ: więc można przyjać że: Widma wartości własnych i lewostronnych wartości własnych są identyczne. Aby otrzymać lepsze oszacowanie położenia wartości własnych można więc zastosować twierdzenie Geshgorina dla A T. Koła zawierające wartości własne mają środki w a ii i promienie równe sumie modułów pozostałych elementów w i-tych kulmnach. Przykład. Podać lokalizację wartości własnych macierzy 8
a) najgorsze oszacowanie lokalizacja w kole o promieniu 4 b) tw. Gershgorina lokalizacja w kole o promieniu 3 c) tw. Gershgorina dla A T jedno z kół jest odseparowane (C' 3 )i zdegenerowane znajduje się w nim dokładnie jedna wartośćwłasna ( =2) - najlepsze oszacowanie 9
Metoda potęgowa wyznaczania pojedynczych wartości własnych i wektorów własnych. Sposób postępowania: 0) Ustalamy maksymalną liczbę iteracji ITM i wybiramy wektor x 0, tak aby: 1) obliczamy wektor v i+1 : oraz liczbę: Jeżeli m i+1 =0 to przerywamy obliczenia. W przeciwnym razie obliczamy: 2) sprawdzamy warunek: i < ITM. Jeśli tak to dokonujemy podstawienia i=i+1 i powtarzamy krok 1. Jeżeli ciąg wektorów: x 0,x 2,x 4,..x 2j,... jest zbieżny do ustalonego wektora x, wówczas ciąg wartości: m 1,m 2,m 3,... jest zbieżny do pewnej liczby m. W takim przypadku może być realizowany jeden z 2 wariantów: 1) 2) 10
W obu przypadkach norma wektora wynosi Wartości i wektory własne a wartość własna jest równa: lub Tw. Jeżeli wśród wartości własnych macierzy A nie ma różnych wartości własnych o równych modułach, to przy dowolnym wektorze startowym x 0, ciąg wektorów x 0,x 2,x 4,... jest zbieżny. Zbieżność metody potęgowej można zwiększyć przesuwając widmo macierzy A: Jeśli wartości własne zostały wyznaczone inną metodą to metoda potegowa może posłużyć do obliczania wektorów własnych. Najlepszą zbiezność do wektora własnwego odpowiadajacego wartości własnej 1 uzyskuje się przesuwając widmo: gdzie: i jest nastepną w kolejności wartością własną po 1 ale różną od niej. Najlepszą zbieżność do wektora odpowiadającego wartości n uzyskuje się dla gdzie: i wartością własną poprzedzającą n 11
Algorytm LR i QR wyznaczania wartości własnych. Metoda LR jest to metodą iteracyjną. W pierwszej iteracji przyjmujemy: W każdej kolejnej iteracji wyznaczamy rozkład A i w postaci: gdzie: L i jest macierzą dolną z jedynkami na diagonali, a R i macierzą trójkątną górną. Rozkład taki można znaleźć przy użyciu metody eliminacji Gaussa. Rozkład ten pozwala przekształcić macierz A i do postaci A i+1 zgodnie z wzorem: Postępując w ten sposób, po wielu iteracjach przekształcamy pierwotną macierz A w macierz trójkatną górną. Wówczas otrzymujemy relację pomiędzy elementami diagonalnymi macierzy trójkatnej a wartościami własnymi macierzy A: gdzie: a ii są elementami diagonalnymi macierzy A i. Wadą rozkładu tego jest fakt, że nie zawsze można znaleźć rozkład macierzy A i w postaci iloczynu LR. Powodem może być złe uwarunkowanie rozkładu. 12
Z metody LR wywodzi się metoda QR. W metodzie tej, podobnie jak w metodzie LR w każdej iteracji dokonujemy macierzy A i. Rozkład ten ma postać: gdzie: R i jest macierzą trójkątna górną, a Q i jest macierzą ortogonalną lub dla macierzy zespolonej W podstawowej wersji metody QR po wykonaniu wielu iteracji (przekształceń), otrzymujemy macierz A i+1 na diagonali której znajdują się wartości własne macierzy A. Wynika to z faktu podobieństwa macierzy w dwóch kolejnych iteracjach: Macierz A i+1 jest podobna do macierzy A i, A i-1,...,a 1. Wadą podstawowej wersji metody QR jest duża czasochłonność. Przekształcenie A i do postaci A i+1 wymaga nakładu obliczeń rzędu n 3. 13
Algorytm QR dla macierzy Hessenberga. Macierzą (górną) Hessenberga jets macierz, którą można zapisać w postaci: gdzie: T jest macierzą trójdiagonalną a U jest macierzą trókatną górną. Każda macierz kwadratowa jest ortogonalnie podobna do macierzy Hessenberga, więc ma ona to samo widmo wartości własnych co macierz H. W celu wyznaczenia wartości własnych macierzy H wyznaczamy ciąg miacierzy: Wszystkie macierze Q i oraz H i są macierzami Hessenberga. Ponieważ: wobec czego wszystkie macierze H i, i=1,2,3,.. są podobne. Elementy na diagonali kolejnych H i dążą do wartości własnych macierzy H 1 =H. Jeżeli macierz H ma pojedyncze wartości własne takie, że są pomiedzy nimi pary sprzężone o identycznych modułach, to nie wszystkie elementy poddiagonalne dążą do 0. W granicy otrzymuje się macierz: 14
gdzie: gwiazdki oznaczają elementy ustalone, kropki lementy których wartości mogą się zmieniać. Wartości własne leżą wtedy bezpośrednio na diagonali lub są wartościami własnymi macierzy 2x2 leżących na diagonali. Wadą metody może być powolna zbieżność. Zwiększenie wydajności uzyskuje się dokonując przesunięcia widma wartości własnych zgodnie z poniższym schematem: Wartość k i wybiera się jako równe otrzymanym już wartościom własnym czyli lub wartości k i oraz k i+1 jako równe wartościom własnym macierzy 2x2 znajdujących się w prawym dolnym rogu macierzy H i. Metodę QR można stosować do dowolenej macierzy. Ze względu na dużą wydajność metody dla macierzy Hessenberga zaleca się przekształecenie macierzy do postaci Hessenberga i zastosowanie QR. 15
Metoda eliminacji Gaussa przekształacenia macierzy do postaci Hessneberga. Macierz A sprowadzamy do postaci Hessenberga dokonując (n-2) przekształceń, uzyskując kolejno macierze: A 1, A 2,..., A n-1 =H. Przekształcenie A i w A i+1 przebiega w następujący sposób: 1)spośród elementów wybieramy ten o największym module. Jeśli są to same elementy zerowe to A i+1 =A i i dokonujemy kolejnego przekształcenia. Jeśli element znajduje się w k-tym wierszu, przestawiamy wiersze i kolumny o indeksach k oraz i+1. 2) Obliczamy współczynniki Ze względu na wybór elementu podstawowego zapewniona jest stabilność numeryczna. 3) Od j-tegi wiersza odejmujemy i+1 wiersz pomnożony przez m j (i) oraz do i+1 kolumny dodajemy j-tą kolumne pomnożoną przez m j (I), J=I+2,I+3,...,n. Elementy są równe 0. i-ta kolumna macierzy A i jest równa i-tej kolumnie macierzy H. 16
Metoda Hausholdera rozkładu QR. Wartości i wektory własne Definiujemy macierz Hausholdera w postaci: Def. Iloczyn zewnętrzny Własności macierzy Hausholdera: Macierz Hausholdera posłuży do znalezienia rozkładu QR. Określamy ciąg macierzy P (1),P (2),P (3),...P (n-1) przy pomocy których definiujemy macierz R (górną trójkatną): 17
Zakładamy: Macierz H (1) jest macierzą Hausholdera sprowadzajacą pierwsza kolumnę macierzy A (a (1) 1 ) do postaci: Przez P (2) oznaczamy: Macierz H (2) sprowadza pierwszą kolumnę macierzy o wymiarze (n-1)x(n-1) utworzonej z wierszy i kolumn o numerach 2,3,4,...,n macierzy P (1) A (a (2) ) do postaci: 1 Postępujemy w ten sposób otrzymując kolejno P (3),P (4), itd. 18
Macierz P (n-1) ma postać: A macierz H (n-1) ma wymiar 2x2. Po wyznaczeniu wszystkich macierzy P (i), rozkład A=QR wyznaczamy według wzorów: Liczba operacji potrzebnych do uzyskania rozkładu Hausholdera wynosi: - mnożeń - dodawań - pierwiastkowań 19
Przykład. Wyznaczyć rozkład QR macierzy i=1 i=2 20
Wartości i wektory własne macierzy symetrycznych. Dzięki symetrii macierzy, metody poszukiwania wartości i wektorów własnych posiadają wiele zalet: 1. Dwukrotnie mniejsza liczba zajętych komórek pamięci niż dla pełnej macierzy 2. Mniejszy nakłąd obliczeń 3. Metody upraszczają się jeśli wartości własne są rzeczywiste 4. Zadanie wyznaczenia wartości własnych jest dobrze uwarunkowane Tw. Jeżeli macierz A jest symetryczna i dodatnio określona, to dla dowolnego wektora początkowego x 0 metoda potęgowa jest zbieżna. Tw. Jeżeli macierz A jest symetryczna i dodatnio określona, to algorytm QR generuje ciąg macierzy A (1),A (2),... zbieżny do macierzy diagonalnej. Algorytm QR zachowuje symetrię macierzy A (i) : Najczęściej jednak macierz symetryczną sprowadza się do postaci trójdiagonlanej. Wyznaczanie wartości i wektorów własnych macierzy trójdiagonalnej wymaga niewielkiego nakładu obliczeń. 21
Przekształcenie macierzy symetrycznej do postaci trójdiagonalnej. Jeśli jako T oznaczymy macierz trójdiagonalną a przez A macierz symetryczną to istnieje taka macierz podobieństwa P: Macierz P można znaleźć stosując metodę Hausholdera lub Givensa. W metodzie Hausholdera liczba działań potrzebnych do sprowadzenia macierzy A do postaci T wynosi: - mnożeń - dodawań Błędy zaokrągleń w metodzie Hasuholdera: - pierwiastkowań gdzie: - oznacza dokładną postać macierzy trójdiagonalnej -stała zależna od sposobu zakrąglania liczb 22
Metoda bisekcji poszukiwania wartości i wektorów własnych macierzy trójdiagonalnej. Sposób postępowania: 1) wybieramy dowolną liczbę i obliczamy wartość wielomianu charakterystycznego rekurencyjnie: - wartość wielomianu (M=3n-3, D=2n-1) 2) Korzystamy z poniższych twierdzeń: Tw. Jeżeli elementy a 2,a 2,...,a n (pozadiagonalne) są niezerowe, to wartości własne macierzy T są pojedyncze. 23
Tw. Jeżeli elementy a 2,a 2,...,a n (pozadiagonalne) są niezerowe, to ciąg wartości n spełnia warunki: a) Jeżeli i dla pewnego i<n, to i-1 i+1 b) Jeżeli n jest różne od 0, to liczba zmian znaków sąsiednich liczb 0 1 n jest równa liczbie wartości własnych macierzy T mniejszych od c) Jeżeli n, to jest wartością własną macierzy T, a ponadto jest tyle wartości własnych mniejszych niż ile nastąpiło zmian znaków w ciągu 0 1 n-1 24
25
Metoda bisekcji jest bardzo dokładna. Wadą jest uzyskiwanie duzych wartości ciągu 0 1 n jeśli znacznie różni się od wartości własnych T. Zaletą natomiast możliwośc obliczenia wartości własnej o określonym indeksie k. Liczba iteracji potrzebna do wyznaczenia k wynosi: Wektory własne Znając wartość własną macierzy T wektor własny wyznaczamy według wzorów: gdzie: b 1,b 2,...,b n elementy diagonalne T a 2,a 3,...,a n elementy pozadiagonalne T 26