Wykład nr 5 i jej modyfikacje. i zera wielomianów Założenia metody Newtona Niech będzie dane równanie f (x) = 0 oraz przedział a, b taki, że w jego wnętrzu znajduje się dokładnie jeden pierwiastek α badanego równania (ewentualnie dokładnie jeden pierwiastek nieparzystej krotności w przypadku funkcji wielomianowej). Ponadto załóżmy, że f C 2 ( a, b ), f (a) f (b) < 0 oraz f i f mają stały znak na przedziale a, b.
Opis metody Newtona W metodzie Newtona (inaczej stycznych) przybliżenie x 1 jest miejscem zerowym prostej stycznej do wykresu funkcji f w punkcie A = (a, f (a)) (jeżeli f (a)f (a) > 0) lub B = (b, f (b)) (jeżeli f (b)f (b) > 0). Kolejne przybliżenia wyznacza się jako miejsca zerowe stycznych do wykresu funkcji f w punktach wyznaczonych przez poprzednie przybliżenia. Wzory metody Newtona Twierdzenie 5.1. (wzory ogólne metody Newtona) Wzór na kolejne przybliżenie w metodzie Newtona może być zapisany nastepująco: gdzie: x n+1 = x n f (x n) f, n = 0, 1, 2,..., (x n ) 1) jeżeli f (a)f (a) > 0, to x 0 = a; 2) jeżeli f (b)f (b) > 0, to x 0 = b. Powyższy wzór posiada bardzo prostą interpretację geometryczną.
Interpretacja geometryczna metody Newtona Zbieżność i oszacowanie błędu metody Newtona Twierdzenie 5.2. (zbieżność metody Newtona) Przy przyjętych założeniach ciąg przybliżeń z metody Newtona jest zbieżny i jego granicą jest szukany pierwiastek α. Dla metody Newtona prawdziwe są oszacowania błędu podane w twierdzeniach 4.4 i 4.5 (poprzedni wykład).
Przybliżanie pochodnej Niech będzie dana funkcja f klasy C 1. Ponieważ funkcja f jest określona wzorem: f f (x + h) f (x) (x) = lim, h 0 h więc jeśli przyjmiemy h 0, to wtedy otrzymujemy f (x) f (x + h) f (x). h Im mniejsza zastosowana wartość parametru h, tym lepsze uzyskane przybliżenie wartości f (x). Wzory metody Steffensena Załóżmy, że są spełnione założenia metody Newtona dla równania nieliniowego f (x) = 0 i przedziału izolacji pierwiastka a, b. W metodzie Steffensena wprowadzamy funkcję pomocniczą g: g (x) = f (x + f (x)) f (x). f (x) Jeśli x jest przybliżeniem pierwiastka naszego równania nieliniowego, to wtedy f (x) 0 i g(x) f (x).
Wzory metody Steffensena Następnie za pomocą funkcji g modyfikujemy wzory metody Newtona: x n+1 = x n f (x n), n = 0, 1, 2,... g (x n ) 1 W metodzie Steffensena punkt początkowy x 0 jest taki sam jak w metodzie Newtona. 2 Wzór na kolejne przybliżenie metody Steffensena nie zawiera pochodnej funkcji f. 3 Wraz z kolejnymi iteracjami metody Steffensena dokładność przybliżenia funkcji f przez funkcję g poprawia się. Wzory metody Halleya Załóżmy, że są spełnione założenia metody Newtona dla równania nieliniowego f (x) = 0 i przedziału izolacji pierwiastka a, b. W metodzie Halleya wprowadzamy funkcję pomocniczą g: g (x) = f (x) f (x). Funkcje f i g mają takie same pierwiastki.
Wzory metody Halleya Następnie stosujemy metodę Newtona do równania g(x) = 0 i otrzymujemy następujące wzory: x n+1 = x n f (x n )f (x n ) (f (x n )) 2 f (x n)f (x n ) 2, n = 0, 1, 2,... 1 W metodzie Halleya punkt początkowy x 0 jest taki sam jak dla metody Newtona. 2 Wzór na kolejne przybliżenia metody Halleya zawiera drugą pochodną funkcji f. Pierwiastek wielokrotny równania Definicja 3.1. (pierwiastek wielokrotny) Niech k 2. Liczbę α nazywamy k-krotnym pierwiastkiem równania f (x) = 0 wtedy i tylko wtedy, gdy jest ona (k 1)-krotnym pierwiastkiem równania f (x) = 0.
Pierwiastki nieparzystej i parzystej krotności 1) Jeżeli pierwiastek α ma nieparzystą krotność, to metody połowienia, regula falsi, siecznych i Newtona w dalszym ciągu działają, przy czym metody siecznych i Newtona są wtedy wolniej zbieżne. 2) Jeżeli pierwiastek α ma parzystą krotność, to metody połowienia, regula falsi i siecznych zawodzą. pozostaje zbieżna pod warunkiem, że istnieje odpowiednie lewostronne lub prawostronne domknięte otoczenie pierwiastka α (spełniające warunki na stały znak pierwszej i drugiej pochodnej). W tym przypadku również obniża się szybkość zbieżności metody Newtona. Przyspieszanie zbieżności dla pierwiastków wielokrotnych Jeżeli α jest pierwiastkiem rzędu k (k 1), to wprowadzamy funkcję pomocniczą g(x) = (f (x)) 1 k, a następnie stosujemy metodę Newtona do równania g(x) = 0 i otrzymujemy następujące wzory: x n+1 = x n k f (x n) f, n = 0, 1, 2,.... (x n ) Na ogół nie znamy a priori krotności pierwiastka.
Przyspieszanie zbieżności dla pierwiastków wielokrotnych Jeżeli nie znamy krotności pierwiastków wielokrotnych, to wprowadzamy funkcję pomocniczą g(x) = f (x) f (x), a następnie stosujemy metodę Newtona do równania g(x) = 0 i otrzymujemy następujące wzory: x n+1 = x n f (x n ) f (x n ) f (x n ) f (x n ) f (x, n = 0, 1, 2,.... n) i klasyczne metody Wszystkie opisane wczesniej metody (tj. połowienia, regula falsi, siecznych, Newtona, Steffensen a i Halley a) oraz ich modyfikacje dla pierwiastków wielokrotnych mogą służyć do znajdowania przyblizonych wartości rzeczywistych zer wielomianów o współczynnikach rzeczywistych. Ponadto na ogół można je zmodyfikować w taki sposób, aby działały również dla zer zespolonych. Zatem stosunkowo wazniejsze jest zagadnienie lokalizacji takich zer. Omówimy kilka twierdzeń zajmujących się tym problemem.
Ciągi Sturma Definicja 5.1. (ciąg Sturma) Niech będzie dany wielomian f o współczynnikach rzeczywistych. Definiujemy skończony ciąg wielomianów {f i } p i=0 rekurencyjnie: f 0 (x) = f (x), f 1 (x) = f (x), f i+1 (x) = reszta z dzielenia f i 1 przez f i wzięta z przeciwnym znakiem, i = 1,..., p, gdzie f p jest ostatnią niezerową resztą. Ciąg ten nazywamy ciągiem Sturma. Ciągi Sturma Jeżeli reszta f p jest niezerową liczbą rzeczywistą, to wtedy wielomian f 0 = f nie ma zer wielokrotnych. Jeżeli natomiast f p jest wielomianem stopnia k, to jego miejsca zerowe są (k + 1)-krotnymi zerami wielomianu f 0.
Ciągi Sturma Niech N(x 0 ) oznacza liczbę zmian znaku w ciągu Sturma dla x = x 0 (z pominięciem zer). 1) Jeżeli x 0 = ±, to wtedy N(± ) definiujemy jako liczbę zmian znaku w ciągu {lim x ± f i (x)} p i=0 (z pominięciem zer). 2) Jeżeli x 0 jest jednokrotnym zerem wielomianu f, to wtedy N(x 0 ) definiujemy jako liczbę zmian znaku w ciągu {f i (x 0 )} p i=1 (z pominięciem zer). 3) Przy wyznaczania kolejnych wyrazów ciągu Sturma często pojawiają się ułamkowe współczynniki. Interesują nas jedynie znaki tych wielomianów (a nie ich dokładne wartości). Aby otrzymać wielomiany o współczynnikach całkowitych należy każdy z nich przemnożyć przez pewną liczbę dodatnią. Twierdzenie Sturma Twierdzenie 5.3. (Sturma o liczbie zer wielomianu) Niech f będzie wielomianem o współczynnikach rzeczywistych. Jeżeli f (a) f (b) 0, to liczba różnych zer rzeczywistych wielomianu f leżących w przedziale (a, b) jest równa N(a) N(b). Przykład 5.1. (zastosowanie twierdzenia Sturma) Zbadać za pomocą twierdzenia Sturma liczbę i lokalizację pierwiastków wielomianu f (x) = x 4 + x 3 x 2 x.
Ciągi Fouriera Definicja 3.2. (ciąg Fouriera) Niech będzie dany wielomian f stopnia n o współczynnikach rzeczywistych. Definiujemy skończony ciąg wielomianów {f i } n i=0 następująco: f 0 (x) = f (x), f i (x) = f (i) (x), i = 1,..., n. Ciąg ten nazywamy ciągiem Fouriera. Niech M(x 0 ) oznacza liczbę zmian znaku w ciągu Fouriera dla x = x 0. Twierdzenie Fouriera Twierdzenie 5.4. (Fouriera o liczbie zer wielomianu) Niech f będzie wielomianem stopnia n o współczynnikach rzeczywistych. Jeżeli f (a) f (b) 0, to liczba zer rzeczywistych wielomianu f leżących w przedziale (a, b) jest równa M(a) M(b) lub jest od tej liczby mniejsza o liczbę parzystą. Przykład 5.2. (zastosowanie twierdzenia Fouriera) Zbadać za pomocą twierdzenia Fouriera liczbę i lokalizację pierwiastków wielomianu f (x) = x 4 + x 3 x 2 x.
Ciągi Laguerre a Definicja 5.3. (ciąg Laguerre a) Niech będzie dany wielomian f (x) = a n x n +a n 1 x n 1 +...+a 1 x +a 0 stopnia n o współczynnikach rzeczywistych. Definiujemy skończony ciąg wielomianów {f i } n i=0 następująco: f i (x) = a n x i + a n 1 x i 1 +... + a n (i 1) x + a n i, i = 0,..., n. Ciąg ten nazywamy ciągiem Laguerre a. Niech L(x 0 ) oznacza liczbę zmian znaku w ciągu Laguerre a dla x = x 0. Twierdzenie Laguerre a Twierdzenie 5.5. (Laguerre a o liczbie zer wielomianu) Niech f będzie wielomianem stopnia n o współczynnikach rzeczywistych. Jeżeli f (a) f (b) 0, to liczba zer rzeczywistych wielomianu f leżących w przedziale (a, b) jest równa L(a) L(b) lub jest od tej liczby mniejsza o liczbę parzystą. Przykład 5.3. (zastosowanie twierdzenia Laguerre a) Zbadać za pomocą twierdzenia Laguerre a liczbę i lokalizację pierwiastków wielomianu f (x) = x 4 + x 3 x 2 x.
Reguła Kartezjusza Twierdzenie 5.6. (reguła Kartezjusza) Liczba dodatnich zer wielomianu f (x) = a n x n +... + a 1 x + a 0 stopnia n o współczynnikach rzeczywistych (z uwzględnieniem ich krotności) jest równa liczbie zmian znaków w ciągu współczynników a n, a n 1,..., a 0 lub jest od tej liczby mniejsza o liczbę parzystą Aby znaleźć liczbę ujemnych zer wielomianu f wystarczy zbadać liczbę zer dodatnich wielomianu g(x) = f ( x). Przykład 5.4. (zastosowanie reguły Kartezjusza) Zbadać za pomocą reguły Kartezjusza liczbę dodatnich i ujemnych pierwiastków wielomianu f (x) = x 4 + x 3 x 2 x.