Wstęp do matematyki Marcin Orchel
Spis treści 1 Ogólne działy 4 1.1 Logika...................................... 4 2 Metody numeryczne 5 2.1 Wprowadzenie do metod numerycznych................... 5 2.1.1 Przestrzeń euklidesowa......................... 5 2.1.2 Ciągi................................... 7 2.1.3 Zadania................................. 9 2.1.4 Laboratoria............................... 9 2.2 Wprowadzenie do metod numerycznych................... 11 2.2.1 Podciągi................................. 11 2.2.2 Ciągi Cauchy ego............................ 12 2.2.3 Kres górny, dolny, maksimum, minimum............... 14 2.2.4 Ciągi monotoniczne.......................... 15 2.2.5 Granica dolna i górna......................... 16 2.2.6 Zadania................................. 17 2.2.7 Laboratoria............................... 17 2.3 Wprowadzenie do metod numerycznych................... 18 2.3.1 Kule otwarte, zbiory otwarte, zbiory domknięte........... 18 2.3.2 Zbiory ograniczone i zbiory zwarte.................. 18 2.3.3 Kombinacje wypukłe, zbiory wypukłe................ 19 2.3.4 Suma zbiorów, przekrój zbiorów................... 19 2.3.5 Zadania................................. 21 2.3.6 Laboratoria............................... 22 2.4 Wprowadzenie do metod numerycznych................... 22 2.4.1 Macierze................................. 22 2.4.2 Zadania................................. 31 2.4.3 Laboratoria............................... 32 2.5 Wprowadzenie do metod numerycznych................... 33 2.5.1 Funkcje................................. 33 2.5.2 Funkcja różniczkowalna i ciągle różniczkowalna........... 34 2.5.3 Hiperpłaszczyzna............................ 38 2.5.4 Twierdzenia o wartościach średnich.................. 40 1
2.5.5 Zadania................................. 41 2.5.6 Laboratoria............................... 42 2.6 Wprowadzenie do metod numerycznych................... 42 2.6.1 Forma kwadratowa........................... 42 2.6.2 Zadania................................. 43 2.7 Wprowadzenie do metod numerycznych................... 44 2.7.1 Stabilność numeryczna......................... 44 2.8 Wprowadzenie do metod numerycznych................... 45 2.8.1 Równania nieliniowe z jedną niewiadomą.............. 45 2.8.2 Metoda Newtona............................ 46 2.8.3 Metoda interpolacji liniowej...................... 46 2.8.4 Pierwiastki równania n-tego stopnia................. 46 2.8.5 Zadania................................. 47 2.9 Wprowadzenie do metod numerycznych................... 47 2.9.1 Chaos deterministyczny........................ 47 2.9.2 Zadania................................. 48 2.10 Wprowadzenie do metod numerycznych................... 48 2.10.1 Rozwiązywanie układów równań liniowych.............. 48 2.10.2 Zadania................................. 50 2.11 Wprowadzenie do metod numerycznych................... 50 2.11.1 Interpolacja............................... 50 2.11.2 Zadania................................. 51 2.12 Wprowadzenie do metod numerycznych................... 52 2.12.1 Liczby losowe.............................. 52 2.12.2 Metoda Monte Carlo.......................... 52 2.12.3 Zadania................................. 52 3 Optymalizacja 53 3.1 Optymalizacja.................................. 53 3.1.1 Problem optymalizacyjny....................... 53 3.1.2 Ekstremum lokalne i globalne..................... 54 3.1.3 Problem optymalizacyjny w formie parametrycznej......... 54 3.1.4 Maksymalizacja użyteczności..................... 55 3.1.5 Minimializacja wydatków....................... 56 3.1.6 Zadania................................. 56 3.2 Optymalizacja.................................. 57 3.2.1 Cele teorii optymalizacji........................ 57 3.2.2 Twierdzenie Weierstrassa....................... 57 3.2.3 Zadania................................. 58 3.3 Optymalizacja.................................. 59 3.3.1 Ekstrema bez ograniczeń....................... 59 3.3.2 Warunki na pierwszą pochodną.................... 60 3.3.3 Warunki na drugą pochodną..................... 60 2
3.3.4 Zadania................................. 62 3.4 Optymalizacja.................................. 63 3.4.1 Metoda ekspansji............................ 63 3.4.2 Poszukiwanie minimum w przedziale................. 64 3.4.3 Metoda złotego podziału....................... 64 3.4.4 Metoda Fibonacciego......................... 66 3.4.5 Zadania................................. 66 3.5 Optymalizacja.................................. 67 3.5.1 Metoda Hooke a-jeevesa........................ 67 3.5.2 Zadania................................. 70 3.6 Optymalizacja.................................. 70 3.6.1 Metody gradientowe.......................... 70 3.6.2 Metoda największego spadku..................... 71 3.6.3 Zadania................................. 72 3.7 Optymalizacja.................................. 73 3.7.1 Metoda Newtona............................ 73 3.7.2 Zadania................................. 74 3.8 Optymalizacja.................................. 75 3.8.1 Problemy optymalizacyjne z warunkami............... 75 3.8.2 Warunki równościowe i twierdzenie Lagrange a........... 75 3.8.3 Warunki na drugą pochodną..................... 76 3.8.4 Metoda Lagrange a........................... 77 3.8.5 Przykłady................................ 78 3.8.6 Zadania................................. 79 3
Rozdział 1 Ogólne działy 1.1 Logika Przydatne reguły logiczne w dowodzeniu twierdzeń. (p q) r p r q (p q) r p (q r) (p (q r)) (p q) (p r) (p q) (p r) p (q r) (p q) (q r) (p r) (p q) (q r) (p q r) 4
Rozdział 2 Metody numeryczne 2.1 Wprowadzenie do metod numerycznych 2.1.1 Przestrzeń euklidesowa Zbiór liczb naturalnych: Zbiór liczb całkowitych: Zbiór liczb wymiernych: N = {1, 2, 3,...} Z = {..., 1, 0, 1,...} Q = {x x = p } q, p, q Z, q 0 Liczby rzeczywiste oznaczane są jako R. Wartość bezwzględna liczby x R: { x jesli x 0 x = x jesli x < 0 Odległość euklidesowa między dwoma punktami x, y R zdefiniowana jest jako x y. Dla n N, R n oznacza n-wymiarową przestrzeń euklidesową. Gdy n = 1 piszemy samo R. Punkt x w R n to wektor x = (x 1,..., x n ) gdzie dla i {1..n}, liczba x i R nazywa się i-tą współrzędną punktu x. Symbol 0 oznacza punkt o współrzędnych (0,..., 0). Dodawanie wektorów dla x, y R n x + y = (x 1 + y 1,..., x n + y n ) Mnożenie skalarne wektora x R n przez liczbę α R αx = (αx 1,..., αx n ) 5
Porównywanie dwóch wektorów x = (x 1,..., x n ) i y = (y 1,..., y n ): x = y, jesli x i = y i dla kazdego i {1..n} x y, jesli x i y i dla kazdego i {1..n} x > y, jesli x y i x y x y, jesli x i > y i dla kazdego i {1..n} Gdy n > 1 nie zawsze możemy stwierdzić który wektor jest większy, np: wektory x = (1, 2) i y = (2, 1) nie spełniają obu nierówności x y i y x. Wyróżnimy następujące części przestrzeni R n : nieujemna ściśle dodatnia R n + = {x R n x 0} R n ++ = {x R n x 0} Mamy dane x, y R. Iloczyn skalarny wektorów x i y zdefiniowany jest jako: n x y = x i y i i=1 Iloczyn skalarny ma następujące własności, dla wektorów x, y, z R n i liczb a, b R przemienność: x y = y x dwuliniowość: (ax + by) z = ax z + by z oraz x (ay + bz) = x ay + x bz nieujemność: x x 0, przy czym równość zachodzi tylko gdy x = 0 Nierówność Cauchy-Schwarza. Dla dowolnych x, y R n : x y (x x) 1/2 (y y) 1/2 Norma euklidesowa wektora x R n zdefiniowana jest jako: ( n ) 1/2 x = x 2 i i=1 Zachodzi następujący związek z iloczynem skalarnym: x = (x x) 1/2 Nierówność Cauchy-Szwarza może być zapisana w postaci: x y x y Norma ma następujące własności dla x, y R n i a R: 6
nieujemność: x 0, przy czym równość jest spełniona tylko gdy x = 0. jednorodność: ax = a x. nierówność trójkąta: x + y x + y. Odległość pomiędzy dwoma wektorami x, y R n jest zdefiniowana jako: ( n ) 1/2 d (x, y) = (x i y i ) 2 i=1 Odległość d zwana jest również metryką. Jest powiązana z normą: d (x, y) = x y Metryka ma następujące własności, dla dowolnych x, y, z R n : nieujemność: d (x, y) 0, przy czym równość jest spełniona tylko gdy x = y przemienność: d (x, y) = d (y, x) nierówność trójkąta: d (x, z) d (x, y) + d (y, z) 2.1.2 Ciągi Ciąg w R n jest to specyfikacja punktu x k R n dla każdej liczby k {1, 2,...}. Ciąg zapisujemy zazwyczaj w postaci x 1, x 2,..., albo {x k }. Definition 2.1.1. Ciąg {x k } w R n jest zbieżny do granicy x (co zapisujemy jako x k x), jeśli odległość d (x k, x) zmierza do zera, gdy k dąży do nieskończoności, czyli gdy dla każdego ɛ > 0 istnieje liczba k (ɛ) taka, że dla każdego k k (ɛ) mamy d (x k, x) < ɛ. Przykładowo ciąg w R zdefiniowany jako x k = 1/k dla każdego k jest ciągiem zbieżnym z granicą x = 0. Dowód: weźmy dowolne k (ɛ) > 1/ɛ. Wtedy dla każdego k > k (ɛ) mamy d (x k, 0) = d (1/k, 0) = 1/k < 1/k (ɛ) < ɛ. Theorem 2.1.2. Ciąg może mieć maksymalnie jedną granicę. To znaczy, gdy ciąg {x k } jest ciągiem w R n zbieżnym do punktu x R n, to nie może być równocześnie zbieżny do punktu y R n dla y x. Dowód. Z nierówności trójkąta mamy d (x k, y) d (x, y) d (x k, x) Ponieważ d (x, y) > 0 oraz d (x k, x) 0 to z nierówności wynika, że d (x k, y) nie może dążyć do zera, gdy k dąży do nieskończoności, dlatego x k y jest niemożliwe. 7
Ciąg {x k } jest ciągiem ograniczonym, kiedy istnieje liczba rzeczywista M taka, że x k M dla każdego k. Ciąg, który nie jest ograniczony zwie się ciągiem nieograniczonym i zachodzi: ciąg {x k } jest nieograniczony, gdy dla każego M R istnieje k (M) taka, że x k(m) > M. Theorem 2.1.3. Każdy ciąg zbieżny w R n jest ograniczony. Dowód. Załóżmy, że x k x oraz, że ɛ = 1 w definicji ciągu zbieżnego. Wtedy istnieje k (1) takie, że dla każdego k k (1), d (x k, x) < 1. Ponieważ d (x k, x) = x k x, to z nierówności trójkąta dla każdego k k (1) x k = (x k x) + x (x k x) + x < 1 + x Teraz zdefiniujmy M jako maksimum skończonego zbioru liczb { } x 1,..., x k(1) 1, 1 + x Wtedy M x k dla każdego k. Z powyższego twierdzenia wynika, że jeśli ciąg nie jest ograniczony, to nie jest zbieżny. Kiedy np. ciąg {x k } jest zdefiniowany jako x k = k. Ale to, że ciąg nie jest ograniczony nie jest jedyną przyczyną braku zbieżności ciągu. Przykładowo ciąg: x k = { 1 k, k = 1, 3, 5,... 1 1 k, k = 2, 4, 6,... jest ograniczony, ponieważ zachodzi x k 1 dla każdego k, ale nie jest zbieżny, ponieważ dla nieparzystych k ciąg zbiega do 0, a dla nieparzystych do 1, a ciąg zbieżny może mieć jedną tylko granicę. { Theorem 2.1.4. Ciąg x k} w R n jest zbieżny do granicy x, wtedy i tylko wtedy, gdy ( ) x k i x i dla każdego i {1,..., n}, gdzie x k = x k 1,..., xk n oraz x = (x 1,..., x n ). Dowód. Odległość pomiędzy dwoma punktami w R n może być zapisana jako: ( n ) 1/2 d (x, y) = x i y i 2 i=1 gdzie x i y i to odległość pomiędzy punktami x i i y i w R. W pierwszym kroku załóżmy, że x k x. Musimy pokazać, że x k i x i dla każdego i, czyli, że dla dowolnych i oraz ɛ > 0 istnieje k i (ɛ) takie, że dla każdego k k i (ɛ) mamy x k i x i < ɛ. Z definicji ( ) x k x wiemy, że istnieje k (ɛ) takie, że d x k, x < ɛ takie, że k k (ɛ). Dlatego też dla każdego k k (ɛ) i dla każdego i zachodzi: x k i x i = ( x k i x i 2 ) 1/2 ( n 1/2 x k 2) j x j = d l=1 8 ( ) x k, x < ɛ
Dlatego wystarczy wziąść k i (ɛ) = { k (ɛ)} dla każdego i. W drugim kroku załóżmy, że x k i jest zbieżne do x i dla każdego i. Niech ɛ > 0. ( ) Pokażemy, że istnieje k (ɛ) takie, że d x k, x < ɛ dla każdego k k (ɛ), co gwarantuje, że x k x. Zdefiniujmy liczbę p = ɛ/ n. Dla każdego i istnieje k i (p) takie, że dla każdego k k i (p) zachodzi x k i x i < p. Zdefiniujmy k (ɛ) jako maksimum ze skończonego zbioru liczb k 1 (p),..., k n (p). Wtedy dla k k (ɛ) mamy x k i x i < p dla każdego i, dlatego: ( ( ) d x k n 1/2 (, x = x k 2) n [ ] ) ɛ 2 1/2 i x i < = ɛ n Theorem 2.1.5. Niech i=1 i=1 { x k} będzie ciągiem w R n zbieżnym do granicy x. Załóżmy, że dla każdego k zachodzi a x k b, gdzie a = (a 1,..., a n ) oraz b = (b 1,..., b n ) są pewnymi stałymi wektorami w R n. Wtedy zachodzi, a x b. Dowód. Twierdzenie zostanie udowodnione, gdy pokażemy, że a i x i b i dla każdego i {1..n}. Załóżmy, że nie zachodzi powyższe, to znaczy dla pewnego i mamy x i < a i. Z poprzedniego twierdzenia mamy, że x k x, to z tego wynika, że x k j x j dla każdego j {1..n}, czyli również x k i x i. Ale to oznacza wraz z x i < a i, że dużych k musi zachodzić x k i < a i, co jest sprzeczne z hipotezą, że a x k b. Podobnie dla x i > b i. 2.1.3 Zadania Zadanie 1. Ile wynosi norma wektora (3, 4, 12) i jaka jest jej interpretacja geometryczna? Zadanie 2. Zbadać czy poniższe ciągi są zbieżne. Jeśli tak to do jakiej granicy: 1. (1/k, ( 1) k) 2. (k 1/k, 1/k sin k) 3. (2, cos 1/k) 4. (k, (k 1) /2k) 2.1.4 Laboratoria 1. Zadania na 3.0 (a) Opanować wyszukiwanie granic na stronie wolframalpha.com, oraz wyświetlanie wykresów ciągów. (b) Napisać funkcję zwracającą dokładność przybliżenia liczby e, za pomocą wartości ciągu 1 + 1 k dla dużego k. Funkcja jako parametr przyjmuje liczbę e ( ) k wczytaną uprzednio z pliku pochodzącego np ze strony http://const.physics.edu.pl/liczbae.php. 9
2. Zadania na 4.0 (a) Napisać funkcję sprawdzającą czy dany ciąg jest ograniczony daną liczbą, funkcja przyjmuje jako parametry ciąg w postaci klasy abstrakcyjnej, oraz wartość ograniczenia, sprawdzamy wartości ciągu począwszy od k = 1, a skończywszy na wybranej dużej liczbie k. 3. Zadania na 5.0 (a) Zaimplementować z definicji wyszukiwanie granic ciągów liczbowych, jednowymiarowych. Wskazówki: rozpatrujemy wybrany duży przedział dla wartości k [a, b], ɛ wybierane takie, które pojawiły się dla rozpatrywanego przedziału k, kandydat na granicę wybierany za pomocą sprawdzenia wartości dla dużego k. Program zwraca informację czy dany kandydat może być granicą, dokładniej zwraca informację o otoczeniu podanej granicy, w którym może znajdować się prawdziwa granica. Ciągi do testowania: sin k 1 k dla wybranych a > 0 ( 1) k k 1 k sin k k 2 cos 1 k k k 1 2k ( 1 + 1 k k a k sin 1 k e k k k k q k ) k 10
dla q < 1 ( 1 + a ) k k dla a N dla a > 0 dla a R k k ln k k e k k a k a k! ( n ln 1 + 1 ) n ( ) k a 1/k 1 k i=1 ln ln k ln k a k k! 1 i ln k dowolnie wybrane ciągi arytmetyczne i geometryczne k 2 + 2k + 1 3k 2 + 1 2.2 Wprowadzenie do metod numerycznych 2.2.1 Podciągi Mamy dany {x k } w R n. Niech m będzie dowolną regułą, która przyporządkowuje dla każdego k N wartość m (k) N. Załóżmy ponadto, że m wzrasta wraz ze wzrostem } k, co znaczy dla każdego k N m (k) < m (k + 1). Możemy zdefiniować nowy {x m(k), którego k-ty element jest m (k) elementem {x k }. Ten nowy ciąg jest zwany podciągiem. Mówiąc inaczej podciąg jest dowolnym nieskończonym podzbiorem wyjściowego ciągu, który zachowuje kolejność elementów. Pomimo tego, że {x k } nie jest zbieżny, to może zawierać podciągi, które są zbieżne. Przykładowo ciąg 0, 1, 0, 1, 0, 1,... nie ma granicy, ale podciągi 0, 0, 0,... i 1, 1, 1,... mają granicę. Jeśli ciąg zawiera podciąg zbieżny, to granica podciągu zbieżnego jest zwana punktem skupienia ciągu wyjściowego. Przykładowo ciąg 0, 1, 0, 1,... ma dwa punkty skupienia 0 i 1. 11
Theorem 2.2.1. Punkt x jest punktem skupienia {x k }, wtedy i tylko wtedy, gdy dla każdego ɛ > 0, istnieje nieskończenie wiele wartości m takich, że d (x, x m ) < ɛ. } Dowód. Załóżmy, że x jest punktem skupienia {x k }. Wtedy musi istnieć podciąg {x m(k), który jest zbieżny } do x. Z definicji zbieżności dla każdego ɛ > 0 nieskończenie wiele elementów {x m(k) musi spełniać d (x, x m ) < ɛ, dlatego też nieskończenie wiele elementów {x k } musi spełniać d (x, x m ) < ɛ. W drugą stronę załóżmy, że dla każdego ɛ > 0 istnieje nieskończenie wiele } m takich, że d (x, x m ) < ɛ. Z tego wynika, że możemy zdefiniować podciąg {x m(k) ciągu {x k } w następujący sposób: m (1) będzie dowolną liczbą taką, że d (x, x m ) < 1. Dla k = 2, 3,... zdefiniujmy m (k) jako dowolne m spełniające } dwa warunki: d (x, x m ) < 1/k i m (k) > m (k 1). Możemy zauważyć, że {x m(k) zbiega do x, dlatego x jest punktem skupienia {x k }. Ciąg {x k } jest zbieżny do x, wtedy i tylko wtedy, gdy każdy jego podciąg jest zbieżny do x. Ciąg {x k } może mieć dowolną liczbę punktów skupienia. Przykładowo punktami skupienia są wszystkie liczby naturalne następującego ciągu: 1, 1, 2, 1, 2, 3, 1, 2, 3, 4,... Jest możliwe, że żaden podciąg nie jest zbieżny, czyli, że ciąg nie ma punktów skupienia. Przykładowo ciąg {x k } w R zdefiniowany jako x k = k dla każdego k. Każdy podciąg tego ciągu zmierza do +. 2.2.2 Ciągi Cauchy ego Ciąg {x k } w R n spełnia kryterium Cauchy ego, jeśli dla każdego ɛ > 0 istnieje liczba k (ɛ) taka, że dla każdego m, l k (ɛ) mamy d (x m, x l ) < ɛ. Opisowo ciąg {x k } spełnia kryterium Cauchy ego, kiedy wybierając dostatecznie duże k odległość pomiędzy dowolnymi dwoma elementami x m i x l w ogonie ciągu: x k, x k+1, x k+2,... może być uczyniona dowolnie małą. Ciąg, który spełnia kryterium Cauchy ego jest nazywany ciągiem Cauchy ego. Przykładowym ciągiem spełniającym kryterium Cauchy ego jest {x k } w R zdefiniowany jako x k = 1/k 2 dla każdego k. Dowód przebiega następująco weźmy dowolne ɛ > 0. Wybierzmy k (ɛ) takie, że k 2 ɛ > 2. Dla m, l k (ɛ) mamy: d (x m, x l ) = 1 m 2 1 l 2 1 m 2 + 1 l 2 1 k (ɛ) 2 + 1 k (ɛ) 2 = 2 k (ɛ) 2 < ɛ { Theorem 2.2.2. Ciąg x k} w R n jest ciągiem Cauchy ego, wtedy i tylko wtedy, gdy dla { } każdego i {1,..., n} x k i jest ciągiem Cauchy ego w R. 12
{ Dowód. Niech x k} będzie ciągiem Cauchy ego w R n. Pokażemy, że dla każdego i i ɛ > 0 istnieje k i (ɛ) takie, że dla każdego m, l k i (ɛ) mamy x m i x l i < ɛ. Dane są { ɛ > 0 i i. Ponieważ x k} jest ciągiem Cauchy ego, to istnieje k (ɛ) takie, że dla każdego ( m, l k (ɛ) mamy d x m x l) < ɛ. Dlatego też dla każdego m, l k (ɛ) otrzymujemy: ( x x m i x l m i = i x l i 2) 1/2 1/2 n x m j x l j 2 ( = d x m, x l) < ɛ j=1 { } Wystarczy teraz wybrać k i (ɛ) = k (ɛ). Dowód w drugą stronę: załóżmy, że x k i jest ciągiem Cauchy ego dla każdego i. Pokażemy, że dla każdego ɛ > 0 istnieje k (ɛ) takie, że dla każdego m, l k (ɛ) zachodzi d x m x l < ɛ. Niech ɛ > 0. Zdefiniujmy p = ɛ/ n. { } Ponieważ każdy x k i jest ciągiem Cauchy ego, to istnieje k i (p) takie, że dla każdego m, l k i (p) mamy x m i x l i < p. Zdefiniujmy k (ɛ) = max {k 1 (p),..., k n (p)}. Wtedy dla m, l k (ɛ) mamy ( d x m, x l) = ( n x m i i=1 ) 1/2 ( x l i 2 n ( ) ) ɛ 2 1/2 < = ɛ n i=1 Jedną z różnic między ciągiem zbieżnym i ciągiem Cauchy ego jest to, że w definicji ciągu zbieżnego występuje bezpośrednio granica. Oba typy ciągów w przestrzeni euklidesowej związane są następującym twierdzeniem: Theorem 2.2.3. Ciąg {x k } w R n jest ciągiem Cauchy ego, wtedy i tylko wtedy, gdy jest ciągiem zbieżnym, to znaczy, wtedy i tylko wtedy gdy istnieje x R n takie, że x k x. Dowód. Załóżmy, że ciąg {x k } jest ciągiem zbieżnym. Pokażemy, że jest wtedy ciągiem Cauchy ego. Weźmy ɛ > 0. Zdefiniujmy p = ɛ/2. Ponieważ x k x, to istnieje k (p) takie, że dla każdego j k (p) mamy d (x j, x) < p. Z nierówności trójkąta dla j, l k (p) otrzymujemy: d (x j, x l ) d (x j, x) + d (x l, x) < p + p = ɛ Wystarczy teraz wziąść k (ɛ) = k (p). Dowód w drugą stronę zostanie tutaj pominięty. Można łatwo udowodnić słabsze twierdzenie: Theorem 2.2.4. Niech {x k } będzie ciągiem Cauchy ego. Wtedy {x k } jest ograniczony, a także posiada co najwyżej jeden punkt skupienia. Dowód. Na początku pokażemy, że ciąg Cauchy ego jest ograniczony, weźmy ɛ = 1. Wtedy istnieje k (1) takie, że dla każdego j, l k (l) mamy d (x j, x l ) < 1. Z nierówności trójkąta dla j k (1) otrzymujemy: (x ) ( ) x j = j x k(l) + x k(l) xk(l) xk(l) x j x k(l) + < 1 + 13
Wybierzmy następnie M jako maksimum ze zbioru: { } xk(l) x 1,..., x k(l) 1, 1 + Dla takiego M zachodzi M x k dla każdego k. Teraz udowodnimy, że ciąg Cauchy ego nie może mieć więcej niż jednego punktu skupienia. Załóżmy, że x jest punktem skupienia ciągu Cauchy ego {x k }. Pokażemy, że x k x. Niech ɛ > 0 i p = ɛ/2. Ponieważ {x k } jest ciągiem Cauchy ego, to istnieje k (p) takie, że d (x j, x l ) < p dla każdego j, l k (p). Ponadto ponieważ x jest punktem skupienia {x k }, istnieją wyrazy ciągu {x k }, które leżą dowolnie blisko x. W szczególności możemy znaleźć m k (p) takie, że d (x m, x) < p. Dlatego, jeśli j k (p) d (x j, x) d (x j, x m ) + d (x m, x) p + p = ɛ Z tego wynika, że x k x. A z tego wynika, że nie może posiadać więcej niż jednego punktu skupienia. Dwa ciągi Cauchy ego {x k } i {y k } są równoważne, jeśli dla każdego ɛ > 0 istnieje k (ɛ) takie, że dla każdego j k (ɛ) zachodzi d (x j, y j ) < ɛ. Ciągi Cauchy ego równoważne zapisujemy jako {x k } {y k }. Można zauważyć, że relacja jest relacją równoważności. Jest zwrotna {x k } {x k }, symetryczna {x k } {y k } z tego wynika {y k } {x k } i przechodnia {x k } {y k } i {y k } {z k } implikuje {x k } {z k }. Dowód przechodniości: niech ɛ > 0 oraz p = ɛ/2. Ponieważ {x k } {y k }, to istnieje k 1 (p) takie, że dla każdego k spełniającego k k 1 (p) zachodzi d (x k, y k ) < p. Podobnie istnieje k 2 (p) takie, że dla każdego k spełniającego k k 2 (p) zachodzi d (y k, z k ) < p. Niech k (ɛ) = max {k 1 (p), k 2 (p)}. Wtedy dla każdego k k (ɛ) zachodzi d (x k, z k ) d (x k, y k ) + d (y k, z k ) < p + p = ɛ, dlatego {x k } {z k }. Równoważne ciągi Cauchy ego muszą mieć tą samą granicę. Dowód: załóżmy, że {x k } {y k } oraz x k x. Niech ɛ > 0. Istnieje k 1 (ɛ) takie, że dla każdego k k 1 (ɛ) zachodzi d (x k, x) < ɛ/2, istnieje także k 2 (ɛ) takie, że dla każdego k k 2 (ɛ) zachodzi d (x k, y k ) < ɛ/2. Ustawiając k (ɛ) = max {k 1 (ɛ), k 2 (ɛ)}, dla każdego k k (ɛ) zachodzi d (x, y k ) d (x, x k ) + d (x k, y k ) < ɛ/2 + ɛ/2 = ɛ, co oznacza y k x. 2.2.3 Kres górny, dolny, maksimum, minimum Niech A będzie niepustym podzbiorem R. Ograniczenie górne zbioru A, zapisywane jako U (A) jest zdefiniowane jako: U (A) = {u R u a dla kazdego a A} Ograniczenie dolne, L (A) jest zdefiniowane jako: L (A) = {l R l a dla kazdego a A} Zbiór U i zbiór L mogą być puste. Przykładowo dla A = N zbiór U jest pusty, dla A = Z zbiory U i L są puste. Jeśli U (A) jest niepusty to mówimy, że zbiór A jest 14
ograniczony od góry. Jeśli L (A) jest niepusty to mówimy, że zbiór A jest ograniczony od dołu. Kres górny zbioru A, zapisywany jako sup A jest najmniejszym elementem ze zbioru ograniczenia górnego. Jeśli U (A) jest niepusty, to sup A jest zdefiniowane jako unikalny punkt a U (A) taki, że a u dla każdego u U (A). Jeśli U (A) jest pusty to piszemy sup A = +. Podobnie kres dolny zbioru A, zapisywany jako inf A jest największym elementem ze zbioru ograniczenia dolnego. Jeśli L (A) jest niepusty, to inf A jest zdefiniowane jako unikalny punkt â L (A) taki, że â l dla każdego l L (A). Jeśli L (A) jest pusty to piszemy inf A =. Theorem 2.2.5. Jeśli U (A) jest niepusty, to kres górny istnieje, to znaczy istnieje a U (A) takie, że a u dla każdego u U (A). Podobnie jeśli L (A) jest niepusty, to kres dolny istnieje, to znaczy istnieje â L (A) takie, że â l dla każdego l L (A). Theorem 2.2.6. Załóżmy, że sup A jest skończone. Wtedy dla każdego ɛ > 0, istnieje a (ɛ) A takie, że a (ɛ) > sup A ɛ. Dowód. Wprowadźmy oznaczenie a = sup A. Przypuśćmy, że twierdzenie nie będzie spełnione dla pewnego ɛ > 0, to znaczy, że a a ɛ dla każdego a A. Ale wtedy a ɛ będzie należało do ograniczenia górnego A. Ale to stoi w sprzeczności z definicją a jako najmniejszego elementu ograniczenia górnego. Maksimum niepustego zbioru A R, zapisywane jako max A jest zdefiniowane jako punkt z A taki, że z a dla każdego a A. Minimum niepustego zbioru A R, zapisywane jako min A jest zdefiniowane jako punkt w A taki, że w a dla każdego a A. Z definicji wynika, że maksimum musi być elementem ograniczenia górnego A, a minimum musi być elementem ograniczenia dolnego A. Można podać alternatywne definicje takie, że max A = A U (A) i min A = A L (A). Wartości sup A i inf A są zawsze zdefiniowane dla niepustego A, a max A i min A mogą nie istnieć, nawet gdy sup A i inf A są skończone. Dla przykładu A = (0, 1), wtedy U (A) = {x x 1} i L (A) = {x x 0}, sup A = 1, inf A = 0. Ale maksimum i minimum nie istnieje. Z definicji wynika, że jeśli maksimum istnieje, to max A = sup A, co oznacza, że maksimum istnieje wtedy i tylko wtedy, gdy sup A A. Podobnie z minimum. 2.2.4 Ciągi monotoniczne Ciąg {x k } w R jest ciągiem rosnącym kiedy a ciągiem malejącym, gdy x k+1 x k dla kazdego k x k+1 x k dla kazdego k Ciąg {x k } w R zmierza do + (x k + ), jeśli dla każdego p N istnieje k (p) takie, że dla każdego k k (p) zachodzi x k p, ciąg {x k } w R zmierza do (x k ), jeśli dla każdego p N istnieje k (p) takie, że dla każdego k k (p) zachodzi x k p. 15
Jeśli ciąg zmierza do ±, to musi być nieograniczony, ale odwrotnie niekoniecznie, np. ciąg {x k } zdefiniowany jako { 1 kiedy k jest nieparzyste x k = k kiedy k jest parzyste jest nieograniczony, ale nie zmierza do +. Jeśli {x k } jest ciągiem nieograniczonym, to musi zawierać co najmniej jeden podciąg, który zmierza do + lub. Theorem 2.2.7. Niech {x k } będzie ciągiem rosnącym w R. Jeśli {x k } jest nieograniczony, to musi zmierzać do +. Jeśli {x k } jest ograniczony, to jest zbieżny do granicy x, gdzie x to kres górny zbioru punktów {x 1, x 2,...}. Ponieważ {x k } w R jest ciągiem rosnącym, wtedy i tylko wtedy, gdy { x k } jest ciągiem malejącym, to zachodzi następujące twierdzenie: Theorem 2.2.8. Niech {x k } będzie ciągiem malejącym w R. Jeśli {x k } jest nieograniczony, to musi zmierzać do. Jeśli {x k } jest ograniczony, to jest zbieżny do granicy x, gdzie x to kres dolny zbioru punktów {x 1, x 2,...}. 2.2.5 Granica dolna i górna Wprowadzimy konwencje, } że ciąg {x k } posiada punkt skupienia +, kiedy {x k } zawiera podciąg {x m(k), który zmierza do +, ciąg {x k } posiada punkt skupienia, kiedy } {x k } zawiera podciąg {x m(k), który zmierza do. W szczególności jeśli ciąg {x k } zmierza do +, wtedy + będzie traktowane jako granica {x k }. Niech będzie dany {x k } w R. Granica górna {x k } jest zdefiniowana jako granica przy k {a k } zdefiniowanego jako: a k = sup {x k, x k+1, x k+2,...} i jest zapisywana jako: lim sup k x k. Można zauważyć, że granica górna zawsze istnieje, są 3 możliwości dla ciągu a k, po pierwsze a k = + dla pewnego k lub dla każdego k, po drugie {a k } musi spełniać a k+1 a k dla każdego k, ponieważ a k+1 jest kresem górnym z mniejszego zbioru, co oznacza, że {a k } musi być ciągiem nierosnącym w R. Z poprzedniego twierdzenia dla ciągów monotonicznych wynika, że jeśli {a k } jest nieograniczony, to a k, a jeśli {a k } jest ograniczony, wtedy {a k } zmierza do pewnego a. We wszystkich 3 przypadkach granica istnieje. Dlatego lim sup zawsze istnieje. Granica dolna {x k } jest zdefiniowana jako granica przy k {b k } zdefiniowanego jako: i jest zapisywana jako: lim inf k x k. b k = inf {x k, x k+1, x k+2,...} Theorem 2.2.9. Niech {x k } będzie ciągiem w R oraz A zbiorem wszystkich punktów skupienia {x k } (włącznie z ± ). Oznaczmy: } a = } lim sup k x k, b = lim inf k x k. Wtedy zachodzi: istnieją podciągi {x m(k) i {x l(k) takie, że x m(k) a i x l(k) b, a = sup A i b = inf A. 16
Z powyższego twierdzenia wynika, że lim sup k x k lim inf k x k. Ostra nierówność zachodzi np. dla ciągu {x k } = {0, 1, 0, 1, 0, 1,...}, który ma lim sup k x k = 1 i lim inf k x k = 0. Theorem 2.2.10. Ciąg {x k } w R jest zbieżny do granicy x R, wtedy i tylko wtedy, gdy lim sup k x k = lim inf k x k = x. Theorem 2.2.11. Ciąg {x k } w R n jest zbieżny do granicy x, wtedy i tylko wtedy, gdy każdy podciąg {x k } jest zbieżny do x. Przykład 1: dany jest ciąg x k = ( 1) k /k. Dla k nieparzystego mamy a k = 1/ (k + 1), dla parzystego a k = 1/k, a zatem lim sup k x k = 0. Przykład 2: dany jest ciąg x k = sin k, wtedy można udowodnić, że a k = 1, a zatem lim sup k x k = 1. 2.2.6 Zadania Zadanie 1. Znaleźć granicę dolną i górną następujących ciągów: x k = ( 1) k dla k = 1, 2,... x k = k ( 1) k dla k = 1, 2,... x k = ( 1) k + 1/k dla k = 1, 2,... x k = 1 dla k parzystych, x k = k/2 dla k nieparzystych, k = 1, 2,.... 1, 1, 2, 1, 2, 3, 1, 2, 3, 4,... Zadanie 2. Znajdź kres dolny, górny, maksimum, minimum następujących zbiorów: X = {x [0, 1] x jest niewymierne} X = {x x = 1/n, n = 1, 2,...} X = {x x = 1 1/n, n = 1, 2,...} X = {x [0, π] sin x > 1/2} 2.2.7 Laboratoria 1. Zadania na 3.0 (a) Napisać metodę w klasie Sequence zwracającą informację czy dany ciąg jest ciągiem malejącym, rosnącym, ściśle malejącym, ściśle rosnącym, stałym. (b) Sprawdzić czy podane ciągi w poprzednim konspekcie w zadaniu na 5.0 są ciągami rosnącymi, malejącymi, itd. (c) Napisać metodę w klasie Sequence zwracającą maksimum i minimum dla ciągów dla zdefiniowanego dużego przedziału, przetestować dla ciągów z poprzedniego konspektu. 17
2. Zadania na 4.0 (a) napisać metodę dla klasy Sequence sprawdzającą czy dany ciąg jest zbieżny za pomocą kryterium Cauchy ego. 3. Zadania na 5.0 (a) Napisać metodę w klasie Sequence zwracającą najdłuższy podciąg stały, rosnący, malejący podanego ciągu w zdefiniowanym dużym przedziale. Wskazówka: można zaimplementować algorytm podany tutaj: http://en.wikipedia.org/wiki/longest_i. 2.3 Wprowadzenie do metod numerycznych 2.3.1 Kule otwarte, zbiory otwarte, zbiory domknięte Niech x R n. Kula otwarta B (x, r) ze środkiem x i promieniem r > 0 jest zdefiniowana jako: B (x, r) = {y R n d (x, y) < r} Po zastąpieniu nierówności ostrej nierównością słabą otrzymujemy kulę domkniętą B z (x, r). Zbiór S w R n nazywamy otwartym, jeśli dla każdego x S istnieje r > 0 takie, że B (x, r) S. Intuicyjnie zbiór S jest otwarty, gdy z każdego punktu x S możemy przemieścić się na małą odległość w dowolnym kierunku bez opuszczania S. Zbiór S w R n jest domknięty, kiedy jego dopełnienie S c = {x R n x / S} jest otwarte. Theorem 2.3.1. Zbiór S R n jest domknięty, wtedy i tylko wtedy, gdy dla każdego ciągu {x k } takiego, że dla każdego k x k S, zachodzi x k x, gdzie x S. Przykładem zbioru domkniętego jest domknięty przedział jednostkowy [0, 1] = {x R 0 x 1}, a zbioru otwartego otwarty przedział jednostkowy (0, 1) = {x R 0 < x < 1}. Istnieją ponadto zbiory, które nie są otwarte i nie są domknięte. Przykładowo [0, 1) = {x R 0 < x 1} oraz (0, 1] = {x R 0 x < 1} Zbiorami w przestrzeni euklidesowej, które są zarówno otwarte jak i domknięte są tylko zbiór pusty i cała przestrzeń. 2.3.2 Zbiory ograniczone i zbiory zwarte Zbiór S R n nazywamy ograniczonym, jeśli istnieje r > 0 takie, że S B (0, r). Czyli gdy zbiór jest całkowicie zawarty w pewnej kuli otwartej ze środkiem w punkcie 0. Przykładowo przedział (0, 1) jest zbiorem ograniczonym w R, natomiast zbiór liczb naturalnych nie jest ograniczony. Zbiór S R n jest zwarty, jeśli dla } każdego ciągu punktów {x k } takiego, że dla każdego k x k S, istnieje podciąg {x m(k) oraz istnieje x S takie, że x m(k) x. Opisowo zbiór jest zwarty, jeśli każdy jego ciąg zawiera podciąg zbieżny do granicy ze zbioru S. Jeśli S R n jest zwarty, to S musi być ograniczony, ponieważ gdyby nie był ograniczony to istniałby ciąg {x k } w S taki, że x k > k, a taki ciąg nie może zawierać podciągu zbieżnego. Podobnie, jeśli zbiór jest zwarty, to musi 18
być również domknięty. Jeśli by tak nie byłoby, to istniałby {x k } w S taki, że x k x, gdzie x / S. Wszystkie podciągi wtedy również zmierzają do x, co stoi w sprzeczności z definicją zwartości. Zachodzi ponadto twierdzenie w drugą stronę, w sumie: Theorem 2.3.2. Zbiór S R n jest zwarty, wtedy i tylko wtedy, gdy jest domknięty i ograniczony. 2.3.3 Kombinacje wypukłe, zbiory wypukłe Dana jest kolekcja punktów x 1,..., x m R n. Punkt z R n jest kombinacją wypukłą punktów (x 1,..., x m ), jeśli istnieje λ R m spełniające λ i 0, i = 1,..., m i m i=1 λ i = 1 takie, że z = m i=1 λ i x i. Zbiór S R n jest wypukły, jeśli każda kombinacja wypukła każdej pary punktów z S jest w S. Intuicyjnie S jest wypukły, jeśli odcinek łączący dowolne dwa punkty w S jest całkowicie zawarty w S. Przykładowo otwarty i domknięty przedział jednostkowy są wypukłe, hiperkula domknięta D = {x R n x 1} jest również wypukła. Okrąg jednostkowy { } C = x R 2 x = 1 nie jest wypukły, ponieważ dla punktów ( 1, 0) C i (1, 0) C istnieje kombinacja wypukła z = (0, 0) / C. Powyższy punkt jest kombinacją wypukłą, ponieważ dla λ = (0.5, 0.5) mamy 0.5 [ 1, 0]+0.5 [1, 0] = [0, 0]. Zauważmy również, że dla podanych dwóch punktów mogą istnieć kombinacje wypukłe należące do C. 2.3.4 Suma zbiorów, przekrój zbiorów Zbiór A indeksuje kolekcje zbiorów S, jeśli S a S jest zdefiniowany dla każdego a A oraz dla każdego S i S istnieje a A. Kolekcja zbiorów S będzie oznaczana jako (S a ) a A. Jeśli zbiór indeksowy zawiera skończoną liczbę elementów będzie zwany skończonym zbiorem indeksowym, w przeciwnym wypadku dowolnym zbiorem indeksowym. Jeśli B A, wtedy kolekcja (S b ) b B jest nazywana podkolekcją. Skończona podkolekcja będzie oznaczana jako (S ϕ ) ϕ B Dla dowolnej kolekcji (S a ) unia kolekcji zapisywana jako a A S a i przecięcie kolekcji zapisywane jako a A S a są zdefiniowane następująco: S a = {x R n x S a dla pewnego a A} a A a A S a = {x R n x S a dla kazdego a A} Theorem 2.3.3 (Prawo de Morgana). Niech A będzie dowolnym zbiorem indeksowym. Niech (G a ) będzie kolekcją zbiorów indeksowanych przez A. Wtedy: ( ) c G a = G c a a A a A 19
( ) c G a = G c a a A a A Theorem 2.3.4. Niech A będzie dowolnym zbiorem indeksowym. Załóżmy, że dla każdego a A, G a jest zbiorem otwartym. Wtedy a A G a jest również otwarta. Theorem 2.3.5. Niech A będzie dowolnym zbiorem indeksowym. Załóżmy, że dla każdego a A, H a jest zbiorem domkniętym. Wtedy a A H a jest również domknięte. Theorem 2.3.6. Niech G 1,..., G l będą zbiorami otwartymi, gdzie l jest dodatnie. Wtedy li=1 G i jest otwarty. Theorem 2.3.7. Niech H 1,..., H l będą zbiorami domkniętymi, gdzie l jest dodatnie. Wtedy l i=1 H i jest domknięta. Warto zaznaczyć, że dwa powyższe twierdzenia są spełnione tylko dla skończonych kolekcji G i H. Przykładowo niech A = {1, 2, 3,...}. Załóżmy, że dla każdego a A G a będzie otwartym przedziałem (0, 1 + 1/a), zaś H a będzie zamkniętym przedziałem [0, 1 1/a]. Wtedy ( a A G a) = (0, 1] nie jest zbiorem otwartym, a zbiór ( a A H a) = [0, 1) nie jest zbiorem domkniętym. Dla podkolekcji (S b ) b B mówimy, że podkolekcja ma niepuste przecięcie, gdy ( b B S b). Theorem 2.3.8. Niech (S a ) a A będzie kolekcją zbiorów zwartych w R n taką, że każda skończona podkolekcja (S ϕ ) ϕ B ma niepuste przecięcie. Wtedy cała kolekcja ma niepuste przecięcie: ( a A S a). Theorem 2.3.9. Niech (S k ) k N będzie kolekcją zbiorów zwartych w R n, która jest zagnieżdżona, to znaczy dla każdego k S k+1 S k. Wtedy k=1 S k. Warto zaznaczyć, że w dwóch powyższych twierdzeniach kolekcja musi składać się ze zbiorów zwartych. Przykładowo dla k N niech S k = [k, ). Zbiory S k nie są zwarte, są domknięte, ale nieograniczone. Kolekcja (S k ) k N jest zagnieżdżona, ale iloczyn zbiorów S k jest pusty, ponieważ dla x R, możemy wziąść k > x, i wtedy x / S k. Zdefiniujmy sumę zbiorów S 1 i S 2 S 1 + S 2 jako: S 1 + S 2 = {x R n x = x 1 + x 2, x 1 S 1, x 2 S 2 } Theorem 2.3.10. Jeśli S 1 i S 2 są zwarte, to S 1 + S 2 też jest zwarty. Warto zaznaczyć, że zbiory muszą być zwarte, nie mogą być tylko domknięte. Przykładowo: niech S 1 = { (x, y) R 2 xy = 1 } oraz S 2 = { (x, y) R 2 xy = 1 }. Zbiory S 1 i S 2 są domknięte. Dla każdego k = 1, 2, 3,... zachodzi (k, 1/k) S 1 i ( k, 1/k) S 2, z tego wynika, że (0, 2/k) S 1 + S 2. Ten ciąg zmierza do (0, 0), które nie może należeć do S 1 + S 2, ponieważ (0, 0) może należeć do S 1 + S 2 wtedy i tylko wtedy, gdy istnieje punkt (x, y) S 1 taki, że ( x, y) S 2. Ale xy = ( x) ( y), dlatego (x, y) S 1 implikuje ( x, y) S 1. Kolekcja zbiorów otwartych (S a ) a A w R n jest pokryciem otwartym danego zbioru S R n, jeśli S S a a A 20
Pokrycie otwarte posiada skończone podpokrycie, jeśli istnieje skończona podkolekcja (S ϕ ) ϕ F taka, że S ϕ F Wskażemy przykłady zbiorów S i otwartych pokryć (S a ) a A zbioru S, takich, które nie dopuszczają skończonych podpokryć. Przykład: niech S będzie domkniętym, nieograniczonym przedziałem [0, ) i A = N. Dla każdego k N definiujemy S k jako (k 2, k + 2). Oczywiście (S k ) k N jest pokryciem otwartym, które nie posiada skończonego podpokrycia. Przykład 2: Niech S będzie zbiorem ograniczonym, otwartym (0, 1) i A = N. Dla każdego k N niech S k = (1/ (k + 2), 1/k). Możemy zauważyć, że k N S k = (0, 1) = S, co jest równoważne temu, że wybrana kolekcja S k jest pokryciem otwartym. Zauważmy, że kolekcja ta nie posiada skończonego podpokrycia. Niech będzie dany skończony zbiór {k 1,..., k l }. Niech k = max {k 1,..., k l }. Jeśli dane jest x takie, że 0 < x < 1/ (k + 2), wtedy x / l j=1 S kj, co implikuje, że żadna skończona podkolekcja nie pokrywa S. Theorem 2.3.11. Zbiór S w R n jest zwarty, wtedy i tylko wtedy, gdy każde otwarte pokrycie S posiada skończone podpokrycie. Theorem 2.3.12. Niech (S a ) a A będzie kolekcją zbiorów wypukłych w R n. Wtedy a A S a jest też wypukły. Theorem 2.3.13. Załóżmy, że S 1 i S 2 są zbiorami wypukłymi w R n, wtedy S 1 + S 2 też jest wypukły. Jeśli S 1 i S 2 są wypukłe to nie możemy twierdzić, że S 1 S 2 też jest wypukłe. Przykładowo S 1 = [0, 1], S 2 = [2, 3]. Obydwa zbiory są wypukłe, ale ich suma nie. 2.3.5 Zadania Zadanie 1. Niech A R 2 będzie zdefiniowany jako: { } A = (x, y) R 2 : 1 < x < 2 i y = x Czy A jest otwarty, ograniczony, zwarty? Zadanie 2. Niech A = {1, 1/2, 1/3,..., 1/n,...} {0}. Czy A jest domknięty, czy A jest zwarty? Zadanie 3. Niech A R 2 będzie zdefiniowany jako: A = {(x, y) R 2 : y = sin 1 } x, x > 0 {(0, 0)} Czy A jest domknięty, otwarty, ograniczony, zwarty? Zadanie 4. Niech A = [ 1, 0) i B = (0, 1]. Czy prawdziwe są następujące stwierdzenia: 1. A B jest zwarty S ϕ 2. A + B = {x + y : x A, y B} jest zwarty 3. A B jest zwarty 21
2.3.6 Laboratoria 1. Zadania na 3.0 (a) Napisać funkcję sprawdzającą czy dana lista punktów należy do podanego okręgu. Funkcja przyjmuje jako parametry listę punktów oraz obiekt klasy okrąg. Punkty powinny być wygenerowane losowo. 2. Zadania na 4.0 (a) Napisać funkcję znajdującą okrąg o najmniejszym możliwym promieniu zawierający losowo wygenerowane punkty na płaszczyźnie. Funkcja przyjmuje jako parametr listę punktów. 3. Zadania na 5.0 (a) Napisać podobną funkcję jak w zadaniu na 4.0 tylko dla przypadku 3d. 2.4 Wprowadzenie do metod numerycznych 2.4.1 Macierze Macierz A n m jest zdefiniowania jako tablica: a 11 a 12... a 1m a 21 a 22... a 2m A =...... a n1 a n2... a nm gdzie a ij jest liczbą rzeczywistą dla każdego i {1,..., n} i j {1,..., m}. Oznaczenie a ij odnosi się do (i, j)-elementu macierzy A. Używamy również zapisu A = (a ij ). Wektor [a i1,..., a im ] jest nazywany i-tym wierszem macierzy A i jest oznaczany jako A r i. Wektor a 1j. a nj jest nazywany j-tą kolumną macierzy A i będzie oznaczane jako A c j. Wobec powyższych oznaczeń: a 11 a 12... a 1m A a 21 a 22... a r 1 2m A =..... =. = [A c 1,..., A c m]. A a n1 a n2... a r n nm 22
Suma macierzy A i B o wymiarach n m oznaczana jako A + B jest macierzą n m zdefiniowaną jako: a 11 + b 11... a 1m + b 1m A + B =..... a n1 + b n1... a nm + b nm Suma macierzy jest zdefiniowana tylko dla macierzy o tych samych wymiarach. Jeśli A jest macierzą n m, B jest macierzą m k to ich iloczyn AB jest macierzą n k, której element (i, j) jest iloczynem skalarnym A r i i Bc j. A r 1 Bc 1 A r 1 Bc 2... A r 1 Bc k A r 2 AB = Bc 1 A r 2 Bc 2... A r 2 Bc k...... A r n B1 c A r n B2 c... A r n Bk c Dla każdego i {1... n} i j {1... k} mamy A r i Bc j = m l=1 a il b lj. Iloczyn macierzy jest zdefiniowany tylko gdy liczba kolumn A jest równa liczbie wierszy B. W ogólności AB nie jest tym samym co BA. Jeśli A ma rozmiar n m, B ma rozmiar m k, wtedy AB jest zdefiniowane, ale BA jest zdefiniowane tylko gdy n = k. Theorem 2.4.1. Dodawanie i mnożenie macierzy mają następujące własności: 1. A + B = B + A 2. dodawanie jest łączne (A + B) + C = A + (B + C). 3. mnożenie jest łączne (AB) C = A (BC). 4. mnożenie jest rozdzielne względem dodawania A (B + C) = AB + AC Macierz transponowana do A, zapisywana jako A to macierz, której element (i, j) jest równy a ji. Jeśli A ma rozmiar n m, to A ma rozmiar m n. Przykładowo: a 11 a 12 A = a 21 a 22 a 31 a 33 [ ] A a11 a = 21 a 31 a 12 a 22 a 32 Macierz transponowana ma następujące własności: (A + B) = A + B (AB) = B A W ostatniej własności iloczyn AB jest zdefiniowany, wtedy i tylko wtedy, gdy iloczyn B A jest zdefiniowany. Często wektor x R n w algebrze traktuje się jako wektor kolumnowy, to znaczy macierz o wymiarach n 1, wtedy wektor wierszowy jest oznaczany jako x i jest macierzą 1 n. 23
Szczególne typy macierzy Macierz diagonalna to taka, że a ij = 0 dla i j. Macierz kwadratowa to macierz A o wymiarach n m, gdzie n = m. Wartość n = m jest nazywana stopniem macierzy. Elementy A a ii dla i = {1,..., n} są nazywane elementami diagonalnymi, pozostałe zaś niediagonalnymi. Macierz kwadratowa jest macierzą symetryczną, jeśli dla każego i, j {1,..., n} zachodzi a ij = a ji. Macierz diagonalna D stopnia n to macierz kwadratowa, której wszystkie elementy niediagonalne są zerami. Każda macierz diagonalna kwadratowa jest symetryczna. d 11 0... 0 0 d 22... 0 D =...... 0 0... d nn Macierz jednostkowa stopnia n to macierz kwadratowa, której elementy diagonalne są jedynkami, a niediagonalne zerami. 1 0... 0 0 1... 0 I =...... 0 0... 1 Macierz jednostkowa jest macierzą diagonalną. Macierz jednostkowa ma następującą własność: jeśli A ma wymiary k n, a B wymiary n m, to wtedy AI = A oraz IB = B, w szczególności I 2 = II = I. Macierz dolnotrójkątna stopnia n to macierz kwadratowa D, w której wszystkie elementy powyżej głównej przekątnej są zerami: d 11 0... 0 d 21 d 22... 0 D =...... d n1 d n2... d nn Macierz górnotrójkątna stopnia n to macierz kwadratowa D, w której wszystkie elementy poniżej głównej przekątnej są zerami: d 11 d 12... d 1n 0 d 22... d 2n D =...... 0 0... d nn Macierz transponowana do górnotrójkątnej jest macierzą dolnotrójkątną i odwrotnie. Macierz schodkowa n m to macierz, której pierwsze niezerowe elementy kolejnych niezerowych wierszy znajdują się w coraz dalszych kolumnach, a wiersze zerowe umieszcza 24
się jako ostatnie. Dla macierzy kwadratowej macierz schodkowa jest macierzą górnotrójkątną. Przykład macierzy schodkowej: 1 9 1 1 D = 0 1 0 2 0 0 1 3 Macierz klatkowa to macierz, której elementami są inne macierze. Przykład: macierz 1 1 2 2 1 1 2 2 P = 3 3 4 4 3 3 4 4 może być zapisana w postaci klatkowej: [ P11 P P = 12 P 21 P 22 ] gdzie P 11 = [ 1 1 1 1 ] P 12 = [ 2 2 2 2 ] P 21 = [ 3 3 3 3 ] P 22 = [ 4 4 4 4 ] Rząd macierzy Niech będzie dany skończony zbiór wektorów x 1,..., x k R n. Wektory te są liniowo zależne, jeśli istnieją liczby rzeczywiste a 1,..., a k, takie, że dla pewnego i, a i 0 oraz a 1 x 1 +... + a k x k = 0 Jeśli jednym rozwiązaniem powyższej równości jest α 1 = = α k x 1,..., x k są liniowo niezależne. Przykładowo wektory [ ] [ ] [ ] 3 7 12 x = y = z = 1 6 10 = 0, to wektory są liniowo zależne, ponieważ x + 3y 2z = 0. Następujące wektory są liniowo niezależne 1 0 0 x = 0 y = 1 z = 0 0 0 1 Niech A będzie macierzą n m. Rząd wierszowy A, zapisywany jako p r (A) jest zdefiniowany jako maksymalna liczba liniowo niezależnych wierszy A. Rząd wierszowy A wynosi k, jeśli zachodzą warunki: istnieje podzbiór (l 1,..., l k ) k różnych liczb ze zbioru {1,..., n} takich, że wektory A r l 1,..., A r l k są liniowo niezależne. 25
dla każdego podzbioru (l 1,..., l k+1 ) k + 1 różnych liczb ze zbioru {1,..., n}, wektory A r l 1,..., A r l k+1 są liniowo zależne. Jeśli k = n to drugi warunek nie jest konieczny. Rząd kolumnowy A zapisywany jako p c (A) jest zdefiniowany jako maksymalna liczba liniowo niezależnych kolumn A. Zachodzi p r (A) n, p c (A) m. Theorem 2.4.2. Rząd wierszowy p r (A) jest równy rzędowi kolumnowemu p c (A). Rząd macierzy oznaczany jest jako p (A). Zachodzi p (A) min {m, n}. Theorem 2.4.3. Rząd macierzy A p (A) jest równy rzędowi macierzy transponowanej p (A ) Theorem 2.4.4. Następujące operacje nie zmieniają rzędu macierzy. Dana jest macierz A n m. Macierz B n m powstała z A poprzez: zamianę dwóch dowolnych wierszy macierzy A pomnożenie każdego elementu w danym wierszu przez niezerową stałą a zamianę danego wiersza, np. i-tego na ten sam wiersz zsumowany z innym wierszem j pomnożonym przez stałą a posiada rząd p (B) ten sam co rząd A p (A). To samo twierdzenie jest spełnione dla kolumn. Macierz A m n jest pełnego rzędu, jeśli p (A) = min {m, n}. W szczególności macierz kwadratowa A stopnia n jest pełnego rzędu, jeśli p (A) = n. Theorem 2.4.5. Niech A ma rozmiar m n Jeśli B ma rozmiar n k, to p (AB) min {p (A), p (B)}. Niech P i Q będą macierzami kwadratowymi stopnia m i n odpowiednio, które są pełnego rzędu. Wtedy p (P A) = p (AQ) = p (P AQ) = p (A) Theorem 2.4.6. Rząd macierzy schodkowej jest równy liczbie jej schodków, czyli niezerowych wierszy. Przekształcanie macierzy do postaci macierzy schodkowej za pomocą operacji elementarnych i odczytanie na jej podstawie rzędu macierzy jest nazywane metodą Gaussa obliczania rzędu macierzy. Operacje elementarne to: przestawienie wierszy macierzy, pomnożenie wiersza przez niezerową stałą, zastąpienie wiersza innym wierszem pomnożonym przez dowolną stałą. 26
Odwracanie macierzy Dana jest macierz kwadratowa A o wymiarach n n. Macierz odwrotna, zapisywana jako A 1 jest zdefiniowana jako macierz B o wymiarach n n, która posiada własność: AB = I. Theorem 2.4.7. Niech A będzie macierzą n n. Warunkiem koniecznym i wystarczającym istnienia macierzy odwrotnej do A jest to, że rząd macierzy A jest równy n, albo równoważnie A 0. Jeśli A 1 istnieje, to jest unikalna, to znaczy dwie różne macierze B i C nie mogą być macierzami odwrotnymi macierzy A. Konstruowanie macierz odwrotnej: dana jest macierz spełniająca warunek A = 0. Weźmy pod uwagę podmacierze A powstające poprzez skreślenie i-tego wiersza i j-tej kolumny (o wymiarach (n 1) (n 1)). Wyznacznik takiej macierzy oznaczmy jako A (ij). Zdefiniujmy: C ij (A) = ( 1) i+j A (ij) gdzie C ij jest nazywane (i, j)-tym dopełnieniem algebraicznym A. Teraz konstruujemy macierz n n C (A) której (i, j)-ty element jest równy C ij (A). Macierz transponowana do C (A) jest nazywana macierzą dołączoną: Ostatecznie C 11 (A)... C n1 (A) Adj (A) =..... C 1n (A)... C nn (A) A 1 = 1 Adj (A) A Macierz odwrotna ma następujące własności: 1. Macierz odwrotna do A 1 jest równa A: ( A 1) 1 = A. 2. Macierz odwrotna do macierzy transponowanej jest transpozycją macierzy odwrotnej: (A ) 1 = ( A 1). 3. (AB) 1 = B 1 A 1. 4. A 1 = 1/ A. 5. Macierz odwrotna do macierzy dolno lub górno trójkątnej jest również odpowiednio macierzą dolno lub górno trójkątną. Metoda Gaussa odwracania macierzy: za pomocą operacji elementarnych sprowadzić macierz klatkową [A I] do macierzy klatkowej [I B]. Macierz B jest macierzą odwrotną do macierzy A, symbolicznie: [A I] [ I A 1]. Przykład: A = [ 7 4 3 2 27 ]
Macierz odwrotna istnieje ( A = 2). [ 7 4 1 0 [A I] = 3 2 0 1 ] [ 1 0 0 1 1 2 3/2 7/2 ] Wyznaczniki Definicja permutacyjna. Będziemy rozważać macierze kwadratowe stopnia n. Wyznacznik to funkcja, która przyporządkowuje A liczbę rzeczywistą zapisywaną jako A. Dla danego zbioru {1,..., n} permutacja tego zbioru to zapisanie tych liczb w dowolnym porządku j 1,..., j n. Weźmy wybraną permutację i wybierzmy dowolne j i. Zliczmy liczby, które następują po j i w zdefiniowanym porządku i jednocześnie są od niej mniejsze. Liczba ta nazywa się liczbą inwersji spowodowaną j i. Jeśli wyznaczymy liczbę inwersji dla każdego j i z danej permutacji i je zsumujemy to otrzymamy całkowitą liczbę inwersji dla permutacji j 1,..., j n. Jeśli ta liczba jest nieparzysta, to permutację nazywamy permutacją nieparzystą, jeśli zaś parzystą to permutację nazywamy permutacją parzystą. Przykładowo mamy daną permutację {4, 2, 3, 1}. Liczba inwersji spowodowana liczbą 4 wynosi 3, dla liczby 2 wynosi 1, dla liczby 3 wynosi 1, dla liczby 1 brak inwersji. Suma wszystkich inwersji jest równa 5, a zatem jest to permutacja nieparzysta. Niech będzie dana macierz kwadratowa A stopnia n. Niech j 1,..., j n oznacza dowolną permutację zbioru {1,..., n}. Rozważmy wektor (a 1j1,..., a njn ). Wektor ten składa się z dokładnie jednego elementu z każdego wiersza i żadne dwa elementy tego wektora nie leżą w tej samej kolumnie. Weźmy iloczyn tych elementów a 1j1 a 2j2 a njn. Jeśli permutacja jest nieparzysta niech ten iloczyn ma znak ujemny, jest parzysta to dodatni. Suma wszystkich możliwych iloczynów zdefiniowanych jak powyżej jest liczbą zwaną wyznacznikiem macierzy A. Przykład: [ ] a11 a A = 12 a 21 a 22 A = a 11 a 22 a 12 a 21 a 11 a 12 a 13 A = a 21 a 22 a 23 a 31 a 32 a 33 A = a 11 a 22 a 33 a 11 a 23 a 32 a 12 a 21 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 a 13 a 22 a 31 Theorem 2.4.8. Niech A będzie macierzą kwadratową stopnia n. 1. Jeśli macierz B powstaje z A poprzez przestawienie dwóch dowolnych wierszy macierzy A, wtedy B = A. 2. Jeśli B powstaje z A poprzez pomnożenie każdego elementu wybranego wiersza przez niezerową stałą a, wtedy B = a A. 3. Jeśli B powstaje z A poprzez zastąpienie wybranego wiersza A przez sumę tego wiersza i innego wiersza pomnożonego przez dowolną stałą a, wtedy B = A. 28
4. Jeśli A ma wiersz samych zer, wtedy A = 0. 5. Jeśli A jest macierzą dolnotrójkątną (lub górnotrójkątną) stopnia n, to A = a 11 a nn. W szczególności I = 1. Pierwsze cztery własności są prawdziwe również dla kolumn. Każda macierz, która powstaje z danej macierzy A o wymiarze n m poprzez usunięcie wybranych wierszy lub kolumn jest zwana podmacierzą A. Theorem 2.4.9. Niech B będzie macierzą o wymiarze n m. Niech k będzie stopniem maksymalnej podmacierzy kwadratowej B, której wyznacznik jest niezerowy. Wtedy p (A) = k. W szczególności wiersze B są liniowo niezależne, wtedy i tylko wtedy, gdy B zawiera podmacierz kwadratową stopnia n, której wyznacznik jest niezerowy. Macierz kwadratowa A stopnia n jest rzędu n, wtedy i tylko wtedy, gdy A 0. Rozwinięcie Laplace a. Zachodzi: n A = a ij C ij j=1 gdzie C ij to dopełnienie algebraiczne elementu a ij. Dopełnienie algebraiczne elementu a ij macierzy to wyznacznik powstały przez skreślenie i-tego wiersza i j-tej kolumny, pomnożony przez ( 1) i+j Przykład: A = 1 2 3 4 5 6 7 8 9 = Operacje na macierzach [ 5 6 8 9 ] 2 [ 4 6 7 9 Operacje na macierzach przydatne w dowodzeniu. ] + 3 [ 4 5 7 8 ] = 3 + 12 9 = 0 (AB) T = B T A T (2.1) AA 1 = A 1 A = I (2.2) IA = A (2.3) AI = A (2.4) (AB) 1 = B 1 A 1 (2.5) ( T v A) T = A T v (2.6) A (BC) = (AB) C (2.7) (ca) B = c (AB) = (AB) c = A (Bc) (2.8) (A ) T 1 = (A 1) T (2.9) 29