Zalecane podręczniki W. Krysicki, L. Włodarski naliza matematyczna w zadaniach, część I i II c Ł. Pawelec G. M. Fichtenholz Rachunek różniczkowy i całkowy, tom I i II S. Dorosiewicz, J. Kłopotowski, D. Kołatkowski Matematyka http://dydmat.mimuw.edu.pl http://wazniak.mimuw.edu.pl 1 Szeregi liczbowe ω Oznaczenie. Zapis a n oznacza sumę a α + a α+1 +... + a ω 1 + a ω. n=α Definicja 1.1. Niech (a n R będzie ciągiem liczbowym. Szeregiem a n nazywamy nieskończony ciąg sum częściowych S k = a n = a 1 + a 2 +... + a k. Jeśli ten ciąg ma granicę n=1 k n=1 skończoną, to mówimy, że szereg jest zbieżny. Jeśli ciąg nie ma granicy lub granicą jest ±, to mówimy że szereg jest rozbieżny. Oznaczenie. Szereg n=1 a n będziemy również oznaczać jako a n. Stwierdzenie 1.2 (warunek konieczny zbieżności. Jeśli szereg a n lim a n = 0. n + jest zbieżny, to 1.1 Szeregi o wyrazach dodatnich Uwaga. W tej części o wszystkich szeregach zakładamy, że ich wyrazy są dodatnie. Możemy wówczas szereg zbieżny oznaczyć jako a n < +, a szereg rozbieżny jako a n = +. Twierdzenie 1.3 (kryterium porównawcze. Dane są dwa ciągi a n i b n, o których wiemy, że a n b n dla wszystkich n N. Wówczas jeśli szereg a n jest rozbieżny, to szereg b n również; a jeśli b n jest zbieżny, to również zbieżny jest a n. Twierdzenie 1.4 (ilorazowe kryterium porównawcze. Dane są dwa ciągi a n i b n, o a n których wiemy, że lim = q. Wówczas: n + b n i gdy 0 < q < + : an < + b n < + ; ii gdy q = 0: an < + = b n < + ; iii gdy q = + : an < + = b n < +. Fakt 1.5. Używając kryteriów porównawczych warto pamiętać, że 1 < + p > 1. np Twierdzenie 1.6 (kryterium d lemberta. Wyznaczmy granicę lim n + a n+1 a n. Jeśli ta granica istnieje (skończona bądź nie, oznaczmy ją jako g. Kryterium d lemberta mówi, że jeśli g > 1, to szereg a n jest rozbieżny; jeśli 0 g < 1, to szereg jest zbieżny. 1
Twierdzenie 1.7 (kryterium pierwiastkowe Cauchy ego. Wyznaczmy granicę lim n + Jeśli ta granica istnieje (skończona bądź nie, oznaczmy ją jako g. Kryterium Cauchy ego mówi, że jeśli g > 1, to szereg a n jest rozbieżny; jeśli 0 g < 1, to szereg jest zbieżny. Uwaga. W obu powyższych twierdzeniach w sytuacji gdy g = 1, musimy zastosować inną metodę by zbadać zbieżność szeregu. Twierdzenie 1.8 (kryterium o zagęszczaniu. Załóżmy, że ciąg a n jest nierosnący, a p > 1 jest liczbą naturalną. Wówczas p n a p n < + a n < +. n an. 1.2 Szeregi ogólne Definicja 1.9. Mówimy, że szereg a n jest bezwzględnie zbieżny, jeśli szereg wartości bezwzględnych a n jest zbieżny. Mówimy, że szereg jest warunkowo zbieżny, jeśli jest zbieżny, ale nie jest bezwzględnie zbieżny; czyli jeśli a n = +, ale a n jest zbieżny. Twierdzenie 1.10 (kryterium Leibniza. Dany jest szereg a n, dla którego: i dla każdego n N zachodzi a n a n+1 < 0; (taki szereg nazywamy przemiennym ii a n jest ciągiem nierosnącym; iii lim a n = 0. n + Wówczas szereg a n jest zbieżny. Stwierdzenie 1.11 (Szacowanie reszty szeregów przemiennych. Załóżmy, że szereg an spełnia założenia kryterium Leibniza (Twr. 1.10. Wówczas zachodzi + a n a r. n=r 1.3 Szeregi a całki Definicja 1.12 (całka niewłaściwa. Niech f : [a, + R będzie funkcją całkowalną na dowolnym przedziale [a, b] dla b > a. Wówczas granicę lim b + b a f(x dx nazywamy całką niewłaściwą funkcji f na przedziale [a, + i oznaczamy jako + f(x dx. Jeśli ta granica istnieje i jest skończona, to mówimy, że całka jest zbieżna. a Twierdzenie 1.13 (kryterium całkowe zbieżności. Załóżmy, że f : [1, + R + jest funkcją nierosnącą i nieujemną. Wówczas mamy n=1 f(n < + + 1 f(x dx < + Stwierdzenie 1.14 (Szacowanie reszty przez całkę. Załóżmy, że funkcja f założenia kryterium całkowego (Twr. 1.13. Wówczas zachodzi + Uwaga. Można zajrzeć też do: r f(x dx n=r f(n + r 1 f(x dx. pl.wikipedia.org/wiki/kryteria_zbieżności_szeregów 2
2 Przestrzenie metryczne Definicja 2.1 (metryka. Niech X będzie niepustym zbiorem. Funkcję spełniającą warunki: 1. d(x, y = 0 x = y 2. d(x, y = d(y, x (symetria d: X X R 3. d(x, y + d(y, z d(x, z (nierówność trójkąta nazywamy metryką. Parę (X, d nazywamy przestrzenią metryczną. Uwaga. Gdy będziemy (w temacie przestrzeni metrycznych pisać R lub R n bez podawania explicite metryki, to zawsze mamy na myśli metrykę euklidesową. 2.1 Zbiory w przestrzeniach metrycznych Definicja 2.2 (kula. Kulą (otwartą o środku w punkcie c i promieniu r co oznaczamy jako B(c, r nazywamy zbiór: B(c, r = {x X : d(c, x < r}. Definicja 2.3 (wnętrze zbioru. Niech X. Punkt a nazywamy punktem wewnętrznym zbioru, jeśli istnieje kula o środku w tym punkcie zawarta w zbiorze. Zbiór wszystkich punktów wewnętrznych zbioru nazywamy wnętrzem zbioru i oznaczamy int. Definicja 2.4 (zbiór otwarty. Zbiór U X nazywamy otwartym, jeśli int U = U. Uwaga: zbiór pusty traktujemy jako otwarty. Stwierdzenie 2.5. Kula otwarta jest zbiorem otwartym w sensie powyższej definicji. Twierdzenie 2.6. Dla dowolnego zbioru zbiór int jest zbiorem otwartym. Innymi słowy int int = int. Twierdzenie 2.7. Suma dowolnej rodziny zbiorów otwartych jest zbiorem otwartym. Przecięcie (część wspólna skończonej rodziny zbiorów otwartych jest zbiorem otwartym. Definicja 2.8 (otoczenie. Otoczeniem punktu x X nazywamy dowolny zbiór otwarty U taki, że x U. Definicja 2.9 (domknięcie zbioru. Punkt x X nazywamy punktem skupienia zbioru X, jeśli dla każdego otoczenia U punktu x mamy: U ( \{x}. Jeśli x oraz x nie jest punktem skupienia zbioru to x nazywamy punktem izolowanym zbioru. Domknięciem zbioru nazywamy zbiór złożony z wszystkich jego punktów skupienia i punktów izolowanych i oznaczamy cl lub. Definicja 2.10 (zbiór domknięty. Zbiór F X nazywamy domkniętym, jeśli cl F = F. Uwaga: zbiór pusty traktujemy jako domknięty. Twierdzenie 2.11. Dla dowolnego zbioru zbiór cl jest zbiorem domkniętym. Innymi słowy cl cl = cl. 3
Twierdzenie 2.12. Przecięcie dowolnej rodziny zbiorów domkniętych jest zbiorem domkniętym. Suma skończonej rodziny zbiorów domkniętych jest zbiorem domkniętym. Twierdzenie 2.13. Niech X. Wtedy jest otwarty wtedy i tylko wtedy gdy def = X \ jest domknięty. Definicja 2.14 (brzeg zbioru. Brzegiem zbioru X nazywamy zbiór bd = cl \ int. Uwaga. Brzeg dowolnego zbioru jest zbiorem domkniętym. Oznaczamy też bd =. Definicja 2.15 (zbiór gęsty. Zbiór X nazywamy gęstym, jeśli cl = X. Definicja 2.16 (zbiór brzegowy. Zbiór X nazywamy brzegowym, jeśli int =. Definicja 2.17 (kres dolny i górny. Dany jest zbiór R. Wówczas kresem górnym (odp. dolnym zbioru nazywamy najmniejszą (odp. największą liczbę ograniczającą zbiór z góry (odp. z dołu. Innymi słowy s jest kresem górnym zbioru, jeśli natomiast i jest kresem dolnym gdy x x s oraz ( x x z = z s, x x i oraz ( x x z = z i, Oznaczenie. Kres górny zbioru oznaczamy jako sup, kres dolny jako inf. Jeśli zbiór nie jest ograniczony z góry (odp. z dołu, to piszemy sup = + (odp. inf =. Definicja 2.18 (średnica zbioru. Średnicę zbioru X definiujemy jako: diam = sup d(x, y. x,y X W przypadku gdy supremum to nie jest skończone mówimy, że zbiór ma nieskończoną średnicę. Definicja 2.19 (zbiór ograniczony. Zbiór X nazywamy ograniczonym, jeśli diam < +. 2.2 Ciągi w przestrzeniach metrycznych Definicja 2.20. Ciągiem w zbiorze X nazywamy odwzorowanie x: N X. Najczęściej elementy ciągu zapisujemy jako x n zamiast x(n. Cały ciąg oznaczamy (x n lub (x n n N. Definicja 2.21 (ciąg zbieżny. Niech (X, d będzie przestrzenią metryczną, a (x n ciągiem z przestrzeni X. Ciąg ten nazywamy zbieżnym, jeśli istnieje g X takie, że: ε>0 M N n>m x n B(g, ε. Element g spełniający powyższy warunek nazywamy granicą ciągu. Jeśli granica nie istnieje, ciąg nazywamy rozbieżnym. Stwierdzenie 2.22. Granica ciągu zbieżnego jest wyznaczona jednoznacznie. Stwierdzenie 2.23. Ciąg zbieżny jest ograniczony. Twierdzenie 2.24 (ciągowa definicja domkniętości. Zbiór X jest domknięty wtedy i tylko wtedy gdy dla każdego ciągu (x n elementów ze zbioru zachodzi: jeśli ciąg (x n jest zbieżny, to jego granica leży w. 4
Definicja 2.25 (zbiór zwarty. Zbiór X, gdzie (X, d to przestrzeń metryczna nazywamy zwartym, jeśli z każdego ciągu elementów zbioru można wybrać podciąg zbieżny do granicy w zbiorze. Stwierdzenie 2.26. Każdy zbiór zwarty jest zbiorem domkniętym. Twierdzenie 2.27. Niech R n. Zbiór jest zwarty wtedy i tylko wtedy gdy jest domknięty i ograniczony. Definicja 2.28 (granica górna i dolna. Dany jest ciąg (x n R. Wówczas kres górny punktów skupienia ciągu (x n nazywamy granicą górną ciągu, a kres dolny granicą dolną. Oznaczamy to jako lim sup x n i lim inf x n. n + n + Inaczej można powiedzieć, że L = lim sup x n, gdy istnieje podciąg ciągu (x n zbieżny do L oraz n + granica g dowolnego podciągu zbieżnego spełnia g L. Uwaga. Punktem skupienia ciągu w R może być również + oraz. Stwierdzenie 2.29. L jest granicą górną ciągu (x n wtedy i tylko wtedy gdy dla dowolnych L 1 i L 2, takich że L 1 < L < L 2, wszystkie x n z wyjątkiem co najwyżej skończonej liczby spełniają x n L 2 oraz istnieje nieskończenie elementów ciągu (x n, dla których x n L 1. Definicja 2.30 (ciąg Cauchy ego. (X, d przestrzeń metryczna. Ciągiem Cauchy ego nazywamy ciąg spełniający warunek: ε>0 M N n,m>m d(x n, x m < ε. Stwierdzenie 2.31. Każdy ciąg zbieżny jest ciągiem Cauchy ego. Stwierdzenie 2.32. Każdy ciąg Cauchy ego jest ograniczony. Definicja 2.33 (przestrzeń zupełna. Przestrzeń metryczną (X, d nazywamy zupełną, jeśli każdy ciąg Cauchy ego elementów tej przestrzeni jest zbieżny. Twierdzenie 2.34. Każda przestrzeń zwarta jest zupełna. 2.3 Norma Definicja 2.35. Niech X będzie przestrzenią liniową nad R (lub C. Funkcja N : X R nazywa się normą, gdy dla wszystkich t R; u, v X spełnione są warunki: 1. N(u = 0 u = 0 (niezdegenerowaność 2. N(tu = t N(u (jednorodność 3. N(u + v N(u + N(v (warunek trójkąta Parę (X, N nazywamy przestrzenią unormowaną. Stwierdzenie 2.36. Każda norma definiuje metrykę wzorem d(u, v = N(u v. Mówimy że jest to metryka indukowana przez normę lub metryka pochodząca od normy. Stwierdzenie 2.37. Każdy iloczyn skalarny definiuje normę wzorem N(u = (u u. Mówimy że jest to norma indukowana przez iloczyn skalarny lub pochodząca od iloczynu skalarnego. Definicja 2.38 (przestrzeń Banacha. Przestrzeń liniową unormowaną zupełną nazywamy przestrzenią Banacha. 5
3 Ciągi funkcyjne Definicja 3.1 (metryka supremum. Przekształcenie f : X Y, gdzie Y to przestrzeń metryczna nazywamy ograniczonym, jeśli zbiór f(x (czyli obraz przekształcenia f jest ograniczony. Zbiór przekształceń ograniczonych z przestrzeni X do przestrzeni metrycznej (Y, d Y oznaczamy B(X, Y. Niech f, g B(X, Y, określamy: ρ(f, g = sup x X Wtedy (B(X, R, ρ jest przestrzenią metryczną. d Y ( f(x, g(x W szczególności, gdy Y = R, to metryka przyjmuje postać: ρ(f, g = sup f(x g(x dla f, g B(X, R. x X Twierdzenie 3.2. Jeśli przestrzeń metryczna Y jest zupełna, to przestrzeń B(X, Y także jest zupełna. Jeśli Y jest przestrzenią Banacha, to B(X, Y też jest przestrzenią Banacha, z normą f = sup f(x, x X gdzie f B(X, Y, a to norma na przestrzeni Y. Definicja 3.3 (Zbieżność punktowa. Ciąg funkcji f n : X R jest zbieżny punktowo na zbiorze X do funkcji f : X R, jeśli x f n (x f(x dla n + innymi słowy: x ε>0 M>0 n>m f n (x f(x < ε. Definicja 3.4 (Zbieżność jednostajna. Niech f, f n B(X, R dla n N. Ciąg funkcji f n jest zbieżny jednostajnie na zbiorze do funkcji f, jeśli jest zbieżny w sensie normy supremum, tzn: f n f sup 0 dla n + innymi słowy: ε>0 M>0 n>m x f n (x f(x < ε Oznaczenie. Zbieżność punktową oznaczamy jako f n f, a zbieżność jednostajną jako f n f. Wniosek 3.5. Ciąg funkcji zbieżny jednostajnie jest zbieżny punktowo. Implikacja przeciwna nie zachodzi! Definicja 3.6 (Zbieżność niemal jednostajna. Dany jest zbiór X. Jeśli f n f na każdym zwartym podbiorze F, mówimy, że f n jest zbieżny niemal jednostajnie do funkcji f na zbiorze. 3.1 Własności zbieżności jednostajnej Twierdzenie 3.7. Mamy ciąg funkcji f n zbieżny jednostajnie do funkcji f. Jeśli f n są ciągłe w punkcie x 0, to funkcja graniczna f jest ciągła w x 0. Jeśli f n są ciągłe, to f również jest ciągła. 6
Twierdzenie 3.8 (różniczkowanie ciągu funkcyjnego. Mamy ciąg funkcji różniczkowalnych f n : [a, b] R, gdzie [a, b] R. Jeśli f n g oraz ciąg f n (x 0 jest zbieżny dla pewnego x 0 [a, b], to: i ciąg f n jest zbieżny jednostajnie do pewnej funkcji f : [a, b] R; ii funkcja f jest różniczkowalna oraz f = g. Twierdzenie 3.9 (Weierstrass. Jeśli f jest funkcją ciągłą na przedziale [a, b], to istnieje ciąg wielomianów P n taki, że P n f na [a, b]. Twierdzenie 3.10 (Bernstein. Jeśli f jest funkcją ciągłą na przedziale [0, 1], ciąg wielomianów P n spełniający P n f na [0, 1] można zapisać wzorem 3.2 Szeregi funkcyjne n P n (x = f k=0 ( k n ( n x n (1 x n k. k Definicja 3.11. Niech dany będzie ciąg funkcyjny f n, gdzie f n : X R. Oznaczmy przez S k funkcję sum częściowych k S k (x = f i (x i=1 Dla szeregu S(x = f i (x pojęcia zbieżności punktowej i jednostajnej definiujemy jak powyżej wykorzystując ciąg funkcyjny S k (x, przy czym szereg S(x jest określony na zbiorze tych i=1 x X dla których jest on zbieżny jako szereg liczbowy (tj. punktowo. Twierdzenie 3.12 (kryterium Weierstrassa. Dany jest ciąg funkcji f n : X R o których wiadomo, że f n (x a n dla każdego x X, n N. Wówczas jeśli szereg a n jest zbieżny, to szereg f n (x jest zbieżny jednostajnie. Jest także bezwzględnie zbieżny, czyli zbieżny jest szereg f n (x. Przykład 3.13. Najważniejszym szeregiem funkcyjnym jest szereg potęgowy. Ma on postać S(x = dla pewnego x 0 R oraz ciągu (a n R. a n (x x 0 n Stwierdzenie 3.14. Szereg potęgowy jest bezwzględnie zbieżny dla wszystkich x B(x 0, R dla pewnego R oraz rozbieżny dla x R \ B(x 0, R. Koło to nazywamy kołem zbieżności, a R promieniem zbieżności. Dodatkowo szereg jest niemal jednostajnie zbieżny na kole zbieżności. Uwaga. R może być również równe 0 (wtedy szereg jest zbieżny tylko dla x = x 0 oraz + (wtedy jest zbieżny dla wszystkich x. Wniosek 3.15. Połączenie kryterium Cauchy ego oraz kryterium Weierstrassa daje wzór na promień zbieżności: 1 R = lim sup n. an n + nalogiczny wzór można otrzymać stosując kryterium d lemberta. 7
Wniosek 3.16. Z Twr. 3.7 wynika, że szereg potęgowy jest funkcją ciągła wewnątrz koła zbieżności, a zatem jest też funkcją całkowalną. Co więcej z Twr. 3.8 wynika, że jest funkcją różniczkowalną i (cały czas wewnątrz koła zbieżności zachodzą wzory: 3.3 Szeregi Taylora ( + + a n (x x 0 n = a n n(x x 0 n 1 n=1 + a n (x x 0 n a n dx = n + 1 (x x 0 n+1 + C Twierdzenie 3.17. Niech f : R R będzie funkcją n krotnie różniczkowalną w punkcie x 0. Wówczas zachodzi f(x = f(x 0 + f (x 0 1! n = k=0 (x x 0 + f (x 0 2! f (k (x 0 (x x 0 k + R n (x k! dla pewnej funkcji R n (x spełniającej lim x x 0 (x x 0 2 +... + f (n (x 0 (x x 0 n + R n (x n! R n (x (x x 0 n = 0. Powyższe równanie nazywamy wzorem (lub rozwinięciem Taylora w punkcie x 0 postaci Peano. z resztą w Uwaga. Gdy x 0 = 0, to taki szereg nazywa się czasem wzorem Maclaurina. Twierdzenie 3.18 (reszta w postaci jawnej. Jeśli funkcja f jest (n + 1 krotnie różniczkowalna w otoczeniu punktu x 0, to zachodzą następujące wzory na funkcję R n (x: a R n (x = f (n+1 (ξ (n + 1! (x x 0 k+1, dla pewnego ξ [x 0, x]; postać Lagrange a reszty b R n (x = f (n+1 (ξ (x ξ k (x x 0, dla pewnego ξ [x 0, x]; postać Cauchy ego reszty n! c R n (x = x x 0 (x u n n! Definicja 3.19. Szereg f (n+1 (u du. postać całkowa reszty f (n (x 0 (x x 0 n n! nazywamy szeregiem Taylora funkcji f. Jeśli ten szereg jest zbieżny punktowo do funkcji f(x dla x, to mówimy, że funkcja f jest analityczna na. 8
Przykład 3.20. Poniżej są szeregi Taylora różnych funkcji rozwinięte w x 0 = 0. e x = ln(1 + x = sin(x = cos(x = arctg(x = n=1 1 1 x = x n n! = 1 + x + x2 2 + x3 6 +... dla x R ( 1 n+1 n x n = x x2 2 + x3... dla x < 1 3 ( 1 n (2n + 1! x2n+1 = x x3 6 + x5 120... dla x R ( 1 n (2n! x2n = 1 x2 2 + x4 24... dla x R ( 1 n 2n + 1 x2n+1 = x x3 3 + x5... dla x 1 5 x n = 1 + x + x 2 + x 3 +... dla x < 1 Uwaga. Można też zajrzeć do: https://pl.wikipedia.org/wiki/wzór_taylora. 4 Odwzorowania 4.1 Ciągłość odwzorowań Definicja 4.1 (ciągłość wg Heinego. Niech (X, d X, (Y, d Y przestrzenie metryczne. Mówimy, że odwzorowanie f : X Y jest ciągłe w punkcie x 0, jeśli dla każdego ciągu (x n zbieżnego do x 0 ciąg f(x n jest zbieżny do f(x 0. Innymi słowy ( lim d X(x n, x 0 = 0 n + = ( lim n + d Y ( f(xn, f(x 0 = 0. Definicja 4.2 (ciągłość wg Cauchy ego. Niech (X, d X, (Y, d Y przestrzenie metryczne. Mówimy, że odwzorowanie f : X Y jest ciągłe w punkcie x 0, jeśli zachodzi: ε>0 δ>0 x X d X (x, x 0 < δ d Y ( f(x, f(x0 < ε. Definicja 4.3 (topologiczna definicja ciągłości. Niech (X, d X, (Y, d Y przestrzenie metryczne. Mówimy, że odwzorowanie f : X Y jest ciągłe w punkcie x 0, jeśli dla każdego otoczenia U punktu f(x 0 przeciwobraz f 1 (U jest zbiorem otwartym w X. Twierdzenie 4.4. Definicje 4.1, 4.2 i 4.3 są równoważne. Odwzorowanie ciągłe w każdym punkcie dziedziny nazywamy odwzorowaniem ciągłym. Stwierdzenie 4.5. Niech (X, d X, (Y, d Y, (Z, d Z - przestrzenie metryczne, przekształcenia f : X Y, g : Y Z są ciągłe. Wtedy złożenie g f : X Z jest ciągłe. 9
4.2 Różniczkowanie odwzorowań Ustalmy od tego momentu, że (X, X, (Y, Y to rzeczywiste przestrzenie Banacha (u nas X = R n i Y = R k, obie z normą euklidesową; zbiór U X zawsze oznacza zbiór otwarty, p U oraz f : U Y. Definicja 4.6 (pochodna kierunkowa. Pochodną kierunkową odwzorowania f : U Y w punkcie p w kierunku wektora h X nazywamy granicę f(p + th f(p D h f(p = lim, t 0 t o ile istnieje i jest skończona. Wyrażenie występujące pod znakiem granicy rozważamy tylko dla tych t R, dla których p + th U. Oznaczenie. Pochodną kierunkową oznaczamy na wiele sposobów: f h (p = f h(p = h f(p = D h f(p. Oznaczenie. Bazę kanoniczną (standardową przestrzeni R n oznaczamy przez e 1,..., e n, tzn. e i = (0, 0,..., }{{} 1,..., 0, 0. i te miejsce Definicja 4.7 (pochodna cząstkowa. Pochodną kierunkową funkcji w punkcie p w kierunku wektora e i nazywamy pochodną cząstkową względem i tej zmiennej. Oznaczenie. Pochodną cząstkowa możemy oznaczać tak: f x i (p = D xi f(p = D i f(p = f x i (p. Definicja 4.8 (pochodna odwzorowania. Pochodną funkcji f w punkcie p nazywamy odwzorowanie liniowe L L(X, Y spełniające warunek: f(p + u f(p L(u lim u 0 u gdzie u X. Odwzorowanie to oznaczamy jako L = Df(p. Oznacza to, że: gdzie lim u 0 r(u u = 0. = 0, f(p + u = f(p + Df(pu + r(u, Stwierdzenie 4.9. Jeśli funkcja jest różniczkowalna w p, to jest ciągła w tym punkcie. Twierdzenie 4.10. Jeśli funkcja f jest różniczkowalna w p, to: a dla każdego h X istnieje pochodna kierunkowa f (p oraz jest równa Df(ph; h b istnieją pochodne cząstkowe D i f(p oraz: n Df(ph = D i f(ph i, gdzie h = (h 1,..., h n R n. i=1 Twierdzenie 4.11. Jeśli pochodne cząstkowe funkcji f w otoczeniu punktu p istnieją i są ciągłe w p, to funkcja ta jest różniczkowalna w punkcie p. 10
4.3 Pochodna złożenia Twierdzenie 4.12. Niech f : U V będzie odwzorowaniem różniczkowalnym w punkcie x 0, gdzie x 0 U X, a g : V Z odwzorowaniem różniczkowalnym w punkcie y 0 = f(x 0, gdzie y 0 V Y. Wówczas odwzorowanie g f jest różniczkowalne w punkcie x 0 oraz zachodzi wzór: D(g f(x 0 = Dg(y 0 Df(x 0. Powyższe twierdzenie można rozpisać, gdy przyjmiemy, że X = R l, Y = R n, a Z = R k. To oznacza, że możemy zapisać f = (f 1,..., f n, gdzie f i : R l R oraz g = (g 1,..., g k, gdzie g j : R n R. W celu uproszczenia zapisu przyjmijmy również, że odwzorowania te są określone na całych przestrzeniach X i Y. Nasze pochodne wyglądają wówczas tak: Df = f 1 f 1... x 1 x l..... f n f n... x 1 x l g 1 g 1... y 1 y n, Dg =..... g k... y 1 g k y n pochodna złożenia to: D(g f = g 1 g 1... y 1 y n..... g k g k... y 1 y n f 1 f 1... x 1 x l..... f n f n... x 1 x l Jeśli zapiszemy macierz w ogólnej postaci [ ] (g fi D(g f = x j i = 1... k, j = 1... l, to mnożąc macierze otrzymamy wzór: (g f i x j = n u=1 g i y u f u x j. W powyższych zapisach dla poprawienia czytelności pominęliśmy punkty w jakich liczone są pochodne cząstkowe. Definicja 4.13 (jakobian. Macierz pierwszej pochodnej funkcji f nazywamy również macierzą Jacobiego. Jej wyznacznik o ile istnieje, tj. gdy f : R n R n nazywamy jakobianem i oznaczamy jako det J f lub J f. 4.4 Odwzorowanie odwrotne Definicja 4.14 (iniekcja. Odwzorowanie f : X Y jest iniekcją (różnowartościowe, gdy ( f(x 1 = f(x 2 = (x 1 = x 2. Innymi słowy (x 1 x 2 = ( f(x 1 f(x 2. 11
Definicja 4.15 (suriekcja. Odwzorowanie f : X Y jest suriekcją (jest na Y, gdy y Y x X f(x = y. Definicja 4.16 (bijekcja. Odwzorowanie f : X Y jest bijekcją, gdy jest iniekcją i suriekcją. Definicja 4.17. Odwzorowanie f : X Y nazywamy odwracalnym (globalnie, jeśli istnieje odwzorowanie g : Y X takie że Innymi słowy g musi spełniać f(x = y g(y = x. f ( g(y = y oraz g ( f(x = x. Odwzorowanie g nazywamy odwzorowaniem odwrotnym i oznaczamy g = f 1. Stwierdzenie 4.18. Odwzorowanie f jest odwracalne wtedy i tylko wtedy gdy jest bijekcją. Definicja 4.19. Odwzorowanie f : U R n, gdzie U R k nazywamy klasy C 1, jeśli jest różniczkowalne oraz dla każdego h R k odwzorowanie U x Df(xh jest ciągłe. Zapisujemy to jako f C 1 (U, R n. Definicja 4.20 (dyfeomorfizm. Odwzorowanie f : U R n, gdzie U R k nazywamy dyfeomorfizmem, jeśli jest bijekcją oraz oba odwzorowania f i f 1 są klasy C 1. Twierdzenie 4.21. Na to by odwzorowanie f : U R n, f = (f 1, f 2,..., f n, gdzie f i : U R, było klasy C 1 potrzeba i wystarcza, by istniały w U wszystkie pochodne cząstkowe D j f i i były ciągłe. Definicja 4.22. Niech f : X Y. Powiemy, że f jest lokalnie odwracalne w punkcie p X, jeśli istnieje otoczenie U X punktu p takie, że f obcięte do U jest odwracalne. Twierdzenie 4.23. Niech f : G R k będzie odwzorowaniem klasy C 1, gdzie G R k zbiór otwarty. Wówczas, jeśli dla pewnego x 0 G zachodzi J f (x 0 0, to: a istnieją otoczenia U x 0 oraz V f(x 0, takie że f jest bijekcją f : U V ; b odwzorowanie f 1 : V U jest klasy C 1 oraz zachodzi: Df 1 (y = ( Df(x 1, dla x U oraz y = f(x. Przykład 4.24 (przekształcenie biegunowe. Odwzorowanie Φ: R 2 R 2 dane wzorem Φ(r, ϕ = (r cos ϕ, r sin ϕ = (x, y jest różniczkowalne klasy C 1, o ile r 0. Jest zatem lokalnie odwracalne w punktach r 0. Nie jest różnowartościowe, więc nie jest globalnie odwracalne. Po obcięciu powyższego do odwzorowania Φ: (0, ( π, π R 2 \ ( R {0} danego tym samym wzorem Φ(r, ϕ = (r cos ϕ, r sin ϕ = (x, y dostajemy bijekcję zatem jest to odwzorowanie odwracalne globalnie. Ponieważ jest klasy C 1, a Jf 0, więc istnieje odwzorowanie odwrotne Φ 1 klasy C 1. Odwzorowanie Φ nazywamy przekształceniem biegunowym. 12
4.5 Odwzorowania uwikłane Definicja 4.25. Niech będzie dane odwzorowanie f : U Y, gdzie U X Y oraz odwzorowanie ϕ: V Y, gdzie V X. Jeśli f(x, ϕ(x = 0 dla każdego x V, to mówimy, że odwzorowanie f zadaje odwzorowanie uwikłane ϕ. Twierdzenie 4.26 (o odwzorowaniu uwikłanym. Przypuśćmy, że X = R n, Y = R m, X Y G podzbiór otwarty, a f : G Y jest klasy C. Załóżmy, że f(x 0, y 0 = 0 oraz f (x Y 0, y 0 0 (dla większej liczby wymiarów ten zapis oznacza jakobian. Wówczas istnieją otoczenia U x 0 i V y 0, takie że U V G, oraz funkcja ϕ C 1 (U, V takie że: a dla (x, y U V mamy f(x, y = 0 y = ϕ(x; b dla x U ϕ (x = f Y (x, ϕ(x 1 f X(x, ϕ(x. Innymi słowy f lokalnie zadaje odwzorowanie uwikłane klasy C 1. 4.6 Pochodne wyższych rzędów Definicja 4.27 (pochodne cząstkowe drugiego rzędu. Niech f : R k U R m. Załóżmy, że istnieje pochodna cząstkowa D i f(x na pewnym otoczeniu V x 0. Wówczas, jeśli istnieje pochodna cząstkowa D j (D i f(x 0, to nazywamy ją pochodną cząstkową drugiego rzędu odwzorowania f w punkcie x 0 względem i-tej i j-tej zmiennej i oznaczamy ją jako D j D i f(x 0 = 2 f x j x i (x 0 = f x j x i (x 0. Cząstkowe pochodne drugiego rzędu dla i j nazywa się pochodnymi mieszanymi. Pochodną D i D i f(x 0 oznaczamy również Di 2 f(x 0 oraz 2 f (x x 2 0. i Definicja 4.28 (pochodna drugiego rzędu. Niech f : R k U R m. Odwzorowanie f nazywamy dwukrotnie różniczkowalnym w punkcie x 0 U, jeśli: i jest ono różniczkowalne w każdym punkcie pewnego otoczenia V x 0 oraz ii przy każdym ustalonym h R k odwzorowanie V R m o wzorze x Df(xh jest różniczkowalne w punkcie x 0. Wówczas dwuliniowe odwzorowanie R k R k R m : (h, h D ( Df(xh h nazywamy pochodną drugiego rzędu odwzorowania f w punkcie x 0 i oznaczamy D 2 f(x 0. Twierdzenie 4.29. by funkcja f była dwukrotnie różniczkowalna w punkcie x 0 wystarcza by: i w pewnym otoczeniu V x 0 istniały pochodne cząstkowe pierwszego rzędu i były ciągłe ii w pewnym otoczeniu V x 0 istniały pochodne cząstkowe drugiego rzędu i były ciągłe w x 0. Twierdzenie 4.30. Jeśli odwzorowanie f jest dwukrotnie różniczkowalne w punkcie x 0, to istnieją drugie pochodne cząstkowe D j D i f(x 0 oraz zachodzi wzór D 2 f(x 0 ( h, h = k i,j=1 dla dowolnych h = (h 1,..., h k, h = (h 1,..., h k. 13 D j D i f(x 0 h i h j
Twierdzenie 4.31 (Schwarza o symetrii drugiej pochodnej. Jeśli odwzorowanie f jest dwukrotnie różniczkowalne w punkcie x 0, to pochodna jest odwzorowaniem dwuliniowym symetrycznym, tzn. zachodzi: D 2 f(x 0 ( h, h = D 2 f(x 0 ( h, h, dla dowolnych h, h R k. W szczególności z tego wynika, że 2 f x j x i (x 0 = 2 f x i x j (x 0 dla dowolnych i, j = 1... k. Twierdzenie 4.32 (Wzór Taylora drugiego rzędu. Jeśli odwzorowanie f : R k U R m jest dwukrotnie różniczkowalne w punkcie x 0 U, to zachodzi wzór: gdzie lim h 0 r(h h 2 = 0. f(x 0 + h = f(x 0 + Df(x 0 h + 1 2 D2 f(x 0 ( h, h + r(h, Uwaga (pochodne wyższych rzędów. Pochodne cząstkowe rzędu n definiujemy indukcyjnie jako pochodne cząstkowe pochodnych cząstkowych rzędu n 1. Odwzorowanie nazywamy n krotnie różniczkowalnym, jeśli jego pochodna rzędu n 1 jest różniczkowalna przy ustalonych wektorach na których obliczamy wartość tej pochodnej. Zachodzą analogiczne twierdzenia dotyczące zależności między różniczkowalnością a istnieniem i ciągłością pochodnych cząstkowych. Zachodzi twierdzenie Schwarza o symetrii. Twierdzenie 4.33 (Wzór Taylora. Jeśli odwzorowanie f jest n krotnie różniczkowalne w punkcie x 0, to zachodzi wzór: f(x 0 + h = f(x 0 + 1 1! Df(x 0h +... + 1 n! Dn f(x 0 h n + r(h, r(h gdzie lim h 0 = 0, a zapis h n oznacza (h,..., h. h n }{{} n razy 5 Funkcje wielu zmiennych 5.1 Ekstrema lokalne Definicja 5.1 (macierz drugiej pochodnej. Niech f : R k U R będzie dwukrotnie różniczkowalna w punkcie x 0 U. Oznaczmy a ij = D i D j f(x 0, gdzie i, j = 1,..., k. Niech : R k R k będzie odwzorowaniem dwuliniowym o macierzy (a ij. Odwzorowanie to nazywamy drugą pochodną funkcji f w punkcie x 0, a macierz macierzą tej pochodnej. Z twierdzenia Schwarza wynika, że macierz jest symetryczna. Mamy: D 2 f(x 0 ( h, h = h T h, dla dowolnych h, h R k. Definicja 5.2. Formą kwadratową H na R k nazywamy wielomian k k H(x = a ij x i x j, gdzie a ij = a ji. i=1 j=1 Zauważmy, że macierz drugiej pochodnej zadaje formę kwadratową wzorem h h T h. 14
Definicja 5.3 (określoność formy. Forma kwadratowa H na R k jest i dodatnio określona, jeśli H(x > 0 dla każdego 0 x R k ; ii ujemnie określona, jeśli H(x < 0 dla każdego 0 x R k ; iii nieujemnie określona, jeśli H(x 0 dla każdego x R k ; iv niedodatnio określona, jeśli H(x 0 dla każdego x R k ; v nieokreślona, jeśli H(x < 0 < H(y dla pewnych x, y R k. Mówimy, że macierz symetryczna jest określona dodatnio (ujemnie,..., jeśli odpowiadająca jej forma kwadratowa H (x = x T x jest określona dodatnio (ujemnie,.... Uwaga. Do badania określoności macierzy (a przez to formy kwadratowej najczęściej używa się kryterium Sylvestera (omawianego na lgebrze I. Twierdzenie 5.4 (warunek konieczny ekstremum lokalnego. Niech U R k będzie otoczeniem punktu p oraz f : U R. Wówczas: a Jeśli f przyjmuje w p ekstremum lokalne oraz istnieje pochodna kierunkowa f (p, to jest h ona równa zeru (w szczególności każda pochodna cząstkowa f x i (p = 0. b Jeśli funkcja f przyjmuje w p minimum lokalne oraz jest dwukrotnie różniczkowalna w p, to macierz drugiej pochodnej D 2 f(p jest nieujemnie określona. c Jeśli funkcja f przyjmuje w p maksimum lokalne oraz jest dwukrotnie różniczkowalna w p, to macierz drugiej pochodnej D 2 f(p jest niedodatnio określona. Twierdzenie 5.5 (warunek wystarczający ekstremum lokalnego. Niech U R k będzie otoczeniem punktu p, f : U R będzie funkcją dwukrotnie różniczkowalną w p. Załóżmy, że Df(p = 0. Wówczas: a Jeśli macierz D 2 f(p jest dodatnio określona, to funkcja f przyjmuje w p minimum lokalne. b Jeśli macierz D 2 f(p jest ujemnie określona, to funkcja f przyjmuje w p maksimum lokalne. c Jeśli macierz D 2 f(p jest nieokreślona, to funkcja f nie ma ekstremum w p. d Jeśli macierz D 2 f(x jest nieujemnie określona dla x U dowolnego otoczenia punktu p, to funkcja f przyjmuje w p minimum lokalne (być może niewłaściwe. e Jeśli macierz D 2 f(x jest niedodatnio określona dla x U dowolnego otoczenia punktu p, to funkcja f przyjmuje w p maksimum lokalne (być może niewłaściwe. Uwaga. W dwóch ostatnich podpunktach powyższego twierdzenia musimy założyć, że f jest klasy C 2 na otoczeniu punktu p. 15
5.2 Ekstrema warunkowe Definicja 5.6 (punkt regularny. Dana jest funkcja G: R n U R k klasy C 1. Rozpatrujemy poziomicę zerową P = { x U : G(x = 0 }. Mówimy, że punkt p P jest punktem regularnym, jeśli DG(p jest epimorfizmem, tj. rząd odpowiadającej jej macierzy jest maksymalny. W przeciwnym przypadku p nazywamy punktem nieregularnym poziomicy. Definicja 5.7 (gradient. Dana jest różniczkowalna funkcja f : R n U R. Macierz pierwszej pochodnej nazywamy również gradientem i oznaczamy f(p = grad f(p = Df(p. Stwierdzenie 5.8. Gradient jest prostopadły do poziomicy. Tzn. że prosta styczna do poziomicy (w punkcie regularnym p jest prostopadła do wektora danego przez ( G(p T. Zatem wektor v jest styczny do {G = 0} wtedy i tylko wtedy gdy v ker G(p, tj. G(p v = 0. Definicja 5.9 (ekstremum warunkowe. Dana jest funkcja G: R n U R k oraz funkcja f : R n V R. Mówimy, że f ma minimum warunkowe w punkcie p przy warunku G = 0, jeśli G(p = 0 oraz funkcja f obcięta to zbioru { x U : G(x = 0 } przyjmuje minimum lokalne w tym punkcie. Innymi słowy istnieje W p otoczenie punktu p, takie że x Wp (G(x = 0 = ( f(x f(p. nalogiczna definicja zachodzi dla maksimum warunkowego. Twierdzenie 5.10 (warunek konieczny ekstremum warunkowego. Dane są funkcje G = (G 1... G k : R n U R k oraz f : R n V R, obie klasy C 1. Niech p P = { x U : G(x = 0 } będzie punktem regularnym. Wówczas jeśli p jest ekstremum warunkowym funkcji f przy warunku G = 0, to k istnieją λ 1,..., λ k R takie że f(p = λ i G i (p. i=1 Liczby λ 1,..., λ k nazywamy mnożnikami Lagrange a. Twierdzenie 5.11 (warunek dostateczny ekstremum warunkowego. Dane są funkcje G = (G 1... G k : R n U R k oraz f : R n V R, obie klasy C 2. Niech p P = { x U : G(x = 0 } będzie punktem regularnym. Załóżmy, że p spełnia warunek konieczny istnienia ekstremum, tj. k grad f(p = λ i grad G i (p dla pewnych λ 1,..., λ k R. i=1 Zdefiniujmy L λ (x = f(x k i=1 λ i G i (x. Wówczas a Jeśli D 2 L(v, v > 0 dla wszystkich 0 v ker DG(p, to p jest minimum warunkowym. b Jeśli D 2 L(v, v < 0 dla wszystkich 0 v ker DG(p, to p jest maksimum warunkowym. c Jeśli D 2 L(v, v > 0 > D 2 L(w, w dla pewnych v, w ker DG(p, to p nie jest ekstremum warunkowym. W powyższych przypadkach mówimy, że forma D 2 L obcięta do ker DG(p jest dodatnio określona (odp. ujemnie określona, nieokreślona. L nazywamy funkcją Lagrange a. 16
5.3 Wielowymiarowa całka Riemanna Definicja 5.12 (kostka. Kostką (domkniętą w R n będziemy nazywać każdy zbiór postaci [a 1, b 1 ]... [a n, b n ] dla pewnych a 1 < b 1,..., a n < b n. Definicja 5.13. Podziałem kostki K będziemy nazywać rodzinę kostek {K i } n i=1, takich że: n a K = K i i=1 b int K i int K j = dla i j (czyli podkostki stykają się co najwyżej brzegami. Rodzinę wszystkich podziałów kostki K oznaczmy przez P(K. Definicja 5.14. Miarą (objętością kostki K = [a 1, b 1 ]... [a n, b n ] nazwiemy liczbę n m(k = b i a i = b 1 a 1 b n a n. i=1 Definicja 5.15. Niech f : K R będzie funkcją ograniczoną, a {K i } n i=1 dowolnym podziałem kostki. Wówczas możemy zdefiniować sumę górną oraz sumę dolną wzorami S ( f, {K i } n i=1 s ( f, {K i } n i=1 = n i=1 n = i=1 m(k i sup x K i f(x m(k i inf x K i f(x. Definicja 5.16. Niech f : K R będzie funkcją ograniczoną. Wówczas definiujemy całkę górną oraz całkę dolną wzorami f(x dx = inf S( f, {K i } D {K i } P(K f(x dx = sup s ( f, {K i }. D {K i } P(K Definicja 5.17. Ograniczoną funkcję f : K R nazywamy całkowalną w sensie Riemanna (lub po prostu całkowalną, jeśli f(x dx = f(x dx i oznaczamy jako K K Oznaczenie. Całki na R 2 i R 3 oznaczamy często jako f oraz f. K K K f(x dx = Definicja 5.18. Jeśli funkcja f : R, gdzie R n jest dowolnym ograniczonym zbiorem, to całkę f definiujemy biorąc K oraz przy pomocy wzoru (o prawa strona istnieje: f(x dx = K 1 (xf(x dx, gdzie funkcja 1 (x nazywa się funkcją charakterystyczną zbioru i wyraża się wzorem 1 (x = { 1 dla x 0 dla x /. K f. 17
Definicja 5.19. Mówimy, że R n jest zbiorem miary zero (lub krócej ma miarę zero, jeśli dla każdego ε > 0 istnieje ciąg kostek (K i i N taki że K i oraz m(k i < ε. i i Twierdzenie 5.20. Niech K R n, a f będzie funkcją całkowalną na kostce K. Wówczas całka f istnieje wtedy i tylko wtedy gdy bd jest zbiorem miary zero. Twierdzenie 5.21. Ograniczona funkcja f : R n K R jest całkowalna wtedy i tylko wtedy gdy zbiór punktów nieciągłości funkcji f ma miarę zero. Stwierdzenie 5.22 (własności całki. Poniższe równości zachodzą pod warunkiem, że wszystkie wyrażenia istnieją (odpowiednie funkcje są całkowalne, brzeg ma miarę zero: 1 dla dowolnego c R (cf = c f 2 (f + g = f + 3 jeśli f g na, to 4 f f g 5 jeśli ma miarę zero, to 6 jeśli int 1 int 2 =, to f 5.4 Techniki całkowania g f = 0 f = f + 1 2 1 Twierdzenie 5.23 (Fubini. Dane są kostki K 1 R n i K 2 R m oraz całkowalna funkcja f : K 1 K 2 R. Wówczas ( ( f(x, y dxdy = f(x, y dy dx = f(x, y dx dy, K 1 K 2 B B o ile wszystkie powyższe funkcje są całkowalne. Czyli zakładamy że dla każdego x całkowalna jest funkcja f(x, : B R oraz dla każdego y B całkowalna jest funkcja f(, y: R. Uwaga. by w powyższym twierdzeniu całki istniały wystarczy, żeby funkcja f była ciągła. Twierdzenie 5.24. Dany jest zbiór postaci = { (x, y R 2 : a x b, u 1 (x y u 2 (x } dla pewnych a, b R oraz funkcji ciągłych u 1, u 2 : [a, b] R, takich że u 1 < u 2. Jeśli f : R jest funkcją ciągłą, to f(x, y dxdy = b a u 2 (x u 1 (x 2 f f(x, y dy dx. nalogiczna wersja twierdzenia zachodzi gdy R 3 i ogólnie R n. Twierdzenie 5.25 (o zamianie zmiennych. Mamy funkcję ciągłą f : R oraz dyfeomorfizm φ: R n U V R n, gdzie V. Wówczas zachodzi f = f φ det J φ, czyli wstawiając y = φ(x mamy f(y 1,..., y n dy 1... dy n = c Ł. Pawelec φ 1 ( φ 1 ( f(φ(x 1,..., x n det ( J φ x1,...,x n dx 1... dx n. 18