II. FUNKCJE WIELU ZMIENNYCH 1. Zbiory w przestrzeni R n Ustalmy dowolne n N. Definicja 1.1. Zbiór wszystkich uporzadkowanych układów (x 1,..., x n ) n liczb rzeczywistych, nazywamy przestrzenią n-wymiarową i oznaczamy ją symbolem R n. Czyli R n def = {(x 1,..., x n ) : x 1,..., x n R}. Elementy (x 1,..., x n ) R n nazywamy punktami przestrzeni R n, zaś liczby x 1,..., x n nazywamy współrzędnymi kartezjańskimi (prostokątnymi) tych punktów. Definicja 1.2. Odległość dwóch punktów P 1, P 2 przestrzeni R n oznaczamy symbolem d (P 1, P 2 ) i określamy wzorem d (P 1, P 2 ) def = (y 1 x 1 ) 2 + + (y n x n ) 2, gdy P 1 = (x 1,..., x n ), P 2 = (y 1,..., y n ). Definicja 1.3. Otoczeniem o promieniu r > 0 punktu P 0 R n nazywamy zbiór O (P 0, r) def = {P R n : d (P 0, P ) < r}. Uwaga 1.1. Otoczeniem punktu P 0 w przestrzeni R 2 (tzn. na płaszczyźnie) jest koło otwarte o środku w punkcie P 0 i promieniu r. Otoczeniem punktu P 0 w przestrzeni R 3 jest kula otwarta o środku w punkcie P 0 i promieniu r. Definicja 1.4. Sąsiedztwem o promieniu r > 0 punktu P 0 R n nazywamy zbiór S (P 0, r) def = O (P 0, r) \ {P 0 }. Uwaga 1.2. Sąsiedztwem punktu P 0 w przestrzeni R 2 (tzn. na płaszczyźnie) jest koło otwarte o środku w punkcie P 0 i promieniu r bez środka. Sąsiedztwem punktu P 0 w przestrzeni R 3 jest kula otwarta o środku w punkcie P 0 i promieniu r bez środka. Definicja 1.5. Zbiór A R n nazywamy ograniczonym, jeżeli jest zawarty w otoczeniu pewnego punktu, tzn. istnieje taki punkt P 0 R n i promień r > 0, że A O (P 0, r). W przeciwnym przypadku mówimy, że zbiór A nie jest ograniczony. Definicja 1.6. Niech A R n. Punkt P A nazywamy punktem wewnętrznym zbioru A, jeżeli istnieje otoczenie tego punktu zawarte w tym zbiorze, tzn. istnieje taka liczba dodatnia r, że O (P, r) A. 1
Wnętrzem zbioru nazywamy zbiór wszystkich jego punktów wewnętrznych. Definicja 1.7. Zbiór A R n nazywamy otwartym, jeżeli każdy punkt tego zbioru jest jego punktem wewnętrznym. Definicja 1.8. Niech A R n. Punkt P A nazywamy punktem brzegowym zbioru A, jeżeli w każdym otoczeniu tego punktu można znaleźć punkty należące i punkty nie należące do tego zbioru, tzn. dla każdej liczby dodatniej r zachodzi warunek O (P, r) A oraz O (P, r) A. Brzegiem zbioru nazywamy zbiór wszystkich jego punktów brzegowych. Definicja 1.9. Niech A R n. Punkt P R n nazywamy punktem skupienia zbioru A, jeżeli w każdym sąsiedztwie tego punktu można znaleźć punkty ze zbioru A, tzn. dla każdej liczby dodatniej r zachodzi warunek S (P, r) A. Definicja 1.10. Zbiór A R n nazywamy domkniętym, jeżeli zawiera swoje punkty skupienia. Definicja 1.11. Niepusty podzbiór przestrzeni R n nazywamy obszarem, jeżeli jest zbiorem otwartym i każde dwa punkty tego zbioru można połączyć łamaną całkowicie zawartą w tym zbiorze. Jeśli do obszaru dodamy jego brzeg, to taki zbiór nazywamy obszarem domkniętym. 2. Granica i ciągłość funkcji n-zmiennych Ustalmy dowolne n N. Definicja 2.1. Funkcją n zmiennych określoną na zbiorze A R n o wartościach w zbiorze R nazywamy przyporządkowanie każdemu punktowi ze zbioru A dokładnie jednej liczby rzeczywistej. Będziemy wówczas pisać f : A R. Wartość funkcji f w punkcie (x 1,..., x n ) A oznaczamy przez f (x 1,..., x n ). Definicja 2.2. Ciągiem punktów przestrzeni R n nazywamy taką funkcję, która każdej liczbie naturalnej przyporządkowuje dokładnie jeden punkt przestrzeni R n. Wartość tego odwzorowania dla liczby naturalnej k nazywamy k-tym wyrazem ciągu i oznaczamy przez P k = ( x k 1,..., x k n). Ciąg taki oznaczamy symbolem (P k ) k N. Definicja 2.3. Mówimy, że ciąg (P k ) k N punktów przestrzeni R n jest zbieżny do punktu P 0 R n, jeżeli k d (P k, P 0 ) = 0. Piszemy wówczas P k = P 0. k 2
Twierdzenie 2.1. Ciąg (P k ) k N = ( ) x k 1,..., x k n punktów przestrzeni k N Rn jest zbieżny do punktu P 0 = (x 0 1,..., x 0 n) R n wtedy i tylko wtedy, gdy k xk i = x 0 i. Przykład 2.1. Ciąg (P k ) k N = punktu P 0 = ( 1 2, 5), bo 1 i n 2k + 5 k 4k + 2 = 2 4 = 1 2 ( 2k+5 4k+2, k 3 k + 5 k )k N punktów płaszczyzny R 2 jest zbieżny do k 3 k + 5 k = 5. k Definicja 2.4. (Heinego) Niech A będzie niepustym podzbiorem przestrzeni R n. Załóżmy ponadto, że P 0 jest punktem skupienia zbioru A oraz f : A R. (i) Mówimy, że liczba g R jest granicą funkcji f w punkcie P 0, jeżeli f (P k) = g, k dla każdego ciągu (P k ) k N spełniającego warunki (P k A P k P 0 ) oraz P k = P 0. k k N Ponadto, piszemy wówczas lub gdy P = (x 1,..., x n ) i P 0 = (x 0 1,..., x 0 n). P P 0 f (P ) = g, (x 1,...,x n) (x 0 1,...,x0 n) f (x 1,..., x n ) = g, (ii) Mówimy, że funkcja f ma w punkcie P 0 granicę niewłaściwą równą + [ ], co zapisujemy [ ] gdy f (P ) = +, P P 0 f (P k) = +, k f (P ) =, P P 0 [ ] f (P k) =, k dla każdego ciągu (P k ) k N spełniającego warunki (P k A P k P 0 ) oraz P k = P 0. k k N 3
Dla funkcji wielu zmiennych zachodzi analogiczne twierdzenie o arytmetyce granic jak dla funkcji jednej zmiennej. Podamy jego sformułowanie dla funkcji dwóch zmiennych. Twierdzenie 2.2. Niech A będzie niepustym podzbiorem płaszczyzny R 2. Załóżmy ponadto, że (x 0, y 0 ) jest punktem skupienia zbioru A oraz f : A R i g : A R. Jeżeli funkcje f i g mają w punkcie (x 0, y 0 ) granice właściwe, to (i) (ii) (iii) (iv) (f (x, y) + g (x, y)) = (f (x, y) g (x, y)) = f (x, y) + f (x, y) g (x, y), g (x, y), (c f (x, y)) = c f (x, y) dla dowolnego c R, (f (x, y) g (x, y)) = f (x, y) g (x, y), (v) f(x,y) = g(x,y) f(x,y) g(x,y), o ile g (x, y) 0. Przykład 2.2. (x,y) (1,1) x y x 2 y = 2 (x,y) (1,1) x y (x y)(x + y) = (x,y) (1,1) 1 x + y = 1 2 Definicja 2.5. (Heinego) Niech A będzie niepustym podzbiorem przestrzeni R n i niech f : A R. (i) Mówimy, że funkcja f jest ciągła w punkcie P 0 A, jeżeli f (P k) = f (P 0 ), k dla każdego ciągu (P k ) k N punktów należących do zbioru A zbieżnego do punktu P 0. (ii) Mówimy, że funkcja f jest ciągła w zbiorze A, jeżeli jest ciągła w każdym punkcie tego zbioru. Uwaga 2.1. Niech A będzie niepustym podzbiorem przestrzeni R n. Jeżeli P 0 A jest również punktem skupienia zbioru A, to funkcja f : A R jest ciągła w punkcie P 0 wtedy i tylko wtedy, gdy istnieje granica P P 0 f (P ) i jest równa f (P 0 ), tj. f (P ) = f (P 0 ). P P 0 Twierdzenie 2.3. (O ciągłości sumy, różnicy, iloczynu i ilorazu funkcji) Jeżeli funkcje f i g są ciągłe w punkcie P 0, to funkcje f + g, f g, f g oraz f g (o ile g (P 0) 0) są ciągłe w punkcie P 0. 4
Twierdzenie 2.4. (Weierstrassa o ograniczoności i osiąganiu kresów) Funkcja ciągła f określona na zbiorze domkniętym i ograniczonym D R n jest ograniczona i osiąga swoje kresy. 3. Pochodna kierunkowa. Pochodne cząstkowe. Ustalmy dowolne n N. Definicja 3.1. Niech A będzie niepustym i otwartym podzbiorem przestrzeni R n, f : A R, P 0 = (x 0 1,..., x 0 n) ustalonym punktem zbioru A, a v = (v 1,..., v n ) niech będzie dowolnym wersorem (wektorem o długości 1) z przestrzeni R n. Jeżeli istnieje skończona granica f (P 0 + tv) f (P 0 ), t 0 t to nazywamy ją pochodną kierunkową funkcji f w punkcie P 0 w kierunku wektora v i oznaczamy symbolem v f (P 0 ). Zatem f (P 0 + tv) f (P 0 ) v f (P 0 ) =. t 0 t Przykład 3.1. Wyznaczymy pochodną kierunkową funkcji f określonej wzorem f(x, y) = x 2 + y 2 2, w punkcie P 0 = (1, 1) w kierunku wektora v = (1, 0). v f (1, 1) = t 0 f ((1, 1) + t(1, 0)) f (1, 1) t = t 0 (1 + t) 2 + 1 2 2 0 t = t 0 t 2 + 2t t = t 0 f (1 + t, 1) f (1, 1) t = t 0 t (t + 2) t = t 0 (t + 2) = 2 Niech dalej e i, gdzie i {1, 2,..., n}, oznaczają wektory bazy kanonicznej w przestrzeni R n, czyli e i = (0,..., 0, 1, 0,..., 0), i {1, 2,..., n}. }{{}}{{} i 1 n i Definicja 3.2. Niech A będzie niepustym i otwartym podzbiorem przestrzeni R n, f : A R, P 0 = (x 0 1,..., x 0 n) ustalonym punktem zbioru A. Pochodne kierunkowe ei f (P 0 ), gdzie i {1, 2,..., n}, nazywamy pochodnymi cząstkowymi funkcji f w punkcie P 0 i oznaczamy ei f (P 0 ) = i f (P 0 ), i {1, 2,..., n}. 5
Pochodne cząstkowe wyższych rzędów Definicja 3.3. Załóżmy, że funkcja f n-zmiennych ma pochodne cząstkowe i f, dla każdego i {1, 2,..., n}, w każdym punkcie pewnego zbioru otwartego A R n. Przy takim założeniu każda z pochodnych cząstkowych i f jest funkcją n-zmiennych. Pochodne cząstkowe pierwszego rzędu funkcji i f, wyznaczone względem j-tej zmiennej, gdzie j {1, 2,..., n}, nazywamy pochodnymi cząstkowymi drugiego rzędu funkcji f i oznaczamy symbolem 2 ijf, i, j {1, 2,..., n}. Pochodne cząstkowe drugiego rzędu funkcji f, otrzymane przez różniczkowanie tej funkcji względem różnych zmiennych, nazywamy pochodnymi cząstkowymi drugiego rzędu mieszanymi. Uwaga 3.1. W szczególności funkcja f dwóch zmiennych ma cztery pochodne cząstkowe drugiego rzędu 2 11f, 2 12f, 2 21f, 2 22f, zaś funkcja f trzech zmiennych ma dziewięć pochodnych cząstkowych drugiego rzędu 2 11f, 2 12f, 2 13f, 2 21f, 2 22f, 2 23f, 2 31f, 2 32f, 2 33f. Uwaga 3.2. Przy obliczniu pochodnej cząstkowej względem jednej zmiennej pozostałe traktujemy jak stałe. Do obliczania pochodnych cząstkowych można stosować reguły różniczkowania funkcji jednej zmiennej, tj. wzory na pochodne sumy, różnicy, iloczynu, ilorazu oraz złożenia funkcji. Przykład 3.2. Niech funkcja f : R 2 R będzie określona wzorem Dla dowolnych (x, y) R 2 mamy f(x, y) = x 2 + y 2 + 2xy + 3x 4y + 7, (x, y) R 2. 1 f(x, y) = 2x + 2y + 3, 2 f(x, y) = 2y + 2x 4, oraz 2 11f(x, y) = 2, 2 12f(x, y) = 2, 2 21f(x, y) = 2, 2 22f(x, y) = 2. Pochodne cząstkowe rzędu trzeciego, czwartego,..., definiujemy analogicznie jak pochodne cząstkowe rzędu drugiego. Definicja 3.4. Niech k N, k 2. Pochodną cząstkową rzędu k funkcji f, nazywamy pochodną cząstkową pierwszego rzędu z pochodnej cząstkowej rzędu k 1 funkcji f. Pochodną cząstkową rzędu k, określoną przez różniczkowanie względem co najmniej dwóch różnych zmiennych, nazywamy pochodną cząstkową mieszaną rzędu k. 6
Twierdzenie 3.1. (Schwarza) Niech funkcja f, n-zmiennych, określona w zbiorze otwartym A R n, ma w tym zbiorze wszystkie możliwe pochodne cząstkowe do rzędu k 1 włącznie i mieszane rzędu k, k N, k 2, wszystkie ciągłe w zbiorze A. Wtedy pochodna cząstkowa mieszana rzędu k funkcji f nie zależy od porządku w jakim zostało wykonane różniczkowanie. Interpretacje geometryczne pochodnej kierunkowej i pochodnych cząstkowych Podamy interpretacje w przypadku funkcji dwóch zmiennych. Fakt 3.1. (Interpretacja geometryczna pochodnej kierunkowej ) Niech (x 0, y 0 ) R 2 i niech funkcja f będzie określona na pewnym otoczeniu O ((x 0, y 0 ), r). Ponadto niech γ oznacza kąt nachylenia do płaszczyzny xoy półstycznej do krzywej otrzymanej w wyniku przekroju wykresu funkcji f półpłaszczyzną przechodzącą przez prostą x = x 0, y = y 0 i równoległą do wersora v. Wtedy v f(x 0, y 0 ) = tgγ. Pochodna kierunkowa określa szybkość zmiany wartości funkcji f w kierunku wektora v. Rysunek 1: Interpretacja geometryczna pochodnej kierunkowej funkcji 7
Fakt 3.2. (Interpretacja geometryczna pochodnych cząstkowych) Niech (x 0, y 0 ) R 2 i niech funkcja z = f(x, y), określona na pewnym otoczeniu O ((x 0, y 0 ), r), ma pochodne cząstkowe pierwszego rzędu w punkcie (x 0, y 0 ). Ponadto niech α oznacza kąt nachylenia stycznej do krzywej otrzymanej w wyniku przekroju wykresu funkcji f płaszczyzną y = y 0 w punkcie (x 0, y 0, f(x 0, y 0 )) do płaszczyzny xoy. Wtedy 1 f(x 0, y 0 ) = tgα. Rysunek 2: Interpretacja geometryczna pochodnej cząstkowej 1 f(x 0, y 0 ) Pochodna cząstkowa 1 f(x 0, y 0 ) jest miarą lokalnej zmiany szybkości wzrostu funkcji f względem zmiennej x przy ustalonej wartości zmiennej y. Podobnie, jeśli β oznacza kąt nachylenia stycznej do krzywej otrzymanej w wyniku przekroju wykresu funkcji f płaszczyzną x = x 0 w punkcie (x 0, y 0, f(x 0, y 0 )) do płaszczyzny xoy, to 2 f(x 0, y 0 ) = tgβ. Rysunek 3: Interpretacja geometryczna pochodnej cząstkowej 2 f(x 0, y 0 ) Pochodna cząstkowa 2 f(x 0, y 0 ) jest miarą lokalnej zmiany szybkości wzrostu funkcji f względem zmiennej y przy ustalonej wartości zmiennej x. 8
4. Różniczkowalność funkcji, różniczka zupełna, gradient funkcji Niech A będzie otwartym podzbiorem przestrzeni R n oraz niech P 0 = (x 0 1,..., x 0 n) będzie ustalonym punktem zbioru A. Załóżmy też, że (x 0 1 + x 1,..., x 0 n + x n ) A oraz f : A R. Definicja 4.1. Wyrażenie f (P 0 ) := f ( x 0 1 + x 1,..., x 0 n + x n ) f ( x 0 1,..., x 0 n nazywamy przyrostem zupełnym funkcji f w punkcie P 0, odpowiadającym przyrostom x 1,..., x n. Definicja 4.2. Mówimy, że funkcja f jest różniczkowalna w punkcie P 0 = (x 0 1,..., x 0 n), jeżeli istnieją takie stałe C 1,..., C n oraz otoczenie punktu P 0, że dla punktów (x 0 1 + x 1,..., x 0 n + x n ) z tego otoczenia przyrost f (P 0 ) można przedstawić w postaci f (P 0 ) = C 1 x 1 +... + C n x n + r ( x 1,..., x n ), ) przy czym ( x 1,..., x n) (0,...,0) r ( x 1,..., x n ) = 0. ( x 1 ) 2 +... + ( x n ) 2 Twierdzenie 4.1. Jeżeli funkcja f jest różniczkowalna w punkcie P 0, to istnieją w tym punkcie skończone pochodne cząstkowe i f(p 0 ), dla każdego i {1,..., n}, funkcji f oraz C i = i f (P 0 ), i {1,...,n} a więc f (P 0 ) = 1 f (P 0 ) x 1 +... + n f (P 0 ) x n + r ( x 1,..., x n ). Twierdzenie 4.2. Jeżeli funkcja jest różniczkowalna w punkcie P 0, to jest w tym punkcie ciągła. Twierdzenie 4.3. Jeżeli funkcja f ma pochodne cząstkowe pierwszego rzędu w każdym punkcie pewnego otoczenia punktu P 0 i te pochodne cząstkowe są ciągłe w punkcie P 0, to funkcja f jest różniczkowalna w punkcie P 0. Przykład 4.1. Rozważmy funkcję Wtedy dla (x, y) R 2 mamy f (x, y) = x 2 y 3 + 2xy + 3, dla (x, y) R 2. 1 f (x, y) = 2xy 3 + 2y, 2 f (x, y) = 3x 2 y 2 + 2x. Zauważmy więc, że pochodne cząstkowe są określone i ciągłe w każdym punkcie płaszczyzny R 2. Na mocy ostatniego twierdzenia funkcja f jest różniczkowalna w każdym punkcie przestrzeni R 2. Uwaga 4.1. Istnienie pochodnych cząstkowych funkcji f w punkcie P 0 nie gwarantuje jej różniczkowalności w tym punkcie. 9
Twierdzenie 4.4. Załóżmy, że funkcja f ma wszystkie pochodne cząstkowe pierwszego rzędu w punkcie P 0. Funkcja f jest różniczkowalna w punkcie P 0 wtedy i tylko wtedy, gdy ( x 1,..., x n) (0,...,0) f (x 0 1 + x 1,..., x 0 n + x n ) f (x 0 1,..., x 0 n) n i f (P 0 ) x i i=1 = 0. ( x 1 ) 2 +... + ( x n ) 2 Przedstawimy teraz interpretację geometryczną różniczkowalności funkcji w punkcie w przypadku funkcji dwóch zmiennych. Fakt 4.1. (Interpretacja geometryczna różniczkowalności funkcji w punkcie) Różniczkowalność funkcji f w punkcie P 0 = (x 0, y 0 ) oznacza istnienie płaszczyzny stycznej do wykresu tej funkcji w punkcie (P 0, f(p 0 )). Rysunek 4: Płaszczyzna styczna do wykresu funkcji Fakt 4.2. (Równanie płaszczyzny stycznej do wykresu funkcji) Załóżmy, że funkcja dwóch zmiennych f ma ciągłe pochodne cząstkowe pierwszego rzędu w punkcie P 0 = (x 0, y 0 ). Równanie płaszczyzny stycznej do wykresu funkcji f w punkcie (P 0, f(p 0 )) ma postać z f(p 0 ) = 1 f(p 0 ) (x x 0 ) + 2 f(p 0 ) (y y 0 ). Definicja 4.3. Niech P 0 = (x 0 1,..., x 0 n) będzie ustalonym punktem przestrzeni R n i niech funkcja f ma wszystkie pochodne cząstkowe pierwszego rzędu w punkcie P 0. Różniczką funkcji f w punkcie P 0 nazywamy funkcję określoną wzorem df P0 ( x 1,..., x n ) := 1 f(p 0 ) x 1 + + n f(p 0 ) x n. Różniczkę funkcji f oznacza się również symbolem df(p 0 ) lub krótko df. 10
Fakt 4.3. (Zastosowanie różniczki funkcji do obliczeń przybliżonych) Niech P 0 = (x 0 1,..., x 0 n) będzie ustalonym punktem przestrzeni R n oraz niech funkcja f, określona przynajmniej na pewnym otoczeniu punktu P 0, ma ciągłe pochodne cząstkowe pierwszego rzędu w punkcie P 0. Wtedy f ( x 0 1 + x 1,..., x 0 n + x n ) f ( x 0 1,..., x 0 n) + dfp0 ( x 1,..., x n ). Definicja 4.4. Niech P 0 = (x 0 1,..., x 0 n) R n. Załóżmy, że funkcja f ma wszystkie pochodne cząstkowe pierwszego rzędu w punkcie P 0. Gradientem funkcji f w punkcie P 0 nazywamy wektor i oznaczamy symbolem gradf(p 0 ), czyli ( 1 f(p 0 ),..., n f(p 0 )) gradf(p 0 ) = ( 1 f(p 0 ),..., n f(p 0 )). Twierdzenie 4.5. Niech P 0 = (x 0 1,..., x 0 n) będzie ustalonym punktem przestrzeni R n oraz niech funkcja f, określona przynajmniej na pewnym otoczeniu punktu P 0, ma ciągłe pochodne cząstkowe pierwszego rzędu w punkcie P 0. Wtedy dla każdego wersora v R n. v f(p 0 ) = gradf(p 0 ) v, Przykład 4.2. Niech f (x, y) = xy dla (x, y) R 2. Wtedy 1 f (x, y) = y, 2 f (x, y) = x, (x, y) R 2. Stąd ( ) 2 2 2 2 2 2, 2 f (1, 1) = 1 f (1, 1) 2 2 + 2f (1, 1) 2 = 1 2 + 1 2 = 2. Twierdzenie 4.6. Jeżeli funkcja jest różniczkowalna w punkcie P 0, to ma w tym punkcie pochodne kierunkowe w kierunku dowolnego wersora v R n. 11
Fakt 4.4. (Interpretacja geometryczna gradientu) (i) Gradient funkcji w punkcie wskazuje kierunek jej najszybszego wzrostu w tym punkcie. (ii) Gradient funkcji w punkcie jest prostopadły do poziomicy funkcji przechodzącej przez ten punkt. 5. Ekstrema lokalne Niech A R n będzie zbiorem otwartym, P 0 = (x 0 1,..., x 0 n) A oraz niech f : A R. Definicja 5.1. (i) Powiemy, że funkcja f ma w punkcie P 0 = (x 0 1,..., x 0 n) minimum lokalne, jeżeli istnieje takie sąsiedztwo S (P 0, r) punktu P 0, że dla wszystkich punktów P = (x 1,..., x n ) z tego sąsiedztwa zachodzi warunek f (P ) f (P 0 ). 12
(ii) Powiemy, że funkcja f ma w punkcie P 0 = (x 0 1,..., x 0 n) minimum lokalne właściwe, jeżeli istnieje takie sąsiedztwo S (P 0, r) punktu P 0, że dla wszystkich punktów P = (x 1,..., x n ) z tego sąsiedztwa zachodzi warunek f (P ) > f (P 0 ). (iii) Powiemy, że funkcja f ma w punkcie P 0 = (x 0 1,..., x 0 n) maksimum lokalne, jeżeli istnieje takie sąsiedztwo S (P 0, r) punktu P 0, że dla wszystkich punktów P = (x 1,..., x n ) z tego sąsiedztwa zachodzi warunek f (P ) f (P 0 ). (iv) Powiemy, że funkcja f ma w punkcie P 0 = (x 0 1,..., x 0 n) maksimum lokalne właściwe, jeżeli istnieje takie sąsiedztwo S (P 0, r) punktu P 0, że dla wszystkich punktów P = (x 1,..., x n ) z tego sąsiedztwa zachodzi warunek f (P ) < f (P 0 ). Twierdzenie 5.1. (Warunek konieczny istnienia ekstremum) Jeżeli funkcja f ma w punkcie P 0 ekstremum lokalne i istnieją w tym punkcie pochodne cząstkowe pierwszego rzędu funkcji f, to 1 f (P 0 ) = 0, 2 f (P 0 ) = 0,..., n f (P 0 ) = 0. (1) Uwaga 5.1. Punkt P 0 spełniający warunek (1) nazywamy punktem stacjonarnym funkcji f. Uwaga 5.2. Twierdzenie odwrotne do Twierdzenia 5.1 nie jest prawdziwe. Przykład 5.1. Rozważmy funkcję określoną wzorem f (x, y) = xy dla (x, y) R 2. Wtedy 1 f (x, y) = y, 2 f (x, y) = x, (x, y) R 2. Stąd 1 f (x, y) = 0 2 f (x, y) = 0 y = 0 x = 0 Punkt (0, 0) jest jedynym punktem stacjonarnym funkcji f, jednak w punkcie (0, 0) funkcja f nie ma ekstremum. Istotnie, skoro f (0, 0) = 0, to gdyby funkcja f miała w punkcie (0, 0) ekstremum lokalne, to na pewnym sąsiedztwie punktu (0, 0) funkcja f musiałaby być nieujemna bądź niedodatnia. Tymczasem w dowolnym sąsiedztwie punktu (0, 0) funkcja f przyjmuje zarówno wartości dodatnie jak i ujemne. Wystarczy bowiem zauważyć, że dla dowolnie ustalonego r > 0 mamy ( r, ) ( r 2 2 S ((0, 0), r), r, ) r 2 2 S ((0, 0), r) oraz f ( r 2, r 2) = r2 4 > 0, natomiast f ( r 2, r ) = r2 2 4 < 0. 13
W celu sformułowania warunków dostatecznych istnienia ekstremum lokalnego funkcji f : A R, określonej na zbiorze otwartym A R n, w punkcie P 0 = (x 0 1,..., x 0 n) A, załóżmy, że ma ona ciągłe pochodne cząstkowe pierwszego i drugiego rzędu w pewnym otoczeniu punktu P 0. Ponadto niech 11f(P 2 0 ) 12f(P 2 0 )... 1if(P 2 0 ) i (P 0 ) = det 21f(P 2 0 ) 22f(P 2 0 )... 2if(P 2 0 ), i {1, 2,..., n}...... i1f(p 2 0 ) i2f(p 2 0 )... iif(p 2 0 ) Twierdzenie 5.2. (Warunek dostateczny istnienia ekstremum lokalnego) Niech P 0 będzie punktem stacjonarnym funkcji f : A R, gdzie A R n jest zbiorem otwartym. Załóżmy, że w pewnym otoczeniu punktu P 0 funkcja f ma ciągłe pochodne cząstkowe pierwszego i drugiego rzędu. (i) Jeżeli i (P 0 ) > 0 dla i {1, 2,..., n}, to funkcja f ma w punkcie P 0 minimum lokalne właściwe. (ii) Jeżeli ( 1) i i (P 0 ) > 0 dla i {1, 2,..., n}, to funkcja f ma w punkcie P 0 maksimum lokalne właściwe. (iii) Jeżeli zachodzi jeden z warunków ( i (P 0 ) 0 dla i {1, 2,..., n 1} oraz n (P 0 ) = 0) lub (( 1) i i (P 0 ) 0 dla i {1, 2,..., n 1} oraz n (P 0 ) = 0), to w punkcie P 0 funkcja f może mieć ekstremum lokalne, ale nie musi; przypadek ten wymaga dodatkowych rozważań. (iv) Jeżeli nie zachodzi żaden z warunków (i) (iii), to funkcja f nie ma ekstremum lokalnego w punkcie P 0. Przykład 5.2. Wyznaczyć ekstrema lokalne funkcji określonej wzorem f(x, y) = x 2 + y 2 + xy + 3x 3y, D f = R 2. Funkcja f jest różniczkowalna w każdym punkcie płaszczyzny, a więc posiada pochodne cząstkowe pierwszego rzędu ze względu na każdą zmienną. Mianowicie 1 f(x, y) = 2x + y + 3, 2 f(x, y) = 2y + x 3, (x, y) R 2. Korzystając z warunku koniecznego istnienia ekstremum lokalnego mamy { 2x + y + 3 = 0 2y + x 3 = 0 { x = 3 y = 3 Jedynym punktem stacjonarnym funkcji f jest punkt ( 3, 3). Ponadto wszystkie pochodne cząstkowe pierwszego rzędu są funkcjami ciągłymi w R 2 oraz 2 11f(x, y) = 2, 2 12f(x, y) = 1, 2 21f(x, y) = 1, 2 22f(x, y) = 2, (x, y) R 2. 14
Zatem 1 ( 3, 3) = 2 11f( 3, 3) = 2 > 0, [ 2 1 2 ( 3, 3) = det 1 2 ] = 3 > 0, a więc w punkcie ( 3, 3) funkcja f ma minimum lokalne właściwe. Przykład 5.3. Wyznaczyć ekstrema lokalne funkcji określonej wzorem f(x, y, z) = x 3 + y 2 + 2z 2 + xy 2xz + 3y 1, D f = R 3. Funkcja f jest różniczkowalna w każdym punkcie przestrzeni R 3, a więc posiada pochodne cząstkowe pierwszego rzędu ze względu na każdą zmienną. Mianowicie, dla dowolnego (x, y, z) R 3, 1 f(x, y, z) = 3x 2 + y 2z, 2 f(x, y, z) = 2y + x + 3, 3 f(x, y, z) = 4z 2x. Korzystając z warunku koniecznego istnienia ekstremum lokalnego mamy 3x 2 + y 2z = 0 2y + x + 3 = 0 4z 2x = 0 x = 1 2 y = 5 4 z = 1 4 lub x = 1 y = 2 z = 1 2 Funkcja f posiada dokładnie dwa punkty stacjonarne: A = ( 1 2, 5 4, 1 4) oraz B = ( 1, 2, 1 2). Wyznaczamy pochodne cząstkowe drugiego rzędu, aby sprawdzić warunek dostateczny istnienia ekstremum lokalnego. Dla dowolnego (x, y, z) R 3 mamy 2 11f(x, y, z) = 6x, 2 12f(x, y, z) = 1, 2 13f(x, y, z) = 2, 2 21f(x, y, z) = 1, 2 22f(x, y, z) = 2, 2 23f(x, y, z) = 0, 2 31f(x, y, z) = 2, 2 32f(x, y, z) = 0, 2 33f(x, y, z) = 4. Sprawdzamy warunek dostateczny w pierwszym punkcie stacjonarnym: A = ( 1 2, 5 4, 1 4). 1 (A) = det [ 3] = 3, [ 3 1 2 (A) = det 1 2 ] = 7, 3 (A) = det 3 1 2 1 2 0 2 0 4 = 36. Ponieważ i (A) < 0, dla każdego i {1, 2, 3}, więc w punkcie A funkcja f nie ma ekstremum lokalnego. Sprawdzamy warunek dostateczny w drugim punkcie stacjonarnym: B = ( 1, 2, 1 2). 1 (B) = det [6] = 6, [ 6 1 2 (B) = det 1 2 ] = 11, 3 (B) = det 6 1 2 1 2 0 2 0 4 = 36. Ponieważ i (B) > 0, dla każdego i {1, 2, 3}, więc w punkcie B funkcja f ma minimum lokalne właściwe. 15
6. Ekstrema globalne funkcji Załóżmy, że f : A R, gdzie A R n. Definicja 6.1. (Wartość najmniejsza i największa funkcji na zbiorze) (i) Liczbę m R nazywamy wartością najmniejszą funkcji f na zbiorze D A, jeżeli istnieje taki punkt P 0 D, że f (P 0 ) = m oraz dla każdego punktu P D zachodzi warunek f(p ) m. Liczbę m nazywamy także minimum globalnym funkcji f na zbiorze D. (ii) Liczbę M R nazywamy wartością największą funkcji f na zbiorze D A, jeżeli istnieje taki punkt P 0 D, że f (P 0 ) = M oraz dla każdego punktu P D zachodzi warunek f(p ) M. Liczbę M nazywamy także maksimum globalnym funkcji f na zbiorze D. Uwaga 6.1. (Algorytm szukania ekstremów globalnych funkcji na zbiorze domkniętym) Załóżmy, że zbiór D jest domkniętym i ograniczonym podzbiorem dziedziny funkcji f. (i) Wyznaczamy punkty należące do wnętrza zbioru D, w których funkcja f może mieć ekstrema lokalne. (ii) Wyznaczamy punkty należące do brzegu zbioru D, w których funkcja może mieć ekstrema warunkowe. (iii) Porównujemy wartości funkcji w otrzymanych punktach i na tej podstawie wyznaczamy wartość największą i wartość najmniejszą funkcji w zbiorze D. Przykład 6.1. Wyznaczymy wartość najmniejszą i wartość największą funkcji f o wzorze f(x, y) = x 2 + 2xy 4x + 8y w zbiorze D = {(x, y) R 2 : 0 x 1 0 y 2}. Zauważmy najpierw, że dziedziną funkcji f jest cała płaszczyzna R 2, a zbiór D R 2 jest domknięty i ograniczony. Ponadto funkcja f jest ciągła w zbiorze D, a więc (na mocy twierdzenia Weierstrassa) jest ograniczona i osiąga w zbiorze D wartość najmniejszą i wartość największą. Wyznaczymy teraz wszystkie punkty należące do wnętrza zbioru D, w których funkcja f może mieć ekstrema lokalne, czyli punkty stacjonarne tej funkcji. W tym celu zauważmy, że 1 f(x, y) = 2x + 2y 4, 2 f(x, y) = 2x + 8, (x, y) R 2. Korzystając z warunku koniecznego istnienia ekstremum lokalnego otrzymujemy 2x + 2y 4 = 0, x = 4, 2x + 8 = 0, y = 6. 16
Zatem jedynym punktem stacjonarnym funkcji f jest punkt ( 4, 6), jednak ( 4, 6) / D, a więc pomijamy go w dalszych badaniach. W konsekwencji oznacza to, że wewnątrz zbioru D funkcja f nie osiąga żadnego ekstremum lokalnego. W kolejnym kroku badamy zachowanie się funkcji f na brzegu obszaru D. Zauważmy, że zbiór D jest prostokątem ograniczonym prostymi o równaniach Dla x = 0 i y [0, 2] mamy x = 0, x = 1, y = 0, y = 2. f(x, y) = f(0, y) = 8y := g 1 (y). Wystarczy zauważyć, że g 1 jest funkcją liniową, a więc osiąga wartości ekstremalne na końcach przedziału [0, 2]. Zatem, w odniesieniu do funkcji f interesować nas będę punkty (0, 0) oraz (0, 2). Dla x = 1 i y [0, 2] mamy f(x, y) = f(1, y) = 1 + 2y 4 + 8y = 10y 3 := g 2 (y). Ponownie zauważmy, że g 2 jest funkcją liniową, a więc osiąga wartości ekstremalne na końcach przedziału [0, 2]. Zatem, w odniesieniu do funkcji f interesować nas będę punkty (1, 0) oraz (1, 2). Dla y = 0 i x [0, 1] mamy f(x, y) = f(x, 0) = x 2 4x := g 3 (x). Tym razem, aby wyznaczyć wartości największą i najmniejszą funkcji g 3 na przedziale [0, 1] zauważmy, że g 3(x) = 0 2x 4 = 0 x = 2. Jednak 2 / [0, 1]. Oznacza to, że funkcja g 3 osiąga wartości ekstremalne na końcach przedziału [0, 1]. Stąd wynika, że w odniesieniu do funkcji f interesować nas będę punkty (0, 0) oraz (1, 0). Dla y = 2 i x [0, 1] mamy f(x, y) = f(x, 2) = x 2 + 4x 4x + 16 = x 2 + 16 := g 4 (x). W celu wyznaczenia wartości największej i najmniejszej funkcji g 4 na przedziale [0, 1] zauważmy, że g 4(x) = 0 2x = 0 x = 0. Ponadto 0 [0, 1], a więc funkcja g 4 osiąga wartości ekstremalne na końcach przedziału [0, 1]. Stąd wynika, że w odniesieniu do funkcji f, ponownie dostajemy punkty (0, 2) oraz (1, 2). Wyznaczamy teraz wartości funkcji f w wyznaczonych punktach, które jak się okazuje są wierzchołkami rozważanego prostokąta. Zatem f(0, 0) = 0, f(0, 2) = 16, f(1, 0) = 3, f(1, 2) = 17. Stąd wynika, że wartość najmniejsza funkcji f na zbiorze D wynosi 3, a wartość największa wynosi 17. 17
7. Różniczki wyższych rzędów, wzór Taylora Definicja 7.1. (Różniczki wyższych rzędów) Załóżmy, że P 0 = (x 0 1,..., x 0 n) jest ustalonym punktem przestrzeni R n i funkcja f jest k-krotnie różniczkowalna przynajmniej w pewnym otoczenie punktu P 0. Różniczką k-tego rzędu funkcji f w punkcie P 0 nazywamy różniczkę z różniczki rzędu k 1, dla każdego k N, przy czym przyjmujemy, że d 0 f = f. Czyli d 2 f = d(df), d 3 f = d(d 2 f),..., d k f = d(d k 1 f). Przykład 7.1. (Wzory na różniczki drugiego i trzeciego rzędu dla funkcji dwóch zmiennych) Załóżmy, że funkcja f jest 3-krotnie różniczkowalna w zbiorze A R 2. Wtedy, korzystając z definicji różniczki i twierdzenia Schwarza, mamy d 2 f = d(df) = d ( 1 f x 1 + 2 f x 2 ) = ( 2 11f x 1 + 2 21f x 2 ) x 1 + ( 2 12f x 1 + 2 22f x 2 ) x 2 = 2 11f( x 1 ) 2 + 2 2 21f x 1 x 2 + 2 22f( x 2 ) 2, d 3 f = d(d 2 f) = 3 111f( x 1 ) 3 + 3 3 112f ( x 1 ) 2 x 2 + 3 3 122f x 1 ( x 2 ) 2 + 3 222f( x 2 ) 3. Twierdzenie 7.1. (Wzór Taylora) Niech k N. Załóżmy, że funkcja f ma w otoczeniu punktu P 0 = (x 0 1,..., x 0 n) ciągłe pochodne cząstkowe do rzędu k włącznie oraz, że P = (x 1,..., x n ) jest dowolnym punktem z tego otoczenia. Wtedy na odcinku łączącym punkty P 0 i P istnieje taki punkt P c = (x c 1,..., x c n), że f(p ) = f(p 0 ) + df P 0 (P P 0 ) 1! + d2 f P0 (P P 0 ) 2! + dk 1 f P0 (P P 0 ) (k 1)! + dk f Pc (P P 0 ). k! 18