Pochodne pierwszego rz edu funkcji wielu zmiennych Ostatnio poprawiłem 7 lutego 25 r Duża cz eść zadań pochodzi od dr Marcina Kuczmy Definicja 2 przekształcenia wieloliniowego Przekształceniem n liniowym prowadzacym z iloczynu kartezjańskiego n przestrzeni V = R k R k 2 R kn w przestrzeń liniowa R l nazywamy takie przekształcenie B : V R l, że dla dowolnego numeru i {, 2,, n} i dowolnych p j R k j, j i, przekształcenie przypisujace punktowi R k i punkt Bp,, p i,, p i+,, p n jest liniowe Zbiór wszystkich przekształceń n liniowych z R k R k 2 R k n do R l oznaczać bedziemy symbolem LR k, R k 2,, R k n ; R l Iloczyn skalarny jest przekształceniem dwuliniowym z R k R k w R Iloczyn wektorowy jest przekształceniem dwuliniowym z R 3 R 3 do R 3 Wyznacznik macierzy wymiaru k można potraktować jako funkcje jej k kolumn Ze znanych własności wyznacznika wynika od razu, że jest to funkcja k liniowa Zbiór LR k, R k 2,, R kn ; R l ma naturalna strukture przestrzeni liniowej nad R: przekształcenia n liniowe można dodawać i mnożyć przez skalary liczby LV ; W oznacza zbiór wszystkich przekształceń liniowych z przestrzeni liniowej V w przestrzeń liniowa W Załóżmy, że B : V LV 2 ; W jest przekształceniem liniowym Przyjmijmy, że B, y = By Jasne jest, że tak określone przekształcenie B z V V 2 do W jest dwuliniowe Jest też zrozumiałe, że dla każdego przekształcenia dwuliniowego B : V V 2 W można określić przekształcenie liniowe B : V LV 2 ; W tak, by spełniona była równość B, y = By Opisana właśnie odpowiedniość miedzy przekształceniami dwuliniowymi z LV, V 2 ; W i przekształceniami liniowymi z LV ; LV 2 ; W jest izomorfizmem tych przestrzeni liniowych Studenci, którzy mieli kłopoty z algebra liniowa powinni to sprawdzić bardzo szczegółowo, tu nie ma żadnego problemu, ale te kwestie każdy powinien dobrze zrozumieć Dzieki opisanemu izomorfizmowi możemy utożsamiać przekształcenia dwuliniowe z macierzami tak, jak utożsamiamy przekształcenia liniowe z macierzami W ksiażce R Sikorskiego używane sa macierze wielowskaźnikowe wielowymiarowe po to, by można było przekształcenia wieloliniowe utożsamiać z macierzami wielowskaźnikowymi Pokazaliśmy poprzednio, że przekształcenie liniowe ma norme to jego najmniejsza stała Lipschitza W dowodzie użyliśmy normy euklidesowej 2 Można używać innej normy w przestrzeni R k i być może jeszcze innej w przestrzeni R l Przekształcenie liniowe w dalszym ciagu bedzie lipschitzowskie Ci studenci, którzy byli uprzejmi zrobić zadanie o równoważności zbieżności w dowolnej normie ze zbieżnościa w normie euklidesowej moga udowodnić to korzystajac z tego twierdzenia Dla wszystkich podaje dowód poniżej W tym dowodzie oznacza dowolna norme na R k, zaś norme na R l Niech L oznacza przekształcenie liniowe z R k do R l, a l i,j jego macierz Mamy wtedy L = l i,j j e i l i,j j e i i j i j i l i,j j 23 j e i ma j j l i,j e i i,j
AM II Pochodne pierwszego rz Gdybyśmy umieli oszacować ma j z góry przez dowód byłby zakończony Wykażemy, że takie oszacowanie jest możliwe Mamy = j j e j j e j ma j e j j j Niech C = e j Mamy wiec Cma j Wynika stad, j że jeśli n j w normie ma j, czyli lim ma j,n =, to również lim n = Oznacza to, j n j n że funkcja : R k [, jest ciagła, jeśli w przestrzeni R k odległość zdefiniowana jest za pomoca normy ma j, a w R normalnie Zbiór { R k : ma j = } j j jest domkniety i ograniczony czyli zwarty, zatem funkcja ciagła określona na nim osiaga kres dolny Niech c = inf{ : ma j = } Ponieważ kres dolny c jest wartościa j funkcji ciagłej na zbiorze nie zawierajacym punktu, jedynego w którym funkcja przyjmuje wartość, wiec c > Załóżmy, że Mamy wtedy = ma j j ma j j Uzyskaliśmy zatem nierówność ma j j L ma j a to oznacza, że liczba c i,j i,j = ma j j j ma j j, a z niej wnioskujemy, że j ma j j c l i,j e i l c i,j e i, i,j j c l i,j e i jest stała Lipschitza dla przekształcenia liniowego L, które odwzorowuje przestrzeń R k z metryka wyznaczona przez norme w przestrzeń R l z metryka wyznaczona przez pewna norme Jasne jest, że po drodze wykazaliśmy, że n wtedy i tylko wtedy, gdy n dla dowolnego ciagu n złożonego z punktów przestrzeni R k W dalszym ciagu L oznaczać bedzie najmniejsza stała Lipschitza przekształcenia liniowego L Ta stała zależy od wyboru norm w dziedzinie i w obrazie i tylko w szczególnych przypadkach bedziemy mówić o jakie normy chodzi, na ogół bedzie to 2 jednak dwójki pisać nie bedziemy Czas na wnioski Twierdzenie 22 o normie przekształcenia wieloliniowego Jeśli B LR k, R k 2,, R k n ; R l, to istnieje liczba rzeczywista C taka, że B, 2,, n C 2 n dla dowolnych wektorów R k, 2 R k 2,, n R kn Dowód Na razie załóżmy, że n = 2 Przekształcenie dwuliniowe B może być potraktowane jako przekształcenie liniowe B : R k LR k 2 ; R l Mamy wiec B B Stad wynika, że B, 2 = B 2 B 2 B 2, co kończy dowód Dla wiekszych n stosujemy indukcje i korzystamy z tego, że dla n = 2 teza jest już udowodniona Na wykładzie było to udowodnione inaczej, ale od przybytku dowodów głowa nie boli podobno 24
AM II Pochodne pierwszego rz Twierdzenie 23 o ciagłości przekształcenia wieloliniowego Jeśli B LR k, R k2,, R kn ; R l, to B odwzorowuje przestrzeń LR k, R k2,, R kn w przestrzeń R l w sposób ciagły Dowód Niech h j, p j R k j i niech h j < Mamy wtedy Bp + h, p 2 + h 2,, p n + h n Bp, p 2,, p n Bp + h, p 2 + h 2, p 3 + h 3,, p n + h n Bp, p 2 + h 2, p 3 + h 3,, p n + h n + + Bp, p 2 + h 2, p 3 + h 3, p n + h n Bp, p 2, p 3 + h 3,, p n + h n + + + Bp, p 2, p 3,, p n + h n Bp, p 2, p 3,, p n = = Bh, p 2 + h 2, p 3 + h 3,, p n + h n + Bp, h 2, p 3 + h 3,, p n + h n + + + Bp, p 2, p 3,, p n + h n B h p 2 +h 2 p 3 +h 3 p n +h n + B p h 2 p 3 +h 3 p n +h n + + B p p 2 p 3 p n h n B h + h 2 + + h n + p + p 2 + p n Z tej nierówności ciagłość B wynika od razu Jeśli komuś sie ten dowód nie podoba, to może mu sie przyjrzeć zakładajac, że B, 2,, n jest wyznacznikiem macierzy kwadratowej wymiaru n, której kolumnami sa,, n to oczywiście nie jest sytuacja ogólna, ale dobry reprezentant trudności tu wystepuj acych Jeśli i to nie pomoże można dowód ciagłości przeprowadzić zapisujac wszystko we współrzednych Zajmiemy sie teraz różniczkowaniem funkcji wielu zmiennych Zaczniemy od pojecia pochodnej czastkowej, bo jest ono najprostszym z tych, którymi przyjdzie nam sie zajać W tym rozdziale, jeśli nie napiszemy wyraźnie, że jest inaczej, odwzorowanie f : G R l bedzie określone na zbiorze otwartym G R k Definicja 24 pochodnej czastkowej Pochodna czastkow a pierwszego rzedu odwzorowania f : G R l ze wzgledu na fp+he zmienna i, i k, w punkcie p G, nazywamy granice lim i fp, o ile h h istnieje; e i R k to wektor, którego wszystkie współrzedne z wyjatkiem i tej sa równe a i ta równa jest, czyli e i =,,,,,, Te pochodna czastkow a oznaczamy symbolem f i p Przykład 25 Niech f = +2 3 2+ 3 e 4 Z definicji pochodnej czastkowej wynika, że zachodzi nastepuj acy wzór: f f + he f f + h, 2, 3, 4 f, 2, 3, 4 = lim = lim = h h h h + h + 2 3 2 + 3 e 4 + 2 3 2 + 3 e 4 = lim = h h Pochodna f funkcji f obliczamy traktujac jako argument funkcji f przy jednoczesnym traktowaniu zmiennych 2, 3, 4 jako stałych parametrów Liczac analogicznie f otrzymujemy jeszcze trzy równości: 2 = 6 2 f 2, 3 = e 4 f, 4 = 3 e 4 Przykład 26 Niech f r ϕ = r cos ϕ r sin ϕ tym razem współrz edne punktów piszemy pionowo, co jak sie okaże później ma sens Obliczymy pochodna wzgledem zmiennej r: 25
AM II Pochodne pierwszego rz f r r ϕ = lim = lim h h Teraz kolej na pochodna wzgledem zmiennej ϕ: f r f ϕ ϕ = lim ϕ+h f r ϕ r r cosϕ+h r = lim sinϕ+h r cos ϕ r sin ϕ h h h f r+h ϕ f ϕ r h r+h cos ϕ r+h sin ϕ r cos ϕ r sin ϕ h h = = lim cos ϕ h sin ϕ = cos ϕ sin ϕ lim h r cosϕ+h r cos ϕ h lim h r sinϕ+h r sin ϕ h = r sin ϕ r cos ϕ Widzimy wiec, że w przypadku odwzorowania o wartościach w R 2 otrzymaliśmy wektor, a nie liczbe! Rezultat ten jest dokładnie taki, jakiego należało sie spodziewać Jeśli funkcja o wartościach w przestrzeni R l ma w jakimś punkcie pochodna wzgledem którejś ze swych k zmiennych, to ta pochodna czastkowa jest wektorem l wymiarowym Właściwie na tym można by skończyć, ale warto jeszcze otrzymany rezultat zinterpretować fizycznie Można myśleć, że wartościa funkcji f jest punkt płaszczyzny oddalony o r od punktu lub wektor zaczynaj acy sie w punkcie i kończ acy sie w punkcie f r ϕ = r cos ϕ r sin ϕ traktujemy wi ec liczby r i ϕ jako tzw współrzedne biegunowe punktu płaszczyzny Przy obliczaniu pochodnej wzgledem r traktujemy zmienna ϕ jako stała Możemy interpretować zmienna r jako czas Po zmianie czasu o h znajdujemy sie w punkcie f r+h ϕ = r+h cos ϕ r+h sin ϕ Znaleźliśmy si e wiec w punkcie leżacym na tej samej półprostej wychodzacej z punktu, ale w innej odległości od pocz atku układu współrzednych Zmiana odległości równa jest zmianie czasu Wobec tego predkość skalarna powinna być równa a wektor predkości powinien być równoległy do półprostej, po której porusza sie punkt Wektor cos ϕ sin ϕ jest równoległy do półprostej wychodz acej z punktu i przechodz acej przez punkt r cos ϕ r sin ϕ Jego długość to Jest to wektor równy predkości wektorowej poruszajacego sie punktu Podobnie można zinterpretować pochodna wzgledem ϕ Tym razem r sie nie zmienia, natomiast zmienia sie kat jaki tworzy wektor o poczatku i końcu r cos ϕ r sin ϕ z osi a odcietych pozioma osia układu współrzednych W tej sytuacji ϕ oznacza zarówno czas jak i ten kat Wobec tego ruch odbywa sie po okregu o środku i promieniu r Chwilowa pr edkość wektorowa jest wiec wektorem stycznym do tego okregu Długość tego wektora to oczywiście r, f bo predkość katowa równa jest Wektorowi r ϕ ϕ = r sin ϕ r cos ϕ przysługuj a obie te własności To właśnie jest wektor predkości chwilowej w tym ruchu w momencie ϕ rϕ r cos ϕ cos ψ Przykład 27 Niech f = r cos ϕ sin ψ Tym razem należy myśleć o tzw współrzednych ψ r sin ϕ sferycznych: r jest odległości a od poczatku układu współrzednych, ϕ szerokościa geograficzna na sferze o środku i promieniu r, zaś ψ długościa geograficzna na tej sferze Obliczamy pochodne czastkowe: f rϕ cos ϕ cos ψ = cos ϕ sin ψ f rϕ r sin ϕ cos ψ, = r sin ϕ sin ψ f rϕ r cos ϕ sin ψ, = r cos ϕ cos ψ r ψ sin ϕ ϕ ψ r cos ϕ ψ ψ Pierwsza z nich, f rϕ, to wektorowa predkość r ψ w ruchu jednostajnym z predkości a skalarna, po promieniu wychodzacym z punktu i przechodzacym przez punkt ; druga z nich, f rϕ, to predkość ϕ wektorowa w ruchu po południku z pred- r cos ϕ cos ψ r cos ϕ sin ψ r sin ϕ ψ Do przeczytania dalszej cz eści tego przykładu wystarczy rozumieć poj ecie pr edkości znane z lekcji fizyki w szkole 26
AM II Pochodne pierwszego rz kościa katow a zachowujemy promień sfery i długość geograficzna, jedynie szerokość geograficzna zmienia sie; trzecia to f rϕ, to predkość ψ ψ w ruchu po równoleżniku z predkości a katow a zachowujemy promień sfery i szerokość geograficzna, jedynie długość geograficzna zmienia sie W pierwszym przypadku predkość skalarna równa jest, bo czas równy jest odległości od punktu, w drugim predkość skalarna równa jest promieniowi południka bo predkość katowa jest równa czyli r, w trzecim natomiast predkość skalarna równa jest promieniowi równoleżnika bo predkość katowa również w tym przypadku równa jest czyli r cos ϕ Te predkości skalarne równe sa odpowiednio długościom wektorów f rϕ, f rϕ i f rϕ r ϕ ψ Przykład 28 Niech f { y = ψ ψ ψ, jeśli = = y; y Funkcja ta nie jest, jeśli lub y 2 +y 2 = i jednocześnie f 2 = 2 w edruj ac wzdłuż prostej o równaniu aża do = f Oczywiście jest to jedyny punkt astkowych funk- atkiem punktu pochodne cz astkowe istnieja, acych na obliczanie pochodnej funkcji jednej funkcja f ma pochodne cz astkowe Wy- ciagła w punkcie, bowiem dla mamy f Oznacza to, że jeśli zbliżamy sie do punktu y =, to wartości badanej funkcji nie d nieciagłości tej funkcji Zbadamy teraz kwestie istnienia pochodnych cz cji f We wszystkich punktach z wyj co wynika od razu z twierdzeń pozwalaj zmiennej rzeczywistej Również w punkcie f f każemy to Mamy lim h h h sam sposób wykazujemy, że f = lim h h = Wykazaliśmy, że f = W taki y = Zauważmy jeszcze, że jeśli lub y, to f y = y 3 2 y wynika to natychmiast z twierdzenia o pochodnej ilorazu dwu 2 +y 2 2 funkcji jednej zmiennej Analogicznie f y y = 3 y 2 Zachecamy 2 +y 2 2 czytelnika do samodzielnego sprawdzenia tych wzorów oraz do sprawdzenia, że pochodne czastkowe, które właśnie znaleźliśmy, sa nieciagłe w punkcie Przykład 28 pokazuje, że stwierdzenie istnienia pochodnych czastkowych w jakimś punkcie, a nawet w całej dziedzinie funkcji nie pozwala jeszcze zbyt wiele na temat tej funkcji wywnioskować z istnienia pochodnych czastkowych nie wynika nawet ciagłość funkcji! Jasne jest, że potrzebne nam sa własności pozwalajace na stwierdzanie ciagłości funkcji i co wiecej na stwierdzanie, że jej zachowanie w małym otoczeniu punktu różniczkowalności jest w przybliżeniu takie jak funkcji liniowej To jest podstawowa idea w rachunku różniczkowym Stosowaliśmy rozumowania oparte na tej właśnie idei wielokrotnie w przypadku funkcji jednej zmiennej To one doprowadziły nas do sformułowania twierdzeń pozwalajacych na ustalanie w jakich przedziałach funkcja różniczkowalna jest monotoniczna, w jakich punktach może mieć lokalne ekstrema itd Podamy teraz definicje różniczkowalności funkcji wielu zmiennych i warunek wystarczajacy dla różniczkowalności Definicja 29 funkcji różniczkowalnej w punkcie Funkcja f : G R l określona na zbiorze G otwartym w R k jest różniczkowalna 27
AM II Pochodne pierwszego rz w punkcie p G wtedy i tylko wtedy, gdy istnieje takie przekształcenie liniowe L: R k R l fp+h fp Lh, że zachodzi równość lim = Wtedy przekształcenie h h liniowe L nazywamy różniczka funkcji f w punkcie p i oznaczamy symbolem Dfp lub dfp lub f p Uwaga 2 o jednoznaczności różniczki fp+h fp Lh fp+h fp Zauważmy, że jeśli lim = i lim Lh h h h h fp+h fp Lh = lim h h fp+h fp lim Lh h h = lim Lh Lh h h =, to zachodzi też wzór Ostatnia równość zachodzi wtedy jedynie, gdy Lh = Lh dla wszystkich h R k Jeśli bowiem Lh Lh dla pewnego h R k, to dla każdego t > zachodzi wzór Lth = t Lh tlh = Lth Lth Lth Lh Lh wiec również = lim = lim = Lh Lh Wynika stad, t + th t + h h że warunek nałożony na różniczke spełniać może co najwyżej jedno przekształcenie liniowe Uwaga 2 o definicji różniczkowalności Definicje różniczkowalności można też sformułować tak: Funkcja f : G R l jest różniczkowalna w punkcie p G wtedy i tylko wtedy, gdy istnieje przekształcenie liniowe L: R k R l i taka funkcja r : B[, ε R l ciagła w punkcie, że r = i dla dowolnego wektora h B, ε zachodzi równość fp + h = fp + Lh + h rh Twierdzenie 22 warunek wystarczajacy dla różniczkowalności Jeśli funkcja f : G R l określona na otwartym podzbiorze przestrzeni R k ma pochodne czastkowe wzgledem zmiennych, 2,, k w każdym punkcie pewnej kuli otwartej Bp, ε o środku w punkcie p i wszystkie one sa ciagłe w punkcie p, to funkcja f jest różniczkowalna w punkcie p i zachodzi nastepuj aca równość: Dfph = f ph + f 2 ph 2 + + f k ph k Dowód By uniknać komplikacji zwiazanych z zapisem przeprowadzimy dowód w przypadku l = i k = 2 Dowód w sytuacji ogólnej nie różni sie niczym istotnym od tego, który zamierzamy podać po prostu jest wiecej współrzednych zarówno w dziedzinie jak i w obrazie Skorzystamy przy tym z twierdzenia Lagrange a o wartości średniej dla funkcji jednej zmiennej rzeczywistej o wartościach rzeczywistych Niech p = p p 2, h = h h 2 Niech αt = fp+te = f p +t p 2 Mamy α t = f p +t p 2 Istnieje taka liczba θ, że αh α = α θ h i < θ < h, zatem zachodzi równość fp + h e fp = f p +h p 2 f p p 2 = f p +θ h p 2 Niech βs = f p +h p 2 +s Istnieje taka liczba σ 2, że βh 2 β = f p +h h2 2 p 2 +σ 2 = β σ 2 h 2 i < σ 2 < h 2 Stad h = h = h fp + h fp f ph f 2 ph 2 = fp + h fp + h e + fp + h e fp f ph f 2 ph 2 = f 2 p + h e + σ 2 e 2 h 2 + f p + θ e h f ph f 2 ph 2 = f 2 fp + h e + σ 2 e 2 f 2 p + h f h fp + θ e f p = h 2 h bo h h, h 2 h i pochodne cz astkowe f 28 i f 2 h, sa ciagłe jako funkcje zespołu
AM II Pochodne pierwszego rz zmiennych w punkcie p Wykazaliśmy, że funkcja liniowa przypisujaca wektorowi h liczbe f ph + f 2 ph 2 jest różniczka funkcji f w punkcie p Uwaga 23 Dowód polega na tym, że zamiast przemieścić sie z punktu p do punktu p + h od razu, przemieszczamy sie najpierw z punktu p do punktu p + h e, czyli równolegle do jednej osi układu współrzednych, a potem dopiero z tego punktu do punktu p + h, drugie przemieszczenie odbywa sie wiec w kierunku równoległym do drugiej osi Czynimy tak, by sprowadzić problem do różniczkowania funkcji jednej zmiennej, bo tam działa twierdzenie Lagrange a o wartości średniej pozwalajace na wnioskowanie własności funkcji z odpowiednich własności pochodnych Pochodna czastkowa obliczana jest po to, by uzyskać informacje o tym jak zmienia sie funkcja w kierunku jednej z osi układu współrzednych Różniczke, o ile istnieje, obliczamy po to, by dowiedzieć sie jak zachowuje sie funkcja w całym otoczeniu punktu Pojeciem pośrednim jest pochodna kierunkowa Definicja 24 pochodnej kierunkowej Pochodna funkcji f : G R l w punkcie p, w kierunku wektora v nazywamy granice fp + tv fp lim, t t jeśli ta granica istnieje Te pochodna oznaczamy symbolem f vp f Jasne jest, że właśnie uogólniliśmy pojecie pochodnej czastkowej: i p = f e i p Pochodna kierunkowa w kierunku wektora v obliczana jest po to, by ocenić tempo zmian funkcji w otoczeniu punktu p na prostej przechodzacej przez punkt p równoległej do wektora v W punktach różniczkowalności funkcji pochodna kierunkowa można znaleźć po obliczeniu różniczki funkcji: Twierdzenie 25 o istnieniu pochodnej kierunkowej Jeśli funkcja f : G R l jest różniczkowalna w punkcie p G, v R k, to funkcja f ma w punkcie p pochodna kierunkowa w kierunku wektora v i zachodzi równość: f vp = Dfpv Dowód Mamy fp+tv fp lim t t = lim fp+tv fp Dfptv tv + Dfpv = Dfpv t + tv t skorzystaliśmy tu z tego, że iloczyn wyrażenia tv, ograniczonego, i wyrażenia t daż acego do ma granice oraz z tego, że Dfptv = tdfpv i oczywiście z różnicz- kowalności funkcji f w punkcie p, z której wynika, że lim fp+tv fp Dfptv t tv W ten sposób zakończyliśmy dowód istnienia pochodnej w kierunku wektora v = Z tego twierdzenia wynika w szczególności, że przy ustalonym punkcie p pochodna f vp jest liniowa funkcja wektora v, oczywiście jeśli funkcja f jest różniczkowalna w tym punkcie Czytelnik zechce sprawdzić, że jeśli f = i f y = 2 y, gdy 2 +y 2 przynajmniej jedna z liczb, y jest różna od, to f v = fv dla każdego wektora 29
AM II Pochodne pierwszego rz v R k W tym przypadku pochodna w kierunku wektora v w punkcie nie jest wiec liniowa funkcja wektora v, a co za tym idzie, funkcja f nie jest różniczkowalna w punkcie Zachecamy do sprawdzenia, że f jest w tym punkcie ciagła Powtórzmy: z różniczkowalności funkcji w punkcie wynika istnienie pochodnych kierunkowych w tym punkcie we wszystkich kierunkach, w szczególności istnienie pochodnych czastkowych Z istnienia pochodnych czastkowych nie wynika nawet ciagłość funkcji widzieliśmy to w przykładzie czwartym Istnieje funkcja, której pochodne kierunkowe we wszystkich kierunkach sa równe w pewnym punkcie i która nie jest ciagła w tym punkcie Oznacza to, że zbadanie zachowania sie funkcji na prostych przechodzacych przez dany punkt to jedynie wstep do zbadania zachowania sie tej funkcji w otoczeniu tego punktu Twierdzenie 26 warunek konieczny dla różniczkowalności Jeśli funkcja f : G R l określona na otwartym podzbiorze przestrzeni R k jest różniczkowalna w punkcie p G, to ma ona w tym punkcie pochodna czastkow a wzgledem każdej ze zmiennych, 2,, k i dla każdego j =, 2,, k zachodzi wzór f j p = Dfpe j, gdzie e j oznacza jak zwykle wektor, którego wszystkie współrzedne z wyjatkiem j tej sa równe, zaś j ta współrzedna równa jest Podane poprzednio przykłady świadcza o istnieniu funkcji, które maja w pewnych punktach pochodne czastkowe, chociaż nie sa w nich różniczkowalne Warunek dostateczny pozwala natomiast na stwierdzenie, że funkcje zdefiniowane za pomoca standardowych wzorów sa różniczkowalne, o ile jedna definicja obowiazuje w całej dziedzinie W innych przypadkach kłopoty z różniczkowalnościa pojawiać sie moga w punktach, w otoczeniu których obowiazuj a różne definicje wartości funkcji Funkcje, które rozważaliśmy w przykładach 25 27 sa dzieki warunkowi wystarczajacemu dla różniczkowalności różniczkowalne ich pochodne czastkowe sa ciagłe w całej przestrzeni To samo dotyczy funkcji z przykładu 28 z wyłaczeniem punktu Przykłady funkcji różniczkowalnych możemy teraz mnożyć, ale nie bedziemy tego czynić Twierdzenie 27 o ciagłości funkcji różniczkowalnej Jeśli funkcja f : G R l jest różniczkowalna w punkcie p G, to jest też ciagła w punkcie p Dowód Załóżmy, że funkcja f jest różniczkowalna w punkcie p Mamy wtedy: limfp + h = lim fp+h fp Dfph h + fp + Dfph = h h h = + fp + Dfp = fp, a to właśnie oznacza, że funkcja f jest ciagła w punkcie p skorzystaliśmy tu z definicji różniczkowalności i z tego, że przekształcenie liniowe Dfp jest ciagłe Dowód został zakończony Czytelnik z łatwościa może przeoczyć różnice miedzy tym rozumowaniem i dowodem przeprowadzonym dla funkcji jednej zmiennej, bo polega ona jedynie na tym, że teraz wystapiła norma wektora a poprzednio wartość bezwzgledna liczby rzeczywistej 3
AM II Pochodne pierwszego rz Jeśli f r ϕ = r cos ϕ r sin ϕ, tak jak w przykładzie 26, to Df r cos ϕ r sin ϕ ϕ = sin ϕ r cos ϕ pierwsza kolumna tej macierzy to pochodna odwzorowania f wzgledem r, czyli pierwszej zmiennej, a druga kolumna to pochodna wzgledem ϕ, czyli drugiej zmiennej W pierwszym wierszu mamy pochodne czastkowe pierwszej funkcji współrzednej odwzorowania f, a w drugim drugiej Przypominamy, że na analizie rozpatrujemy macierze przekształcenia liniowego prawie zawsze wzgledem standardowej bazy w R k Formalnie rzecz biorac różniczka funkcji w punkcie jest przekształceniem liniowym przestrzeni argumentów w przestrzeń wartości odwzorowania, jednak ponieważ używamy ustalonych baz, bedziemy utożsamiać przekształcenie liniowe z jego macierza wzgledem tych baz rϕ Niech f = ψ W tym przypadku mamy Df rϕ r cos ϕ cos ψ r cos ϕ sin ψ, zajmujemy sie wiec odwzorowaniem z przykładu 27 r sin ϕ cos ϕ cos ψ r sin ϕ cos ψ r cos ϕ sin ψ = cos ϕ sin ψ r sin ϕ sin ψ r cos ϕ cos ψ Po- ψ sin ϕ r cos ϕ ast- dobnie jak w przypadku poprzednim widzimy, że pierwsza kolumna to pochodna cz kowa wzgledem zmiennej r, druga wzgledem zmiennej ϕ, trzecia wzgledem zmiennej ψ W pierwszym wierszu wystepuj a kolejno pochodne czastkowe pierwszej funkcji współrzednej odwzorowania f wzgledem kolejnych zmiennych itd Twierdzenie 28 o pochodnej przekształcenia wieloliniowego Jeśli B jest przekształceniem n liniowym, to B jest różniczkowalne i zachodzi wzór DBp, p 2,, p n h, h 2,, h n = = Bh, p 2,, p n + Bp, h 2, p 3,, p n + + Bp, p 2,, p n, h n Dowód Wyrażenie Bp + h, p 2 + h 2,, p n + h n można przedstawić jako sume 2 n składników Każdy z nich jest wartościa funkcji B na n elementowym ciagu, którego cześć wyrazów to punkty p j a pozostałe to punkty h j Jeśli h j wystepuje dwa lub wiecej razy, to po podzieleniu przez h, czyli przez h 2 + h 2 2 + + h 2 n otrzymujemy wyrażenie daż ace do przy h 2 Podamy teraz twierdzenia pozwalajace na obliczanie pochodnych jednych funkcji, gdy znane sa pochodne innych funkcji Twierdzenie 29 o arytmetycznych własnościach różniczki Jeśli funkcje f i g określone na tym samym zbiorze otwartym sa różniczkowalne w punkcie p, to: a jeśli f i g prowadza w te sama przestrzeń R l, to ich suma i różnica sa różniczkowalne i zachodzi wzór Df + gp = Dfp + Dgp; b jeśli wartości f leża w R l, wartości g leża w R m i h = f, g, to funkcja h: R k R l+m jest różniczkowalna i prawdziwy jest wzór Dhph = Dfph, Dgph; 2 Oczywiście h 2 = h h, mamy tu do czynienia z iloczynem skalarnym wektora h przez ten sam wektor h 3
AM II Pochodne pierwszego rz lim h c jeżeli ich iloczyn f g jest zdefiniowany np wartościami funkcji f sa liczby rzeczywiste albo wartościami funkcji f i g sa wektory tego samego wymiaru a iloczyn to iloczyn skalarny, lub wartości obu funkcji f, g to wektory trójwymiarowe a iloczyn, to iloczyn wektorowy, lub wartości funkcji f i g to macierze takich wymiarów, że mnożenie f g jest wykonalne, to f g jest funkcja różniczkowalna w punkcie p i zachodzi Df gp = Dfp gp + fp Dgp, tzn Df gph = Dfph gp + fp Dgph dla h R k, 3 ogólnie: jeżeli B jest przekształceniem dwuliniowym określonym na iloczynie kartezjańskim przeciwdziedzin funkcji f i g, to funkcja h określona za pomoca wzoru h = Bf, g jest różniczkowalna w punkcie p i zachodzi wzór Dhph = B Dfph, gp + B fp, Dgph Dowód Dowód cześci a to proste ćwiczenie na zastosowanie definicji różniczki i twierdzenia mówiacego, że granica sumy to suma granic Dowód cześci b wymaga jedynie zastosowania definicji różniczki i zrozumienia zwiazku miedzy zbieżnościa w R l i w R m a zbieżnościa w R l+m Zajmiemy sie cześci a c Niech fp + h = fp + Dfph + h rh oraz niech gp+h = gp+dgph+ h ϱh przy czym r i ϱ sa funkcjami ciagłymi w punkcie oraz r = i ϱ = Możemy teraz napisać B fp + h, gp + h = B fp + Dfph + h rh, gp + Dgph + h roh = B fp, gp + B Dfph, gp + B fp, Dgph + B Dfph, Dgph + + h B rh, gp + Dgph + h ϱh + h B fp + Dfph + h rh, ϱh Stad i z twierdzenia o normie przekształcenia wieloliniowego wynika natychmiast, że B Dfph, Dgph + h B rh, gp + Dgph + h ϱh + h + h B fp + Dfph + h rh, ϱh = Dowód cz eści c został tym samym zakończony Twierdzenie 22 o różniczce złożenia dwu funkcji Załóżmy, że funkcja g jest różniczkowalna w punkcie p a funkcja f w punkcie gp oraz że złożenie f g jest zdefiniowane, tj dziedzina funkcji f zawiera zbiór wartości funkcji g Wtedy złożenie f g jest różniczkowalne w punkcie p i zachodzi równość: Df gp = Dfgp Dgp, tu kropka oznacza mnożenie macierzy czyli składanie przekształceń liniowych Jeśli f = f, f 2,, f m oraz g = g, g 2,, g l, to f i g j p = l s= f i y s gp gs j p Dowód Niech gp + h = gp + Dgph + h rh i fgp + H = fgp + DfgpH + H ϱh Z różniczkowalności funkcji f i g wynika, że lim rh = h oraz lim ϱh = Zdefiniujmy Hh = gp + h gp Zachodzi wtedy równość H Hh = Dgph + h rh, zatem Hh Mamy h 3 Mnożenie macierzy jest nieprzemienne, wi ec nie wolno zmieniać kolejności czynników iloczynu 32
AM II Pochodne pierwszego rz fgp + h = fgp + DfgpH + H ϱh = = fgp + Dfgp Dgph + h rh + H ϱh = = fgp + DfgpDgph + Dfgp h rh [ + H ϱh = = fgp + DfgpDgph + h Dfgprh + ] Dgp h + rh ϱh h Teza wynika od razu z tego że granica wyrażenia w nawiasie kwadratowym jest Twierdzenie 22 o różniczce funkcji odwrotnej Załóżmy, że funkcja f : G R l jest różniczkowalna w pewnym punkcie p zbioru otwartego G R k, że jej zbiór wartości jest otwarty w R l, że różniczka Dfp jest izomorfizmem oraz że funkcja f jest różnowartościowa i funkcja odwrotna f jest ciagła w punkcie fp Wtedy funkcja f jest różniczkowalna w punkcie fp i zachodzi równość Df fp = [Dfp] Dowód Niech H = fp + h fp Ta równość jest równoważna nastepuj acej: fp + h = fp + H, a ta z kolei temu, że p + h = f fp + H Wobec tego mamy h = f fp + H f fp Z ciagłości odwzorowania f wynika, że zachodzi równość lim H = lim fp + h fp =, a z ci agłości h h f wynika, że lim h = H = lim f fp + H f fp = Widzimy wiec, H że lim h = wtedy i tylko H wtedy, gdy lim H = Z różnowartościowości funkcji f wynika, że H = wtedy i tylko h wtedy, gdy h = Mamy zatem H f fp+h f fp Dfp = p+h p Dfp fp+h fp = H fp+h fp rh = h Dfp Dfph+ h rh Dfp = Dfph+ h rh Dfp h +rh h h, bo licznik ostatniego ułamka daży do, a mianownik jest od oddzielony: lim rh = h i istnieje liczba c > taka, że Dfpv c dla każdego wektora v, którego długościa jest Stad i z definicji różniczki wynika, że Dfp jest różniczk a przekształcenia f w punkcie fp Twierdzenie o arytmetycznych własnościach różniczki jest nieomal oczywiste, jego stosowanie nie sprawia nikomu żadnych trudności Z twierdzeniem o pochodnej złożenia zapoznamy sie dokładniej nieco poźniej, teraz wypada stwierdzić, że jedna z głównych przyczyn definiowania iloczynu macierzy w znany sposób jest to, że wtedy teza twierdzenia o różniczce złożenia wyglada dokładnie tak jak w przypadku funkcji jednej zmiennej Ta sama uwaga dotyczy twierdzenia o różniczce funkcji odwrotnej Podajemy je, by pokazać pełna analogie teorii funkcji jednej i wielu zmiennych rzeczywistych Zreszta tak jak w przypadku funkcji jednej zmiennej problemem jest różniczkowalność funkcji odwrotnej, wartość różniczki można znaleźć korzystajac z twierdzenia o pochodnej złożenia dwu funkcji Dodajmy jeszcze, że w twierdzeniu o różniczce funkcji odwrotnej wymiary przestrzeni wartości i przestrzeni argumentów musza być równe, bo zakładamy, że te przestrzenie sa izomorficzne Szczególnie ważne sa funkcje wielu zmiennych o wartościach rzeczywistych W tym przypadku czesto mówimy o gradiencie funkcji zamiast o jej różniczce w punkcie 33
AM II Pochodne pierwszego rz Definicja 222 gradientu funkcji o wartościach rzeczywistych Jeśli f : G R jest funkcja określona na podzbiorze otwartym G przestrzeni R k różniczkowalna w punkcie p R k, to gradientem funkcji f w punkcie p nazywamy taki wektor grad fp, że dla każdego wektora h R k zachodzi równość Dfph = grad fp h Różnica miedzy gradientem i różniczka wyda sie wielu czytelnikom różnica minimalna: gradient jest wektorem k wymiarowym, natomiast różniczka Dfp jest przekształceniem liniowym z przestrzeni R k w jednowymiarowa przestrzeń liniowa R, czyli elementem przestrzeni R k Ponieważ stosujemy standardowe bazy w przestrzeni R k, wiec współrzedne wektora grad fp sa równe odpowiednim współrzednym przekształcenia liniowego Dfp To nasz wybór, na razie naturalny Gdy bedziemy rozważać kwestie nieco ogólniejsze, np funkcje określone jedynie na powierzchniach, to żadnej naturalnej metody wybierania bazy nie bedzie, wiec utożsamienie gradientu z różniczka za pomoca współrzednych straci sens Rozważmy teraz funkcje f : G R różniczkowalna w punkcie p G Niech v i w oznaczaja takie wektory, że v = grad fp i w = grad fp Mamy wtedy f vp = Dfpv = v grad fp = v w v w = w 2 = f wp Wykazaliśmy wiec Twierdzenie 223 o kierunku najszybszego wzrostu funkcji Pochodna funkcji f w kierunku gradientu funkcji w danym punkcie p jest najwieksz a ze wszystkich pochodnych w tym punkcie w kierunku wektorów o długości grad fp Zwykle mówimy, że gradient wskazuje kierunek najszybszego wzrostu funkcji, bo pochodna mierzy tempo zmian funkcji, jeśli pochodna jest dodatnia to funkcja rośnie Rozważanie jedynie wektorów o danej długości jest oczywiście konieczne, bo f αvp = αf vp dla dowolnego punktu p, dowolnego wektora v i dowolnej liczby rzeczywistej α, a my chcemy porównywać tempo wzrostu funkcji wzdłuż prostych przechodzacych przez punkt p oczywiście przy założeniu, że po każdej prostej poruszamy sie z ta sama predkości a podany w tym zdaniu wzór stwierdza po prostu, że zmiana predkości poruszania sie po prostej przechodzacej przez p powoduje wzrost predkości zmian funkcji w takim samym stosunku Jednym z naszych celów jest znajdowanie wartości najmniejszych i najwiekszych funkcji wielu zmiennych, których wartościami sa liczby rzeczywiste, tzw funkcji rzeczywistych W przypadku funkcji jednej zmiennej punktem wyjścia do rozwiazywania zadań tego typu było twierdzenie o zerowaniu sie pochodnej w punktach lokalnego ekstremum Powtórzmy je teraz dla funkcji wielu zmiennych Twierdzenie 224 o zerowaniu sie pochodnych w punktach lokalnego ekstremum Jeśli funkcja f : G R ma w punkcie p lokalne maksimum lub lokalne minimum i ma pochodna kierunkowa f vp w kierunku wektora v, to f vp = Jeśli f jest różniczkowalna w punkcie p, to grad fp = 34
AM II Pochodne pierwszego rz Dowód Wynika to natychmiast z tego, że jeśli f ma lokalne ekstremum w punkcie p, to dla dowolnego wektora v funkcja g zdefiniowana wzorem gt = fp + tv ma lokalne ekstremum w punkcie, a zatem = g = f vp ostatni wzór wynika natychmiast z definicji obu pochodnych w nim wystepuj acych Definicja 225 wektora stycznego do zbioru Niech A R k bedzie dowolnym zbiorem Wektor v R k nazywać bedziemy stycznym do zbioru A w punkcie p A wtedy i tylko wtedy, gdy istnieje liczba t i ciag p n p punktów zbioru A zbieżny do p, o wyrazach różnych od p taki, że v = t lim n p n p n p Zbiór wektorów stycznych do zbioru A w punkcie p A oznaczamy symbolem T p A Z definicji wynika od razu, że mówić o wektorach stycznych do A w punkcie p można, jeśli istnieje co najmniej jeden ciag p n punktów zbioru A o wyrazach różnych od p, zbieżny do p Takie punkty nazywane sa punktami skupienia zbioru A Wektor jest styczny do każdego zbioru w każdym jego punkcie skupienia Jeśli v T p A oraz s, to również sv T p A Nie jest natomiast prawda, że suma wektorów stycznych do zbioru A jest wektorem stycznym do zbioru A Może sie tak zdarzyć, ale nie musi Nastepne twierdzenie wynika wprost z definicji wektora stycznego Twierdzenie 226 o styczności wektora stycznego do krzywej zawartej w zbiorze A Niech p bedzie punktem skupienia zbioru A R k Niech γ : δ, δ R k bedzie funkcja różniczkowalna w punkcie, δ >, przy czym γt A dla t > oraz γ = p Wtedy wektor γ = Dγ jest styczny do A w punkcie p Można myśleć, że obraz funkcji γ to krzywa w R k przechodzaca przez punkt p i to taka, że jeśli posuwamy sie wzdłuż niej w odpowiednim kierunku, to nie opuszczamy zbioru A Wektor γ można potraktować jako wektor predkości γ opisuje ruch pewnego punktu w ten sposób, że w chwili t poruszajacy sie punkt znajduje sie w położeniu γt, w tej sytuacji wektor γ jest wektorem predkości chwilowej, wiec musi być styczny do krzywej, po której punkt sie porusza Nasza definicja jest dosyć ogólna, wiec nie każdy wektor styczny do zbioru może być potraktowany jako wektor styczny do krzywej zawartej w tym zbiorze W wielu podrecznikach wektory styczne do zbioru sa definiowane jako wektory styczne do krzywych zawartych w tym zbiorze, my wybieramy nieco ogólniejsza, mniej popularna definicje, bo w niektórych sytuacjach jest ona wygodniejsza i ułatwia omawianie pewnych kwestii Podaliśmy wiele twierdzeń i definicji, teraz czas na ich zilustrowanie y Przykład 227 Niech g = + 2y + 3z 6 i niech A = {p : gp = }, tzn zbiór z y A składa sie z tych punktów =, że + 2y + 3z = 6, jest wiec, z jak wiadomo, płaszczyzna Punkt q := leży na tej płaszczyźnie, bo + 2 + 3 = 6 Równanie 2 płaszczyzny przepisać możemy w postaci wektorowej: u = u q, gdzie u = Niech 3 a v = b bedzie c wektorem prostopadłym do wektora u, tzn = u v = a+2 b+3 c 35
AM II Pochodne pierwszego rz +at Niech γt = q + tv = +bt Wtedy gγt = + at + 2 + bt + 3 + ct 6 = +ct 2 ab ab t = t =, zatem γt A Wobec tego γ t = jest wektorem stycznym do 3 c c 2 płaszczyzny A w punkcie q Wykazaliśmy wiec, że każdy wektor prostopadły do u = 3 jest styczny do płaszczyzny A Wykazaliśmy też, że jeśli wektor v jest prostopadły do wektora u, to punkt q+v leży na płaszczyźnie A Wektor v może wiec być potraktowany jako różnica dwóch punktów płaszczyzny A, czyli jako na niej leżacy Zauważmy jeszcze, że innych wektorów stycznych do płaszczyzny nie ma: jeżeli p n A, czyli u p n 6 =, to oczywiście u p n q =, zatem u =, jeśli p wiec tv = lim n q n p n, to u tv =, zatem również u v = q p n q p n q Wykazaliśmy wiec, że zbiór wektorów stycznych do płaszczyzny A składa sie z wektorów leżacych na tej płaszczyźnie tj bed acych różnicami punktów z tej płaszczyzny 2 oraz że wektor u = jest do wszystkich tych wektorów, wiec 3 również do płaszczyzny A prostopadły Czytelnik zauważył z pewnościa, że wybór punktu płaszczyzny był całkowicie nieistotny dla tych rozważań Istotne było jedynie to, że równanie płaszczyzny było postaci u 6 = Jasne jest, że równanie dowolnej płaszczyzny w R 3 może być zapisane w ten sposób, zatem teza jest prawdziwa dla dowolnego punktu leżacego na dowolnej płaszczyźnie Te sama postać ma równanie prostej w R 2, tylko wymiar jest mniejszy Można też myśleć o wiekszych wymiarach Jeśli wiec prosta na płaszczyźnie zdefiniowana jest za pomoca równania a + by + c =, to wektor a b jest do tej prostej prostopadły Wróćmy jeszcze do płaszczyzny A Zdefiniowana ona została za pomoca równania g = Okazało sie, że gradient funkcji g jest do tej płaszczyzny prostopadły Oznacza to, że funkcja g najszybciej zmienia sie w kierunku prostopadłym do płaszczyzny A, natomiast w kierunku stycznym do płaszczyzny jej pochodne kierunkowe sa równe, wiec tempo zmian jest najmniejsze, co nikogo nie dziwić nie powinno, bo przecież na płaszczyźnie A funkcja g jest stała Również ten efekt jest przejawem ogólniejszej prawidłowości, o czym przekonamy sie niebawem Twierdzenie 228 warunek konieczny styczności do poziomicy funkcji Jeśli funkcja g : G R jest różniczkowalna w punkcie p i wektor v jest styczny w punkcie p do do zbioru M :={ R k : g = gp}, zwanego poziomica funkcji g zawierajac a punkt p, to Dgpv =, czyli grad gp v = Dowód Załóżmy, że v T p M Istnieja wtedy: liczba rzeczywista s > i ciag p p n punktów zbioru M różnych od p, takie że p = lim p n i sv = lim n p Niech n n p n p gp + h = gp + Dgph + h rh Mamy wtedy gp n = gp+p n p = gp+dgpp n p+ p n p rp n p i wobec równości gp n = gp możemy napisać: = Dgpp n p + p n p rp n p Po podzieleniu stronami przez p n p = otrzymujemy = Dgp pn p + rp p n p n p Po przejściu do granicy: = Dgpsv = sdgpv Stad teza wynika od razu Twierdzenie 229 warunek dostateczny styczności do poziomicy Jeśli funkcja g : G R jest ciagła w otoczeniu punktu p i różniczkowalna w punkcie p, 36
AM II Pochodne pierwszego rz grad gp, = Dgpv = grad gp v, to wektor v jest styczny w punkcie p do poziomicy funkcji g zawierajacej punkt p, tzn do zbioru M :={ R k : g=gp} Dowód Niech gp + h = gp + Dgph + h rh Z tego że funkcja g jest różniczkowalna w punkcie p wynika, że lim rh = Z tego, że funkcja g jest ciagła h wynika, że funkcja r też jest ciagła ciagłość w punkcie wynika z poprzedniego zdania Niech v bedzie jednostkowym wektorem prostopadłym do grad gp, czyli = grad gp v = Dgpv i v = Mamy wykazać, że v T p M Jeśli istnieje ciag liczb dodatnich t n taki, że p + t n v M dla wszystkich n naturalnych, to teza jest spełniona w oczywisty sposób Załóżmy wiec, że takiego ciagu nie ma Oznacza to, że w pobliżu punktu p nie ma innych punktów zbioru M leżacych na prostej przechodzacej przez p równoległej do wektora v Pokażemy jednak, że bardzo blisko tej prostej takie punkty już sa 4 Z założenia wynika, że istnieje liczba δ > taka, że jeśli < t < δ, to gp gp + tv = gp + Dgptv + h rtv = gp + h rtv Stad wynika, że dla takich t mamy rtv Niech ϱt = sup{ rw : w 2t} Jest jasne, że ϱt rtv > dla t > oraz że lim t +ϱt = Istnieje wi ec taka liczba δ, δ, że dla t, δ zachodza nierówności: tv ± t ϱt grad gp = = t 2 + t 2 ϱt grad gp 2 grad gp 4 2t < oraz < ϱt < Wtedy 4 Dgptv ± t ϱt grad gp = grad gp tv ± t ϱt grad gp = = t ϱt grad gp 2 > 2tϱt t 2 + t 2 ϱt grad gp 2 r tv ± tϱt grad gp = = tv ± t ϱt grad gp r tv ± tϱt grad gp Stad wynika, że suma liczb Dgptv ± t ϱt grad gp = ±t ϱt grad gp 2 i tv ± t ϱt grad gp r tv ± tϱt grad gp ma taki znak, jak pierwsza z nich, bo pierwsza ma wieksz a wartość bezwzgledn a Wobec tego dla < t < δ zachodza nierówności: gp + tv t ϱt grad gp < gp < gp + tv + t ϱt grad gp Z ciagłości funkcji g wynika istnienie liczby τt t ϱt, t ϱt, dla której zachodzi równość gp = g p + tv + τt grad gp, zatem p + tv + τt grad gp M τt tv+τt grad gp Ponieważ lim =, wiec t + t lim = v = v Wektor v jest wi ec t + tv+τt grad gp v styczny do zbioru M w punkcie p, a wobec tego każdy otrzymany przez pomnożenie v przez liczbe nieujemna też jest styczny do M w punkcie p Zadanie 2 Wykazać, że założenie ciagłości funkcji g w otoczeniu punktu p, a nie tylko w tym punkcie, jest istotne dla prawdziwości udowodnionego twierdzenia Przykład 23 Niech g y = 2 +y 2 25 i niech A = { : g = } Niech q = 3 4, wiec q A Musi być spełniony warunek konieczny styczności do poziomicy, wiec wektory styczne do A w punkcie q musza być prostopadłe do wektora grad gq = 2 3 4, 4 Znacznie bliżej prostej niż p, rozumowanie jest możliwe, bo człon h r h jest mały w porównaniu z Dgph Z tej prostej zejdziemy w kierunku wektora grad gp lub w dokładnie przeciwnym 37
AM II Pochodne pierwszego rz wiec również do wektora 3 4 a ponieważ funkcja g jest ci agła, wiec każdy wektor v prostopadły do wektora 3 4 jest styczny do M Jest to zgodne z twierdzeniem znanym ze szkoły podstawowej a może z gimnazjum, wg którego prosta styczna do okregu jest prostopadła do promienia, w rozpatrywanym przypadku do wektora zaczynajacego sie w punkcie = i kończ acego sie w punkcie q = 3 4 Napiszmy teraz równanie tej stycznej Punkt leży na stycznej wtedy i tylko wtedy, gdy wektor q jest prostopadły do wektora q, tzn gdy q q = Przyjmujac = y otrzymujemy równanie 3 3 + y 4 4 =, czyli 3 + 4y = 3 2 + 4 2 = 25 Przykład 23 Rozważmy teraz wykres Γ R 2 funkcji różniczkowalnej f : R R Niech a R bedzie ustalona liczba rzeczywista i niech p = a fa b edzie punktem wykresu odpowiadajacym liczbie a Zdefiniujmy funkcje g : R 2 R za pomoca wzoru g y = f y Oczywiście zbiór Γ zdefiniowany jest równaniem g y = Funkcja g jest różniczkowalna, wiec również ciagła Znajdziemy przestrzeń styczna do Γ w punkcie p Mamy grad gp = f a Wobec tego zbiór wektorów stycznych do Γ pokrywa sie ze zbiorem wektorów prostopadłych do gradientu g, czyli równoległych do wektora f a Dowolny wektor styczny do wykresu Γ jest wi ec postaci τ f a, gdzie τ jest dowoln a liczba rzeczywista Napiszmy równanie stycznej w punkcie p do wykresu Γ funkcji f Punkt leży na tej stycznej wtedy i tylko wtedy, gdy = p grad gp = a f a+y fa Można to równanie przepisać w postaci y = f a a + fa, jest wiec to równanie, z którym mieliśmy już do czynienia w przypadku funkcji jednej zmiennej Widać wiec, że nowa definicja wektora stycznego rozszerza zakres poprzednio stosowanej Przykład 232 Niech L: R k R l bedzie przekształceniem liniowym Zachodzi wtedy Lp+h = Lp+Lh, zatem różniczka przekształcenia liniowego jest ono samo i to niezależnie od tego w jakim punkcie różniczki poszukujemy: DLph = Lh Wynika to Lp+h Lp Lh z definicji różniczki: lim =, bo licznik tego ułamka jest tożsamościowo h h równy Podobnie jest w przypadku przekształcenia afinicznego, tj przekształcenia F postaci F = L + v, gdzie L oznacza ustalone przekształcenie liniowe z R k do R l, a v ustalony wektor l wymiarowy W tym przypadku DF ph = Lh 5 dla każdego punktu p R k i każdego wektora h R k Wynika to natychmiast z równości F p+h F p Lh lim h h każdego h Lp+h+v Lp+v Lh = lim h h =, bo licznik ułamka jest równy dla Przykład 233 Niech g = r 2, r > Niech S = { R k : g = } Zbiór S jest wiec k wymiarowa sfera o promieniu r i środku w poczatku układu współrzednych Niech p S Znajdziemy przestrzeń styczna do sfery S w punkcie p Wektory styczne musza być prostopadłe do gradientu funkcji g 5 Czesto piszemy Dfp = L pomijajac argument h Przekształcenie liniowe to szczególny przypadek wieloliniowego, wiec to powtórzenie fragmentu twierdzenia o różniczkowaniu przekształceń wieloliniowych 38
AM II Pochodne pierwszego rz Zróżniczkujemy funkcje g Mamy g + h = + h + h + h h r 2 = g + 2 h + h 2 Zachodzi oczywista h 2 równość lim h h = Z tej równości i z definicji różniczki przekształcenia wynika, że Dgh = 2 h Oznacza to, że grad g = 2, bo punkt nie leży na sferze S Wobec tego i wobec ciagłości funkcji g zbiór wektorów stycznych do S w punkcie p S to po prostu zbiór wektorów prostopadłych do p Możemy teraz napisać równanie płaszczyzny stycznej do tej sfery w punkcie p Punkt leży na tej płaszczyźnie stycznej wtedy i tylko wtedy, gdy wektor p jest styczny do sfery, tzn p p = To równanie można przepisać w postaci p = p p Widać, że w zapisie wektorowym przypadek sfery jednowymiarowej, czyli okregu na płaszczyźnie przykład 6, nie różni sie niczym od płaszczyzny stycznej do sfery dwuwymiarowej umieszczonej w przestrzeni trójwymiarowej lub ogólnie sfery k wymiarowej umieszczonej w przestrzeni k wymiarowej Przykład 234 Niech g y = y i niech M = { : g = } Jasne jest, że w tym przypadku zbiór M składa sie z dwu prostych: = oraz y = Wobec tego przestrzeń styczna do zbioru M w punkcie zawiera te dwie proste wektor styczny do jednej z nich w punkcie jest oczywiście styczny do zbioru M w tym punkcie Wykażemy, że to już sa wszystkie wektory styczne do zbioru M w tym punkcie Tym razem stwierdzenie, że musza być one prostopadłe do gradientu nic nie wnosi, bo gradientem jest wektor zerowy Samo stwierdzenie jest oczywiste, bo ciag zbieżny do punktu musi zawierać podciag złożony z punktów leżacych na jednej z osi Stad wynika od razu, że wektor styczny do M musi być styczny do jednej z osi układu współrzednych Przykład 235 Niech g y = 2 + y 2 2 2 + y 2, M = { R 2 : g = } Jasne jest, że A Znajdziemy wszystkie wektory styczne do zbioru A w punkcie Bez trudu stwierdzamy, że grad g y = 4 2 +y 2 2 4y 2 +y 2 +2y, zatem grad g = Podobnie jak w przykładach poprzednich wektory styczne do zbioru M w punkcie musza być prostopadłe do wektora grad g, tylko że w tym przypadku nic z tego nie wynika, bo każdy wektor jest prostopadły zerowego Równanie g = to po prostu y 4 + 2 2 + y 2 2 + 4 = Potraktowawszy jako parametr możemy je rozwiazać wzgledem niewiadomej y 2 : y 2 = 2 2 ± 2 2 2 + 2 + 4 2 4 4 = 2 2 2 ± + 8 2 Ponieważ y 2, wiec mamy y 2 = 2 2 2 + + 8 2 Wobec tego y 2 = +82 +2 2 2 2+2 2 + +8 2 = 22 4 +2 2 +, +8 2 zatem dla zachodzi jedna z dwu równości: y = 2 2 +2 2 +, y +8 2 + = 2 2 +2 2 + +8 2 Bez trudu 6 stwierdzamy, że y = i y + = Wynika stad, ze wektorami stycznymi do zbioru A sa wektory, oraz wszystkie wektory, które można otrzymać 6 Korzystamy z definicji pochodnej, bo liczymy pochodna tylko w jednym punkcie i to w punkcie 39
AM II Pochodne pierwszego rz przez pomnożenie jednego z tych dwóch przez liczbe rzeczywista Wykażemy, że innych wektorów stycznych w tym punkcie do zbioru A nie ma Wynika to od razu z tego, że ciag zbieżny do punktu musi zawierać podciag złożony z punktów leżacych na wykresie funkcji y lub z punktów leżacych na wykresie funkcji y +, wiec wektor styczny wyznaczony przez ten ciag bedzie jednym z poprzednio znalezionych Przykład 236 Niech g y = 4 + y 4 2 y 2 i niech M = { : g = } Jasne jest, że g = Znajdziemy przestrzeń styczna do zbioru M w punkcie Mamy grad g y = 4 3 2 4y 2y, wi ec 3 grad g = Podobnie jak w poprzednim przykładzie z tego, że wektory styczne do M sa prostopadłe do wektora grad g =, nic ciekawego nie wynika, wiec postapimy tak, jak w przykładzie Potraktujemy y jako niewiadoma, jako parametr Przy założeniu, że liczba jest dostatecznie mała 7 otrzymujemy wzór: y 2 = 2 ± + 42 4 4, dla dużych pod pierwiastkiem pojawia sie liczba ujemna, wiec równanie nie ma rozwiazań Ponieważ y 2, wiec w przypadku 2 < otrzymujemy równość y 2 = 2 + + 42 4 4 Punkty znalezione w ten sposób w przypadku znajda sie w pobliżu punktu lub punktu Wobec tego w pobliżu punktu nie ma innych punktów zbioru A W takiej sytuacji mówimy, że punkt jest to punkt izolowany zbioru A Nie ma wiec ciagów zbieżnych do punktu złożonych z elementów zbioru M Wobec tego jedynym wektorem stycznym do zbioru A w punkcie jest wektor zerowy Przykład 237 Niech f = i niech Γ bedzie wykresem funkcji f Znajdziemy wektory styczne do Γ w punkcie Załóżmy, że lim p n = lim n n n f n = Mamy wi ec lim n = = lim n Założyć też należy, że p n, a to oznacza, że n n n n p n Ponieważ p n = 2 n + n, wiec lim n = i lim n p n n że jedynym jednostkowym wektorem stycznym do Γ jest wektor otrzymujemy mnożac ten wektor przez liczby nieujemne = Wynika stad, Wszystkie inne Przykład 238 Niech f = 3 Ponieważ równanie y = 3 można przepisać w postaci równoważnej y 3 =, wiec wykres funkcji, która przypisuje liczbie liczbe 3 to to samo co wykres funkcji, która liczbie y przypisuje liczbe y 3 po prostu w drugim przypadku osia argumentów jest oś pionowa, a osia wartości pozioma, dokładnie przeciwnie niż w przypadku pierwszym Styczna do wykresu funkcji jednej zmiennej była poszukiwana w przykładzie siódmym Stosujac tamten wynik możemy stwierdzić, że przestrzeń styczna do wykresu funkcji f w punkcie to prosta równoległa do wektora 3 2 =, czyli prosta pionowa Komentarz na temat definicji wektora stycznego W wielu ksiażkach autorzy stosuja nieco inna definicje wektora stycznego Rozpatruja mianowicie funkcje γ : [t, t + δ A majace prawostronna pochodna w punkcie t Inni z kolei zakładaja, że funkcja γ ma być określona na przedziale otwartym δ, δ 7 tu oznacza to, że 2 2 + 5 4
AM II Pochodne pierwszego rz W tym ostatnim przypadku jedynym wektorem stycznym w punkcie do wykresu funkcji jest wektor zerowy Nasza definicja jest wiec inna, ogólniejsza Podaliśmy ja, bo choć nie jest przesadnie popularna, to jest najbardziej zbliżona do intuicji zwiazanych z pojeciem styczności, bywa prostsza w użyciu W przypadku zbiorów bardziej skomplikowanych, np zbioru Cantora czy iloczynu kartezjańskiego zbioru Cantora przez odcinek, jest chyba najwygodniejsza Dobrze też działa w najważniejszym przypadku, tzw rozmaitości różniczkowych, w tym rozmaitości z brzegiem, o których porozmawiamy wiosna Przykłady: różniczkowanie, poszukiwanie ekstremów Przykład 239 Znajdziemy najmniejsza i najwieksz a wartość wyrażenia y 2 z 3 założywszy, że, y, { z i + y + z = 6 y } y Niech C = :, y, z, + y + z = 6 i f = y 2 z 3 Funkcja z z f jest ciagła na R 3 y, wiec też na zbiorze C Zbiór C jest ograniczony, bo jeśli punkt z znajduje sie zbiorze C, to 6, y 6, z 6 Jest też domkniety, wiec zwarty, wiec funkcja ciagła określona na tym zbiorze przyjmuje w jakimś jego punkcie wartość najmniejsza i w jakimś punkcie wartość najwieksz a C oczywiście nie zawiera żadnej kuli, wiec nie można tu stosować twierdzenia o zerowaniu sie gradientu w punktach lokalnego ekstremum Można natomiast wyznaczyć jedna z trzech zmiennych za pomoca dwu pozostałych, np = 6 y z i rozważyć funkcje dwu zmiennych: g y z = 6 y zy 2 z 3 na zbiorze D = { } y z : y, z, y + z 6 Zbiór D, podobnie jak C, jest zwarty Funkcja g jest ciagła w każdym punkcie płaszczyzny, wiec również w punktach zbioru D i wobec tego przyjmuje w jakimś punkcie tego zbioru wartość najmniejsza i w jakimś punkcie wartość najwieksz a Łatwo zauważyć, że zbiór D jest trójkatem prostokatnym równoramiennym którego wierzchołkami sa punkty, 6 i 6 Na brzegu tego trójkata, czyli w punktach prostej y =, w punktach prostej z = oraz w punktach prostej y + z = 6 funkcja g przyjmuje wartość Wewnatrz trójkata przyjmuje wartości dodatnie Wobec tego jej najmniejsza wartościa jest liczba, a wartość najwieksza jest przyjeta w pewnym punkcie wewnetrznym W tym punkcie wewnetrznym gradient funkcji g jest równy Zachodzi równość grad g y y z = 2 z 3 +2yz 3 6 y z Obie współrzedne maja być równe, a ponieważ y 2 z 3 +3y 2 z 2 6 y z szukamy punktów wewnatrz trójkata D, wiec musi być y > i z >, zatem musza być spełnione równości y + 26 y z = i z + 36 y z =, czyli 3y + 2z = 2 i 3y + 4z = 8 Wobec tego musi być z = 3 i y = 2 Ponieważ wartość najwieksza jest przyjmowana w pewnym punkcie i jedynym kandydatem jest punkt 2 3, wi ec najwieksz a wartościa funkcji g na zbiorze D jest liczba g 2 3 = 6 2 32 2 3 3 = 8 y Przykład 24 Niech f = 2 + 2y 2 + 3z 2 4 + 8y 2z Jasne jest, że funkcja z nie jest ograniczona z góry: lim f = + Nie jest jasne czemu równy jest kres + 4
AM II Pochodne pierwszego rz dolny funkcji i czy jest on jej wartościa Jeśli kres jest wartościa funkcji określonej na całej przestrzeni, to gradient tej funkcji w punkcie, w którym jest on przyjmowany y 2 4 jest wektorem zerowym Mamy grad f = 4y+8 Jasne jest, że ten wektor równy z 6z 2 2 jest wtedy i tylko wtedy, gdy = 2, y = 2 i z = 2 Mamy f 2 = 24 Jeśli wiec kres dolny jest wartościa funkcji, to musi być równy 24 Wykażemy, że tak jest y w rzeczywistości f + 24 = 2 2 + 2y + 2 2 + 3z 2 2, co kończy dowód z W istocie rzeczy do znalezienia kresów rachunek różniczkowy w tym zadaniu nie był potrzebny, w rzeczywistości funkcja f w ostatnim kroku została potraktowana jako suma 3 wielomianów kwadratowych, każdy innej zmiennej, które zostały sprowadzone do postaci kanonicznych! Rachunek różniczkowy pomaga tu jedynie ustalić, jaki punkt jest podejrzany o to, że w nim kres jest osiagany, ale oczywiście te hipoteze można sformułować nie liczac żadnych pochodnych Przykład 24 Niech f y = 2 2 4y + y 2 2 + 68y Podobnie jak w przykładzie poprzednim widać, że lim + = +, zatem funkcja nie jest ograniczona z góry, czyli jej kresem górnym jest + Jeśli kres dolny tej funkcji jest jej wartościa, to w punkcie, w którym jest przyjmowany, gradient funkcji f jest wektorem zerowym Mamy grad f y = 4 4y 2 4+2y+68 Ma wi ec być 4 4y 2 = = 4 + 2y + 68 Rozwiazuj ac ten układ dwóch równań liniowych z dwiema niewiadomymi otrzymujemy = 2, y = 3 Jedynym kandydatem na punkt, w którym mógłby być osiagni ety kres dolny tej funkcji, jest wiec punkt 2 3 Niech u = 2, v = y + 3 Mamy wi ec f y = f u+2 v 3 = 2u + 2 2 4u + 2v 3 + v 3 2 2u + 2 + 68v 3 = = 2u 2 4uv + v 2 22 = 2u v 2 + 8v 2 22 ostatnie przekształcenie to po prostu sprowadzenie wielomianu kwadratowego zmiennej u, którego współczynniki zależa od parametru v, do postaci kanonicznej Jasne jest, że najmniejsza wartościa otrzymanego wyrażenia jest liczba 22 i że wartość ta jest przyjmowana jedynie wtedy, gdy u = v i v =, tzn u = = v Podobnie jak w poprzednim przykładzie można było nie liczyć pochodnych, lecz potraktować od razu funkcje jako wielomian zmiennej u z parametrem v, sprowadzić go do postaci kanonicznej i rzecz cała zakończyć Przykład 242 Niech f y = 2 2 4y + y 2 2 + 4y Z oczywistej równości lim + = + wynika, że sup f = + Post epuj ac tak jak w poprzednim przykładzie znajdujemy grad f y = 4 4y 2 4+2y+4 Ten wektor równy jest wtedy i tylko wtedy, gdy = 2 i y = 3 Podstawmy = u + 2, y = v 3 Wtedy f y = 2u+2 2 4u+2v 3+v 3 2 2u+2+4v 3 = 2u 2 4uv+v 2 4 = = 2u v 2 v 2 4 W odróżnieniu od przykładów poprzednich wyrażenie 2u v 2 v 2 bywa ujemne, wiec liczba 4 nie jest kresem dolnym funkcji f Co wiecej, mamy f v v = v 2 4, zatem kresem dolnym funkcji f jest, co oznacza, v że funkcja f nie jest ograniczona również z dołu Oczywiście również w tym przykładzie użycie pochodnych nie jest konieczne, można od razu potraktować funkcje jako wielomian zmiennej zależny od parametru y 42 2