Optymalizacja II. Jan Palczewski poprawki Andrzej Palczewski WWW:

Wielkość: px
Rozpocząć pokaz od strony:

Download "Optymalizacja II. Jan Palczewski poprawki Andrzej Palczewski WWW:"

Transkrypt

1 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 1/144 Optymalizacja II Jan Palczewski poprawki Andrzej Palczewski WWW: 14 października 2016

2 2/144 c J. Palczewski, Uniwersytet Warszawski, Streszczenie. Wykład prezentuje teorię optymalizacji nieliniowej z ograniczeniami równościowymi i nierównościowymi. Uzupełniony jest z wprowadzeniem do metod numerycznych. Tu będzie informacja o prawach autorskich i zasadach powielania Copyright c J. Palczewski, Uniwersytet Warszawski, Wydział Matematyki, Informatyki i Mechaniki, Niniejszy plik PDF został utworzony 14 października Skład w systemie L A TEX, z wykorzystaniem m.in. pakietów beamer oraz listings. Szablony podręcznika i prezentacji: Piotr Krzyżanowski, projekt: Robert Dąbrowski.

3 Spis treści 1 Wiadomości wstępne Problem optymalizacji Istnienie minimum funkcji ciągłej Minima lokalne funkcji jednej zmiennej Wzory Taylora Ekstrema globalne Zadania Ekstrema funkcji wielu zmiennych Notacja i twierdzenia Taylora w wielu wymiarach Znikanie gradientu Dodatnia i ujemna określoność macierzy Warunki II-go rzędu (kryterium drugiej różniczki) Ekstrema globalne i określoność drugiej różniczki Zadania Funkcje wypukłe Zbiory wypukłe i twierdzenia o oddzielaniu Definicja funkcji wypukłej Własności funkcji wypukłych Charakteryzacje funkcji wypukłej Subróżniczka Zadania Ekstrema funkcji wypukłej z ograniczeniami Problem minimalizacyjny Funkcje pseudowypukłe Maksymalizacja funkcji wypukłej Zadania Warunek konieczny I rzędu Stożek kierunków stycznych

4 4/144 c J. Palczewski, Uniwersytet Warszawski, Ograniczenia nierównościowe Warunki konieczne Kuhna-Tuckera Zadania Warunki regularności i przykłady Warunki regularności Przykłady Zadania Funkcje quasi-wypukłe i warunki dostateczne Quasi-wypukłość Maksymalizacja funkcji quasi-wypukłej Warunki dostateczne Zadania Warunek konieczny dla ograniczeń mieszanych Warunek konieczny pierwszego rzędu Warunki regularności Warunki drugiego rzędu Warunki drugiego rzędu Podsumowanie Przykład Zadania Teoria dualności Warunek dostateczny Warunek konieczny dla programowania wypukłego Zadanie pierwotne i dualne Zadania Teoria wrażliwości Ograniczenia równościowe Ograniczenia nierównościowe Zadania Wprowadzenie do numerycznych metod optymalizacji Własności algorytmów optymalizacyjnych Optymalizacja bez użycia pochodnych Zadania Metody spadkowe 119

5 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 5/ Metody największego spadku Metoda Newtona Metoda kierunków i gradientów sprzężonych Zadania Metody optymalizacji z ograniczeniami Algorytm Zoutendijka dla ograniczeń liniowych Algorytm Zoutendijka dla ograniczeń nieliniowych Modyfikacja Topkisa-Veinotta Podsumowanie Zadania

6 Wprowadzenie Optymalizacja to poszukiwanie czegoś najlepszego. Sprawdzenie, czy coś (np. decyzja) jest najlepsze, wymaga, przede wszystkim, określenia jakiejś miary, która pozwoli tą decyzję ocenić funkcji celu. Konieczne jest także opisanie zbioru wszystkich dopuszczalnych decyzji zbioru punktów dopuszczalnych. Matematyczne przedstawienie zadania optymalizacyjnego, które zaprezentujemy na tym wykładzie, może wydać się dużym uproszczeniem, lecz okazuje się ono być wystarczające w wielu praktycznych zastosowaniach. Będziemy opisywać zbiór punktów dopuszczalnych jako podzbiór wielowymiarowej przestrzeni rzeczywistej opisany przez układ równości i/lub nierówności. Funkcja celu będzie przyporządkowywała każdemu punktowi tego zbioru liczbę rzeczywistą mierzącą jego optymalność. W przypadku minimalizacji, funkcja celu często zwana jest funkcją kosztu, a celem optymalizacji jest wybranie spośród dozwolonych, opisanych przez ograniczenia, sposobów postępowania tych, które ten koszt uczynią najmniejszym. Jeśli funkcja celu i wszystkie funkcje opisujące ograniczenia są liniowe, to mamy do czynienia z programowaniem liniowym. Istnieje wówczas algorytm (tzw. algorytm sympleks) pozwalający na szybkie i dokładne rozwiązywanie takich zagadnień (patrz monografie Bazaraa, Jarvis, Sherali [2] oraz Gass [8]). Sprawa znacznie się komplikuje, jeśli choć jedna z funkcji jest nieliniowa. Przenosimy się wówczas do świata programowania nieliniowego, który jest dużo bogatszy i trudniejszy. W ten właśnie świat mają wprowadzić czytelnika niniejsze notatki. Okazuje się, że wiele zastosowań matematyki sprowadza się właśnie do problemów optymalizacyjnych. Zarządzanie procesami produkcyjnymi, logistyka, czy decyzje inwestycyjne to typowe problemy programowania nieliniowego. Nie dziwi zatem, że wielu ekonomistów jest ekspertami w tej dziedzinie. Co więcej, wiele teorii ekonomicznych opiera się na założeniu, że świat dąży lub oscyluje wokół punktu równowagi, czyli punktu będącego rozwiązaniem pewnego problemu optymalizacyjnego. Równie ważne zastosowania ma programowanie nieliniowe w mechanice, elektronice, zarządzaniu zasobami wodnymi (tamy, irygacja itp.) oraz budownictwie. Można się pokusić o stwierdzenie, że to jedna z najczęściej stosowanych przez niematematyków dziedzin matematyki. Nie można też pominąć statystyki: np. metoda najmniejszych kwadratów, czy największej wiarogodności. Zwykle, gdy teoria matematyczna zostaje użyta w praktyce, eleganckie metody analityczne oddają pola metodom numerycznym. Metody numeryczne mają na celu znalezienie przybliżenia rozwiązania zadania optymalizacyjnego, gdy staje się ono zbyt skomplikowane, by rozwiązać je w piękny analityczny sposób. Trzy ostatnie rozdziały tych notatek stanowią wprowadzenie do tej ważnej dziedziny. Zainteresowany czytelnik może poszerzyć swoją wiedzę czytając monografie Bertsekasa [4, 5], Luenbergera [9] lub Bazaraa, Sherali i Shetty [3]. 6

7 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 7/144 Literatura Monografia Bazaraa, Sherali, Shetty [3] prezentuje podejście bardziej inżynierskie, utylitarne. Prezentuje zarówno teorię, jak i metody numeryczne. Wszystkie twierdzenia poparte są dowodami i uzupełnione przykładami, tak więc stwierdzenie, że jest to pozycja inżynierska, tyczy się tego, że autorzy ilustrują matematyczne rozumowania intuicjami pochodzącymi z zastosowań. Bertsekas jest ekspertem od metod numerycznych programowania nieliniowego. W jego książkach [4, 5] czytelnik może szukać zaawansowanych algorytmów. Teoria jest jednak zaprezentowana dość skrupulatnie, więc i tutaj można się całkiem dużo dowiedzieć o metodach analitycznych. Książka Luenbergera [9] prezentuje zarówno teorię programowania liniowego jak i nieliniowego. Większy nacisk położony jest w niej na metody numeryczne niż na prezentację matematycznej teorii w pełnej ogólności. Programowanie liniowe nie jest przedmiotem tych notatek, lecz co jakiś czas wspominane, szczególnie w przypadku metod numerycznych. Czytelnik chcący pogłębić wiedzę na jego temat odsyłany jest do książek Bazaraa, Jarvis, Shetty [2] i Gass [8]. Literatura w języku polskim nie jest zbyt obszerna. Warto tu wspomnieć monografie Zangwilla [13] i Canona, Culluma i Polaka [6]. Notacja R zbiór liczb rzeczywistych, x = (x 1,..., x n ) wektor (pogrubiona litera) x y relacja pomiędzy dwoma wektorami; równoważna x i y i dla każdego i x = x x x2 n norma euklidesowa w R n, cl W domknięcie zbioru W w domyślnej normie (najczęściej euklidesowej) f (x), f (x) pierwsza i druga pochodna funkcji jednej zmiennej Df(x) pierwsza pochodna funkcji wielu zmiennych, wektor wierszowy D 2 f(x) macierz drugich pochodnych funkcji wielu zmiennych Podziękowania Część wykładów i zadań bazuje na notatkach prof. Bronisława Jakubczyka. W największym stopniu dotyczy to wykładów 1, 2, 10, 11. Niektóre zadania pochodzą od dr. Wojciecha Kryńskiego. Ogromne wyrazy wdzięczności należą się Agnieszce Wiszniewskiej-Matyszkiel za liczne uwagi i komentarze dotyczące zarówno samego doboru materiału jak i jego przedstawienia. Jan Palczewski, Warszawa 2012 Wersja wykładu, która znajduje się na stronie zawiera kilka modyfikacji w stosunku do wersji umieszczonej w portalu Zasadnicza różnica polega na umieszczeniu nowej wersji wykładów 12 i 13, a także rozszerzeniu wykładów 10 i 14. Poza tym zostały skorygowane zauważone błędy lub niezręczności w dowodach i przykładach. Autor poprawek jest bardzo wdzięczny Przemysławowi Kiciakowi za wskazanie wielu z tych błędów, a także za uzupełnienie wykładów o rys. 4.2, 5.4 i Andrzej Palczewski, Warszawa 2016

8 Rozdział 1 Wiadomości wstępne 1.1 Problem optymalizacji Niech W R n będzie niepustym zbiorem, zaś f : W R dowolną funkcją. Będziemy rozważać problem minimalizacji funkcji f na zbiorze W, przyjmując różne postaci W, w tym: W = R n (problem optymalizacji bez ograniczeń) (unconstrained optimization), W = {x R n : g 1 (x) = 0,..., g m (x) = 0}, gdzie g 1,... g m : R n R pewne funkcje (problem optymalizacji z ograniczeniami równościowymi) (equality constraints), W = {x R n : g 1 (x) 0,..., g m (x) 0}, gdzie g 1,... g m : R n R pewne funkcje (problem optymalizacji z ograniczeniami nierównościowymi) (inequality constraints). Zbiór W nosi nazwę zbioru punktów dopuszczalnych (feasible set/region). Definicja 1.1. Punkt x 0 W nazywamy minimum globalnym (global minimum) funkcji f na zbiorze W jeśli f(x) f(x 0 ) dla każdego x W. Definicja 1.2. Punkt x 0 W nazywamy minimum lokalnym (local minimum) funkcji f jeśli istnieje ε > 0 takie, że dla kuli B(x 0, ε) o środku w x 0 i promieniu ε zachodzi f(x) f(x 0 ) dla każdego x B(x 0, ε) W. Oczywiście, jeśli x 0 jest minimum globalnym to jest minimum lokalnym. Minimum nazywamy ścisłym, jeśli w powyższych definicjach zachodzi f(x) > f(x 0 ), dla x x 0. Analogicznie definiujemy globalne i lokalne maksimum. Punkt x 0 nazywamy ekstremum (lokalnym, globalnym) jeśli jest on maksimum lub minimum (lokalnym, globalnym). Minimum (globalne, lokalne) nie musi istnieć, tzn. może się okazać, że nie istnieje x 0 spełniające warunek z definicji 1.1 lub 1.2. W szczególności minimum globalne f na zbiorze W nie istnieje gdy: (a) inf x W f(x) =, lub (b) inf x W f(x) = c R, ale x U takie, że f(x) = c. 8

9 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 9/144 Przykład 1.1. Niech W = R, f(x) = x sin x. Dla tej funkcji inf x W f(x) =, zatem minimum globalne nie istnieje. Jeżeli natomiast ograniczymy się do przedziału W = [a, b], to minimum globalne będzie istnieć. Funkcja ta osiąga minima lokalne w nieskończonej ilości punktów, dla W = R. Jeżeli za W przyjmiemy odcinek otwarty, to minimum globalne istnieje lub nie istnieje, w zależności od tego odcinka. Ogólnie, funkcja ciągła może nie osiągać kresów na zbiorze niezwartym, w szczególności na podzbiorze otwartym W R n. 1.2 Istnienie minimum funkcji ciągłej Przypomnijmy, że podzbiór zwarty w R n to podzbiór domknięty i ograniczony. Twierdzenie 1.1. Jeśli W jest zbiorem zwartym i f : W R jest funkcją ciągłą, to f osiąga kresy na W (dolny i górny) (achieves its infimum and supremum). Oznacza to, że istnieją x 0, y 0 W takie, że dla dowolnego x W zachodzi f(x 0 ) f(x) f(y 0 ). Będziemy oznaczali normę euklidesową w R n przez x = x x x2 n. Warunek zwartości zbioru w powyższym twierdzeniu możemy osłabić do warunku domkniętości, jeśli funkcja jest koercywna. Koercywność funkcji definiujemy następująco: Definicja 1.3. Funkcję f : W R na podzbiorze W R n nazywamy koercywną (coercive), jeśli f(x) dla x. Można ten warunek zapisać równoważnie r>0 s>0 x W : x > s = f(x) > r. W szczególności, jeśli W jest ograniczony, to f jest automatycznie koercywna na W. Twierdzenie 1.2. Jeśli zbiór W jest domknięty oraz funkcja f : W R jest ciągła i koercywna, to istnieje punkt x 0 w którym funkcja f przyjmuje minimum, tzn. istnieje x 0 W taki, że f(x 0 ) = inf x W f(x). Dowód. Niech y będzie ustalonym punktem w zbiorze W R n. Rozpatrzmy zbiór U = {x W : f(x) f(y)}. Zauważmy, że U jest zbiorem domkniętym w W, bo funkcja f jest ciągła, a nierówność w warunku nieostra. Z domkniętości W wynika, że U jest domknięty w R n. Jest on też ograniczony. Mianowicie, dla r = f(y), z koercywności f istnieje s > 0 takie, że jeśli x > s, to f(x) > r = f(y), skąd U jest zawarte w kuli B(s) = {x : x s}. Zatem U jest zbiorem zwartym. Wówczas istnieje x 0 U punkt minimum na zbiorze U. Dla x U mamy f(x) > f(y) f(x 0 ), więc x 0 jest globalnym minimum na całym W. Domkniętość W nie jest potrzebna, jeśli f odpowiednio rośnie w pobliżu granicy W. Twierdzenie 1.3. Niech W R n będzie dowolnym niepustym podzbiorem oraz f : W R funkcją ciągłą. Jeśli dla pewnego ustalonego punktu y W oraz dowolnego ciągu x n W, takiego że x n cl W \ W lub x n zachodzi lim inf f(x n) > f(y), n to istnieje punkt x 0 w którym funkcja f przyjmuje minimum.

10 10/144 c J. Palczewski, Uniwersytet Warszawski, Dowód. Zbiór U definiujemy jak w poprzednim dowodzie, U = {x W : f(x) f(y)}. Aby pokazać domkniętość U weźmy dowolny ciąg (x n ) U zbieżny do x. Pokażemy, że x U. Z x n U mamy f(x n ) f(y) i jeśli x / W, nierówność ta przeczy założeniu twierdzenia. Wynika stąd, że x W. Korzystając teraz z ciągłości f na W dostajemy f( x) f(y), skąd x U. Ograniczoność zbioru U wynika z założonej w twierdzeniu implikacji x n lim inf n f(x n ) > f(y). Pozostała część dowodu jest identyczna jak w dowodzie poprzedniego twierdzenia. Przykład 1.2. Funkcja f(x, y) = xy ln(xy) jest ciągła i spełnia założenia Twierdzenia 1.3 na zbiorze W = {(x, y) R n : x > 0, y > 0, x + y 4}, osiąga więc minimum na W. 1.3 Minima lokalne funkcji jednej zmiennej Niech W R podzbiór otwarty. Przypomnimy elementarne fakty. Twierdzenie 1.4 (Warunek konieczny I rzędu). Jeśli x 0 W jest punktem lokalnego minimum lub maksimum funkcji f : W R oraz f posiada pochodną w punkcie x 0, to f (x 0 ) = 0. Dowód twierdzenia 1.4. Niech x 0 - minimum lokalne. Dla dostatecznie małych h zachodzi f(x 0 + h) f(x 0 ). Zatem dla h > 0 mamy Dla h < 0 Stąd f (x 0 ) = 0. f(x 0 + h) f(x 0 ) h f(x 0 + h) f(x 0 ) h f(x 0 + h) f(x 0 ) 0 = lim 0 = f (x 0 ) 0. h 0 h f(x 0 + h) f(x 0 ) 0 = lim 0 = f (x 0 ) 0. h 0 h Twierdzenie 1.5 (Warunek konieczny II rzędu). Jeśli f : W R jest klasy C 2 na zbiorze W i x 0 jest punktem lokalnego minimum, to f (x 0 ) 0. Twierdzenie 1.6 (Warunek dostateczny II rzędu). Jeśli f : W R jest klasy C 2 na zbiorze W oraz f (x 0 ) = 0, f (x 0 ) > 0 dla pewnego x 0 W, to f ma ścisłe lokalne minimum w punkcie x 0. Uwaga 1.1. Twierdzenie 1.5 pozostaje prawdziwe przy zamianie lokalnego minimum na maksimum, jeśli znak znak drugiej pochodnej zmienimy na przeciwny. Uwaga 1.2. Jeśli W nie jest otwarty, to Twierdzenia 1.4 i 1.5 nie są prawdziwe dla x 0 W (brzeg W ), np. funkcja f(x) = x 2 przyjmuje minimum na odcinku [0, 2] w punkcie x 0 = 2, ale żaden z warunków koniecznych tych twierdzeń nie zachodzi. Natomiast Twierdzenie 1.6 zachodzi również dla W będącego odcinkiem domkniętym i x 0 W. Poniższe twierdzenie uogólnia warunek dostateczny II rzędu. Twierdzenie 1.7. Jeśli funkcja f jest klasy C k na podzbiorze otwartym W R i zachodzi f (x 0 ) = f (x 0 ) = = f (k 1) (x 0 ) = 0 oraz f (k) (x 0 ) 0 w pewnym x 0 W, to:

11 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 11/144 I) Jeśli k jest nieparzyste, to funkcja f nie posiada w punkcie x 0 ekstremum lokalnego. II) Jeśli k jest parzyste oraz: (a) f (k) (x 0 ) > 0, to punkt x 0 jest ścisłym minimum lokalnym f, (b) f (k) (x 0 ) < 0, to punkt x 0 jest ścisłym maksimum lokalnym f. 1.4 Wzory Taylora W tym podrozdziale przypomnimy wyniki, których będziemy używać w wielu dowodach w trakcie tego wykładu. Skorzystamy z nich również, aby przedstawić zwięzłe dowody twierdzeń Twierdzenie 1.8 (Twierdzenie o wartości średniej). Jeśli funkcja f : [a, b] R jest ciągła na [a, b] i różniczkowalna na (a, b), to istnieje taki punkt x (a, b), że f(b) f(a) = f (x)(b a). Zauważmy, że do prawdziwości powyższego twierdzenia nie jest konieczna ciągłość pierwszej pochodnej (w zadaniu 1.7 pokazujemy, że różniczkowalność nie musi pociągać ciągłości pochodnej). Dowód twierdzenia 1.8. Niech g(x) = [f(b) f(a)]x (b a)f(x) dla x [a, b]. Wówczas g jest ciągła na [a, b], różniczkowalna w (a, b) oraz g(a) = f(b)a f(a)b = g(b). Pokażemy teraz, że istnieje punkt x 0 (a, b), w którym pochodna g się zeruje. Jeśli g jest funkcją stałą, to dla dowolnego x 0 (a, b) mamy g (x 0 ) = 0. W przeciwnym przypadku, na mocy twierdzenia 1.1 funkcja g przyjmuje swoje kresy na [a, b]. Jeden z kresów jest różny od g(a) = g(b). Zatem jest on przyjmowany w punkcie x 0 we wnętrzu przedziału [a, b]. Korzystając z twierdzenia 1.4 wnioskujemy, że g (x 0 ) = 0. Różniczkując g otrzymujemy: 0 = g (x 0 ) = [f(b) f(a)] (b a)f (x). Po prostych przekształceniach otrzymujemy poszukiwany wzór. Twierdzenie 1.9 (Twierdzenie Taylora z resztą w postaci Peano). Niech f : [a, b] R będzie funkcją klasy C 1 na [a, b] oraz dwukrotnie różniczkowalna w pewnym x 0 (a, b). Wówczas dla x [a, b] zachodzi następujący wzór: f(x) = f(x 0 ) + f (x 0 )(x x 0 ) + f (x 0 ) (x x 0 ) 2 + o ( (x x 0 ) 2). 2 Uwaga 1.3. W sformułowaniu powyższego twierdzenia użyliśmy notacji małe o. Rozumieć ją należy następująco: R(x) = f(x) f(x 0 ) f (x 0 )(x x 0 ) f (x 0 ) (x x 0 ) 2 2 jest rzędu mniejszego niż (x x 0 ) 2, tzn. lim x x 0 R(x) (x x 0 ) 2 = 0.

12 12/144 c J. Palczewski, Uniwersytet Warszawski, Przykład 1.3. Innym zastosowaniem powyższej notacji jest definicja pochodnej. Pochodną funkcji f w punkcie x 0 nazywamy taką liczbę α R, że f(x) = f(x 0 ) + α(x x 0 ) + o(x x 0 ). Dowód twierdzenia 1.9. Bez straty ogólności możemy założyć x 0 = 0. Musimy wykazać, że R(x) := f(x) f(0) f (0)x f (0) 2 x 2 jest niższego rzędu niż x 2, tzn. R(x) = o(x 2 ). Z ciągłości pierwszej pochodnej f dostajemy f(x) f(0) = x 0 f (y)dy. Wiemy, że f jest różniczkowalna w 0. Zatem f (y) = f (0) + f (0)y + r(y), gdzie r(y) = o(y). Oznacza to, że r(y) lim = 0. y 0 y Dla dowolnego ε > 0 istnieje zatem δ > 0, taka że y < δ pociąga r(y) < ε y. Ustalmy zatem dowolny ε > 0 i związaną z nim δ > 0. Weźmy x < δ i scałkujmy pochodną f (y). Otrzymamy wówczas: f(x) f(0) = x 0 ( f (0) + f (0)y + r(y) ) dy = f (0)x + f (0) x x 2 + r(y)dy, 2 0 czyli R(x) = x 0 r(y)dy. Korzystając z oszacowania r(y) < ε y dla y < δ dostajemy A zatem R(x) x Z dowolności ε > 0 wynika, iż R(x) = o(x 2 ). 0 r(y) dy < x 0 R(x) x 2 < ε 2. ε y dy = εx2 2. Uwaga 1.4. Twierdzenie 1.9 można uogólnić do dowolnie długiej aproksymacji Taylora. Dowód przebiega wówczas podobnie, lecz jest nieznacznie dłuższy. Zakładając większą gładkość funkcji f możemy opisać dokładniej błąd aproksymacji we wzorze Taylora. Twierdzenie 1.10 (Twierdzenie Taylora z resztą w postaci Lagrange a). Niech f : [a, b] R będzie funkcją klasy C k 1 na [a, b] oraz k-krotnie różniczkowalna na (a, b). Wtedy dla ustalonego x 0 (a, b) i x [a, b] zachodzi następujący wzór: k 1 f(x) = f(x 0 ) + i=1 f (i) (x 0 ) i! gdzie x jest pewnym punktem pomiędzy x 0 i x. W szczególności dla k = 2 dostajemy (x x 0 ) i + f (k) ( x) (x x 0 ) k, k! f(x) = f(x 0 ) + f (x 0 )(x x 0 ) f ( x)(x x 0 ) 2.

13 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 13/144 Dowód twierdzenia Niech liczba M spełnia równanie k 1 f(x) = f(x 0 ) + i=1 f (i) (x 0 ) (x x 0 ) i + M(x x 0 ) k. i! Celem dowodu jest pokazanie, że M = f (k) ( x) k! dla pewnego punktu x pomiędzy x 0 i x. Określmy funkcję Zauważmy, że k 1 g(y) = f(y) i=1 f (i) (x 0 ) (y x 0 ) i M(y x 0 ) k, y [x 0, x]. i! g(x 0 ) = g (x 0 ) = = g (k 1) (x 0 ) = 0. Ponieważ g(x) = 0, to na podstawie twierdzenia 1.8 istnieje x 1 (x 0, x), taki że g (x 1 ) = 0. Stosując jeszcze raz tw. 1.8 do funkcji g (y) dla y [x 0, x 1 ] dostajemy x 2 (x 0, x 1 ), w którym g (x 2 ) = 0. Postępując w ten sposób dostajemy ciąg punktów x > x 1 > x 2 > > x k > x 0, takich że g (j) (x j ) = 0, j = 1,..., k. Z warunku dla punktu x k otrzymujemy 0 = g (k) (x k ) = f (k) (x k ) k!m. Szukanym punktem x w twierdzeniu jest więc x k. 1.5 Ekstrema globalne Uzupełnimy jeszcze twierdzenie 1.6 o wynik dotyczący ekstremów globalnych. Niech I R będzie odcinkiem otwartym, domkniętym, lub jednostronnie domkniętym (być może nieograniczonym) i niech f : I R będzie funkcją klasy C 1 na I i klasy C 2 na int I. Zachodzi następujące Twierdzenie Przy powyższych założeniach, jeśli f (x 0 ) = 0 oraz: (a) f (x) 0 x I = x 0 jest globalnym minimum na I, (b) f (x) 0 x I = x 0 jest globalnym maksimum na I. Jeśli założenia powyższe uzupełnimy o warunek f (x 0 ) > 0 (odpowiednio f (x 0 ) < 0), to x 0 będzie ścisłym globalnym minimum (maksimum). Dowód. Wzór Taylora, tw. 1.10, daje f(x) = f(x 0 ) f ( x)(x x 0 ) 2, gdzie x jest pewnym punktem pomiędzy x 0 i x. Stąd drugi człon wzoru Taylora decyduje o nierówności pomiędzy f(x) a f(x 0 ) i otrzymujemy obie implikacje w twierdzeniu dotyczące słabych ekstremów. Załóżmy dodatkowo w pierwszym stwierdzeniu, że f (x 0 ) > 0. Z założenia f (x) 0 i warunku f (x 0 ) = 0 dostajemy f (x) = f (x) f (x 0 ) = x x 0 f (y)dy 0, gdy x > x 0. Podobnie pokazujemy, że f (x) = x 0 x f (y)dy 0, gdy x < x 0. Z faktu, że f (x 0 ) > 0 i ciągłości drugiej pochodnej dostajemy dodatkowo, że ta pochodna jest ściśle

14 14/144 c J. Palczewski, Uniwersytet Warszawski, dodatnia w otoczeniu x 0. Zatem całki są dodatnie, co pociąga nierówności f (x) > 0, gdy x > x 0, oraz f (x) < 0, gdy x < x 0. Wynika stąd, że funkcja f jest ściśle rosnąca na prawo od x 0 i ściśle malejąca na lewo od x 0, a więc x 0 jest ścisłym minimum. Przypadek ścisłego maksimum dowodzimy analogicznie. 1.6 Zadania Ćwiczenie 1.1. Czy funkcja f(x, y) = x 4 + x 2 xy + 2y 2 osiąga minimum na zbiorze {(x, y) R 2 : x 1}. Ćwiczenie 1.2. Znajdź minimum funkcji f(x, y) = 2x + 3y na zbiorze W = {(x, y) R 2 : x 2 + y 2 = 1}. Ćwiczenie 1.3. Znajdź maksimum funkcji f(x, y) = x 2 4y 2 na zbiorze W = {(x, y) R 2 : 2x 2 + y = 1}. Ćwiczenie 1.4. Znajdź minimum funkcji f(x, y) = e x2 y 2 na zbiorze W = {(x, y) R 2 : x 2 + y 2 = 1}. Ćwiczenie 1.5. Rozważmy następujący nieliniowy problem optymalizacyjny: (x 1 4) 2 + (x 2 2) 2 min, 4x x2 2 36, x x 2 = 4, 2x Naszkicuj zbiór punktów dopuszczalnych, czyli punktów spełniających wszystkie ograniczenia. 2. Znajdź graficznie rozwiązanie powyższego problemu optymalizacyjnego. 3. Znajdź następnie rozwiązanie w przypadku, gdy minimalizacja zamieniona zostanie na maksymalizację. Ćwiczenie 1.6. Niech g będzie funkcją spełniającą: 0 g(y) 1, y [0, 1], oraz 1 0 g(y)dy = 1. Znajdź x [0, 1], dla którego następująca całka jest minimalna: 1 (x y) 2 g(y)dy. Ćwiczenie 1.7. Wykaż, że funkcja 0 f(x) = { x 2 sin ( 1 x), x 0, 0, x = 0, jest różniczkowalna w R, lecz jej pochodna nie jest ciągła. Ćwiczenie 1.8. Udowodnij, że poniższe definicje pochodnej funkcji f : [a, b] R w punkcie x 0 (a, b) są równoważne: (a) f f(x 0 + h) f(x 0 ) (x 0 ) = lim, h 0 h (b) f(x) = f(x 0 ) + α(x x 0 ) + o(x x 0 ) dla x [a, b] i α R niezależnego od x. Przez równoważność rozumiemy to, że jeśli granica w (a) istnieje, to zależność (b) jest spełniona z α = f (x 0 ); i odwrotnie, jeśli (b) zachodzi dla pewnego α, to granica w (a) istnieje i jest równa α.

15 Rozdział 2 Ekstrema funkcji wielu zmiennych 2.1 Notacja i twierdzenia Taylora w wielu wymiarach W tym podrozdziale przypomnimy krótko twierdzenia Taylora dla funkcji wielu zmiennych. Wprowadźmy najpierw niezbędną notację. Niech f : W R, gdzie W R n jest zbiorem otwartym. Przyjmiemy następujące oznaczenia: x = (x 1, x 2,..., x n ) T wektor kolumnowy, f(x) = f(x 1, x 2,..., x n ), ( ) Df(x) = f x 1, f x 2,, f x n gradient funkcji f, D 2 f(x) Hesjan (Hessian matrix) funkcji f: D 2 f(x) = 2 f x f x 2 x 1. 2 f x n x 1 2 f x 1 x 2 2 f x f x n x 2 2 f x 1 x n 2 f x 2 x n 2 f x 2 n. Definicja 2.1. Funkcja f jest różniczkowalna w punkcie x 0 W, jeśli istnieje wektor α R n, taki że f(x) = f(x 0 ) + α T (x x 0 ) + o( x x 0 ) dla x W. Funkcja f jest dwukrotnie różniczkowalna w punkcie x 0 W, jeśli istnieje wektor α R n oraz macierz H R n n, takie że dla x W. f(x) = f(x 0 ) + α T (x x 0 ) (x x 0) T H(x x 0 ) + o( x x 0 2 ) Uwaga 2.1. Możemy założyć, że macierz H w powyższej definicji jest symetryczna. Wystarczy zauważyć, że (x x 0 ) T H(x x 0 ) = (x x 0 ) T H + HT 2 15 (x x 0 ).

16 16/144 c J. Palczewski, Uniwersytet Warszawski, Twierdzenie 2.1. I) Jeśli funkcja f jest różniczkowalna w x 0, to Df(x 0 ) istnieje i α = Df(x 0 ) T. Odwrotnie, jeśli Df(x) istnieje w pewnym otoczeniu x 0 i jest ciągłe w x 0, to f jest różniczkowalna w x 0. II) Jeśli hesjan D 2 f(x) istnieje w pewnym otoczeniu x 0 i jest ciągły w x 0, to f jest dwukrotnie różniczkowalna w x 0, D 2 f(x 0 ) jest macierzą symetryczną oraz H = D 2 f(x 0 ). Dowód powyższego twierdzenia pomijamy. Zainteresowany czytelnik znajdzie go w podręcznikach analizy wielowymiarowej. Uwaga 2.2. Ilekroć będziemy chcieli wykorzystać drugą pochodną funkcji wielowymiarowej, będziemy musieli zakładać, że hesjan D 2 f jest funkcją ciągłą. Jeśli nie poczynimy takiego założenia, nie będziemy mieli dobrego sposobu na policzenie drugiej pochodnej, a zatem taki rezultat będzie miał małą wartość praktyczną. Uwaga 2.3. Dla funkcji f : W R określonej na zbiorze otwartym W R n mówimy, że f jest klasy C 1 (odpowiednio, klasy C 2 ) i piszemy f C 1 (f C 2 ), gdy f jest ciągła na W oraz f (odpowiednio, f x i i 2 f x i x j ) istnieją i są ciągłe na W. Gdy rozważany zbiór W R n nie jest otwarty, mówimy że f jest klasy C 1 (odpowiednio, klasy C 2 ) na W, jeśli istnieje rozszerzenie f funkcji f do zbioru otwartego W zawierającego W takie, że f jest klasy C 1 (odpowiednio, klasy C 2 ) na W. W tym wypadku można więc mówić o pochodnych cząstkowych funkcji f również w punktach brzegowych zbioru W. Pochodne te są jednoznacznie określone przez wartości funkcji na int W, jeśli zachodzi W cl(int W ) (wynika to z ciągłości tych pochodnych). Zapiszemy teraz rozwinięcie Taylora rzędu 2. Lemat 2.1. Niech W R n otwarty. Dla funkcji f : W R klasy C 2 i punktów x, x 0 W takich, że odcinek łączący x 0 z x leży w W zachodzi f(x) = f(x 0 ) + Df(x 0 )(x x 0 ) (x x 0) T D 2 f( x)(x x 0 ), gdzie x jest pewnym punktem wewnątrz odcinka łączącego x 0 z x. Dowód. Dowód wynika z zastosowania twierdzenia 1.10 do funkcji g(t) = f ( x 0 + t(x x 0 ) ), t [0, 1]. Definicja 2.2. Podzbiór W R n jest wypukły, jeśli dla każdych x, y W i każdego λ [0, 1]. λx + (1 λ)y W Wniosek 2.1. Niech W R n zbiór otwarty, wypukły oraz f : W R klasy C 2. Wówczas dla dowolnych x 0, x W mamy f(x) = f(x 0 ) + Df(x 0 )(x x 0 ) (x x 0) T D 2 f( x)(x x 0 ), gdzie x należy do wnętrza odcinka łączącego x 0 i x, tzn. istnieje λ (0, 1), taka że x = λx 0 + (1 λ)x. Dowód. Z wypukłości W wynika, że dla każdego x 0, x W odcinek łączący te punkty zawarty jest w W. Teza wynika teraz z lematu 2.1. x i

17 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 17/ Znikanie gradientu Będziemy rozważać funkcję f : W R, gdzie W jest podzbiorem w R n mającym niepuste wnętrze int W. Twierdzenie 2.2 (Warunek konieczny I rzędu, necessary I order condition). Jeśli funkcja f : W R jest różniczkowalna w punkcie x 0 należącym do wnętrza zbioru W oraz x 0 jest lokalnym minimum (maksimum) funkcji f to Df(x 0 ) = 0. Dowód. Z faktu, że x 0 int W wynika, że funkcja g(t) = f(x 0 +te i ), gdzie e i jest i-tym wersorem (tj. e i ma jedynkę na i-tej współrzędnej i zera poza nią), jest dobrze określona na otoczeniu 0. Ma ona również lokalne ekstremum w punkcie 0. Na mocy tw. 1.4 mamy g (0) = 0. W terminach funkcji f oznacza to, że f x i (x 0 ) = 0. Przeprowadzając to rozumowanie dla i = 1, 2,..., n dostajemy tezę.. Warunek znikania gradientu będzie często używany, zatem użyteczna będzie Definicja 2.3. Punkt x 0 int W nazywamy punktem krytycznym funkcji f : W R, jeśli f jest różniczkowalna w x 0 oraz Df(x 0 ) = 0. Oczywiście, warunek znikania gradientu Df(x 0 ) nie jest wystarczający na to, by w x 0 znajdowało się lokalne minimum lub maksimum. Do rozstrzygnięcia tego jest potrzebny analog warunku o znaku drugiej pochodnej (tw. 1.6). W przypadku wielowymiarowym ten warunek definiuje się jako dodatnią (ujemną) określoność macierzy drugich pochodnych. 2.3 Dodatnia i ujemna określoność macierzy Niech A = {a ij } n i,j=1 będzie macierzą symetryczną, tzn. a ij = a ji. Rozważmy formę kwadratową x T Ax = n i,j=1 a ij x i x j. Definicja 2.4. Określoność macierzy A lub formy kwadratowej x T Ax definiujemy następująco: A jest nieujemnie określona, co oznaczamy A 0, jeśli x T Ax 0 x R n. A jest dodatnio określona (positively defined), co oznaczamy A > 0, jeśli x T Ax > 0 x R n \ {0}. Odwracając nierówności definiujemy niedodatnią określoność i ujemną określoność (negatively defined). Macierz A nazywamy nieokreśloną, jeśli istnieją wektory x, x R n takie, że x T Ax > 0, x T A x < 0.

18 18/144 c J. Palczewski, Uniwersytet Warszawski, Zauważmy, że z definicji określoności macierzy, wyliczając wyrażenie e T i Ae i = a ii na wersorze e i = (0,..., 1,..., 0) T, z jedynką na i-tym miejscu, wynikają następujące warunki konieczne odpowiedniej określoności macierzy A: Jeśli A jest dodatnio określona, to a 11 > 0,..., a nn > 0. Jeśli A jest nieujemnie określona, to a 11 0,..., a nn 0. Jeśli A jest ujemnie określona, to a 11 < 0,..., a nn < 0. Jeśli A jest niedodatnio określona, to a 11 0,..., a nn 0. Jeśli a ii > 0 i a jj < 0, dla pewnych i, j, to A jest nieokreślona. Warunki konieczne i dostateczne podane są w poniższym twierdzeniu, którego dowód pomijamy. Twierdzenie 2.3 (Kryterium Sylvestera, Sylvester criterion). I. Forma kwadratowa x T Ax jest dodatnio określona wtedy i tylko wtedy, gdy zachodzi: D 1 > 0, D 2 > 0,......, D n > 0, gdzie przez D 1,..., D n oznaczamy minory główne macierzy A: D 1 = det(a 11 ), D 2 = det ( a11 a 12 a 21 a 22 ),..., D n = det a a 1n..... a n1... a nn. Forma kwadratowa x T Ax jest ujemnie określona wtedy i tylko wtedy, gdy x T ( A)x jest dodatnio określona, co przekłada się na ciąg warunków: D 1 > 0, D 2 > 0,......, ( 1) n D n > 0. II. Forma kwadratowa x T Ax jest nieujemnie określona wtedy i tylko wtedy, gdy dla dowolnych 1 k n oraz 1 i 1 < i 2 <... < i k n zachodzi a i1 i 1 a i1 i 2... a i1 i k a i2 i det 1 a i2 i 2... a i2 i k a ik i 1 a ik i 2... a ik i k (jest to minor rzędu k złożony z kolumn i 1,..., i k i rzędów i 1,..., i k ). Określoność macierzy symetrycznej jest niezależna od bazy, w której jest reprezentowana. W bazie własnej macierz A jest diagonalna z wartościami własnymi na diagonali. Dostajemy zatem następujące warunki równoważne określoności: Macierz A jest dodatnio określona wtw, gdy wszystkie jej wartości własne są dodatnie. Macierz A jest nieujemnie określona wtw, gdy wszystkie jej wartości własne są nieujemne. Macierz A jest ujemnie określona wtw, gdy wszystkie jej wartości własne są ujemne. Macierz A jest niedodatnio określona wtw, gdy wszystkie jej wartości własne są niedodatnie.

19 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 19/ Warunki II-go rzędu (kryterium drugiej różniczki) Twierdzenie 2.4 (Warunek konieczny II rzędu). Jeśli f jest klasy C 2 na zbiorze otwartym W R n i x 0 W jest minimum lokalnym, to macierz D 2 f(x 0 ) jest nieujemnie określona. Podobnie, jeśli x 0 jest lokalnym maksimum, to D 2 f(x 0 ) jest niedodatnio określona. Twierdzenie 2.5 (Warunek dostateczny II rzędu). Jeśli f jest klasy C 2 na zbiorze otwartym W R n, Df(x 0 ) = 0 oraz D 2 f(x 0 ) jest dodatnio określona (ujemnie określona) to f ma ścisłe lokalne minimum (lokalne maksimum) w x 0. Dowód twierdzenia 2.4. Niech x 0 W będzie minimum lokalnym f. Ustalmy niezerowy wektor h R n i funkcję g(t) = f(x 0 + th), gdzie t R jest z dostatecznie małego otoczenia zera, aby x 0 + th W. Wtedy funkcja g ma lokalne minimum w punkcie t = 0. Ponieważ f jest klasy C 2, funkcja g również jest klasy C 2. Z Twierdzenia 1.5 dla przypadku skalarnego wiemy, że skoro t = 0 jest lokalnym minimum, to g (0) 0. Ze wzorów na pochodną funkcji złożonej mamy g (0) = h T D 2 f(x 0 )h. Z dowolności wektora h wynika nieujemna określoność macierzy D 2 f(x 0 ). Dowód twierdzenia 2.5. Załóżmy najpierw, że D 2 f(x 0 ) > 0. Określmy funkcję α : W R wzorem α(x) = inf h =1 ht D 2 f(x)h. Funkcja ta jest ciągła na mocy ciągłości hesjanu f oraz ćwiczenia 2.2. Istnieje zatem kula B(x 0, ε), taka że α(x) > 0 dla x B(x 0, ε). Ustalmy dowolny x B(x 0, ε). Na mocy wzoru Taylora, lemat 2.1, mamy f(x) = f(x 0 ) + Df(x 0 )(x x 0 ) (x x 0) T D 2 f( x)(x x 0 ), dla pewnego punktu x leżącego na odcinku łączącym x 0 i x, a zatem i należącego do kuli B(x 0, ε). Pierwsza pochodna f znika w punkcie x 0, zaś (x x 0 ) T D 2 f( x)(x x 0 ) = x x 0 2 (x x 0) T x x 0 D2 f( x) (x x 0) x x 0 x x 0 2 α( x). Mamy zatem f(x) f(x 0 ) x x 0 2 α( x) > 0, gdyż funkcja α jest dodatnia na kuli B(x 0, ε). Wnioskujemy więc, że x 0 jest ścisłym minimum lokalnym. Dowód przypadku D 2 f(x 0 ) < 0 jest analogiczny Ekstrema globalne i określoność drugiej różniczki Niech teraz f : W R będzie funkcją klasy C 1 na zbiorze wypukłym W R n, oraz klasy C 2 na int W. Twierdzenie 2.6. Jeśli x 0 int W jest punktem krytycznym f, to:

20 20/144 c J. Palczewski, Uniwersytet Warszawski, I) D 2 f(x) 0 x int W = x 0 jest globalnym minimum, II) D 2 f(x) 0 x int W = x 0 jest globalnym maksimum. Jeśli dodatkowo D 2 f(x 0 ) > 0 w pierwszym stwierdzeniu (D 2 f(x 0 ) < 0 w drugim stwierdzeniu), to x 0 jest ścisłym globalnym minimum (maksimum). Dowód. Jeśli x W, to z wypukłości W cały odcinek łączący x 0 z x (poza punktem x) leży w int W i możemy zastosować wzór Taylora, lemat 2.1, który daje f(x) = f(x 0 ) (x x 0) T D 2 f( x)(x x 0 ), gdzie x jest pewnym punktem z odcinka łączącego x 0 z x. Nierówność D 2 f( x) 0 (odpowiednio, D 2 f( x) 0) oznacza, że drugi człon w powyższym wzorze jest nieujemny (niedodatni), co pociąga obie implikacje w twierdzeniu. W przypadku, gdy w (I) mamy dodatkowo D 2 f(x 0 ) > 0, odwołamy się do używanej już funkcji g(t) = f ( x 0 + t(x x 0 ) ), t [0, 1]. Z wypukłości W wynika, że g jest dobrze określona, tzn. x 0 + t(x x 0 ) W dla t [0, 1]. Nasze założenia implikują, że g (0) = 0, g (0) > 0 oraz g (t) 0. Możemy skorzystać z tw. 1.11, które stwierdza, że g ma ścisłe globalne minimum w t = 0. Zatem g(1) > g(0), czyli f(x) > f(x 0 ). Z dowolności x wynika, iż x 0 jest ścisłym minimum globalnym. Przypadek D 2 f(x 0 ) < 0 w stwierdzeniu (II) dowodzimy analogicznie. 2.5 Zadania Ćwiczenie 2.1. Wykaż, że hesjan funkcji nie jest symetryczny w punkcie (0, 0). 0, x 1 = x 2 = 0, f(x 1, x 2 ) = x 1 x 2 (x 2 1 x2 2 ), w p.p., x 2 1 +x2 2 Ćwiczenie 2.2. Niech W R k, A R n zwarty oraz f : W A R ciągła. Udowodnij, że funkcja g : W R zadana wzorem jest ciągła. g(x) = inf f(x, y) y A Ćwiczenie 2.3. Pochodną kierunkową funkcji f w punkcie x i kierunku d nazywamy granicę f( x + hd) f( x) D d f( x) = lim. h 0 h Udowodnij, że max d =1 D d f( x) jest przyjmowane dla d = Df( x)/ Df( x). Ćwiczenie 2.4. Rozważmy następującą funkcję (czasami zwaną funkcją Peano): f(x 1, x 2 ) = (x 2 2 x 1 )(x 2 2 2x 1 ).

21 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 21/ Udowodnij, że funkcja f ograniczona do każdej prostej przechodzącej przez 0 ma w tym punkcie minimum lokalne. 2. Wykaż, że f jako funkcja wielu zmiennych nie ma ekstremum lokalnego w Znajdź wartości własne macierzy drugiej pochodnej f. Co możesz z nich wywnioskować? Czy tłumaczą one zachowanie funkcji f w 0? Ćwiczenie 2.5. Rozważmy funkcję kwadratową wielu zmiennych: f(x) = 1 2 xt Ax + b T x + c, gdzie A jest macierzą kwadratową, niekoniecznie symetryczną, b jest wektorem, zaś c stałą. Wyznacz gradient i hesjan (macierz drugiej pochodnej) funkcji f. Wskazówka. Załóż najpierw, że A jest symetryczna. Udowodnij później, że dla każdej macierzy kwadratowej A istnieje macierz symetryczna Â, taka że xt Âx = x T Ax dla każdego x. Ćwiczenie 2.6. Zbadaj określoność następujących macierzy i porównaj wyniki z ich formą zdiagonalizowaną: [ ] [ ] [ ] ,,, Ćwiczenie 2.7. Znajdź ekstrema globalne funkcji f(x) = 1 [ ] xt x + [2, 1]x Ćwiczenie 2.8. Niech (Ω, F, P) będzie przestrzenią probabilistyczną, co między innymi oznacza, że P(Ω) = 1. Dana jest zmienna losowa η L 2 (Ω, F, P), tzn. funkcja mierzalna η : Ω R n o tej własności, że E η 2 <. Znajdź wektor x R n, taki że E η x 2 jest najmniejsza. Wskazówka. Zapisz E η x 2 jako funkcję kwadratową. Ćwiczenie 2.9. Niech f : R n R i x R n. Załóżmy, że f jest klasy C 2 na otoczeniu x oraz Df( x) = 0 T. Udowodnij, że jeśli macierz D 2 f( x) jest nieokreślona, to f nie ma ekstremum lokalnego w x. Ćwiczenie Udowodnij nierówność średnich rozwiązując zadanie optymalizacyjne: xytz max, x + y + t + z = 4c, x, y, t, z [0, ). Ćwiczenie Znajdź minima lokalne funkcji f(x, y) = 1 4 x x3 2xy + y 2 + 2x 2y + 1.

22 Rozdział 3 Funkcje wypukłe 3.1 Zbiory wypukłe i twierdzenia o oddzielaniu Przypomnijmy, za def. 2.2, definicję zbioru wypukłego: zbiór W R n jest wypukły, jeśli λx + (1 λ)y W dla każdych x, y W i każdego λ [0, 1]. Równoważnie można wypukłość zdefiniować za pomocą m-tek punktów: Lemat 3.1. Zbiór W R n jest wypukły wtw, gdy dla dowolnego m 2, punktów x 1,..., x m W oraz liczb a 1,..., a m 0, takich że a a m = 1 mamy a 1 x 1 + a 2 x a m x m W. Dowód tego lematu pozostawiamy jako ćwiczenie (patrz ćw. 3.3). Udowodnimy natomiast geometryczną własność zbiorów wypukłych, która przyda nam się wielokrotnie. Lemat 3.2. Niech W R n będzie zbiorem wypukłym o niepustym wnętrzu. Wówczas: I) Dla dowolnego x W oraz x 0 int W odcinek łączący x 0 z x, z pominięciem punktu x, należy do wnętrza W : λx 0 + (1 λ)x int W, 0 λ < 1. II) W cl(int W ). Dowód. Weźmy punkty x 0 i x jak w założeniach lematu. Z otwartości int W wynika, że istnieje kula B(x 0, ε) int W. Połączmy punkty tej kuli z punktem x. Dostaniemy stożek o wierzchołku x i podstawie B(x 0, ε) (patrz rys. 3.1). Stożek ten leży w całości w W. Jego wnętrze zawiera odcinek od x 0 do x bez końca x. Kończy to zatem dowód (I). Dowód (II) wynika natychmiast z (I). Przypomnijmy twierdzenia o oddzielaniu zbiorów wypukłych w przestrzeniach R n (separation (hyper)plane theorems) (dowody tych twierdzeń można znaleźć np. w rozdziale 2.4 monografii Bazaraa, Sherali, Shetty [3] lub w rozdziale 11 monografii Rockafellara [11]). 22

23 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 23/144 Rysunek 3.1: Stożek o wierzchołku x i podstawie B( x, ε). Twierdzenie 3.1 (Twierdzenie o oddzielaniu (Weak separation theorem)). Niech U, V R n będą niepustymi zbiorami wypukłymi, takimi że U V =. Wówczas istnieje hiperpłaszczyzna rozdzielająca U od V, tzn. istnieje niezerowy wektor a R n spełniający a T x a T y, x U, y V. Korzystając z ciągłości odwzorowania liniowego x a T x dostajemy bardzo przydatny wniosek, który również będziemy nazywać twierdzeniem o oddzielaniu. Wniosek 3.1. Niech U, V R n będą niepustymi zbiorami wypukłymi, takimi że int U i (int U) V =. Wówczas istnieje hiperpłaszczyzna rozdzielająca U od V, tzn. istnieje niezerowy wektor a R n spełniający a T x a T y, x U, y V. Twierdzenie 3.2 (Twierdzenie o ostrym oddzielaniu (Strong separation theorem)). Niech U, V R n będą niepustymi zbiorami wypukłymi domkniętymi, U zwarty i U V =. Wówczas istnieje hiperpłaszczyzna ściśle rozdzielająca U od V, tzn. istnieje niezerowy wektor a R n spełniający sup a T x < inf x U y V at y. Uwaga 3.1. Powyższe twierdzenia mają intuicyjną geometryczną interpretację. Dwa rozłączne zbiory wypukłe mogą być rozdzielone hiperpłaszczyzną w ten sposób, iż jeden z nich leży w domkniętej półprzestrzeni po jednej stronie hiperpłaszczyzny, podczas gdy drugi leży po przeciwnej stronie tejże hiperpłaszczyzny. W twierdzeniu o oddzielaniu nie możemy zagwarantować, iż któryś ze zbiorów leży we wnętrzu półprzestrzeni, tzn. ma puste przecięcie z hiperpłaszczyzną. Wersja o ostrym oddzielaniu właśnie to gwarantuje. Hiperpłaszczyzna, o której mowa w twierdzeniach zadana jest wzorem: {x R n : a T x = α}, gdzie α = sup x U a T x. Nie musi to być jedyna hiperpłaszczyzna spełniająca warunki rozdzielania lub ostrego rozdzielenia.

24 24/144 c J. Palczewski, Uniwersytet Warszawski, Twierdzenia o oddzielaniu będziemy dowodzić w przeciwnej kolejności niż są podane. Okazuje się bowiem, że łatwiej udowodnić twierdzenie o ostrym oddzielaniu. Później w dowodzie twierdzenia o oddzielaniu skorzystamy z ostrego oddzielania zbiorów wypukłych. Dowód twierdzenia 3.2. Określmy funkcję d : U V R wzorem d(x, y) = x y. Z ograniczoności zbioru U wynika, że d jest funkcją koercywną; zbieżność do nieskończoności może się tylko odbywać po argumencie ze zbioru V. Na mocy tw. 1.2 funkcja d jako ciągła i koercywna określona na zbiorze domkniętym U V osiąga swoje minimum w pewnym punkcie (x 0, y 0 ) U V. Z faktu, że U V = wynika, że x 0 y 0. Połóżmy a = y 0 x 0. Pokażemy, że jest to szukany wektor z tezy twierdzenia. Udowodnimy, że a T y a T y 0. Niech y V, y y 0. Zdefiniujmy funkcję Rozwijając dostajemy g(t) = ( d ( x 0, y 0 + t(y y 0 ) )) 2, t R. g(t) = y 0 x t(y 0 x 0 ) T (y y 0 ) + t 2 (y y 0 ) T (y y 0 ). Funkcja ta jest różniczkowalna dla t R i g(0) g(t) dla t [0, 1] (na mocy wypukłości V i definicji y 0 ). Zatem g (0) 0, czyli Nierówność ta jest równoważna a T y a T y 0. (y 0 x 0 ) T (y y 0 ) 0. Podobnie pokazujemy, że a T x a T x 0 dla x U. Do zakończenia dowodu wystarczy sprawdzić, że a T y 0 > a T x 0. Ta nierówność jest równoważna a 2 > 0, co zachodzi, gdyż x 0 y 0. Dowód twierdzenia 3.1. Rozważmy zbiór C = V U = {y x : x U, y V }. Zbiór ten jest wypukły i 0 / C. Równoważne tezie twierdzenia jest znalezienie wektora niezerowego a R n oddzielającego C od {0}, tzn. takiego że a T x 0 dla x C. Zdefiniujmy zbiory A x = {a R n : a = 1, a T x 0}. Wystarczy pokazać, że x C A x. Będziemy rozumować przez sprzeczność. Załóżmy więc, że x C A x =. Niech B x = S \ A x, gdzie S jest sferą jednostkową S = {a R n : a = 1}. Zbiory B x, x C, są otwartymi podzbiorami zbioru zwartego S. Z założenia, że przecięcie ich dopełnień w S jest puste, wynika, że rodzina {B x } x C jest pokryciem otwartym S. Na mocy zwartości S istnieje podpokrycie skończone B x1,..., B xk, czyli Połóżmy A x1 A xk =. k Ĉ = conv{x 1,..., x k } = { λ i x i : λ 1,..., λ k 0, i=1 k λ i = 1}. i=1 Zbiór Ĉ jest wypukły i domknięty oraz Ĉ C. Stąd 0 / Ĉ i na mocy twierdzenia o ostrym oddzielaniu zastosowanego do Ĉ i {0} istnieje wektor a Rn \ {0}, taki że W szczególności, a T x 1 > 0,..., a T x k > 0, czyli przecięcie k i=1 A xi =. a T x > 0, x Ĉ. a a A x i, i = 1,..., k, co przeczy założeniu, że

25 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 25/ Definicja funkcji wypukłej Definicja 3.1. Funkcję f : W R, gdzie W R n wypukły, nazwiemy: wypukłą, jeśli dla każdego x, y W i λ (0, 1) zachodzi f ( λx + (1 λ)y ) λf(x) + (1 λ)f(y). ściśle wypukłą, jeśli dla każdego x, y W, x y i λ (0, 1) zachodzi f ( λx + (1 λ)y ) < λf(x) + (1 λ)f(y). Funkcja f jest (ściśle) wklęsła, jeśli ( f) jest (ściśle) wypukła. Okazuje się, że wystarczy rozważać λ = 1/2 w definicji wypukłości. Zacytujemy najpierw silny wynik noszący nazwisko Sierpińskiego, a później łatwiejszy, który dowiedziemy: Twierdzenie 3.3. Jeśli funkcja f : W R, gdzie W R n wypukły, jest mierzalna w sensie Lebesgue a oraz spełnia ( x + y ) f(x) + f(y) f, 2 2 to jest wypukła. Dowód. Patrz dowód tw. Sierpińskiego w [7, str. 12]. My udowodnimy słabszy wynik; założymy mianowicie ciągłość f. Twierdzenie 3.4. Jeśli funkcja f : W R, gdzie W R n wypukły, jest ciągła oraz spełnia to jest wypukła. ( x + y ) f 2 f(x) + f(y), 2 Dowód. Pokażemy najpierw, przez indukcję po k, że nierówność wypukłości zachodzi dla λ postaci p/2 k, p = 0, 1,..., 2 k. Własność ta jest spełniona dla k = 1 z założenia twierdzenia. Przeprowadźmy teraz krok indukcyjny. Załóżmy, że nierówność jest prawdziwa dla k. Weźmy p, q > 0 całkowite, o sumie p+q = 2 k+1. Załóżmy p q. Wówczas p 2 k q i możemy napisać: Mamy zatem z = f(z) 1 ( p 2 f q 2k ) x+ 2k 2 k y f(y) 1 2 p 2 k+1 x + q 2 k+1 y = 1 ( p 2 2 k x + q ) 2k 2 k y + y. p 2 k f(x)+ 1 q 2 k 2 2 k f(y)+ 1 2 f(y) = p 2 q f(x)+ f(y). k+1 2k+1 Pierwsza nierówność wynika z założenia twierdzenia, zaś druga z założenia indukcyjnego. Dowód w przypadku p q jest symetryczny, ze zmienioną rolą x i y. Zbiór punktów postaci p/2 k, k = 1, 2,..., jest gęsty w odcinku (0, 1). Z ciągłości funkcji f otrzymujemy nierówność wypukłości dla dowolnego λ (0, 1).

26 26/144 c J. Palczewski, Uniwersytet Warszawski, Przykład 3.1. Funkcja afiniczna f(x) = a T x + b jest wypukła i wklęsła. Norma w R n jest funkcją wypukłą. Wystarczy skorzystać z nierówności trójkąta. Odległość punktu od zbioru definiujmy następująco d(x, W ) = inf y W x y. Odległość punktu od zbioru wypukłego jest funkcją wypukłą: f(x) = d(x, W ) dla pewnego zbioru wypukłego W R n. 3.3 Własności funkcji wypukłych W tym rozdziale zakładamy, iż funkcja f : W R jest określona na niepustym wypukłym podzbiorze W R n. Definicja 3.2. Epigrafem (epigraph of a function) funkcji f : W R nazywamy zbiór epi(f) = { (x, z) W R : z f(x) }. Definicja 3.3. Zbiorem poziomicowym (sublevel set of a function or trench of a function) funkcji f : W R nazywamy W α (f) = { x W : f(x) α }, α R. Twierdzenie 3.5 (Twierdzenie o epigrafie). Funkcja f jest wypukła wtedy i tylko wtedy, gdy jej epigraf epi(f) jest wypukłym podzbiorem R n+1. Twierdzenie 3.6. Jeśli funkcja f jest wypukła, to zbiór poziomicowy W α (f) jest wypukły dla dowolnego α. Dowód powyższych twierdzeń pozostawiamy czytelnikowi. Uwaga 3.2. Twierdzenie odwrotne do tw. 3.6 nie jest prawdziwe. Połóżmy W = R n i weźmy dowolny niepusty wypukły zbiór A R n. Rozważmy funkcję f(x) = { 0, x A, 1, x / A. Każdy zbiór poziomicowy tej funkcji jest wypukły (W α (f) = A dla α < 1 i W α (f) = R n dla α 1), zaś funkcja nie jest wypukła. Okazuje się, że wypukłość gwarantuje ciągłość we wnętrzu int W. Rezultat ten nie może być rozszerzony na brzeg W. Twierdzenie 3.7. Jeśli funkcja f jest wypukła, to jest również ciągła na int W. Dowód powyższego twierdzenia wykracza poza ramy tego wykładu. Zainteresowany czytelnik może go znaleźć w monografii [10] w rozdziale IV.41. Twierdzenie 3.8 (Twierdzenie o hiperpłaszczyźnie podpierającej (supporting hyperplane)). Jeśli f jest wypukła, to w każdym punkcie x int W istnieje hiperpłaszczyzna podpierająca, tzn. istnieje ξ R n takie że f(x) f( x) + ξ T (x x), x W.

27 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 27/144 Jeśli f jest ściśle wypukła, to f(x) > f( x) + ξ T (x x), x W \ { x}. Jeśli f jest różniczkowalna w x, to w obu powyższych nierównościach możemy przyjąć ξ = Df( x) T. Dowód tw Na mocy twierdzenia 3.5, epigraf epi(f) jest zbiorem wypukłym. Zastosujemy twierdzenie o oddzielaniu do zbiorów U = int epi(f) i V = {( x, f( x))}. Istnieje niezerowy wektor a = (ξ, α) R n R, takie że ξ T x + αy ξ T x + αf( x) (3.1) dla (x, y) epi(f). Nierówność ta musi być prawdziwa dla wszystkich y f(x). Zatem α 0. Okazuje się, że α 0. Dowiedziemy tego przez sprzeczność: załóżmy α = 0. Wówczas dla dowolnego x W mamy ξ T (x x) 0. Korzystając z tego, że x jest we wnętrzu W, wiemy, że x+εξ W dla dostatecznie małego ε > 0. Połóżmy x = x+εξ. Wtedy 0 ξ T (x x) = εξ T ξ = ε ξ 2, a zatem ξ = 0. Przeczy to niezerowości wektora (ξ, α). Wnioskujemy więc, że α < 0. Możemy założyć, że α = 1 w nierówności (3.1) (wystarczy podzielić obie strony przez α ). Dla dowolnego x W dostajemy zatem ξ T x f(x) ξ T x f( x), co przepisujemy następująco f(x) f( x) + ξ T (x x). Kończy to dowód pierwszej części twierdzenia. Dowód drugiej części twierdzenia. Przypuśćmy, że f jest ściśle wypukła. Ustalmy x int W. Na mocy pierwszej części twierdzenia f(x) f( x) + ξ T (x x) dla dowolnego x W. Przypuśćmy, że dla pewnego x W, x x, ta nierówność nie jest ścisła, tj. f(x) = f( x) + ξ T (x x). Ze ścisłej wypukłości dostajemy ( x + x ) f < f(x) f( x) = f( x) ξt (x x). (3.2) Z drugiej strony, z istnienia płaszczyzny podpierającej w x mamy ( x + x ) ( f f( x) + ξ T x + x 2 2 ) x = f( x) + ξ T x x. 2 Dostajemy sprzeczność z nierównością (3.2). Pokazuje to, że dla funkcji ściśle wypukłej f musi być spełniona ścisła nierówność f(x) < f( x) + ξ T (x x) jeśli tylko x x. Kończy to dowód drugiej części twierdzenia. Załóżmy teraz, że f jest różniczkowalna w x. Dla dowolnego x W, x x i λ (0, 1), z wypukłości mamy (1 λ)f( x) + λf(x) f( x) f(x) f( x) = λ f( (1 λ) x + λx ) f( x) λ = f( x + λ(x x) ) f( x). λ (3.3)

28 28/144 c J. Palczewski, Uniwersytet Warszawski, Policzmy granicę (difference quotient), gdy λ dąży do zera: ) f ( x + λ(x x) f( x) f(x) f( x) lim = Df( x)(x x), λ 0 λ gdzie istnieje granicy i ostatnia równość wynika z różniczkowalności f w punkcie x. Jeśli f jest ściśle wypukła, to powtarzamy dowód drugiej części twierdzenia korzystając z ostatniej nierówności, czyli zastępując ξ T przez Df( x). Dostajemy wówczas f(x) f( x) > Df( x)(x x). Prawdziwe jest twierdzenie odwrotne do twierdzenia 3.8 (patrz tw. 3.9). Wniosek 3.2. Jeśli f wypukła i różniczkowalna w x, to w x int W jest minimum globalne wtw, gdy Df( x) = 0. Dowód. Implikacja w prawą stronę wynika z tw Aby dowieść implikacji przeciwnej, załóżmy Df( x) = 0 dla pewnego x = 0. Na mocy tw. 3.8 dla dowolnego x W mamy f(x) f( x) + Df( x)(x x) = f( x), co dowodzi, że w punkcie x jest minimum globalne. Poniżej wymieniamy pozostałe własności funkcji wypukłych. Ich dowody pozostawione są jako ćwiczenia. Niech W R n, wypukły, zaś I dowolny zbiór. Jeśli funkcje f i : W R, i I, są wypukłe, to f(x) = sup i I f i (x) jest wypukła ze zbiorem wartości R { }. Niech W R n, wypukły. Jeśli funkcje f i : W R, i = 1, 2,..., m, są wypukłe i α i > 0 dla i = 1, 2,..., m, to funkcja f = m i=1 α i f i jest wypukła. Jeśli jedna z funkcji f i jest ściśle wypukła, to f jest również ściśle wypukła. Niech W R n, A R m wypukłe zbiory. Jeśli funkcja h : W A R jest wypukła i ograniczona z dołu, to jest wypukła. f(x) = inf h(x, a), x W, a A Niech f : R n R wypukła. Jeśli h : R m R n afiniczna, to złożenie f h jest funkcją wypukłą. Niech W R n wypukły. Jeśli f : W R jest funkcją wypukłą i g : R R jest wypukła i niemalejąca, to g f jest funkcją wypukłą. Jeśli dodatkowo g jest rosnąca, zaś f ściśle wypukła, to g f jest ściśle wypukła. Niech W R n wypukły. Jeśli f : W R jest funkcją (ściśle) wklęsłą i f > 0, to funkcja 1/f jest (ściśle) wypukła.

29 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 29/ Charakteryzacje funkcji wypukłej Twierdzenie 3.9. Niech W R n wypukły o niepustym wnętrzu. Jeśli w każdym punkcie x int W istnieje wektor ξ R n, taki że f(x) f( x) + ξ T (x x), x W, to funkcja f jest wypukła. Jeśli nierówność jest ostra dla x x, to f jest ściśle wypukła. Dowód. Weźmy x int W, y W i λ (0, 1). Oznaczmy x λ = λx+(1 λ)y. Chcemy wykazać, że f(x λ ) λf(x) + (1 λ)f(y). Na mocy Lematu 3.2 punkt x λ należy do wnętrza W. Stosując założenie do tego punktu dostajemy ξ R n, takie że f(x) f(x λ ) + ξ T (x x λ ), f(y) f(x λ ) + ξ T (y x λ ). (3.4) Stąd λf(x) + (1 λ)f(y) f(x λ ) + ξ T [ λ(x x λ ) + (1 λ)(y x λ ) ] = f(x λ ), gdyż wielkości w nawiasie kwadratowym zerują się. Kończy to dowód twierdzenia. Jeśli nierówność w założeniu jest ostra i x y, to nierówności (3.4) są ostre i dostajemy warunek ścisłej wypukłości. Twierdzenie Niech W R n niepusty, otwarty i wypukły, zaś f : W R dwukrotnie różniczkowalna. Wówczas: I) f jest wypukła wtw, gdy hesjan D 2 f(x) jest nieujemnie określony dla każdego x W. II) Jeśli hesjan D 2 f(x) jest dodatnio określony dla każdego x W, to f jest ściśle wypukła. Analogiczna teza zachodzi w przypadku wklęsłości. Dowód. Załóżmy najpierw, że hesjan jest nieujemnie określony dla każdego x W. Wówczas, na mocy wniosku 2.1, dla dowolnych x, x W mamy f(x) = f( x) + Df( x)(x x) (x x)t D 2 f( x)(x x), gdzie x jest punktem leżącym na odcinku łączącym x z x. Założenie o nieujemnej określoności hesjanu pociąga nieujemność ostatniego składnika powyższej sumy. Stąd f(x) f( x) + Df( x)(x x). (3.5) Ponieważ powyższa nierówność zachodzi dla dowolnych x, x W, to f jest wypukła na mocy twierdzenia 3.9. Jeśli założymy, że hesjan jest dodatnio określony dla każdego punktu W, to nierówność (3.5) jest ostra i twierdzenie 3.9 implikuje ścisłą wypukłość f. Przejdźmy teraz do dowodu implikacji przeciwnej. Załóżmy, że funkcja f jest wypukła. Ustalmy x W i h R n, h 0. Z otwartości W wynika, że istnieje δ > 0, dla której x + th W, t ( δ, δ). Zdefiniujmy funkcję g(t) = f ( x + th ), t ( δ, δ). Jest to funkcja jednej zmiennej, dwukrotnie różniczkowalna oraz wypukła. Stosując twierdzenie 3.8 dostajemy g(t) g(0) + g (0)t, t ( δ, δ).

30 30/144 c J. Palczewski, Uniwersytet Warszawski, Na mocy twierdzenie Taylora z resztą w postaci Peano, tw. 1.9, mamy g(t) = g(0) + g (0)t g (0)t 2 + o(t 2 ), t ( δ, δ). Powyższa nierówność i wzór Taylora dają następujące oszacowanie na drugą pochodną Dzielimy obie strony przez t 2 : 1 2 g (0)t 2 + o(t 2 ) g (0) + o(t2 ) t 2 0. W granicy przy t dążącym do zera, drugi składnik zanika i pozostaje g (0) 0. Co ta nierówność znaczy w terminach funkcji f? Liczymy: g (t) = Df( x + th)h, g (t) = h T D 2 f( x + th)h. Stąd g (0) = h T D 2 f( x)h. Powyższe rozumowanie możemy przeprowadzić dla dowolnego h R n. Wykazaliśmy więc nieujemną określoność D 2 f( x). 3.5 Subróżniczka Zajmiemy się teraz uogólnieniem pojęcia pochodnej na nieróżniczkowalne funkcje wypukłe. Niech W R n będzie zbiorem wypukłym, zaś f : W R funkcją wypukłą. Definicja 3.4. Wektor ξ R n nazywamy subgradientem(subgradient) funkcji f w punkcie x 0 W, jeśli f(x) f(x 0 ) + ξ T (x x 0 ), x W. Zbiór wszystkich subgradientów f w punkcie x 0 nazywamy subróżniczką (subdifferential) i oznaczamy f(x 0 ). Wniosek 3.3. Jeśli W R n jest zbiorem wypukłym o niepustym wnętrzu, to f : W R jest wypukła wtw, gdy w każdym punkcie zbioru int W istnieje subgradient: f(x) x int W. Dowód. Implikacja w prawą stronę wynika z twierdzenia 3.8, zaś implikacja w stronę lewą z tw Lemat 3.3. Niech W R n będzie zbiorem wypukłym, zaś f : W R funkcją wypukłą. Wówczas subróżniczka f(x) jest zbiorem wypukłym i domkniętym. Jeśli x jest wewnętrznym punktem W, x int W, to zbiór f(x) jest ograniczony więc zwarty. Dowód. Dowód wypukłości i domkniętości pozostawiamy jako ćwiczenie (patrz ćw. 3.24). Ustalmy x int W. Wówczas istnieje ε > 0, taki że kula domknięta B( x, ε) jest zawarta w int W. Dla dowolnego ξ f( x) f(x) f( x) + ξ T (x x), x W.

31 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 31/144 A zatem sup x B( x,ε) f(x) f( x) + sup x B( x,ε) ξ T (x x). Lewa strona jest niezależna od ξ oraz, z ciągłości f na int W, skończona. Supremum po prawej stronie jest przyjmowane dla x = x + εξ/ ξ i wynosi ε ξ. Dostajemy zatem ε ξ co dowodzi ograniczoności zbioru f( x). sup f(x) f( x), x B( x,ε) Pokażemy teraz związek subróżniczki z pochodnymi kierunkowymi funkcji. Związek ten przyda nam się w dalszych dowodach. Definicja 3.5. Pochodną kierunkową funkcji f w punkcie x w kierunku d nazywamy granicę f f( x + λd) f( x) ( x; d) = lim. λ 0 λ Z własności pochodnych jednostronnych dla skalarnych funkcji wypukłych wynikają następujące własności pochodnych kierunkowych: Lemat 3.4. Niech W R n będzie zbiorem wypukłym otwartym, zaś f : W R funkcją wypukłą. Wówczas dla każdego d R n i x W I) istnieje pochodna kierunkowa f (x; d). II) f (x; d) = inf λ>0 f( x+λd) f( x) λ. III) f (x; d) f (x; d). Dowód. Zdefiniujmy funkcję skalarną g(t) = f(x + td) dla t, takich że x + td W. Z otwartości W wynika, że g jest określona na pewnym otoczeniu zera ( δ, δ). Jest ona także wypukła. Wówczas iloraz różnicowy jest monotoniczny, tzn. dla δ < t 1 < t 2 < δ mamy g(t 1 ) g(0) t 1 g(t 2) g(0) t 2. (3.6) Z monotoniczności ilorazu różnicowego wynika, że istnieją pochodne lewostronna g (0 ) i prawostronna g (0+), g (0 ) g (0+) oraz g (0+) = inf t>0 g(t) g(0). t Wystarczy teraz zauważyć, że f (x; d) = g (0+), zaś f (x; d) = g (0 ). Pozostał nam jeszcze dowód monotoniczności ilorazu różnicowego. Weźmy najpierw 0 < t 1 < t 2 < δ i zauważmy, że nierówność (3.6) jest równoważna g(t 1 ) λg(t 2 ) + (1 λ)g(0), gdzie λ = t 1 /t 2 (0, 1) oraz λt 2 + (1 λ)0 = t 1. Prawdziwość ostatniej nierówności wynika z wypukłości funkcji g. Przypadek δ < t 1 < t 2 < 0 dowodzimy analogicznie. Dla δ < t 1 < 0 < t 2 < δ nierówność (3.6) jest równoważna g(0) λ g(t 1) + λ 1 + λ g(t 2), λ = t 1 t 2,

32 32/144 c J. Palczewski, Uniwersytet Warszawski, która wynika z wypukłości g, gdyż 1/(1 + λ) (0, 1) oraz λ t 1 + λ 1 + λ t 2 = 0. Pochodne kierunkowe pozwalają na nową charakteryzację subróżniczki. Lemat 3.5. Niech W R n będzie zbiorem wypukłym otwartym, zaś f : W R funkcją wypukłą. Prawdziwa jest następująca równoważność: ξ f( x) wtw, gdy f ( x; d) ξ T d, d R n. Dowód. Ustalmy x W i ξ f( x). Wówczas dla λ > 0 i d R n (oczywiście takich, że x + λd W ) mamy f( x + λd) f( x) + λξ T d. Zatem co implikuje f ( x; d) ξ T d. f( x + λd) f( x) λ ξ T d, Weźmy teraz wektor ξ R n spełniający warunek f ( x; d) ξ T d dla każdego d R n. Na mocy lematu 3.4(II) dla λ > 0 mamy A zatem f ( x; d) f( x + λd) f( x). λ f( x + λd) f( x) + ξ T (λd). Z dowolności λ i d wynika, iż ξ jest subgradientem. Poniższe twierdzenie precyzuje związek pomiędzy subróżniczką i pochodną kierunkową funkcji. Zwróć uwagę na wykorzystanie twierdzenia o oddzielaniu w dowodzie. Metoda polegająca na sprytnym dobraniu rozłącznych zbiorów wypukłych, które można rozdzielić hiperpowierzchnią, będzie wielokrotnie wykorzystywana w dowodzeniu twierdzeń dotyczących funkcji wypukłych. Twierdzenie Niech f : W R będzie funkcją wypukłą zadaną na wypukłym otwartym zbiorze W R n. Dla dowolnego x W i d R n zachodzi f ( x; d) = max ξ f( x) ξt d. Ponadto, funkcja f jest różniczkowalna w x wtw, gdy subróżniczka f( x) składa się z jednego subgradientu. Tym subgradientem jest wówczas Df( x) T. Dowód. Z lematu 3.5 wynika, że f ( x; d) ξ T d dla ξ f( x). Stąd f ( x; d) max ξ f( x) ξt d. Udowodnienie przeciwnej nierówności wymaga skorzystania z twierdzenia o oddzielaniu. Zdefiniujmy dwa zbiory: C 1 = {(x, z) W R : z > f(x)}, C 2 = {(x, z) W R : x = x + λd, z = f( x) + λf ( x; d), λ 0}.

33 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 33/144 Zauważmy, że C 1 różni się od epigrafu f tylko brzegiem {(x, z) W R : z = f(x)}. Możemy zatem zastosować podobne rozumowanie jak w dowodzie tw. 3.5, aby wykazać, że C 1 jest zbiorem wypukłym. Zbiór C 2 jest półprostą o początku w punkcie ( x, f( x)) i o kierunku ( d, f ( x; d) ), więc jest wypukły. Można zauważyć, że jest on wykresem liniowego przybliżenia funkcji f wokół punktu x wzdłuż odcinka { x + λd : λ 0} W. Na mocy lematu 3.4(II) mamy f (x; d) f( x+λd) f( x) λ, czyli f( x + λd) f( x) + λf (x; d). Wnioskujemy stąd, że zbiory C 1 i C 2 są rozłączne. Stosujemy twierdzenie o oddzielaniu, tw. 3.1: istnieje niezerowy wektor (µ, γ) R n R, taki że µ T x + γz µ T ( x + λd) + γ ( f( x) + λf ( x; d) ), (x, z) C 1, λ [0, L), (3.7) gdzie L = sup{λ 0 : x + λd W }. Zauważmy, że γ nie może być ujemna, gdyż wtedy lewa strona mogłaby być dowolnie mała (z może być dowolnie duże). Nie może także być γ = 0, gdyż wówczas dla każdego x W musiałoby zachodzić µ T (x x) λµ T d. Jest to możliwe tylko, gdy µ = 0 (korzystamy tutaj z faktu, że (x x) może być dowolnie małe bo W jest otwarty). A to przeczy niezerowości wektora (µ, γ). Dowiedliśmy zatem, że γ > 0. Bez straty ogólności można przyjąć, że γ = 1 dokonując przeskalowania µ w nierówności (3.7), czyli µ T x + z µ T ( x + λd) + f( x) + λf ( x; d), (x, z) C 1, λ [0, L). Zbiegając z z do f(x) otrzymujemy nierówność, która zachodzi dla wszystkich x W oraz λ [0, L) µ T x + f(x) µ T ( x + λd) + f( x) + λf ( x; d), x W, λ [0, L). (3.8) Kładąc λ = 0 dostajemy co po przekształceniu daje µ T (x x) + f(x) f( x), f(x) f( x) µ T (x x). A zatem µ f( x). Biorąc w nierówności (3.8) λ > 0 i x = x dostajemy czyli To kończy dowód pierwszej części twierdzenia. µ T (λd) λf ( x; d), sup ξ T d f ( x; d). ξ f( x) Dowód drugiej części twierdzenia wynika z następujących obserwacji. 1. Funkcja f jest różniczkowalna w punkcie x wtw, gdy f ( x; d) = α T d dla każdego d R n i pewnego wektora α R n. Równoważność ta wynika wprost z definicji pochodnej (patrz roz. 2). Jeśli f jest różniczkowalna w x, jedynym wektorem spełniającym f ( x; d) = α T d jest α = Df( x) T. Wynika stąd, że jeśli f( x) jest zbiorem jednoelementowym to f jest różniczkowalna w x. 2. Załóżmy teraz, że f jest różniczkowalna w x. Z definicji różniczkowalności wynika, że dla dostatecznie małego λ > 0 mamy (bez zmniejszania ogólności możemy założyć, że d = 1) f( x + λd) = f( x) + λdf( x)d + o(λ).

34 34/144 c J. Palczewski, Uniwersytet Warszawski, Z drugiej strony korzystając z definicji subgradientu mamy gdzie ξ jest subgradientem f w x. Odejmując stronami dostajemy f( x + λd) f( x) + λξ T d, λ ( ξ T Df( x) ) d o(λ) 0. Dzieląc tę nierówność przez λ i przechodząc z λ do zera dostajemy ( ξ T Df( x) ) d 0. Biorąc teraz d = ( ξ T Df( x) ) / ξ T Df( x) dostajemy równość ξ T = Df( x), czyli zbiór subróżniczek f( x) jest jednoelementowy. Twierdzenie 3.11 wykorzystamy kilkukrotnie w dowodzie poniższego twierdzenia, które będzie użyteczne w znajdowaniu subróżniczek. Twierdzenie Niech W R n będzie zbiorem wypukłym otwartym, zaś f 1, f 2 : W R funkcjami wypukłymi. I) Niech f = f 1 + f 2. Wówczas f 1 (x) + f 2 (x) = f(x), gdzie f 1 (x) + f 2 (x) = { ξ 1 + ξ 2 : ξ 1 f 1 (x), ξ 2 f 2 (x) }. II) Niech f = max(f 1, f 2 ). Wówczas f 1 (x), f(x) = conv ( f 1 (x) f 2 (x) ), f 2 (x), f 1 (x) > f 2 (x), f 1 (x) = f 2 (x), f 1 (x) < f 2 (x), gdzie conv( f 1 (x) f 2 (x)) jest zbiorem kombinacji wypukłych elementów zbiorów f 1 (x) i f 2 (x). Dowód. Zaczniemy od dowodu (I). Ustalmy x W. Niech ξ 1 f 1 ( x) i ξ 2 f 2 ( x). Wówczas dla x W zachodzi Dodając te nierówności stronami otrzymujemy f 1 (x) f 1 ( x) + ξ T 1 (x x), f 2 (x) f 2 ( x) + ξ T 2 (x x). f(x) f( x) + (ξ 1 + ξ 2 ) T (x x), czyli ξ 1 + ξ 2 f( x). Dowiedliśmy zawierania f 1 ( x) + f 2 ( x) f( x). Przypuśćmy, że inkluzja ta jest ostra, tzn. istnieje ξ f( x), taki że ξ / f 1 ( x) + f 2 ( x). Na mocy lematu 3.3 subróżniczki f 1 ( x) i f 2 ( x) są zwartymi zbiorami wypukłymi. A zatem ich suma algebraiczna jest również zbiorem zwartym i wypukłym (patrz ćw. 3.25). Stosujemy twierdzenie o ostrym oddzielaniu do zbiorów {ξ} oraz f 1 ( x) + f 2 ( x). Dostajemy µ R n i stałą b R, takie że µ T ξ 1 + µ T ξ 2 < b < µ T ξ, ξ 1 f 1 ( x), ξ 2 f 2 ( x).

35 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 35/144 Bierzemy maksimum po ξ 1, ξ 2 po lewej stronie i stosujemy twierdzenie 3.11: f 1( x; µ) + f 2( x; µ) < ξ T µ f ( x; µ). Z drugiej strony, z własności pochodnych kierunkowych mamy f 1( x; µ) + f 2( x; µ) = f ( x; µ). Doprowadziliśmy do sprzeczności: ξ o żądanych własnościach nie może istnieć. Kończy to dowód (I). Dowód (II). Postać subróżniczki f na zbiorach {x W : f 1 (x) > f 2 (x)} i {x W : f 1 (x) < f 2 (x)} jest oczywista. Jedynie przypadek {x W : f 1 (x) = f 2 (x)} wymaga dokładnego dowodu. Ustalmy x W, dla którego f 1 ( x) = f 2 ( x). Oznaczmy A = conv ( f 1 ( x) f 2 ( x) ). Dla i = 1, 2 oraz x W mamy f(x) f( x) f i (x) f( x) = f i (x) f i ( x) ξ T i (x x), ξ i f i ( x). Stąd dostajemy f 1 ( x) f 1 ( x) f( x). Z wypukłości subróżniczki (patrz lemat 3.3) wynika, że A f( x). Załóżmy teraz, że istnieje ξ f( x)\a. Zbiór A jest wypukły i zwarty. Stosujemy twierdzenie o ostrym oddzielaniu do zbiorów A i {ξ}. Dostajemy µ R n i stałą b R, takie że µ T ξ < b < µ T ξ, ξ A. W szczególności µ T ξ i < b dla ξ i f i ( x), i = 1, 2, czyli, na mocy tw. 3.11, Podobnie, b < ξ T µ f ( x; µ). Podsumowując: max ( f 1( x; µ), f 2( x; µ) ) b. max ( f 1( x; µ), f 2( x; µ) ) < f ( x; µ). (3.9) Z drugiej strony, definicja pochodnej kierunkowej daje nam następującą równość (przypomnijmy, że f( x) = f 1 ( x) = f 2 ( x)): f( x + λd) f( x) λ Przechodząc z λ do zera dostajemy ( f1 ( x + λd) f( x) = max λ f ( x; d) = max ( f 1( x; d), f 2( x; d) )., f ) 2( x + λd) f( x), λ > 0. λ Biorąc d = µ dostajemy sprzeczność z (3.9), a więc nie może istnieć ξ f( x) \ A. Twierdzenie Niech W R n będzie zbiorem wypukłym otwartym, f : W R funkcją wypukłą, zaś A będzie macierzą n m. Zdefiniujmy W = {x R m : Ax W }. Wówczas W jest zbiorem wypukłym otwartym oraz funkcja F : W R zadana wzorem F (x) = f(ax) ma w punkcie x W subróżniczkę zadaną wzorem F (x) = A T f(ax). Dowód. Dowód będzie przebiegał podobnie jak dowód poprzedniego twierdzenia. Ustalmy x W. Weźmy ξ f(a x). Wówczas f(ax) f(a x) + ξ T (Ax A x) = f(a x) + (A T ξ) T (x x),

36 36/144 c J. Palczewski, Uniwersytet Warszawski, czyli A T ξ F ( x). Stąd mamy zawieranie A T f(a x) F ( x). Równości tych dwóch zbiorów dowiedziemy przez sprzeczność. Załóżmy, że istnieje ξ F ( x) \ A T f(a x). Zbiór A T f(a x) jest wypukły i domknięty, jako liniowy obraz zbioru wypukłego i domkniętego. Zastosujemy twierdzenie o ostrym oddzielaniu, aby oddzielić go od zbioru jednoelementowego {ξ}. Dostajemy µ R m oraz b R, takie że µ T A T ξ < b < µ T ξ, ξ f(a x). Biorąc supremum po ξ f(a x) po lewej stronie i stosując tw otrzymujemy f (A x; Aµ) b. Prawą stronę możemy również oszacować przez pochodną kierunkową: µ T ξ F ( x; µ). Podsumowując: f (A x; Aµ) < F ( x; µ). Jednak z własności pochodnych kierunkowych natychmiast wnioskujemy, że F ( x; d) = f (A x; Ad) dla dowolnego d R m. Mamy zatem sprzeczność. Dowodzi to, iż zbiór F ( x) \ A T f(a x) jest pusty. 3.6 Zadania Ćwiczenie 3.1. Niech U, V R n będą zbiorami wypukłymi. Wykaż, że 1. U V jest zbiorem wypukłym. 2. U V może nie być zbiorem wypukłym. Ćwiczenie 3.2. Czy zbiór {(x 1, x 2, x 3 ) R 3 : x 6 1 +x2 1 +x 2x 3 +x 2 3 1} jest zbiorem wypukłym? Ćwiczenie 3.3. Udowodnij lemat 3.1. Ćwiczenie 3.4. Niech W 1 = {(x 1, x 2 ) : x 2 e x 1 }, W 2 = {(x 1, x 2 ) : x 2 e x 1 }. Wykaż, że zbiory W 1, W 2 są wypukłe i rozłączne. Znajdź prostą (hiperpłaszczyznę) je dzielącą. Czy istnieje hiperpłaszczyzna dzieląca ściśle te zbiory (w sensie twierdzenia o ostrym oddzielaniu)? Ćwiczenie 3.5. Niech W 1, W 2 R n będą zbiorami wypukłymi. Udowodnij, że inf{ x y : x W 1, y W 2 } > 0 wtw, gdy istnieje hiperpłaszczyzna ściśle (w sensie tw. o ostrym oddzielaniu) oddzielająca te zbiory. Ćwiczenie 3.6. Niech X R n będzie dowolnym zbiorem. Zdefiniujmy zbiór X jako zbiór takich punktów x R n, dla których istnieje liczba naturalna m N, zależna od punktu, wektor [λ 1,..., λ m ] [0, 1] m o tej własności, że m i=1 λ i = 1, oraz x 1,..., x m X i Udowodnij, że 1. X jest zbiorem wypukłym. m x = λ i x i. i=1 2. X jest najmniejszym zbiorem wypukłym zawierającym X.

37 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 37/ W definicji zbioru X można założyć, że m n + 1, gdzie n jest wymiarem przestrzeni (Tw. Caratheodory ego). Zbiór X nazywa się otoczką wypukłą zbioru X i oznaczane jest conv(x). Ćwiczenie 3.7. Udowodnij twierdzenie 3.5. Ćwiczenie 3.8. Udowodnij twierdzenie 3.6. Ćwiczenie 3.9. Znajdź przykład zbioru W R n i funkcji wypukłej f : W R, która nie jest ciągła na całym zbiorze W. Wskazówka. Twierdzenie 3.7 pomoże w wyborze zbioru W. Ćwiczenie Niech W R n będzie zbiorem wypukłym i otwartym, zaś f : W R funkcją różniczkowalną. Udowodnij następującą równoważność: f jest wypukła wtw, gdy ( Df(y) Df(x) ) (y x) 0, x, y W. Ćwiczenie Udowodnij: Niech W R n, wypukły, zaś I dowolny zbiór. Jeśli funkcje f i : W R, i I, są wypukłe, to f(x) = sup i I f i (x) jest wypukła ze zbiorem wartości R { }. Ćwiczenie Udowodnij: Niech W R n, wypukły. Jeśli funkcje f i : W R, i = 1, 2,..., m, są wypukłe i α i > 0 dla i = 1, 2,..., m, to funkcja f = m i=1 α i f i jest wypukła. Jeśli jedna z funkcji f i jest ściśle wypukła, to f jest również ściśle wypukła. Ćwiczenie Udowodnij: Niech W R n, wypukły, zaś A R m wypukły, zwarty. Jeśli funkcja h : W A R jest wypukła i ciągła, to jest wypukła. f(x) = inf h(x, a), x W, a A Wskazówka. Korzystając ze zwartości A i ciągłości h, dla każdego x istnieje a(x) A realizujący infimum. Dowodzimy teraz z definicji funkcji wypukłej. Ćwiczenie Udowodnij uogólnienie twierdzenia z ćwiczenia 3.13: opuścimy zwartość A i ciągłość h. Niech W R n, A R m wypukłe zbiory. Jeśli funkcja h : W A R jest wypukła i ograniczona z dołu, to f(x) = inf h(x, a), x W, a A jest wypukła. Ćwiczenie Skonstruuj przykład, który pokaże, że założenie o ograniczoności z dołu nie może być pominięte w twierdzeniu z ćw Ćwiczenie Udowodnij, że funkcja odległości od zbioru wypukłego jest funkcją wypukłą. Podaj przykład wskazujący na konieczność wypukłości zbioru. Ćwiczenie Udowodnij: Niech f : R n R wypukła. Jeśli h : R m R n afiniczna, to złożenie f h jest funkcją wypukłą.

38 38/144 c J. Palczewski, Uniwersytet Warszawski, Ćwiczenie Udowodnij: Niech W R n, wypukły. Jeśli f : W R jest funkcją wypukłą i g : R R jest wypukła i niemalejąca, to g f jest funkcją wypukłą. Kiedy g f jest ściśle wypukła? Stwórz analog powyższego twierdzenia dla funkcji wklęsłych. Ćwiczenie Udowodnij: Niech W R n wypukły. Jeśli f : W R jest funkcją (ściśle) wklęsłą i f > 0, to funkcja 1/f jest (ściśle) wypukła. Ćwiczenie Czy jeśli f : R n R i g : R R wypukłe, to g f : R n R jest wypukła? Ćwiczenie Udowodnij, że funkcja f(x 1, x 2 ) = e x2 1 x 2 jest wypukła. Ćwiczenie Niech W R n i funkcja f : W R klasy C 2. Załóżmy ponadto, że D 2 f(x) 0 dla każdego x W (tzn. Hesjan jest nieujemnie określony). Rozstrzygnij, który z następujących warunków jest wystarczający, by zdanie było prawdziwe: W = R n, W jest wypukły i otwarty, W jest wypukły, W jest otwarty. Df( x) = 0 = w x jest globalne minimum Ćwiczenie Znajdź przykład zbioru X R n oraz funkcji f : X R klasy C 2, takiej że 1. D 2 f(x) 0 (tzn. hesjan jest nieujemnie określony) dla każdego x X, 2. istnieje punkt x X, w którym jest minimum lokalne funkcji f, ale nie jest ono globalne. Ćwiczenie Niech W R n będzie zbiorem wypukłym, zaś f : W R funkcją wypukłą. Udowodnij, że f(x) jest zbiorem wypukłym i domkniętym. Ćwiczenie Niech A, B R n będą zbiorami wypukłymi zwartymi. Udowodnij, że suma algebraiczna tych zbiorów A + B = {a + b : a A, b B} jest zbiorem zwartym i wypukłym. Ćwiczenie Niech W R n wypukły otwarty i f : W R wypukła. Wykaż, że ξ R n jest subgradientem f w x W wtw, gdy odwzorowanie x ξ T x f(x) osiąga swoje minimum w x. Ćwiczenie Znajdź subróżniczkę funkcji R n x x. Ćwiczenie Niech A będzie macierzą n n symetryczną i nieujemnie określoną. Udowodnij, że f(x) = x T Ax, x R n, jest funkcją wypukłą i znajdź jej subróżniczkę. Ćwiczenie Wykaż, że dla skalarnej funkcji wypukłej f : (a, b) R mamy f(x) = [f (x ), f (x+)], gdzie f (x±) oznaczają prawo- i lewo-stronne pochodne w punkcie x (a, b).

39 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 39/144 Ćwiczenie Niech f : R n R wypukła, x, y R n ustalone wektory. Zdefiniujmy g(t) = f(tx + (1 t)y), t R. Wykaż, że g jest wypukła oraz g(t) = (x y) T f ( tx + (1 t)y ). Ćwiczenie Wykaż, że funkcja f(x) = max( 2x + 5, 3x 2 1) jest wypukła na R i znajdź jej subróżniczkę. Ćwiczenie Niech f W (x) = inf y W x y, x R n, gdzie W R n jest zbiorem wypukłym. Znajdź subróżniczkę w następujących przypadkach: W = { x} dla pewnego x R n, W = conv({(0, 0), (1, 0)}) R 2, tzn. W jest odcinkiem, W = conv({(0, 0), (1, 0), (0, 1), (1, 1)}) R 2, tzn. W jest kwadratem.

40 Rozdział 4 Ekstrema funkcji wypukłej z ograniczeniami 4.1 Problem minimalizacyjny Niech W będzie niepustym wypukłym podzbiorem R n, zaś f : W R będzie funkcją wypukłą. Rozważmy problem minimalizacji funkcji f na zbiorze W : { f(x) min, x W. (4.1) Przypomnijmy, że punktami dopuszczalnymi (feasible solution/point/vector) nazywamy elementy zbioru W. Rozwiązaniem globalnym nazywamy taki punkt x W, że f( x) f(x) dla każdego x W. Rozwiązaniem lokalnym jest taki punkt x W, że istnieje ε > 0, dla którego f( x) f(x), jeśli x W B( x, ε). Rozwiązanie jest ścisłe, jeśli f( x) < f(x) dla x W B( x, ε) i x x. Innymi słowy, x jest rozwiązaniem lokalnym, jeśli x jest minimum funkcji f na pewnym otoczeniu x. Twierdzenie 4.1. Niech W R n wypukły, f : W R wypukła. Jeśli x W będzie rozwiązaniem lokalnym (4.1), to: I) x jest rozwiązaniem globalnym, II) Zbiór rozwiązań globalnych jest wypukły. III) Jeśli f jest ściśle wypukła, to x jest ścisłym rozwiązaniem lokalnym. IV) Jeśli x jest ścisłym rozwiązaniem lokalnym, to x jest jedynym rozwiązaniem globalnym. Zauważmy, że w powyższym twierdzeniu nie zakładamy różniczkowalności funkcji f. Dowód twierdzenia 4.1. (I): Dowód przez sprzeczność. Przypuśćmy, że istnieje x W takie że f(x ) < f( x). Ponieważ x jest rozwiązaniem lokalnym, to f( x) f(x) dla x W B( x, ε) i ε > 0. Z wypukłości zbioru W wynika, iż odcinek łączący x i x znajduje się w zbiorze W. Ma on więc niepuste przecięcie z kulą B( x, ε): dla pewnego λ (0, 1) mamy λ x+(1 λ)x B( x, ε). Z wypukłości f dostajemy f ( λ x + (1 λ)x ) λf( x) + (1 λ)f(x ) < f( x), 40

41 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 41/144 co przeczy lokalnej optymalności x. (II) Pozostawione jako ćwiczenie. (III) Wynika wprost z definicji ścisłej wypukłości. (IV) Pozostawione jako ćwiczenie. Dotychczas pokazaliśmy, że warunkiem koniecznym i dostatecznym minimum różniczkowalnej funkcji wypukłej na zbiorze wypukłym i otwartym jest zerowanie się pochodnej/gradientu. Uogólnimy teraz te wyniki na przypadek dowolnych zbiorów wypukłych. Twierdzenie 4.2. Niech W R n wypukły, f : W R wypukła. Jeśli f jest różniczkowalna w punkcie x W, to mamy następującą równoważność: x jest rozwiązaniem (4.1) wtw, gdy Df( x)(x x) 0 dla każdego x W. Uwaga 4.1. W sformułowaniu powyższego twierdzenia, jak i w wielu miejscach w dalszej części tych notatek, zastosowany jest następujący skrót myślowy. Aby mówić o różniczkowalności funkcji f w punkcie x W, musi być ona określona w pewnym otoczeniu x, czyli w kuli B( x, ε) dla pewnego ε > 0. Jeśli x jest na brzegu W, to zakładać będziemy, że f jest określona na W B( x, ε) mimo, że jest to pominięte, dla prostoty notacji, w założeniach twierdzenia. Uwaga 4.2. Jeśli x int W, (is in interior of W ) to warunek powyższy sprowadza się do warunku zerowania się pochodnej Df( x) = 0. Dowód tw Niech Df( x)(x x) 0 dla każdego x W. Załóżmy, że w punkcie x funkcja f nie osiąga minimum. Istnieje wtedy punkt x W, w którym f(x ) < f( x). Tworzymy ciąg x k = (1 1 k ) x + 1 k x. Z wypukłości zbioru W wynika, że x k W. Rozważmy pochodną kierunkową funkcji f w punkcie x w kierunku wektora (x x) f ( x; x f ( x + 1 k x) = lim (x x) ) f( x) k 1/k lim k (1 1/k)f( x) + 1/kf(x ) f( x) 1/k f(x k ) f( x) = lim k 1/k = f(x ) f( x) < 0. Z założenia mamy f ( x; x x) = Df( x)(x x) 0. Otrzymaliśmy więc sprzeczność, co dowodzi, że x jest minimum funkcji f w zbiorze W, czyli rozwiązaniem (4.1). Załóżmy teraz, że x jest rozwiązaniem (4.1). Ustalmy x W. Zauważmy, że wypukłość W implikuje x + λ(x x) = (1 λ) x + λx W dla λ [0, 1]. Z definicji pochodnej mamy Df( x)(x x) = lim λ 0, λ<1 f ( x + λ(x x) ) f( x). λ Ponieważ w punkcie x jest minimum, to f ( x + λ(x x) ) f( x). Stąd Df( x)(x x) 0. Z dowodu powyższego twierdzenia dostajemy użyteczny wniosek. Wniosek 4.1. Jeśli x W, gdzie W R n jest wypukły, jest rozwiązaniem lokalnym (4.1) dla funkcji f : W R (niekoniecznie wypukłej) różniczkowalnej w x, to Df( x)(x x) 0 dla każdego x W.

42 42/144 c J. Palczewski, Uniwersytet Warszawski, Przykład 4.1. Rozważmy problem minimalizacyjny: ( 2 x 1 2) 3 + (x2 5) 2 min, x 1 + x 2 2, 2x 1 + 3x 2 11, x 1, x 2 0, Zbiór W zadany jest przez ograniczenia liniowe (patrz rysunek 4.1): W = {(x 1, x 2 ) R 2 : x 1, x 2 0, x 1 + x 2 2, 2x 1 + 3x 2 11}. Rysunek 4.1: Zbiór punktów dopuszczalnych. Łatwo sprawdzić, że jest on wypukły. Funkcja f(x 1, x 2 ) = (x )2 + (x 2 5) 2 jest ściśle wypukła: jej hesjan wynosi [ ] D f(x 1, x 2 ) =. 0 2 Na mocy tw. 4.1 minimum jest jednoznaczne. Policzmy gradient f: Df(x 1, x 2 ) = (2x 1 3, 2x 2 10). Gradient zeruje się w punkcie ( 3 2, 5), który jest poza zbiorem W. Minimum należy zatem szukać na brzegu W. Nie mamy jeszcze narzędzi ułatwiających znalezienie tego punktu. Zgadujemy... Sprawdźmy wierzchołek x = (1, 3). Gradient w tym punkcie wynosi ( 1, 4). Zauważmy, że wektory x x są kombinacjami liniowymi dodatnimi wektorów x 1 = (0, 2) (1, 3) = ( 1, 1) i x 2 = ( 11 2, 0) (1, 3) = ( 9 2, 3), tzn. x x = a 1x 1 + a 2 x 2 dla pewnych a 1, a 2 0. Wystarczy zatem sprawdzić, że Df( x)(x 1 ) 0 i Df( x)x 2 0: ( ) 1 Df( x)(x 1 ) = ( 1, 4) = 5, Df( x)(x 2 ) = ( 1, 4) 1 ) ( 9/2 3 Na mocy tw. 4.2 minimum jest rzeczywiście w punkcie (1, 3). =

43 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 43/144 Rozszerzymy teraz twierdzenie 4.2 na klasę funkcji wypukłych nieróżniczkowalnych skorzystamy z wprowadzonego w poprzednim rozdziale pojęcia subróżniczki. Twierdzenie 4.3. Niech W R n wypukły otwarty, f : W R wypukła. Załóżmy, że zbiór punktów dopuszczalnych W jest wypukłym podzbiorem W. Mamy następującą równoważność: x jest rozwiązaniem (4.1) wtw, gdy istnieje ξ f( x), takie że ξ T (x x) 0 dla każdego x W. Wniosek 4.2. Jeśli x int W, to f ma w x W minimum globalne wtw, gdy 0 f( x). Teza ta jest w szczególności prawdziwa, gdy W R n jest wypukły otwarty a f : W R wypukła. Dowód twierdzenia 4.3. Zacznijmy od łatwiejszej implikacji. Załóżmy, że istnieje ξ f( x), takie że ξ T (x x) 0 dla każdego x W. Z faktu, że ξ jest subgradientem wynika, że f(x) f( x) + ξ T (x x), x W. Wystarczy teraz skorzystać z założenia, żeby zauważyć, że f(x) f( x) dla x W, czyli x jest rozwiązaniem (4.1). Załóżmy teraz, że x W jest rozwiązaniem (4.1). Zdefiniujmy dwa zbiory C 1 = { (x, z) R n R : x W, z > f(x) f( x) }, C 2 = { (x, z) R n R : x W, z 0 }. Oba zbiory są wypukłe, C 1 ma niepuste wnętrze (zbiór C 2 ma puste wnętrze, jeśli W ma puste wnętrze). Z faktu, że punkt x jest rozwiązaniem (4.1) wynika, że C 1 C 2 =. Stosujemy twierdzenie o oddzielaniu: istnieje niezerowy wektor (µ, γ) R n R i stała b R, takie że µ T x + γz b, x W, z > f(x) f( x) µ T x + γz b, x W, z 0. (4.2) Zanim przejdziemy do analitycznych rozważań popatrzmy na geometryczny obraz (patrz Rys. 4.2). Zauważmy, że zbiory C 1 i C 2 stykają się w punkcie ( x, 0). Hiperpłaszczyzna oddzielająca te zbiory musi zatem przechodzić przez ten punkt. Jest ona styczna do wykresu funkcji x f(x) f( x) pierwsza grupa współrzędnych µ wektora (µ, γ) do niej normalnego, z dokładnością do długości i zwrotu, wyznacza subgradient tego odwzorowania w punkcie x (a zatem także subgradient f). Z faktu, że ta hiperpłaszczyzna jest również styczna do C 2 dostajemy µ T (x x) 0. Udowodnijmy to teraz analitycznie. Odejmijmy od obu stron nierówności (4.2) µ T x: µ T (x x) + γz b, x W, z > f(x) f( x) (4.3) µ T (x x) + γz b, x W, z 0, (4.4) gdzie b = b µ T x. Zauważmy najpierw, że γ nie może być większa od zera, bo wykorzystując dowolność z 0, dostajemy sprzeczność z (4.4). Kładąc w (4.4) x = x i z = 0, otrzymujemy b 0. Biorąc z kolei x = x, nierówność (4.3) upraszcza się do γz b dla z > 0. Stąd b 0. Podsumowując: b = 0. Korzystając z faktu, że b = 0 pokażemy niemożliwość spełnienia warunku γ = 0. Z nierówności (4.3) (pamiętając o otwartości W ) dostalibyśmy bowiem µ = 0, co przeczyłoby niezerowości wektora (µ, γ). Wykazaliśmy więc, że γ < 0.

44 44/144 c J. Palczewski, Uniwersytet Warszawski, z C 1 z = f(x) x x C 2 (µ, γ) } {{ } } W {{ } W Rysunek 4.2: Zbiory C 1 i C 2 z dowodu twierdzenia 4.3. Przechodząc w (4.3) z z do f(x) f( x) mamy µ T (x x) + γ ( f(x) f( x) ) 0. Dzieląc obie strony przez γ i pamiętając, że γ < 0 dostajemy µ T γ (x x) + f(x) f( x) 0, co dowodzi, że µ γ f( x). Kładąc z = 0 w (4.4) otrzymujemy µt (x x) 0. Dzielimy obie strony przez γ > 0: co kończy dowód. µt γ (x x) 0, 4.2 Funkcje pseudowypukłe W tym podrozdziale wprowadzimy rodzinę funkcji, dla której spełniony jest warunek: Df( x) = 0 w x jest minimum globalne. Okazuje się, że rodzina ta obejmuje nie tylko funkcje wypukłe. Definicja 4.1. Niech W R n będzie wypukły, otwarty i niepusty, zaś f : W R. Funkcja f jest pseudowypukła (pseudoconvex) w zbiorze W, jeśli f jest różniczkowalna w W oraz x, y W : Df(x)(y x) 0 = f(y) f(x).

45 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 45/144 Funkcja f jest ściśle pseudowypukła w zbiorze W, jeśli x, y W : Df(x)(y x) 0, x y = f(y) > f(x). Wprowadzimy także funkcje pseudowypukłe w punkcie. Funkcja f jest pseudowypukła w punkcie x zbioru W, jeśli f jest różniczkowalna w x oraz y W : Df( x)(y x) 0 = f(y) f( x). Analogicznie definiuje się funkcję ściśle pseudowypukłą w punkcie. Pseudowypukłość w punkcie jest więc własnością funkcji f odniesioną do całego zbioru W (podobnie jak wypukłość), ale definiowaną jedynie w punktach różniczkowalności funkcji f. Jeśli funkcja f jest (ściśle) pseudowypukła w każdym punkcie x W, to jest ona (ściśle) pseudowypukła w zbiorze W, Funkcja f jest (ściśle) pseudowklęsła (pseudoconcave), jeśli ( f) jest (ściśle) pseudowypukła. Uwaga 4.3. Implikacja w definicji pseudowypukłości ma równoważną postać: x, y W : f(y) < f(x) = Df(x)(y x) < 0. Rysunek 4.3: Przykłady funkcji pseudowypukłych i pseudowklęsłych. Na rysunku 4.3 znajdują się przykłady jednowymiarowych funkcji pseudowypukłych i pseudowklęsłych.

46 46/144 c J. Palczewski, Uniwersytet Warszawski, Lemat 4.1. Niech f : W R, gdzie W R n wypukły, otwarty i niepusty. Jeśli f jest (ściśle) wypukła i różniczkowalna w W, to f jest (ściśle) pseudowypukła. Dowód. Załóżmy, że f wypukła. Na mocy tw. 3.8 dla dowolnych x, x W mamy f(x) f( x) + Df( x)(x x). Jeśli zatem Df( x)(x x) 0, to f(x) f( x) i f jest pseudowypukła. W analogiczny sposób dowodzimy, że ścisła wypukłość pociąga ścisłą pseudowypukłość. Lemat 4.2. Niech f : W R, gdzie W R n wypukły, otwarty i niepusty. Jeśli f jest funkcją pseudowypukłą w x W, to x jest minimum globalnym wtw, gdy Df( x) = 0. Dowód. Identyczny jak dowód wniosku 3.2. Dowód poniższego lematu jest identyczny jak dowód twierdzenia 4.2. Lemat 4.3. Niech W R n wypukły, f : W R pseudowypukła. Mamy następującą równoważność: x jest rozwiązaniem (4.1) wtw, gdy Df( x)(x x) 0 dla każdego x W. 4.3 Maksymalizacja funkcji wypukłej Definicja 4.2. Punktem ekstremalnym (extremal point) zbioru wypukłego W R n nazwiemy taki punkt x W, który nie jest punktem wewnętrznym żadnego odcinka zawartego w W, tj. jeśli x = λx 1 + (1 λ)x 2 dla pewnych λ (0, 1) i x 1, x 2 W, to x 1 = x 2 = x. Definicja 4.3. Otoczką wypukłą (convex hull) punktów (x i ) i I nazywamy zbiór punktów będących kombinacją wypukłą skończonej liczby spośród punktów (x i ). Otoczkę wypukłą można równoważnie definiować jako najmniejszy zbiór wypukły zawierający punkty (x i ) i I. Przedstawimy teraz prostą wersję twierdzenia Kreina-Millmana. Twierdzenie 4.4. Niech U R n będzie zbiorem wypukłym i zwartym. Jest on wówczas otoczką wypukłą swoich punktów ekstremalnych. Przed przejściem do dowodu powyższego twierdzenia wprowadzimy niezbędne pojęcia. Przypomnijmy, że przestrzenią afiniczną nazywamy zbiór A, taki że k i=1 λ i x i A dla dowolnych (x i ) A i (λ i ) R takich że k i=1 λ i = 1. Każda podprzestrzeń afiniczna R n może zostać przesunięta tak, aby zawierała 0. Staje się ona wówczas podprzestrzenią liniową. Wymiarem podprzestrzeni afinicznej nazywamy wymiar tej podprzestrzeni liniowej. Definicja 4.4. Wymiarem zbioru wypukłego U R n nazywamy wymiar otoczki afinicznej U, tzn. podprzestrzeni afinicznej generowanej przez U: k aff U = { λ i x i : x 1,..., x k U, i=1 k λ i = 1}. i=1 Zapiszmy łatwe wnioski z powyższej definicji i rozważań ją poprzedzających: Wniosek 4.3.

47 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 47/ Zbiór wypukły o wymiarze m < n możemy traktować jako podzbiór przestrzeni R m. 2. Zbiór wypukły w przestrzeni R n ma niepuste wnętrze wtw, gdy jego wymiar wynosi n. Dotychczas rozważaliśmy hiperpłaszczyzny podpierające epigraf funkcji wypukłej. Teraz uogólnimy to pojęcie na dowolny zbiór wypukły. Lemat 4.4. Niech U R n będzie zbiorem wypukłym o niepustym wnętrzu. Przez punkt brzegowy x U przechodzi wówczas hiperpłaszczyzna, taka że zbiór U leży w jednej z wyznaczonych przez nią półprzestrzeni. Hiperpłaszczyznę tą nazywamy hiperpłaszczyzną podpierającą zbiór U w punkcie x. Dowód. Na mocy twierdzenia o oddzielaniu zastosowanego do U i V = { x} (zauważmy, że (int U) V = ) istnieje a R n, takie że a T x a T x dla każdego x U. Szukaną hiperpłaszczyzną jest H = {x R n : a T x = a T x}. Zbiór U zawarty jest w półprzestrzeni {x R n : a T x a T x}. Dowód twierdzenia 4.4. Przeprowadzimy indukcję po wymiarze m zbioru zwartego i wypukłego U. Przypadki m = 0 (U jest punktem) i m = 1 (U jest odcinkiem) są trywialne. Czas na krok indukcyjny. Załóżmy, że każdy zbiór wypukły i zwarty o wymiarze nie większym od m jest otoczką wypukłą swoich punktów ekstremalnych. Weźmy zbiór wypukły i zwarty U o wymiarze m + 1. Zbiór ten traktujemy jako podzbiór R m+1. Ma on wówczas niepuste wnętrze. Niech x U. Przypadek (I): x leży na brzegu U. Na mocy lematu 4.4 istnieje hiperpłaszczyzna podpierająca H przechodząca przez x. Zbiór U x = U H jest wypukły, zwarty i o wymiarze co najwyżej m. Na mocy założenia indukcyjnego punkt x jest kombinacją wypukłą punktów ekstremalnych U x. Pozostaje już tylko wykazać, że punkty ekstremalne U x są punktami ekstremalnymi U. Wynika to stąd, że żaden punkt x U x nie może być przedstawiony jako kombinacja wypukła punktów, z których jeden lub oba nie należą do U x. Przypadek (II): x leży we wnętrzu U. Przeprowadźmy przez x dowolną prostą. Przecina ona brzeg U w dwóch punktach x 1, x 2. Z przypadku (I) wiemy, że każdy z punktów x 1, x 2 może zostać przedstawiony jako kombinacja wypukła skończonej liczby punktów ekstremalnych U. Punkt x może być zapisany jako kombinacja wypukła x 1, x 2, a więc należy do otoczki wypukłej punktów ekstremalnych U. Poniżej prezentujemy inny dowód twierdzenia 4.4 bazujący częściowo na pomysłach wykorzystywanych w dowodzie ogólnej wersji twierdzenia Kreina-Milmana. W przeciwieństwie do powyższego rozumowania, dowód ten nie jest konstruktywny. Alternatywny dowód twierdzenia 4.4. Jeśli zbiór U zawarty jest w R 1, to teza twierdzenia jest trywialna. Załóżmy więc, że każdy wypukły zwarty podzbiór R m jest otoczką wypukłą swoich punktów ekstremalnych. Udowodnimy prawdziwość tego stwierdzenia dla U R m+1. Niech W będzie otoczką wypukłą punktów ekstremalnych U. Oczywiście W U. Przypuśćmy, że istnieje x U \ W. Wówczas możemy znaleźć kulę o środku w x i dostatecznie małym promieniu, która nie przecina W. Na mocy twierdzenia o ostrym oddzielaniu, tw. 3.2, istnieje wektor a R m+1, taki że a T x α dla x W i a T x > α. Niech β = sup x U a T x. Supremum to jest po całym zbiorze U i jest skończone ze zwartości U. Hiperpłaszczyzna P = {x R m+1 : a T x = β} nie przecina W (bo α < a T x β), ale ma punkt wspólny z U. Rzeczywiście, P U := P U jest niepusty, gdyż ze zwartości U wynika, że supremum definiujące β jest osiągane,

48 48/144 c J. Palczewski, Uniwersytet Warszawski, czyli istnieje x U, dla którego a T x = β. Pokażemy, że P U zawiera punkt ekstremalny U, co będzie sprzeczne z definicją zbioru W. Zbiór P U jest niepustym, zwartym zbiorem wypukłym w przestrzeni afinicznej o wymiarze m. Zbiór P U możemy traktować jako podzbiór R m, czyli na mocy założenia indukcyjnego jest on otoczką wypukłą swoich punktów ekstremalnych. Niech ȳ będzie jednym z punktów ekstremalnych P U i załóżmy, że jest on kombinacją wypukłą y 1, y 2 U, ȳ = λy 1 + (1 λ)y 2 dla λ (0, 1). Wówczas β = a T ȳ = λa T y 1 + (1 λ)a T y 2. Z konstrukcji β wynika, że zarówno a T y 1 jak i a T y 2 muszą być równe β, czyli y 1, y 2 P U. Z faktu, że ȳ jest punktem ekstremalnym P U wnioskujemy, że y 1 = y 2 = ȳ, czyli ȳ jest punktem ekstremalnym U. Twierdzenie 4.5. Niech f : W R wypukła, ciągła, określona na wypukłym i zwartym zbiorze W R n. Wówczas punkt ekstremalny zbioru W jest jednym z rozwiązań globalnych problemu { f(x) max, x W. Dowód. Funkcja ciągła osiąga swoje kresy na zbiorze zwartym. Powyższy problem maksymalizacyjny ma zatem rozwiązanie x W. Na mocy tw. 4.4 punkt x jest kombinacją wypukłą skończonej liczby punktów ekstremalnych, x 1,..., x m, zbioru W, tzn. x = a 1 x 1 + a 2 x a m x m dla liczb a 1,..., a m > 0 takich że a a m = 1. Z wypukłości f dostajemy f( x) a 1 f(x 1 ) a m f(x m ). Z faktu, że x jest maksimum f na zbiorze W wynika, że f(x 1 ) =... = f(x m ) = f( x). Przykład 4.2. Rozważmy następujące zadanie optymalizacyjne: x 1 + x 2 2 max, x x2 2 1, x 1 + x 2 0. Rysunek 4.4: Zbiór punktów dopuszczalnych. Punkty ekstremalne zaznaczone pogrubioną linią.

49 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 49/144 Funkcja celu jest wypukła, więc na mocy twierdzenia 4.5 punkt ekstremalny jest rozwiązaniem. Zbiór punktów dopuszczalnych jest kołem przeciętym z półprzestrzenią, czyli zbiorem wypukłym. Zbiór punktów ekstremalnych zaznaczony jest pogrubioną linią na rysunku 4.4. Jest to fragment okręgu. Zmaksymalizujmy więc funkcję celu na całym okręgu i zobaczmy, czy rozwiązanie należy do tego fragmentu okręgu. Podstawiając x 2 2 = 1 x2 1 do funkcji celu dostajemy x x 2 1 max. Rozwiązaniem tego problemu jest x 1 = 1/2. Stąd x 2 = ± 3/2. Para (1/2, 3/2) należy do półokręgu punktów ekstremalnych, więc jest rozwiązaniem, lecz niekoniecznie jedynym. Para (1/2, 3/2) nie należy nawet do zbioru punktów dopuszczalnych. Twierdzenie 4.5 jest szczególnie użyteczne przy maksymalizacji funkcji wypukłej na zbiorach wielościennych: Definicja 4.5. Zbiór W R n nazwiemy zbiorem wielościennym, jeśli jest przecięciem skończonej rodziny półprzestrzeni, tzn. gdzie p i R n, p i 0 i α i R. W = { x R n : p T i x α i, i = 1,..., m }, Rysunek 4.5: Zbiory wielościenne. Ciemnymi kropami zaznaczone są punkty ekstremalne. Łatwo można zauważyć, że punktami ekstremalnymi ograniczonych zbiorów wielościennych są wierzchołki (patrz rys. 4.5). Lemat 4.5. Zbiór wielościenny jest domknięty i wypukły. Dowód. Zbiór wielościenny jest domknięty i wypukły jako przecięcie rodziny zbiorów domkniętych i wypukłych.

50 50/144 c J. Palczewski, Uniwersytet Warszawski, Przykład 4.3. Rozważmy problem optymalizacyjny x x2 2 max, x 1 + 3x 2 12, 5x 1 + x 2 18, 3x 1 + 2x 2 8. Rysunek 4.6: Zbiór punktów dopuszczalnych. Punkty ekstremalne zaznaczone dużymi kropkami. Funkcja celu jest wypukła, zaś zbiór punktów dopuszczalnych jest wielościenny. Jego punkty ekstremalne to (0, 4) T, (3, 3) T i (4, 2) T, patrz rysunek 4.6. Wartość funkcji celu w tych punktach wynosi odpowiednio: 16, 18 i 20. Rozwiązaniem jest zatem punkt (4, 2) T. Można łatwo dowieść, że jest to jedyne rozwiązanie tego problemu. 4.4 Zadania Ćwiczenie 4.1. Udowodnij, że zbiór rozwiązań globalnych zagadnienia (4.1) jest wypukły dla wypukłego zbioru W R n i wypukłej funkcji f : W R. Ćwiczenie 4.2. Rozważmy zagadnienie (4.1) dla wypukłego zbioru W R n i wypukłej funkcji f : W R. Wykaż, że ścisłe rozwiązanie lokalne jest jedynym rozwiązaniem globalnym. Ćwiczenie 4.3. Udowodnij: Niech W R n wypukły oraz g, h : W R różniczkowalne. Jeśli zachodzi jeden z poniższych warunków: g jest wypukła, g 0, oraz h jest wklęsła, h > 0, g jest wypukła, g 0, oraz h jest wypukła, h > 0, to f = g/h jest pseudowypukła. Podaj przykład, że f nie jest wypukła.

51 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 51/144 Ćwiczenie 4.4. Udowodnij: Niech W R n wypukły oraz g, h : W R różniczkowalne. Jeśli g jest wypukła i g 0 oraz h jest wklęsła, h > 0, to f = gh jest pseudowypukła. Ćwiczenie 4.5. Udowodnij, że zbiór minimów funkcji pseudowypukłej f : W R, gdzie W R n wypukły, jest zbiorem wypukłym. Ćwiczenie 4.6. Odpowiedz na następujące pytania: 1. Czy suma funkcji pseudowypukłych jest pseudowypukła? 2. Czy jeśli funkcje g 1, g 2 są pseudowypukłe w punkcie x oraz Dg 1 (x) = Dg 2 (x) = 0 T, to funkcja g 1 + g 2 jest pseudowypukła w x? 3. Czy suma funkcji pseudowypukłej i wypukłej jest pseudowypukła? Odpowiedzi uzasadnij kontrprzykładami lub dowodami. Ćwiczenie 4.7. Korzystając z tw. 4.2 rozwiąż zadanie { 2x + 3y min, x 2 + 2y 2 1. Ćwiczenie 4.8. Znaleźć rozwiązania zadania log(x 1 + 4) + x 2 max, x 2 2 x 1, x 2 4. Wskazówka. Skorzystaj z tw Ćwiczenie 4.9. Rozwiąż zadanie e (x 1 3)2 +x 2 log(x 2 ) min, x 2 > 1, x 1 [1, 100]. Ćwiczenie Udowodnij, że x W jest punktem ekstremalnym zbioru wypukłego W R n wtw, gdy W \ x jest zbiorem wypukłym. Ćwiczenie Wykaż, że jeśli w punkcie brzegowym x zbioru wypukłego U istnieje hiperpłaszczyzna podpierająca H, taka że H U = { x}, to punkt x jest punktem ekstremalnym U. Ćwiczenie Zbadaj związek pomiędzy subróżniczką funkcji wypukłej w punkcie x a hiperpłaszczyznami podpierającymi epigraf tej funkcji w tym punkcie. Ćwiczenie Znaleźć rozwiązanie zadania ( ) log 1 x x 2 max, x 2 2 x 1, x 2 4.

52 52/144 c J. Palczewski, Uniwersytet Warszawski, Ćwiczenie Rozwiąż problem programowania nieliniowego z ograniczeniami: log 2 (x 1 + x 2 ) 2 x 2 2x 1 x x 2 min, x 1 0, x 2 0, x 1 + x 2 1, x 1 x 2 + x 1 4. Ćwiczenie ([3, Zadania 3.28, 3.29]) Zdefiniujmy f : [0, ) n R następująco: f(x) = min { c T y + x T (Ay b) : y W }, gdzie W jest zbiorem wielościennym, b, c R n, A R n n. 1. Wykaż, że f jest wklęsła. 2. Scharakteryzuj subróżniczkę f. 3. Znajdź subróżniczkę w punktach x 0 dla A = ( ) 3 2, b = 1 2 ( ) 6, c = 4 ( ) 1. 2 Ćwiczenie Korzystając z tw. 4.3 rozwiąż następujący problem optymalizacyjny: x 2 6x + y 2 + 2y min, x + 2y 10 = 0, 25 x 2 y 2 0.

53 Rozdział 5 Warunek konieczny I rzędu 5.1 Stożek kierunków stycznych Rozważmy problem optymalizacyjny { f(x) min, x W, (5.1) gdzie W R n i f : W R. Niech x będzie rozwiązaniem lokalnym. Będziemy chcieli powiązać geometrię lokalną zbioru W w punkcie x z zachowaniem funkcji f, czyli kierunkami spadku jej wartości. Przez lokalną geometrię W rozumiemy zbiór kierunków, w których możemy się poruszyć z punktu x nie opuszczając W. Definicja 5.1. Stożkiem kierunków stycznych (cone of tangents) T ( x) do W w punkcie x cl W nazywamy zbiór wektorów d R n takich że dla pewnych λ k > 0, x k W i x k x. d = lim k λ k(x k x) Powyższa definicja mówi, iż kierunek d należy do stożka kierunków stycznych T ( x), jeśli jest on granicą kierunków wyznaczonych przez ciąg punktów dopuszczalnych (x k ) zmierzających to x. Zapisać możemy to formalnie w następujący sposób: { T ( x) = d R n x k x } : d = λ lim k x k x dla pewnych λ 0, (x k) W oraz x k x, x k x. (5.2) Dowód tej tożsamości oraz poniższego lematu pozostawiamy jako ćwiczenie. Lemat Zbiór T ( x) jest stożkiem, tzn. λd T ( x) dla dowolnych d T ( x) i λ 0. W szczególności, 0 T ( x). 2. Jeśli x jest punktem wewnętrznym zbioru W, to T ( x) = R n. 3. Stożek T ( x) jest domknięty. 53

54 54/144 c J. Palczewski, Uniwersytet Warszawski, Rysunek 5.1: Stożki styczne zaczepione w punkcie styczności. Przykład 5.1. Na rysunku 5.1 znajdują się trzy przykłady zbiorów i stożków do nich stycznych w punkcie x. Stożki te są przesunięte o wektor x, by pokazać ich zależność od kształtu zbioru. W przykładzie (a) i (c) zakładamy, że brzeg zbioru W jest gładki, więc stożki te są półprzestrzeniami ograniczonymi przez styczną w x. W przykładzie (b) zbiór W to wnętrze narysowanego stożka (bez brzegu). Wówczas stożek kierunków stycznych jest domknięciem zbioru W. Jak już wspomnieliśmy, stożek kierunków stycznych jest ściśle związany z rozwiązaniem zagadnienia (5.1). Jeśli w punkcie x W funkcja f ma minimum lokalne na W, to wówczas kierunki spadku wartości funkcji f nie mogą należeć do zbioru kierunków stycznych w punkcie x. Gdyby tak nie było, to poruszając się w kierunku spadku funkcji f zmniejszalibyśmy jej wartość jednocześnie pozostając w zbiorze W. Intuicje te formalizujemy poniżej. Definicja 5.2. Niech f : X R będzie różniczkowalna w x X. Zbiorem kierunków spadku (improving/descent directions) funkcji f w punkcie x nazywamy D( x) = {d R n : Df( x) d < 0}. Twierdzenie 5.1. Niech x będzie rozwiązaniem lokalnym problemu (5.1). Jeśli f jest różniczkowalna w x, to D( x) T ( x) =. Dowód. Weźmy d T ( x). Wówczas d = lim k λ k (x k x) dla pewnego ciągu punktów (x k ) W zbieżnego do x oraz ciągu liczb (λ k ) (0, ). Z definicji różniczkowalności f w x mamy f(x k ) = f( x) + Df( x)(x k x) + o( x k x ). Z faktu, że x jest rozwiązaniem lokalnym f(x k ) f( x) dla dostatecznie dużych k. W połączeniu z powyższym wzorem daje to następujące oszacowanie: 0 f(x k ) f( x) = Df( x)(x k x) + o( x k x ). Mnożąc obie strony powyższej nierówności przez λ k dostajemy 0 Df( x) ( λ k (x k x) ) + λ k o( x k x ).

55 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 55/144 Zrobimy teraz sztuczkę, aby rozwiązać problem z o( x k x ) i przejdziemy z k to nieskończoności: 0 Df( x) ( λ k (x k x) ) o( x k x ) + λ k x k x. }{{}}{{} x k x d d }{{} 0 Udowodniliśmy zatem, że Df( x)d 0, czyli d / D( x). Kończy to dowód twierdzenia. Przykład 5.2. Rozważmy następujący problem optymalizacyjny: { x x 2 2 min, x 1 + x 2 1. Oznaczmy f(x 1, x 2 ) = x x2 2 i W = {x R2 : x 1 + x 2 1}. Zbadamy zbiory T ( x) i D( x) w następujących punktach: [1, 1] T, [1, 0] T, [ 1 2, 1 2 ]T. x = [1, 1] T. Punkt ten leży wewnątrz zbioru W, czyli T ( x) = R 2. Zbiór kierunków spadku funkcji f dany jest następująco: D( x) = { d R 2 : Df( x)d < 0 } = { d R 2 : [2, 2]d < 0 } = { d R 2 : d 1 + d 2 < 0 }. W oczywisty sposób część wspólna powyższych zbiorów nie jest pusta, czyli w punkcie [1, 1] T nie ma minimum. x = [1, 0] T. Punkt ten leży na brzegu zbioru W. Łatwo można zauważyć, że T ( x) = { d R 2 : d 1 + d 2 0 }, D( x) = { d R 2 : d 1 < 0 }. Zbiory te mają niepuste przecięcie (patrz podwójna kratka na rys. 5.2), więc w punkcie Rysunek 5.2: Stożek kierunków stycznych i stożek kierunków spadku w punkcie x = [1, 0] T. [1, 0] T nie ma minimum. x = [ 1 2, 1 2 ]T. Zauważmy, że T ( x) = { d R 2 : d 1 +d 2 0 }, D( x) = { d R 2 : [1, 1]d < 0 } = { d R 2 : d 1 +d 2 < 0 }. Zbiory te mają zatem puste przecięcie, więc w punkcie [ 1 2, 1 2 ]T może być minimum.

56 56/144 c J. Palczewski, Uniwersytet Warszawski, Bezpośrednie wykorzystanie twierdzenia 5.1 do szukania kandydatów na rozwiązania zadań z ograniczeniami nie wygląda zachęcająco. Dlatego postaramy się opisać prościej zbiór T ( x) oraz warunek T ( x) D( x) =. 5.2 Ograniczenia nierównościowe Zajmiemy się problemem optymalizacyjnym w następującej formie: f(x) min, g i (x) 0, i = 1,..., m, x X, (5.3) gdzie X R n jest zbiorem otwartym i f, g 1,..., g m : X R. A zatem W = { x X : g 1 (x) 0,..., g m (x) 0 }. (5.4) Funkcje g i nazywane są ograniczeniami nierównościowymi, zaś cały problem (5.3) zadaniem optymalizacyjnym z ograniczeniami nierównościowymi. Ustalmy x W i załóżmy, że funkcje g i są ciągłe. Wówczas ruch wokół x ograniczają lokalnie tylko te warunki, dla których g i ( x) = 0. W przypadku pozostałych, z ciągłości g i wynika, iż istnieje pewne otoczenie x, na którym mamy g i < 0. Okazuje się, że ta obserwacja będzie pełnić ważną rolę w procesie optymalizacji z ograniczeniami nierównościowymi. Definicja 5.3. Zbiorem ograniczeń aktywnych (binding/active/tight constraints) w punkcie x W nazywamy zbiór I( x) = { i {1, 2,..., m} : g i ( x) = 0 }. Głównym wynikiem tego rozdziału będzie powiązanie własności ograniczeń aktywnych w danym punkcie x W z lokalną geometrią tego zbioru wokół x. W tym celu wprowadźmy następującą definicję. Definicja 5.4. Niech x W i g i różniczkowalne w x dla ograniczeń aktywnych i I( x). Stożkiem kierunków stycznych dla ograniczeń zlinearyzowanych (cone of tangents for binding constraints) nazywamy zbiór T lin ( x) = { d R n : i I( x) Dg i ( x)d 0 }. Stożek kierunków stycznych dla ograniczeń zlinearyzowanych jest zbiorem wielościennym, a zatem wypukłym i domkniętym. Lemat 5.2. Jeśli x W, to T ( x) T lin ( x). Dowód. Dowód przebiega bardzo podobnie do dowodu twierdzenia 5.1. Weźmy d T ( x). Wówczas d = lim k λ k (x k x) dla pewnego ciągu punktów (x k ) W zbieżnego do x oraz ciągu liczb dodatnich (λ k ). Ustalmy i I( x). Z definicji różniczkowalności g i w x mamy g i (x k ) = g i ( x) + Dg i ( x)(x k x) + o( x k x ).

57 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 57/144 Ograniczenie i-te jest aktywne w x. Zatem g i ( x) = 0. Oczywiście, g i (x k ) 0, ponieważ x k W. W połączeniu w powyższym wzorem daje to następujące oszacowanie: 0 g i (x k ) g i ( x) = Dg i ( x)(x k x) + o( x k x ). Mnożąc obie strony powyższej nierówności przez λ k dostajemy 0 Dg i ( x) ( λ k (x k x) ) + λ k o( x k x ). Zrobimy teraz sztuczkę, aby rozwiązać problem o( x k x ) i przejdziemy z k to nieskończoności: 0 Dg i ( x) ( λ k (x k x) ) + λ k x k x }{{}}{{} d d o( x k x ) x k x } {{ } 0 Udowodniliśmy zatem, że Dg i ( x)d 0. Analogicznie wynik otrzymujemy dla każdego ograniczenia aktywnego i I( x). A zatem d T lin ( x).. Rysunek 5.3: Zbiór punktów dopuszczalnych (zaznaczony na szaro) z przykładu 5.3. Przykład 5.3. Rozważmy zbiór W = {x R 2 : x x2 2 1, x 2 0}, patrz rysunek 5.3. Zapiszmy go w kanonicznej formie (5.4): X = R n, g 1 (x 1, x 2 ) = x x 2 2 1, g 2 (x 1, x 2 ) = x 2. Zbadajmy trzy punktu tego zbioru ( 1 2, 1 2 ), (0, 1) i (1, 0). x = ( 1 2, 1 2 ): I( x) = i T ( x) = T lin = R n. x = (0, 1): I( x) = {1}, T ( x) = {d R n : d 2 0}, T lin ( x) = {d R 2 : Dg 1 (0, 1)d 0} = {d R 2 : [0, 2]d 0} = T ( x). x = (1, 0): I( x) = {1, 2}, T ( x) = {d R n : d 1 0, d 2 0}, T lin ( x) = {d R 2 : Dg 1 (1, 0)d 0, Dg 2 (1, 0)d 0} = {d R 2 : [2, 0]d 0, [0, 1]d 0} = T ( x).

58 58/144 c J. Palczewski, Uniwersytet Warszawski, Przykład 5.4. Rozważmy ten sam zbiór W co w powyższym przykładzie, lecz zapiszmy go nieco inaczej: W = {x R 2 : x x 2 2 1, x 3 2 0}. Zmianie uległo drugie ograniczenie: z x 2 0 na x Nowy opis zbioru W odpowiada ograniczeniom g 1 (x 1, x 2 ) = x 2 1 +x2 2, g 2(x 1, x 2 ) = x 3 2. Rozważmy zbiory T ( x) i T lin( x) w punkcie x = (0, 1). Stożek kierunków stycznych jest identyczny, gdyż zbiór się nie zmienił: T ( x) = {d R n : d 1 0, d 2 0}. Natomiast stożek kierunków stycznych dla ograniczeń zlinearyzowanych jest następujący: T lin ( x) = {d R 2 : Dg 1 (1, 0)d 0, Dg 2 (1, 0)d 0} = {d R 2 : [2, 0]d 0, [0, 0]d 0} = {d R 2 : d 1 0}. Widzimy zatem, że nie zawsze zachodzi równość pomiędzy T ( x) i T lin ( x). 5.3 Warunki konieczne Kuhna-Tuckera W lemacie 5.2 wykazaliśmy, że T ( x) T lin ( x). Pokazaliśmy w przykładach, że dość często mamy równość tych dwóch zbiorów. Okazuje się, że to bardzo ważna własność, która będzie punktem wyjścia dla całej teorii optymalizacji nieliniowej Kuhna-Tuckera. Zanim jednak przejdziemy do głównego twierdzenia dowiedziemy pomocniczy, lecz bardzo ważny lemat. Lemat 5.3 (Farkas (1901)). Niech A będzie macierzą m n i d R n. Wówczas dokładnie jeden z układów ma rozwiązanie: Ax 0, A T y = d, (1) d T x > 0, (2) y 0, x R n, y R m. Dowód. Pokażemy najpierw, że jeśli układ (2) ma rozwiązanie, to układ (1) go nie ma. Weźmy zatem y spełniające (2). Zatem d = A T y. Wstawiamy to do układu (1) i otrzymujemy { Ax 0, y T Ax > 0. Pierwsza nierówność oznacza, że każda współrzędna wektora Ax jest niedodatnia. Ponieważ współrzędne y są nieujemne, to iloczyn skalarny y T (Ax) jest niedodatni. Przeczy to drugiej nierówności, a zatem dowodzi, że (1) nie ma rozwiązania. Załóżmy teraz, że układ (2) nie ma rozwiązania. Zdefiniujmy zbiór V = {x R n : x = A T y dla pewnego y R m, y 0}. Łatwo sprawdzić, że jest to zbiór wypukły i domknięty. Z faktu, że układ (2) nie ma rozwiązania wynika, że d / V. Zastosujmy więc twierdzenia o ostrym oddzielaniu, tw. 3.2 do zbiorów V i U = {d}. Istnieje więc wektor a R n taki że a T d > sup a T x. x V

59 Korzystaj. Nie kopiuj. Nie rozpowszechniaj. 59/144 Pokażemy, że x = a jest rozwiązaniem układu (1). Oznaczmy α = sup x V x T x. Ponieważ 0 V, to α 0, co pociąga d T x > 0. Pozostaje tylko udowodnić, że A x 0. Przypuśćmy, że i-ta współrzędna A x jest dodatnia. Z definicji zbioru V wynika, że dla dowolnego y 0 zachodzi α x T A T y = y T A x. Zdefiniujmy ciąg y n = [0,..., 0, n, 0,..., 0] T, gdzie n jest na i-tej współrzędnej. Na mocy założenia o dodatniości (A x) i dostajemy lim n yt n A x = lim n(a x) i =, n co przeczy temu, że y T n A x α. Sprzeczność ta dowodzi, że A x 0. Rysunek 5.4 ilustruje lemat Farkasa w przypadku dwuwymiarowym. Macierz A jest wymiaru 2 2 a jej wierszami są wektory a 1 i a 2 (wektory te traktujemy jako wektory wierszowe, tj. inaczej niż pozostałe wektory, które są wektorami kolumnowymi ). Dla układu (1) z lematu, warunek Ax 0 oznacza jednoczesne spełnienie dwóch nierówności a 1 x 0 i a 2 x 0. Zbiór wartości x, dla których każda z tych nierówności jest spełniona zaznaczono przerywanymi liniami. Warunek Ax 0 jest spełniony w części wspólnej tych dwóch zbiorów. Dla danego wektora d, warunek d T x > 0 jest spełniony na zbiorze zaznaczonym szarym kolorem. Jest więc jasne, że układ (1) posiada rozwiązanie, jeśli obszar szary i obszar z podwójnym kreskowaniem posiadają część wspólną. Ten przypadek jest zilustrowany lewym obrazkiem na rysunku. Na prawym obrazku część wspólna jest zbiorem pustym, dlatego prawy obrazek odpowiada przypadkowi, gdy układ (1) nie posiada rozwiązania. Aby geometrycznie zinterpretować układ (2) musimy zobaczyć jak wygląda zbiór {A T y : y 0}. Wektory A T y można zapisać jako kombinację liniową y 1 a T 1 +y 2a T 2, gdzie y = (y 1, y 2 ) T. Łatwo zauważyć, że dla y 1 0, y 2 0 jest to stożek rozpięty przez wektory a T 1 i at 2. Stożek ten został zakropkowany na rysunku 5.4. Równanie AT y = d jest spełnione, jeśli wektor d leży w zakropkowanym stożku. Taki przypadek ilustruje prawy obrazek. Na obrazku lewym wektor d leży na zewnątrz zakropkowanego stożka, dlatego układ (2) nie posiada rozwiązania dla tego przypadku. a 2 x 0 d T x > 0 d a 2 x 0 a 1 {A T y : y 0} a 1 {A T y : y 0} d T x > 0 a 2 a 1 x 0 d a 2 a 1 x 0 Rysunek 5.4: Ilustracja lematu Farkasa (lemat 5.3). Na rysunku lewym układ (1) posiada rozwiązanie a układ (2) nie posiada rozwiązania. Na rysunku prawym jest odwrotnie. Twierdzenie 5.2 (Twierdzenie Kuhna-Tuckera). Niech x będzie rozwiązaniem lokalnym (5.3). Jeśli funkcje f oraz g i, i I( x), są różniczkowalne w x oraz T ( x) = T lin ( x), to istnieje µ

Matematyka stosowana. Optymalizacja II. Jan Palczewski

Matematyka stosowana. Optymalizacja II. Jan Palczewski Matematyka stosowana Optymalizacja II Jan Palczewski J.Palczewski@mimuw.edu.pl http://www.mimuw.edu.pl/~jpalczew Uniwersytet Warszawski, 2014 Streszczenie. Wykład prezentuje teorię optymalizacji nieliniowej

Bardziej szczegółowo

II. FUNKCJE WIELU ZMIENNYCH

II. FUNKCJE WIELU ZMIENNYCH II. FUNKCJE WIELU ZMIENNYCH 1. Zbiory w przestrzeni R n Ustalmy dowolne n N. Definicja 1.1. Zbiór wszystkich uporzadkowanych układów (x 1,..., x n ) n liczb rzeczywistych, nazywamy przestrzenią n-wymiarową

Bardziej szczegółowo

1 Pochodne wyższych rzędów

1 Pochodne wyższych rzędów 1 Pochodne wyższych rzędów Definicja 1.1 (Pochodne cząstkowe drugiego rzędu) Niech f będzie odwzorowaniem o wartościach w R m, określonym na zbiorze G R k. Załóżmy, że zbiór tych x G, dla których istnieje

Bardziej szczegółowo

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych,

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych, IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. Definicja 1.1. Niech D będzie podzbiorem przestrzeni R n, n 2. Odwzorowanie f : D R nazywamy

Bardziej szczegółowo

2. Definicja pochodnej w R n

2. Definicja pochodnej w R n 2. Definicja pochodnej w R n Niech będzie dana funkcja f : U R określona na zbiorze otwartym U R n. Pochodną kierunkową w punkcie a U w kierunku wektora u R n nazywamy granicę u f(a) = lim t 0 f(a + tu)

Bardziej szczegółowo

Pochodne funkcji wraz z zastosowaniami - teoria

Pochodne funkcji wraz z zastosowaniami - teoria Pochodne funkcji wraz z zastosowaniami - teoria Pochodne Definicja 2.38. Niech f : O(x 0 ) R. Jeżeli istnieje skończona granica f(x 0 + h) f(x 0 ) h 0 h to granicę tę nazywamy pochodną funkcji w punkcie

Bardziej szczegółowo

Pochodna funkcji odwrotnej

Pochodna funkcji odwrotnej Pochodna funkcji odwrotnej Niech będzie dana w przedziale funkcja różniczkowalna i różnowartościowa. Wiadomo, że istnieje wówczas funkcja odwrotna (którą oznaczymy tu : ), ciągła w przedziale (lub zależnie

Bardziej szczegółowo

1 Funkcje dwóch zmiennych podstawowe pojęcia

1 Funkcje dwóch zmiennych podstawowe pojęcia 1 Funkcje dwóch zmiennych podstawowe pojęcia Definicja 1 Funkcją dwóch zmiennych określoną na zbiorze A R 2 o wartościach w zbiorze R nazywamy przyporządkowanie każdemu punktowi ze zbioru A dokładnie jednej

Bardziej szczegółowo

Zbiory wypukłe i stożki

Zbiory wypukłe i stożki Katedra Matematyki i Ekonomii Matematycznej 28 kwietnia 2016 Hiperpłaszczyzna i półprzestrzeń Definicja Niech a R n, a 0, b R. Zbiór H(a, b) = {x R n : (a x) = b} nazywamy hiperpłaszczyzną, zbiory {x R

Bardziej szczegółowo

Pochodna funkcji. Pochodna funkcji w punkcie. Różniczka funkcji i obliczenia przybliżone. Zastosowania pochodnych. Badanie funkcji.

Pochodna funkcji. Pochodna funkcji w punkcie. Różniczka funkcji i obliczenia przybliżone. Zastosowania pochodnych. Badanie funkcji. Pochodna funkcji Pochodna funkcji w punkcie. Różniczka funkcji i obliczenia przybliżone. Zastosowania pochodnych. Badanie funkcji. Małgorzata Wyrwas Katedra Matematyki Wydział Informatyki Politechnika

Bardziej szczegółowo

Funkcje dwóch zmiennych

Funkcje dwóch zmiennych Funkcje dwóch zmiennych Andrzej Musielak Str Funkcje dwóch zmiennych Wstęp Funkcja rzeczywista dwóch zmiennych to funkcja, której argumentem jest para liczb rzeczywistych, a wartością liczba rzeczywista.

Bardziej szczegółowo

Korzystając z własności metryki łatwo wykazać, że dla dowolnych x, y, z X zachodzi

Korzystając z własności metryki łatwo wykazać, że dla dowolnych x, y, z X zachodzi M. Beśka, Wstęp do teorii miary, Dodatek 158 10 Dodatek 10.1 Przestrzenie metryczne Niech X będzie niepustym zbiorem. Funkcję d : X X [0, ) spełniającą dla x, y, z X warunki (i) d(x, y) = 0 x = y, (ii)

Bardziej szczegółowo

VIII. Zastosowanie rachunku różniczkowego do badania funkcji. 1. Twierdzenia o wartości średniej. Monotoniczność funkcji.

VIII. Zastosowanie rachunku różniczkowego do badania funkcji. 1. Twierdzenia o wartości średniej. Monotoniczność funkcji. VIII. Zastosowanie rachunku różniczkowego do badania funkcji. 1. Twierdzenia o wartości średniej. Monotoniczność funkcji. Twierdzenie 1.1. (Rolle a) Jeżeli funkcja f jest ciągła w przedziale domkniętym

Bardziej szczegółowo

Rozdział 6. Ciągłość. 6.1 Granica funkcji

Rozdział 6. Ciągłość. 6.1 Granica funkcji Rozdział 6 Ciągłość 6.1 Granica funkcji Podamy najpierw dwie definicje granicy funkcji w punkcie i pokażemy ich równoważność. Definicja Cauchy ego granicy funkcji w punkcie. Niech f : X R, gdzie X R oraz

Bardziej szczegółowo

Notatki z Analizy Matematycznej 3. Jacek M. Jędrzejewski

Notatki z Analizy Matematycznej 3. Jacek M. Jędrzejewski Notatki z Analizy Matematycznej 3 Jacek M. Jędrzejewski ROZDZIAŁ 6 Różniczkowanie funkcji rzeczywistej 1. Pocodna funkcji W tym rozdziale rozważać będziemy funkcje rzeczywiste określone w pewnym przedziale

Bardziej szczegółowo

Notatki z Analizy Matematycznej 2. Jacek M. Jędrzejewski

Notatki z Analizy Matematycznej 2. Jacek M. Jędrzejewski Notatki z Analizy Matematycznej 2 Jacek M. Jędrzejewski Definicja 3.1. Niech (a n ) n=1 będzie ciągiem liczbowym. Dla każdej liczby naturalnej dodatniej n utwórzmy S n nazywamy n-tą sumą częściową. ROZDZIAŁ

Bardziej szczegółowo

3. Funkcje wielu zmiennych

3. Funkcje wielu zmiennych 3 Funkcje wielu zmiennych 31 Ciagłość Zanim podamy definicję ciagłości dla funkcji wielu zmiennych wprowadzimy bardzo ogólne i abstrakcyjne pojęcie przestrzeni metrycznej Przestrzeń metryczna Metryka w

Bardziej szczegółowo

Ekstrema globalne funkcji

Ekstrema globalne funkcji SIMR 2013/14, Analiza 1, wykład 9, 2013-12-13 Ekstrema globalne funkcji Definicja: Funkcja f : D R ma w punkcie x 0 D minimum globalne wtedy i tylko (x D) f(x) f(x 0 ). Wartość f(x 0 ) nazywamy wartością

Bardziej szczegółowo

Temperatura w atmosferze (czy innym ośrodku) jako funkcja dł. i szer. geogr. oraz wysokości.

Temperatura w atmosferze (czy innym ośrodku) jako funkcja dł. i szer. geogr. oraz wysokości. Własności Odległości i normy w Będziemy się teraz zajmować funkcjami od zmiennych, tzn. określonymi na (iloczyn kartezja/nski egzemplarzy ). Punkt należący do będziemy oznaczać jako Przykł. Wysokość terenu

Bardziej szczegółowo

Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji

Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji Adam Kiersztyn Lublin 2014 Adam Kiersztyn () Pochodne cząstkowe i ich zastosowanie. Ekstrema lokalne funkcji maj 2014 1 / 24 Zanim przejdziemy

Bardziej szczegółowo

Wzór Maclaurina. Jeśli we wzorze Taylora przyjmiemy x 0 = 0 oraz h = x, to otrzymujemy tzw. wzór Maclaurina: f (x) = x k + f (n) (θx) x n.

Wzór Maclaurina. Jeśli we wzorze Taylora przyjmiemy x 0 = 0 oraz h = x, to otrzymujemy tzw. wzór Maclaurina: f (x) = x k + f (n) (θx) x n. Wzór Maclaurina Jeśli we wzorze Taylora przyjmiemy x 0 = 0 oraz h = x, to otrzymujemy tzw. wzór Maclaurina: f (x) = n 1 k=0 f (k) (0) k! x k + f (n) (θx) x n. n! Wzór Maclaurina Przykład. Niech f (x) =

Bardziej szczegółowo

Pewne własności zbiorów i funkcji wypukłych w przestrzeniach unormowanych

Pewne własności zbiorów i funkcji wypukłych w przestrzeniach unormowanych Maciej Grzesiak Pewne własności zbiorów i funkcji wypukłych w przestrzeniach unormowanych 1. Pochodna funkcji o argumencie wektorowym Niech f : W R, gdzie W R n jest zbiorem otwartym. Oznaczenia: x = (x

Bardziej szczegółowo

Programowanie liniowe

Programowanie liniowe Programowanie liniowe Maciej Drwal maciej.drwal@pwr.wroc.pl 1 Problem programowania liniowego min x c T x (1) Ax b, (2) x 0. (3) gdzie A R m n, c R n, b R m. Oznaczmy przez x rozwiązanie optymalne, tzn.

Bardziej szczegółowo

Wykład 4 Przebieg zmienności funkcji. Badanie dziedziny oraz wyznaczanie granic funkcji poznaliśmy na poprzednich wykładach.

Wykład 4 Przebieg zmienności funkcji. Badanie dziedziny oraz wyznaczanie granic funkcji poznaliśmy na poprzednich wykładach. Wykład Przebieg zmienności funkcji. Celem badania przebiegu zmienności funkcji y = f() jest poznanie ważnych własności tej funkcji na podstawie jej wzoru. Efekty badania pozwalają naszkicować wykres badanej

Bardziej szczegółowo

13. Funkcje wielu zmiennych pochodne, gradient, Jacobian, ekstrema lokalne.

13. Funkcje wielu zmiennych pochodne, gradient, Jacobian, ekstrema lokalne. 13. Funkcje wielu zmiennych pochodne, gradient, Jacobian, ekstrema lokalne. 1. Wprowadzenie. Dotąd rozważaliśmy funkcje działające z podzbioru liczb rzeczywistych w zbiór liczb rzeczywistych, zatem funkcje

Bardziej szczegółowo

2. ZASTOSOWANIA POCHODNYCH. (a) f(x) = ln 3 x ln x, (b) f(x) = e2x x 2 2.

2. ZASTOSOWANIA POCHODNYCH. (a) f(x) = ln 3 x ln x, (b) f(x) = e2x x 2 2. 2. ZASTOSOWANIA POCHODNYCH. Koniecznie trzeba znać: twierdzenia o ekstremach (z wykorzystaniem pierwszej i drugiej pochodnej), Twierdzenie Lagrange a, Twierdzenie Taylora (z resztą w postaci Peano, Lagrange

Bardziej szczegółowo

Metody optymalizacji. notatki dla studentów matematyki semestr zimowy 2015/2016

Metody optymalizacji. notatki dla studentów matematyki semestr zimowy 2015/2016 Metody optymalizacji notatki dla studentów matematyki semestr zimowy 2015/2016 Aktualizacja: 11 stycznia 2016 Spis treści Spis treści 2 1 Wprowadzenie do optymalizacji 1 11 Podstawowe definicje i własności

Bardziej szczegółowo

Matematyka II. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr letni 2018/2019 wykład 13 (27 maja)

Matematyka II. Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr letni 2018/2019 wykład 13 (27 maja) Matematyka II Bezpieczeństwo jądrowe i ochrona radiologiczna Semestr letni 208/209 wykład 3 (27 maja) Całki niewłaściwe przedział nieograniczony Rozpatrujemy funkcje ciągłe określone na zbiorach < a, ),

Bardziej szczegółowo

Pochodne wyższych rzędów definicja i przykłady

Pochodne wyższych rzędów definicja i przykłady Pochodne wyższych rzędów definicja i przykłady Pochodne wyższych rzędów Drugą pochodną funkcji nazywamy pochodną pochodnej tej funkcji. Trzecia pochodna jest pochodną drugiej pochodnej; itd. Ogólnie, -ta

Bardziej szczegółowo

RÓŻNICZKOWANIE FUNKCJI WIELU ZMIENNYCH: rachunek pochodnych dla funkcji wektorowych. Pochodne cząstkowe funkcji rzeczywistej wielu zmiennych

RÓŻNICZKOWANIE FUNKCJI WIELU ZMIENNYCH: rachunek pochodnych dla funkcji wektorowych. Pochodne cząstkowe funkcji rzeczywistej wielu zmiennych RÓŻNICZKOWANIE FUNKCJI WIELU ZMIENNYCH: rachunek pochodnych dla funkcji wektorowych Pochodne cząstkowe funkcji rzeczywistej wielu zmiennych wyliczamy według wzoru (x, x 2,..., x n ) f(x, x 2,..., x n )

Bardziej szczegółowo

ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ

ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ ANALIZA MATEMATYCZNA Z ELEMENTAMI STATYSTYKI MATEMATYCZNEJ FUNKCJE DWÓCH ZMIENNYCH RZECZYWISTYCH Definicja 1. Niech A będzie dowolnym niepustym zbiorem. Metryką w zbiorze A nazywamy funkcję rzeczywistą

Bardziej szczegółowo

1 Pochodne wyższych rzędów

1 Pochodne wyższych rzędów Pochodne wyższych rzędów Pochodną rzędu drugiego lub drugą pochodną funkcji y = f(x) nazywamy pochodną pierwszej pochodnej tej funkcji. Analogicznie definiujemy pochodne wyższych rzędów, jako pochodne

Bardziej szczegółowo

Analiza matematyczna 1 - test egzaminacyjny wersja do ćwiczeń

Analiza matematyczna 1 - test egzaminacyjny wersja do ćwiczeń Analiza matematyczna 1 - test egzaminacyjny wersja do ćwiczeń Leszek Skrzypczak 1. Niech E = {x [0, 1] : x = k 2 n k = 1, 2,... 2 n, n = 1, 2, 3,...} Wówczas: (a) Dla dowolnych liczb wymiernych p, q [0,

Bardziej szczegółowo

LX Olimpiada Matematyczna

LX Olimpiada Matematyczna LX Olimpiada Matematyczna Rozwiązania zadań konkursowych zawodów stopnia drugiego 13 lutego 2009 r. (pierwszy dzień zawodów) Zadanie 1. Liczby rzeczywiste a 1, a 2,..., a n (n 2) spełniają warunek a 1

Bardziej szczegółowo

Matematyka z el. statystyki, # 4 /Geodezja i kartografia I/

Matematyka z el. statystyki, # 4 /Geodezja i kartografia I/ Matematyka z el. statystyki, # 4 /Geodezja i kartografia I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Akademicka 15, p.211a, bud. Agro

Bardziej szczegółowo

Rozdział 7. Różniczkowalność. 7.1 Pochodna funkcji w punkcie

Rozdział 7. Różniczkowalność. 7.1 Pochodna funkcji w punkcie Rozdział 7 Różniczkowalność Jedną z konsekwencji pojęcia granicy funkcji w punkcie jest pojęcie pochodnej funkcji. W rozdziale tym podamy podstawowe charakteryzacje funkcji związane z pojęciem pochodnej.

Bardziej szczegółowo

1 Metody rozwiązywania równań nieliniowych. Postawienie problemu

1 Metody rozwiązywania równań nieliniowych. Postawienie problemu 1 Metody rozwiązywania równań nieliniowych. Postawienie problemu Dla danej funkcji ciągłej f znaleźć wartości x, dla których f(x) = 0. (1) 2 Przedział izolacji pierwiastka Będziemy zakładać, że równanie

Bardziej szczegółowo

1 Relacje i odwzorowania

1 Relacje i odwzorowania Relacje i odwzorowania Relacje Jacek Kłopotowski Zadania z analizy matematycznej I Wykazać, że jeśli relacja ρ X X jest przeciwzwrotna i przechodnia, to jest przeciwsymetryczna Zbadać czy relacja ρ X X

Bardziej szczegółowo

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa.

VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa. VII. Elementy teorii stabilności. Funkcja Lapunowa. 1. Stabilność w sensie Lapunowa. W rozdziale tym zajmiemy się dokładniej badaniem stabilności rozwiązań równania różniczkowego. Pojęcie stabilności w

Bardziej szczegółowo

Zdzisław Dzedzej. Politechnika Gdańska. Gdańsk, 2013

Zdzisław Dzedzej. Politechnika Gdańska. Gdańsk, 2013 Zdzisław Dzedzej Politechnika Gdańska Gdańsk, 2013 1 PODSTAWY 2 3 Definicja. Przestrzeń metryczna (X, d) jest zwarta, jeśli z każdego ciągu {x n } w X można wybrać podciąg zbieżny {x nk } w X. Ogólniej

Bardziej szczegółowo

Wykłady... b i a i. i=1. m(d k ) inf

Wykłady... b i a i. i=1. m(d k ) inf Wykłady... CŁKOWNIE FUNKCJI WIELU ZMIENNYCH Zaczniemy od konstrukcji całki na przedziale domkniętym. Konstrukcja ta jest, w gruncie rzeczy, powtórzeniem definicji całki na odcinku domkniętym w R 1. Przedziałem

Bardziej szczegółowo

Metoda Karusha-Kuhna-Tuckera

Metoda Karusha-Kuhna-Tuckera Badania operacyjne i teoria optymalizacji Poznań, 2015/2016 Plan 1 Sformułowanie problemu 2 3 Warunki ortogonalności 4 Warunki Karusha-Kuhna-Tuckera 5 Twierdzenia Karusha-Kuhna-Tuckera 6 Ograniczenia w

Bardziej szczegółowo

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie:

Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie: Ciągi rekurencyjne Zadanie 1 Znaleźć wzór ogólny i zbadać istnienie granicy ciągu określonego rekurencyjnie: w dwóch przypadkach: dla i, oraz dla i. Wskazówka Należy poszukiwać rozwiązania w postaci, gdzie

Bardziej szczegółowo

Matematyka i Statystyka w Finansach. Rachunek Różniczkowy

Matematyka i Statystyka w Finansach. Rachunek Różniczkowy Rachunek Różniczkowy Ciąg liczbowy Link Ciągiem liczbowym nieskończonym nazywamy każdą funkcję a która odwzorowuje zbiór liczb naturalnych N w zbiór liczb rzeczywistych R a : N R. Tradycyjnie wartość a(n)

Bardziej szczegółowo

Zadania do Rozdziału X

Zadania do Rozdziału X Zadania do Rozdziału X 1. 2. Znajdź wszystkie σ-ciała podzbiorów X, gdy X = (i) {1, 2}, (ii){1, 2, 3}. (b) Znajdź wszystkie elementy σ-ciała generowanego przez {{1, 2}, {2, 3}} dla X = {1, 2, 3, 4}. Wykaż,

Bardziej szczegółowo

Rozdział 4. Ciągi nieskończone. 4.1 Ciągi nieskończone

Rozdział 4. Ciągi nieskończone. 4.1 Ciągi nieskończone Rozdział 4 Ciągi nieskończone W rozdziale tym wprowadzimy pojęcie granicy ciągu. Dalej rozszerzymy to pojęcie na przypadek dowolnych funkcji. Jak zauważyliśmy we wstępie jest to najważniejsze pojęcie analizy

Bardziej szczegółowo

Zadania z analizy matematycznej - sem. I Pochodne funkcji, przebieg zmienności funkcji

Zadania z analizy matematycznej - sem. I Pochodne funkcji, przebieg zmienności funkcji Zadania z analizy matematycznej - sem. I Pochodne funkcji przebieg zmienności funkcji Definicja 1. Niech f : (a b) R gdzie a < b oraz 0 (a b). Dla dowolnego (a b) wyrażenie f() f( 0 ) = f( 0 + ) f( 0 )

Bardziej szczegółowo

Indukcja. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak

Indukcja. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak Indukcja Materiały pomocnicze do wykładu wykładowca: dr Magdalena Kacprzak Charakteryzacja zbioru liczb naturalnych Arytmetyka liczb naturalnych Jedną z najważniejszych teorii matematycznych jest arytmetyka

Bardziej szczegółowo

Dystrybucje, wiadomości wstępne (I)

Dystrybucje, wiadomości wstępne (I) Temat 8 Dystrybucje, wiadomości wstępne (I) Wielkości fizyczne opisujemy najczęściej przyporządkowując im funkcje (np. zależne od czasu). Inną drogą opisu tych wielkości jest przyporządkowanie im funkcjonałów

Bardziej szczegółowo

1 Nierówność Minkowskiego i Hoeldera

1 Nierówność Minkowskiego i Hoeldera 1 Nierówność Minkowskiego i Hoeldera Na państwa użytek załączam precyzyjne sformułowania i dowody nierówności Hoeldera i Minkowskiego: Twierdzenie 1.1 Nierówność Hoeldera). Niech p, q będą takimi liczbami

Bardziej szczegółowo

Optymalizacja ciągła

Optymalizacja ciągła Optymalizacja ciągła 5. Metody kierunków poparwy (metoda Newtona-Raphsona, metoda gradientów sprzężonych) Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 28.03.2019 1

Bardziej szczegółowo

WYKŁAD Z ANALIZY MATEMATYCZNEJ I. dr. Elżbieta Kotlicka. Centrum Nauczania Matematyki i Fizyki

WYKŁAD Z ANALIZY MATEMATYCZNEJ I. dr. Elżbieta Kotlicka. Centrum Nauczania Matematyki i Fizyki WYKŁAD Z ANALIZY MATEMATYCZNEJ I dr. Elżbieta Kotlicka Centrum Nauczania Matematyki i Fizyki http://im0.p.lodz.pl/~ekot Łódź 2006 Spis treści 1. CIĄGI LICZBOWE 2 1.1. Własności ciągów liczbowych o wyrazach

Bardziej szczegółowo

Zad.3. Jakub Trojgo i Jakub Wieczorek. 14 grudnia 2013

Zad.3. Jakub Trojgo i Jakub Wieczorek. 14 grudnia 2013 Zad.3 Jakub Trojgo i Jakub Wieczorek 14 grudnia 2013 W pierwszej części naszej pracy będziemy chcieli zbadać ciągłość funkcji f(x, y) w przypadku gdy płaszczyzna wyposażona jest w jedną z topologii: a)

Bardziej szczegółowo

Funkcja jednej zmiennej - przykładowe rozwiązania 1. Badając przebieg zmienności funkcji postępujemy według poniższego schematu:

Funkcja jednej zmiennej - przykładowe rozwiązania 1. Badając przebieg zmienności funkcji postępujemy według poniższego schematu: Funkcja jednej zmiennej - przykładowe rozwiązania Zadanie 4 c) Badając przebieg zmienności funkcji postępujemy według poniższego schematu:. Analiza funkcji: (a) Wyznaczenie dziedziny funkcji (b) Obliczenie

Bardziej szczegółowo

Zajęcia nr 1 (1h) Dwumian Newtona. Indukcja. Zajęcia nr 2 i 3 (4h) Trygonometria

Zajęcia nr 1 (1h) Dwumian Newtona. Indukcja. Zajęcia nr 2 i 3 (4h) Trygonometria Technologia Chemiczna 008/09 Zajęcia wyrównawcze. Pokazać, że: ( )( ) n k k l = ( n l )( n l k l Zajęcia nr (h) Dwumian Newtona. Indukcja. ). Rozwiązać ( ) ( równanie: ) n n a) = 0 b) 3 ( ) n 3. Znaleźć

Bardziej szczegółowo

Formy kwadratowe. Rozdział 10

Formy kwadratowe. Rozdział 10 Rozdział 10 Formy kwadratowe Rozważmy rzeczywistą macierz symetryczną A R n n Definicja 101 Funkcję h : R n R postaci h (x) = x T Ax (101) nazywamy formą kwadratową Macierz symetryczną A występującą w

Bardziej szczegółowo

1 Wartości własne oraz wektory własne macierzy

1 Wartości własne oraz wektory własne macierzy Rozwiązania zadania umieszczonego na końcu poniższych notatek proszę przynieść na kartkach Proszę o staranne i formalne uzasadnienie odpowiedzi Za zadanie można uzyskać do 6 punktów (jeżeli przyniesione

Bardziej szczegółowo

F t+ := s>t. F s = F t.

F t+ := s>t. F s = F t. M. Beśka, Całka Stochastyczna, wykład 1 1 1 Wiadomości wstępne 1.1 Przestrzeń probabilistyczna z filtracją Niech (Ω, F, P ) będzie ustaloną przestrzenią probabilistyczną i niech F = {F t } t 0 będzie rodziną

Bardziej szczegółowo

Wykład 10. Stwierdzenie 1. X spełnia warunek Borela wtedy i tylko wtedy, gdy każda scentrowana rodzina zbiorów domkniętych ma niepusty przekrój.

Wykład 10. Stwierdzenie 1. X spełnia warunek Borela wtedy i tylko wtedy, gdy każda scentrowana rodzina zbiorów domkniętych ma niepusty przekrój. Wykład 10 Twierdzenie 1 (Borel-Lebesgue) Niech X będzie przestrzenią zwartą Z każdego pokrycia X zbiorami otwartymi można wybrać podpokrycie skończone Dowód Lemat 1 Dla każdego pokrycia U przestrzeni ośrodkowej

Bardziej szczegółowo

Z52: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania, zagadnienie brzegowe.

Z52: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania, zagadnienie brzegowe. Z5: Algebra liniowa Zagadnienie: Zastosowania algebry liniowej Zadanie: Operatory różniczkowania zagadnienie brzegowe Dyskretne operatory różniczkowania Numeryczne obliczanie pochodnych oraz rozwiązywanie

Bardziej szczegółowo

1 Zbiory. 1.1 Kiedy {a} = {b, c}? (tzn. podać warunki na a, b i c) 1.2 Udowodnić, że A {A} A =.

1 Zbiory. 1.1 Kiedy {a} = {b, c}? (tzn. podać warunki na a, b i c) 1.2 Udowodnić, że A {A} A =. 1 Zbiory 1.1 Kiedy {a} = {b, c}? (tzn. podać warunki na a, b i c) 1.2 Udowodnić, że A {A} A =. 1.3 Pokazać, że jeśli A, B oraz (A B) (B A) = C C, to A = B = C. 1.4 Niech {X t } będzie rodziną niepustych

Bardziej szczegółowo

SIMR 2016/2017, Analiza 2, wykład 1, Przestrzeń wektorowa

SIMR 2016/2017, Analiza 2, wykład 1, Przestrzeń wektorowa SIMR 06/07, Analiza, wykład, 07-0- Przestrzeń wektorowa Przestrzeń wektorowa (liniowa) - przestrzeń (zbiór) w której określone są działania (funkcje) dodawania elementów i mnożenia elementów przez liczbę

Bardziej szczegółowo

Krzywa uniwersalna Sierpińskiego

Krzywa uniwersalna Sierpińskiego Krzywa uniwersalna Sierpińskiego Małgorzata Blaszke Karol Grzyb Streszczenie W niniejszej pracy omówimy krzywą uniwersalną Sierpińskiego, zwaną również dywanem Sierpińskiego. Pokażemy klasyczną metodę

Bardziej szczegółowo

n=0 Dla zbioru Cantora prawdziwe są wersje lematu 3.6 oraz lematu 3.8 przy założeniu α = :

n=0 Dla zbioru Cantora prawdziwe są wersje lematu 3.6 oraz lematu 3.8 przy założeniu α = : 4. Zbiory borelowskie. Zbiór wszystkich podzbiorów liczb naturalnych będziemy oznaczali przez ω. Najmniejszą topologię na zbiorze ω, w której zbiory {A ω : x A ω \ y}, gdzie x oraz y są zbiorami skończonymi,

Bardziej szczegółowo

KADD Minimalizacja funkcji

KADD Minimalizacja funkcji Minimalizacja funkcji Poszukiwanie minimum funkcji Foma kwadratowa Metody przybliżania minimum minimalizacja Minimalizacja w n wymiarach Metody poszukiwania minimum Otaczanie minimum Podział obszaru zawierającego

Bardziej szczegółowo

Rachunek różniczkowy i całkowy w przestrzeniach R n

Rachunek różniczkowy i całkowy w przestrzeniach R n Rachunek różniczkowy i całkowy w przestrzeniach R n Na dzisiejszym wykładzie rozważać będziemy funkcje f : R m R n Każda taka funkcję f można przedstawić jako wektor funkcji (f 1, f 2,, f n ), gdzie każda

Bardziej szczegółowo

22 Pochodna funkcji definicja

22 Pochodna funkcji definicja 22 Pochodna funkcji definicja Rozważmy funkcję f : (a, b) R, punkt x 0 b = +. (a, b), dopuszczamy również a = lub Definicja 33 Mówimy, że funkcja f jest różniczkowalna w punkcie x 0, gdy istnieje granica

Bardziej szczegółowo

Układy równań i nierówności liniowych

Układy równań i nierówności liniowych Układy równań i nierówności liniowych Wiesław Krakowiak 1 grudnia 2010 1 Układy równań liniowych DEFINICJA 11 Układem równań m liniowych o n niewiadomych X 1,, X n, nazywamy układ postaci: a 11 X 1 + +

Bardziej szczegółowo

domykanie relacji, relacja równoważności, rozkłady zbiorów

domykanie relacji, relacja równoważności, rozkłady zbiorów 1 of 8 2012-03-28 17:45 Logika i teoria mnogości/wykład 5: Para uporządkowana iloczyn kartezjański relacje domykanie relacji relacja równoważności rozkłady zbiorów From Studia Informatyczne < Logika i

Bardziej szczegółowo

Agata Boratyńska ZADANIA Z MATEMATYKI, I ROK SGH GRANICA CIĄGU

Agata Boratyńska ZADANIA Z MATEMATYKI, I ROK SGH GRANICA CIĄGU Agata Boratyńska Zadania z matematyki Agata Boratyńska ZADANIA Z MATEMATYKI, I ROK SGH GRANICA CIĄGU. Korzystając z definicji granicy ciągu udowodnić: a) n + n+ = 0 b) n + n n+ = c) n + n a =, gdzie a

Bardziej szczegółowo

jest ciągiem elementów z przestrzeni B(R, R)

jest ciągiem elementów z przestrzeni B(R, R) Wykład 2 1 Ciągi Definicja 1.1 (ciąg) Ciągiem w zbiorze X nazywamy odwzorowanie x: N X. Dla uproszczenia piszemy x n zamiast x(n). Przykład 1. x n = n jest ciągiem elementów z przestrzeni R 2. f n (x)

Bardziej szczegółowo

Topologia - Zadanie do opracowania. Wioletta Osuch, Magdalena Żelazna, Piotr Kopyrski

Topologia - Zadanie do opracowania. Wioletta Osuch, Magdalena Żelazna, Piotr Kopyrski Topologia - Zadanie do opracowania Wioletta Osuch, Magdalena Żelazna, Piotr Kopyrski 5 grudnia 2013 Zadanie 1. (Topologie na płaszczyźnie) Na płaszczyźnie R 2 rozważmy następujące topologie: a) Euklidesową

Bardziej szczegółowo

A i. i=1. i=1. i=1. i=1. W dalszej części skryptu będziemy mieli najczęściej do czynienia z miarami określonymi na rodzinach, które są σ - algebrami.

A i. i=1. i=1. i=1. i=1. W dalszej części skryptu będziemy mieli najczęściej do czynienia z miarami określonymi na rodzinach, które są σ - algebrami. M. Beśka, Wstęp do teorii miary, rozdz. 3 25 3 Miara 3.1 Definicja miary i jej podstawowe własności Niech X będzie niepustym zbiorem, a A 2 X niepustą rodziną podzbiorów. Wtedy dowolne odwzorowanie : A

Bardziej szczegółowo

Metody numeryczne I Równania nieliniowe

Metody numeryczne I Równania nieliniowe Metody numeryczne I Równania nieliniowe Janusz Szwabiński szwabin@ift.uni.wroc.pl Metody numeryczne I (C) 2004 Janusz Szwabiński p.1/66 Równania nieliniowe 1. Równania nieliniowe z pojedynczym pierwiastkiem

Bardziej szczegółowo

Metoda mnożników Lagrange a i jej zastosowania w ekonomii

Metoda mnożników Lagrange a i jej zastosowania w ekonomii Maciej Grzesiak Metoda mnożników Lagrange a i jej zastosowania w ekonomii 1 Metoda mnożników Lagrange a znajdowania ekstremum warunkowego Pochodna kierunkowa i gradient Dla prostoty ograniczymy się do

Bardziej szczegółowo

1. Funkcje monotoniczne, wahanie funkcji.

1. Funkcje monotoniczne, wahanie funkcji. 1. Funkcje monotoniczne, wahanie funkcji. Zbiór X będziemy nazywali uporządkowanym, jeśli określona jest relacja zawarta w produkcie kartezjańskim X X, która jest spójna, antysymetryczna i przechodnia.

Bardziej szczegółowo

Informacja o przestrzeniach Hilberta

Informacja o przestrzeniach Hilberta Temat 10 Informacja o przestrzeniach Hilberta 10.1 Przestrzenie unitarne, iloczyn skalarny Niech dana będzie przestrzeń liniowa X. Załóżmy, że każdej parze elementów x, y X została przyporządkowana liczba

Bardziej szczegółowo

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne.

Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne. Wykład Matematyka A, I rok, egzamin ustny w sem. letnim r. ak. 2002/2003. Każdy zdający losuje jedno pytanie teoretyczne i jedno praktyczne. pytania teoretyczne:. Co to znaczy, że wektory v, v 2 i v 3

Bardziej szczegółowo

Dystrybucje. Marcin Orchel. 1 Wstęp Dystrybucje Pochodna dystrybucyjna Przestrzenie... 5

Dystrybucje. Marcin Orchel. 1 Wstęp Dystrybucje Pochodna dystrybucyjna Przestrzenie... 5 Dystrybucje Marcin Orchel Spis treści 1 Wstęp 1 1.1 Dystrybucje................................... 1 1.2 Pochodna dystrybucyjna............................ 3 1.3 Przestrzenie...................................

Bardziej szczegółowo

Przykładami ciągów, które Czytelnik dobrze zna (a jeśli nie, to niniejszym poznaje), jest ciąg arytmetyczny:

Przykładami ciągów, które Czytelnik dobrze zna (a jeśli nie, to niniejszym poznaje), jest ciąg arytmetyczny: Podstawowe definicje Definicja ciągu Ciągiem nazywamy funkcję na zbiorze liczb naturalnych, tzn. przyporządkowanie każdej liczbie naturalnej jakiejś liczby rzeczywistej. (Mówimy wtedy o ciągu o wyrazach

Bardziej szczegółowo

zbiorów domkniętych i tak otrzymane zbiory domknięte ustawiamy w ciąg. Oznaczamy

zbiorów domkniętych i tak otrzymane zbiory domknięte ustawiamy w ciąg. Oznaczamy 5. Funkcje 1 klasy Baire a. Pod koniec XIX i początkiem XX wieku kilku matematyków zajmowało się problemami dotyczącymi klasyfikacji funkcji borelowskich: między innymi R. Baire, E. Borel, H. Lebesgue

Bardziej szczegółowo

Informacja o przestrzeniach Sobolewa

Informacja o przestrzeniach Sobolewa Wykład 11 Informacja o przestrzeniach Sobolewa 11.1 Definicja przestrzeni Sobolewa Niech R n będzie zbiorem mierzalnym. Rozważmy przestrzeń Hilberta X = L 2 () z iloczynem skalarnym zdefiniowanym równością

Bardziej szczegółowo

Funkcje wielu zmiennych

Funkcje wielu zmiennych Funkcje wielu zmiennych Wykresy i warstwice funkcji wielu zmiennych. Granice i ciagłość funkcji wielu zmiennych. Pochodne czastkowe funkcji wielu zmiennych. Gradient. Pochodna kierunkowa. Różniczka zupełna.

Bardziej szczegółowo

III. Funkcje rzeczywiste

III. Funkcje rzeczywiste . Pojęcia podstawowe Załóżmy, że dane są dwa niepuste zbiory X i Y. Definicja. Jeżeli każdemu elementowi x X przyporządkujemy dokładnie jeden element y Y, to mówimy, że na zbiorze X została określona funkcja

Bardziej szczegółowo

Uzupełnienia dotyczące zbiorów uporządkowanych (3 lutego 2011).

Uzupełnienia dotyczące zbiorów uporządkowanych (3 lutego 2011). Uzupełnienia dotyczące zbiorów uporządkowanych (3 lutego 2011). Poprzedniczka tej notatki zawierała błędy! Ta pewnie zresztą też ; ). Ćwiczenie 3 zostało zmienione, bo żądałem, byście dowodzili czegoś,

Bardziej szczegółowo

Wykłady ostatnie. Rodzinę P podzbiorów przestrzeni X nazywamy σ - algebrą, jeżeli dla A, B P (2) A B P, (3) A \ B P,

Wykłady ostatnie. Rodzinę P podzbiorów przestrzeni X nazywamy σ - algebrą, jeżeli dla A, B P (2) A B P, (3) A \ B P, Wykłady ostatnie CAŁKA LBSGU A Zasadnicza różnica koncepcyjna między całką Riemanna i całką Lebesgue a polega na zamianie ról przestrzeni wartości i przestrzeni argumentów przy konstrukcji sum górnych

Bardziej szczegółowo

Konstrukcja liczb rzeczywistych przy pomocy ciągów Cauchy ego liczb wymiernych

Konstrukcja liczb rzeczywistych przy pomocy ciągów Cauchy ego liczb wymiernych Konstrukcja liczb rzeczywistych przy pomocy ciągów Cauchy ego liczb wymiernych Marcin Michalski 14.11.014 1 Wprowadzenie Jedną z intuicji na temat liczb rzeczywistych jest myślenie o nich jako liczbach,

Bardziej szczegółowo

Zasada indukcji matematycznej

Zasada indukcji matematycznej Zasada indukcji matematycznej Twierdzenie 1 (Zasada indukcji matematycznej). Niech ϕ(n) będzie formą zdaniową zmiennej n N 0. Załóżmy, że istnieje n 0 N 0 takie, że 1. ϕ(n 0 ) jest zdaniem prawdziwym,.

Bardziej szczegółowo

O geometrii semialgebraicznej

O geometrii semialgebraicznej Inauguracja roku akademickiego 2018/2019 na Wydziale Matematyki i Informatyki Uniwersytetu Łódzkiego O geometrii semialgebraicznej Stanisław Spodzieja Łódź, 28 września 2018 Wstęp Rozwiązywanie równań

Bardziej szczegółowo

Maciej Grzesiak. Optymalizacja

Maciej Grzesiak. Optymalizacja Maciej Grzesiak Optymalizacja Oznaczenia. Część pojęć i twierdzeń jest formułowana dla ogólnej przestrzeni liniowej V. Jeśli jest ona skończenie wymiarowa, tzn. V = R n dla pewnego n, to wektory traktujemy

Bardziej szczegółowo

Metody Rozmyte i Algorytmy Ewolucyjne

Metody Rozmyte i Algorytmy Ewolucyjne mgr inż. Wydział Matematyczno-Przyrodniczy Szkoła Nauk Ścisłych Uniwersytet Kardynała Stefana Wyszyńskiego Podstawy optymalizacji Plan prezentacji 1 Podstawy matematyczne 2 3 Eliminacja ograniczeń Metody

Bardziej szczegółowo

Wykład 1. Na początku zajmować się będziemy zbiorem liczb całkowitych

Wykład 1. Na początku zajmować się będziemy zbiorem liczb całkowitych Arytmetyka liczb całkowitych Wykład 1 Na początku zajmować się będziemy zbiorem liczb całkowitych Z = {0, ±1, ±2,...}. Zakładamy, że czytelnik zna relację

Bardziej szczegółowo

WYKŁADY Z MATEMATYKI DLA STUDENTÓW UCZELNI EKONOMICZNYCH

WYKŁADY Z MATEMATYKI DLA STUDENTÓW UCZELNI EKONOMICZNYCH WYKŁADY Z MATEMATYKI DLA STUDENTÓW UCZELNI EKONOMICZNYCH Pod redakcją Anny Piweckiej Staryszak Autorzy poszczególnych rozdziałów Anna Piwecka Staryszak: 2-13; 14.1-14.6; 15.1-15.4; 16.1-16.3; 17.1-17.6;

Bardziej szczegółowo

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne.

Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne. Funkcje wymierne. Funkcja homograficzna. Równania i nierówności wymierne. Funkcja homograficzna. Definicja. Funkcja homograficzna jest to funkcja określona wzorem f() = a + b c + d, () gdzie współczynniki

Bardziej szczegółowo

7 Twierdzenie Fubiniego

7 Twierdzenie Fubiniego M. Beśka, Wstęp do teorii miary, wykład 7 19 7 Twierdzenie Fubiniego 7.1 Miary produktowe Niech i będą niepustymi zbiorami. Przez oznaczmy produkt kartezjański i tj. zbiór = { (x, y : x y }. Niech E oraz

Bardziej szczegółowo

Rachunek różniczkowy funkcji dwóch zmiennych

Rachunek różniczkowy funkcji dwóch zmiennych Rachunek różniczkowy funkcji dwóch zmiennych Definicja Spis treści: Wykres Ciągłość, granica iterowana i podwójna Pochodne cząstkowe Różniczka zupełna Gradient Pochodna kierunkowa Twierdzenie Schwarza

Bardziej szczegółowo

KADD Minimalizacja funkcji

KADD Minimalizacja funkcji Minimalizacja funkcji n-wymiarowych Forma kwadratowa w n wymiarach Procedury minimalizacji Minimalizacja wzdłuż prostej w n-wymiarowej przestrzeni Metody minimalizacji wzdłuż osi współrzędnych wzdłuż kierunków

Bardziej szczegółowo

Optymalizacja ciągła

Optymalizacja ciągła Optymalizacja ciągła 4. Metody kierunków poprawy (metoda spadku wzdłuż gradientu) Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 21.03.2019 1 / 41 Plan wykładu Minimalizacja

Bardziej szczegółowo

Zadania optymalizacyjne w szkole ponadgimnazjalnej. Materiały do przedmiotu Metodyka Nauczania Matematyki 2 (G-PG). Prowadzący dr Andrzej Rychlewicz

Zadania optymalizacyjne w szkole ponadgimnazjalnej. Materiały do przedmiotu Metodyka Nauczania Matematyki 2 (G-PG). Prowadzący dr Andrzej Rychlewicz Zadania optymalizacyjne w szkole ponadgimnazjalnej. Materiały do przedmiotu Metodyka Nauczania Matematyki 2 G-PG). Prowadzący dr Andrzej Rychlewicz Przeanalizujmy następujące zadanie. Zadanie. próbna matura

Bardziej szczegółowo