Repetytorium z przedmiotu MIARA I PRAWDOPODOBIEŃSTWO dla kierunku Informatyka 2001/2002 Adam Jakubowski Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Toruń, 2002
Spis treści Wstęp 1 1 Całka w sensie Lebesgue a i całkowanie ciągów funkcyjnych 3 Przestrzenie z miarą...................... 3 Funkcje mierzalne........................ 8 Definicja całki według Lebesgue a............. 10 Całkowanie ciągów funkcyjnych............... 12 2 Zagadnienie istnienia i jednoznaczności przedłużenia miar 17 Zagadnienie przedłużenia miary............... 17 Konstrukcja Caratheodory ego............... 18 Jednoznaczność rozszerzenia................. 19 Struktura F µ........................... 21 Miara Lebesgue a na IR 1.................... 21 Produkt miar i miara Lebesgue a na IR d.......... 22 Twierdzenie Fubiniego i twierdzenie o zmianie zmiennych 24 3 Przestrzenie funkcyjne i rodzaje zbieżności funkcji mierzalnych 27 Przestrzenie funkcji całkowalnych............. 27 Rodzaje zbieżności funkcji mierzalnych i relacje między nimi............................. 30 Gęstość funkcji gładkich w L p (IR d )............. 31 4 Formalizm teorii prawdopodobieństwa i częstościowa interpretacja prawdopodobieństwa 33 Charakterystyki zmiennych losowych........... 33 Klasyfikacja rozkładów na prostej............. 35 Rozkłady wielowymiarowe i niezależność stochastyczna 38 Charakterystyki wektorów losowych........... 42 Prawa wielkich liczb...................... 44 Literatura 47
ii Spis treści
Wstęp Niniejsze Repetytorium nie jest ani skryptem ani tym bardziej podręcznikiem i nie może być traktowane jako źródło wiedzy w oderwaniu od semestralnego wykładu przedmiotu Miara i prawdopodobieństwo dla kierunku Informatyka. Należy podkreślić, że program przedmiotu Miara i prawdopodobieństwo dla kierunku Informatyka jest istotnie różny od programu tego przedmiotu dla kierunku Matematyka. Repetytorium pomyślane jest jako pomoc w przygotowaniu się do egzaminu ustnego. Repetytorium zawiera wszystkie definicje i sformułowania faktów i twierdzeń wymagane na egzaminie po semestrze zimowym roku akademickiego 2001/2002. W trakcie wykładu zasygnalizowałem, że znajomość niektórych dowodów nie będzie konieczna podczas egzaminu. Twierdzenia, fakty i lematy, które należy opanować wraz z dowodami, oznaczone są napisem Szczególną uwagę należy poświęcić rozwiązaniu zadań i wyjaśnieniu przykładów umieszczonych w Repetytorium. Adam Jakubowski 1
2 Wstęp
1. Całka w sensie Lebesgue a i całkowanie ciągów funkcyjnych Przestrzenie z miarą 1.1 Definicja σ-algebrą podzbiorów zbioru Ω nazywamy rodzinę F 2 Ω spełniającą następujące warunki. S0), Ω F. S1) Jeżeli A F, to również A c F. S2) Jeżeli A 1, A 2,... F, to j=1 A j F. 1.2 Definicja Przestrzenią mierzalną nazywamy parę (Ω, F), gdzie Ω jest niepustym zbiorem, a F jest σ-algebrą podzbiorów zbioru Ω. 1.3 Definicja Niech (Ω, F) będzie przestrzenią mierzalną i niech Ω 0 Ω. Niech F Ω 0 = {A Ω 0 ; A F}. Parę (Ω 0, F Ω 0 ) nazywamy podprzestrzenią mierzalną przestrzeni (Ω, F). 1.4 Przykłady 1. F = 2 Ω, F = {, Ω}. 2. Niech R = {A 1, A 2,..., A n } - skończone rozbicie przestrzeni Ω, tj. Ω = n j=1 A j i zbiory A j są parami rozłączne: A i A j =, jeśli i j. Wtedy F = {sumy rozłączne elementów rozbicia R} jest σ-algebrą. 3. Niech {F i ; i II} będzie rodziną σ-algebr podzbiorów zbioru Ω. Wówczas F = i II F i jest σ-algebrą. 4. Niech C 2 Ω będzie klasą zbiorów. Wówczas przekrój wszystkich σ- algebr podzbiorów Ω zawierających klasę C jest σ-algebrą. Nazywamy ją σ-algebrą generowaną przez klasę C i oznaczamy symbolem σ(c). 1.5 Definicja Podzbiory borelowskie IR 1 to elementy σ-algebry generowanej przez podzbiory otwarte (równoważnie: domknięte) prostej. σ-algebrę zbiorów borelowskich oznaczamy symbolem B 1. 3
4 1. Całka w sensie Lebesgue a 1.6 Fakt Niech S 1 = {(, a] ; a IR 1 }, I 1 = {(a, b] ; a < b, a, b IR 1 }. Wtedy B 1 = σ(s 1 ) = σ(i 1 ). 1.7 Zadanie Pokazać, że Fakt 1.6 pozostaje prawdziwy, jeśli klasę S 1 zastąpić przez C = {(, q] ; q Q}. 1.8 Uwaga Nie można w prosty sposób opisać struktury zbiorów borelowskich, np. jako przeliczalne sumy przeliczalnych przekrojów zbiorów otwartych i domkniętych.... Wiadomo jednak, że zbiorów borelowskich jest istotnie mniej niż wszystkich podzbiorów prostej: tylko kontinuum c. 1.9 Definicja Algebrą Boole a zbiorów nazywamy rodzinę A spełniającą następujące warunki. A0), Ω A. A1) Jeżeli A A, to również A c A. A2) Jeżeli A, B A, to A B F. Najmniejszą algebrę zawierającą daną klasę zbiorów C nazywamy algebrą generowaną przez klasę C i oznaczamy przez a(c). 1.10 Zadanie Niech C będzie rodziną podzbiorów zbioru Ω. Określamy kolejne klasy pochodne. C 1 = C {, Ω} {C c ; C C}. C 2 = { skończone przekroje zbiorów z klasy C 1 }. C 3 = {sumy skończone rozłąćznych elementów z klasy C 2 }. Pokazać, że C 3 = a(c). 1.11 Wniosek Jeżeli C jest skończona, to a(c) jest skończona. Jeżeli C jest przeliczalna, to a(c) jest przeliczalna. 1.12 Umowa IR + = {x IR 1 ; x 0}. IR + = IR + {+ }. Niech a IR +. Rozszerzamy zwykłe działania na zbiór IR +. 0 + = 0, a + = +, a 0, + + a = +, + a = +, a +.
Przestrzenie z miarą 5 1.13 Umowa Niech A 1, A 2,... Ω. Operacja j A j określona jest tylko dla zbiorów parami rozłącznych i oznacza zwykła sumę j A j. 1.14 Definicja Niech (Ω, F) będzie przestrzenią mierzalną. Miarą na (Ω, F) nazywamy funkcję µ : F IR + spełniającą następujące warunki. M0) µ( ) = 0. M1) Jeżeli A 1, A 2,... F są parami rozłączne, to (własność σ-addytywności miary). µ( A j ) = µ(a j ). j=1 j=1 1.15 Uwaga Jeżeli istnieje zbiór A 0 F o mierze skończonej: µ(a 0 ) < +, to M0 wynika z M1. 1.16 Definicja Miarę µ nazywamy probabilistyczną lub unormowaną, jeśli µ(ω) = 1. 1.17 Definicja Miara µ jest skończona, jeśli µ(ω) < +. 1.18 Definicja Miara µ jest σ-skończona, jeśli istnieją zbiory A 1, A 2,... F, takie że Ω = j=1 A j i µ(a j ) < +, j = 1, 2,.... 1.19 Przykłady 1. Niech Ω 0 Ω i niech F = 2 Ω. Określamy miarę liczącą elementy zbioru Ω 0 wzorem µ(a) = { #A Ω0 jeśli jest to zbiór skończony, + w przeciwnym przypadku. 2. Niech Ω 0 = {ω 1, ω 2,...} będzie podzbiorem przeliczalnym zbioru Ω. Niech p 1, p 2,... IR +. Określamy (Z definicji 0). µ(a) = {j ; ω j A} 1.20 Zadanie Obie funkcje określone powyżej sa miarami. Kiedy są one miarami probabilistycznymi, skończonymi, σ-skończonymi? p j.
6 1. Całka w sensie Lebesgue a 1.21 Definicja Trójkę (Ω, F, µ), gdzie (Ω, F) jest przestrzenią mierzalną, a µ jest miarą na (Ω, F), nazywamy przestrzenią z miarą. 1.22 Definicja Skończenie addytywną nazywamy funkcję µ : F IR + spełniającą następujące warunki. FM0) µ( ) = 0. FM1) Jeżeli A, B F są rozłączne, to µ(a B) = µ(a) + µ(b). 1.23 Fakt Funkcja addytywna µ na F ma następujące własności: 1. Jeżeli A, B F, A B, to µ(a) µ(b). 2. Jeżeli A, B F, A B i µ(a) < +, to µ(b \ A) = µ(b) µ(a). 3. Jeżeli A 1, A 2,..., A n F są parami rozłączne, to 4. Dla dowolnych A 1, A 2,..., A n F (Własność subaddytywności). n n µ( A j ) = µ(a j ). j=1 j=1 n n µ( A j ) µ(a j ). j=1 j=1 5. Jeżeli µ(ω) < +, to dla dowolnych A 1, A 2,..., A n F n n µ( A j ) = µ(a j ) j=1 j=1 µ(a i A j ) 1 i<j n + µ(a i A j A k ) 1 i<j<k n... + ( 1) n+1 µ(a 1 A 2... A n ). 6. Jeżeli A 1, A 2,... F są parami rozłączne, to µ(a j ) µ( A j ). j=1 j=1 (Własność super-σ-addytywności).
Przestrzenie z miarą 7 1.24 Fakt Niech µ : F IR + będzie funkcją addytywną. Następujące warunki są równoważne: (i) µ jest miarą. (ii) µ jest sub-σ-addytywna, tzn. dla dowolnych A 1, A 2,... F µ( A j ) µ(a j ). j=1 j=1 (iii) µ jest ciągła z dołu, tzn. jeżeli zbiory A 1, A 2,... F są wstępujące: A 1 A 2..., to µ( A j ) = lim µ(a j ). j j=1 1.25 Fakt Niech µ : F IR + będzie miarą. Wówczas µ jest ciągła z góry, tzn. jeżeli zbiory A 1, A 2,... F są zstępujące: A 1 A 2... i od pewnego miejsca mają miary skończone (µ(a j ) < + dla j j 0 ), to µ( j=1 A j ) = lim µ(a j ). j 1.26 Zadanie Podać przykład przestrzeni z miarą i zstępującego ciągu zbiorów A j, dla którego lim j µ(a j ) > µ( j=1 A j ). 1.27 Fakt Niech µ : F IR + będzie skończoną funkcją addytywną (µ(ω) < + ). Następujące warunki są równoważne: (i) µ jest miarą. (ii) µ jest ciągła z góry. (iii) µ jest ciągła z góry na zbiorze pustym, tzn. jeżeli zbiory A 1, A 2,... F są zstępujące: A 1 A 2... i j=1 A j =, to lim µ(a j ) = 0. j
8 1. Całka w sensie Lebesgue a Funkcje mierzalne 1.28 Definicja Funkcję f : (Ω, F) IR 1 nazywamy mierzalną, jeśli dla każdego a IR 1 {f a} = {ω ; f(ω) a} F. 1.29 Definicja Mierzalną funkcję f : (IR 1, B 1 ) B 1 nazywamy funkcją borelowską. 1.30 Fakt Funkcja f : (Ω, F) IR 1 jest mierzalna wtedy, i tylko wtedy, gdy dla każdego B B 1 f 1 (B) F, tzn. f 1 (B 1 ) F. A w dowodzie: 1.31 Lemat f 1 (σ(c)) = σ(f 1 (C)). 1.32 Fakt Funkcja na (Ω, F) przyjmująca przeliczalny zbiór wartości jest mierzalna dokładnie wtedy, gdy dla każdego x IR 1 f 1 ({x}) F. W szczególności, funkcja charakterystyczna zbioru A Ω, określona wzorem { 1 jeśli ω A; I A (ω) = 0 jeśli ω A, jest mierzalna, wtedy i tylko wtedy, gdy A F. 1.33 Uwaga Często spotykane są również inne oznaczenia funkcji charakterystycznej zbioru A, np. I(A), 1I A lub χ A. 1.34 Zadanie Każda funkcja niemalejąca określona na IR 1 jest borelowska. 1.35 Zadanie Każda funkcja ciągła określona na IR 1 jest borelowska. 1.36 Zadanie Suma, różnica, iloczyn itp. funkcji mierzalnych jest funkcją mierzalną. 1.37 Definicja Określamy prostą rozszerzoną IR 1 = IR 1 {, + }, B 1 = σ(b 1, { }, {+ }). W rozszerzonej prostej określamy w naturalny sposób działania (np. 0 ( ) = 0 (+ ) = 0), z wyjątkiem operacji + (+ ) i + + ( ) itp., które pozostają symbolami nieoznaczonymi.
Funkcje mierzalne 9 1.38 Wniosek Odwzorowanie f : (Ω, F) IR 1 jest mierzalne dokładnie wtedy, gdy {f a} F dla każdego a IR 1. (Takie odwzorowanie nazywamy funkcją mierzalną numeryczną.) 1.39 Wniosek Niech f 1, f 2,... będzie ciągiem mierzalnych funkcji numerycznych określonych na (Ω, F). Funkcje numeryczne (sup n są mierzalne. f n )(ω) := sup{f n (ω) ; n IN}, (inf f n )(ω) := inf{f n (ω) ; n IN}, n 1.40 Wniosek Funkcje numeryczne (lim inf n są mierzalne. f n )(ω) := lim inf n f n (ω), (lim sup n f n )(ω) := lim sup f n (ω), n 1.41 Wniosek Granica punktowa ciągu mierzalnych funkcji numerycznych jest mierzalną funkcją numeryczną. 1.42 Definicja Funkcję mierzalną nazywamy prostą, jeśli przyjmuje skończenie wiele wartości. 1.43 Wniosek Funkcja f : (Ω, F) (IR 1, B 1 ) jest prosta dokładnie wtedy, gdy istnieją liczby x 1, x 2,..., x m takie, że f 1 ({x j }) F, j = 1, 2,..., m, oraz m f(ω) = x j I f 1 ({x j })(ω). j=1 1.44 Wniosek Każda funkcja postaci m j=1 a j I Aj, gdzie A j F i a j IR 1 jest funkcja prostą. 1.45 Uwaga Rozważmy następujący przykład. Niech A, B F, A B i niech a b, b i a, b 0. Wówczas f = ai A + bi B = ai A\B + (a + b)i A B + bi B\A + 0I (A B) c. Funkcja prosta może więc posiadać wiele reprezentacji postaci m j=1 a j I Aj.
10 1. Całka w sensie Lebesgue a 1.46 Twierdzenie Jeżeli f : (Ω, F) (IR 1, B 1 ) jest funkcja mierzalną, to istnieje ciąg f n funkcji prostych punktowo zbieżny do f. Jeżeli f jest nieujemna, to istnieje monotoniczny ciąg nieujemnych funkcji prostych punktowo zbieżny do f (0 f n f). Jeżeli f jest ograniczona, to istnieje ciąg funkcji prostych jednostajnie zbieżny do f. Definicja całki według Lebesgue a 1.47 Definicja Niech f : (Ω, F) (IR 1, B 1 ) będzie funkcją numeryczną i niech µ będzie miarą na (Ω, F). Będziemy określać całkę w sensie Lebesgue a funkcji f względem miary µ stopniowo, w kolejnych krokach rozszerzając definicje całki na coraz obszerniejsze klasy funkcji. Innymi słowy, całkę będziemy definiować przez indukcję mierzalną. Krok 1. Jeżeli f jest funkcją charakterystyczną zbioru, tzn. f = I A, A F, to f dµ := µ(a). Krok 2. Jeżeli f jest nieujemną funkcją prostą, tzn. f = m j=1 a j I Aj, a j 0, A j F, j = 1, 2,..., m, to m f dµ := a j µ(a j ). j=1 Uwaga: trzeba pokazać, że definicja nie zależy od reprezentacji funkcji prostej. Krok 3. Jeżeli f jest nieujemną funkcja numeryczną, to f dµ := sup{ s dµ ; 0 s f, s- funkcja prosta }. Krok 4. Niech f + (ω) = max{f(ω), 0} i f (ω) = max{ f(ω), 0}. Jeżeli f + dµ < + lub f dµ < +, to f dµ := f + dµ f dµ ( IR 1 ). 1.48 Definicja Mówimy, że funkcja numeryczna f jest całkowalna, jeśli f + dµ < + i f dµ < + (równoważnie: f dµ < + ). W takim przypadku f dµ IR 1.
Definicja całki 11 1.49 Twierdzenie Całka z numerycznych funkcji nieujemnych ma następujące własności. 1. Jeżeli 0 f g, to f dµ g dµ. 2. Jeżeli f 0, to f dµ = 0 wtedy i tylko wtedy, gdy µ{f > 0} = 0. 3. Jeżeli f, g 0 i a, b IR +, to (af + bg) dµ = a f dµ + b g dµ. 4. Jeżeli f 0, to funkcja zbioru F A A f dµ := fi A dµ jest miarą na (Ω, F). 1.50 Twierdzenie Całka z numerycznych funkcji całkowalnych ma następujące własności. 1. Jeżeli f jest całkowalna, to µ{ f = + } = 0. 2. Jeżeli f, g są całkowalne i a, b IR 1, to całkowalna jest funkcja af +bg i ma miejsce równość (af + bg) dµ = a f dµ + b g dµ. 3. Jeżeli f jest całkowalna, to funkcja zbioru F A f dµ := A fi A dµ jest σ-addytywna na F. 1.51 Uwaga O całkowaniu funkcji o wartościach zespolonych. Jeśli zauważyć, że można utożsamić C z IR 2, mierzalność funkcji f : (Ω, F) (C, B C ) oznacza jednoczesną mierzalność części rzeczywistej Rf i części urojonej If. Z definicji, f : (Ω, F) (C, B C ) jest całkowalna, jeśli całkowalne są Rf i If, i wtedy f dµ := Rf dµ + i If dµ. Można pokazać, że tak określona całka ma zwykłe własności, tzn. jest liniowa i f dµ f dµ.
12 1. Całka w sensie Lebesgue a 1.52 Uwaga Niech f i g będą funkcjami numerycznymi na (Ω, F). Oznaczmy N f = {ω ; f(ω) = + }, N g = {ω ; g(ω) = + }. Jeżeli f i g są całkowalne, to na mocy Twierdzenia 1.50, p. 1, µ(n f ) = µ(n g ) = 0. Wynika stąd, że na zbiorze N f N g suma f + g może nie być określona (np. może być postaci + + ( )). Jest jednak określona µ-prawie wszędzie, tzn. wszędzie poza zbiorem miary µ zero. 1.53 Definicja Mówimy,że pewna własność (np. równość dwóch funkcji lub skończoność wartości funkcji) ma miejsce µ-prawie wszędzie, jeśli istnieje zbiór N F, µ(n) = 0, taki że rozważana własność ma miejsce już dla wszystkich ω / N. (Np. f n f 0 µ-prawie wszędzie, jeśli istnieje zbiór Ω 0 F taki, że µ(ω c 0 ) = 0 i dla każdego ω Ω 0, f n (ω) f 0 (ω)). 1.54 Fakt Jeżeli f = g µ-prawie wszędzie i f jest całkowalna, to g też jest funkcją całkowalną i f dµ = g dµ. 1.55 Wniosek Całka jest funkcją klasy funkcji równych prawie wszędzie. 1.56 Uwaga Określona wyżej całka f dµ oznaczana będzie (w zależności od potrzeb) również symbolami Ω f(ω) µ(dω), Ω f(ω) dµ(ω) itp. Podobnie znaczenie symbolu A f(ω) dµ(ω) itp. pokrywa się z A f dµ. Całkowanie ciągów funkcyjnych Wszystkie ciągi funkcji numerycznych rozważane w tym paragrafie sa określone na wspólnej przestrzeni z miarą (Ω, F, µ). 1.57 Twierdzenie (Lebesgue a o zbieżności monotonicznej) Jeżeli 0 f 1 f 2..., to lim f n dµ = lim f n dµ. n n 1.58 Twierdzenie (O całkowaniu szeregów o wyrazach nieujemnych) Jeżeli f 1, f 2,... 0, to f j dµ = f j dµ. j=1 j=1 W szczególności, szereg j=1 f j zbieżny jest szereg j=1 fj dµ. jest całkowalny wtedy i tylko wtedy, gdy
Całkowanie ciągów funkcyjnych 13 1.59 Wniosek Jeżeli j=1 fj dµ < +, to szereg funkcyjny j=1 f j jest zbieżny µ-prawie wszędzie. 1.60 Twierdzenie (Lemat Fatou) Jeżeli f 1, f 2,... 0, to lim inf n f n dµ lim inf n f n dµ. 1.61 Twierdzenie (Lebesgue a o zbieżności majoryzowanej) Przypuśćmy, że f n f 0 µ-prawie wszędzie. Jeżeli istnieje funkcja g całkowalna i taka, że dla każdego n IN f n g µ-prawie wszędzie, to: 1. f 0 jest całkowalna; 2. f n dµ f 0 dµ. 1.62 Zadanie Podać przykład ciągu funkcyjnego f n na [0, 1], który jest zbieżny wszędzie do f 0 0, ale dla którego lim n 1 0 f n(x) dx 0. (całka oznacza zwykłą całkę Riemanna) 1.63 Zadanie Niech dla każdego n IN będzie dany szereg zbieżny k=1 a n,k. Przypuśćmy, że dla każdego k IN, lim n a n,k = a k. Na podstawie twierdzeń Lebesgue a o zbieżności monotonicznej i majoryzowanej, podać dwa kryteria dla zbieżności lim a n,k = a k. n k=1 k=1 1.64 Fakt Niech f będzie mierzalna i całkowalna na (Ω, F, P ). Wówczas funkcja zbioru jest σ-addytywna. F A A f dµ := fi A dµ =: µ f (A),
14 1. Całka w sensie Lebesgue a 1.65 Uwaga Jeżeli f = f + f, to µ f (A) = µ f +(A) µ f (A), gdzie µ f + i µ f są już miarami skończonymi. Przy tym µ f +(A) = µ f (A {f 0}), µ f (A) = µ f (A {f < 0}). Jest to przykład tzw. rozkładu Hahna. 1.66 Twierdzenie Jeżeli ν jest ograniczoną funkcją σ-addytywną na (Ω, F), to istnieje zbiór B F oraz miary skończone ν + i ν, takie że dla każdego A F ν(a) = ν + (A) ν (A), ν + (A) = ν(a B), ν (A) = ν(a B c ). 1.67 Twierdzenie (O różniczkowaniu pod znakiem całki) Niech (Ω, F, µ) będzie przestrzenią z miarą. Niech f : (a, b) Ω IR 1 spełnia następujące warunki. 1. Dla każdego t (a, b) funkcja f(t, ) jest mierzalna na (Ω, F) i całkowalna względem miary µ, tak że określona jest funkcja (a, b) t F (t) = f(t, ω) dµ(ω). 2. Dla prawie wszystkich ω Ω funkcja f(, ω) jest różniczkowalna na całym odcinku (a, b). 3. Istnieje funkcja całkowalna g : (Ω, F, µ) (IR 1, B 1 ) spełniająca dla µ-p.w. ω warunek sup f (s, ω) t g(ω). s (a,b) Wówczas funkcja h jest różniczkowalna na (a, b) i dla t 0 (a, b) dh f dt (t 0) = t (t 0, ω) dµ(ω). 1.68 Definicja Miarą Lebesgue a nazywamy jedyną miarę l na B 1 spełniającą warunek l((a, b]) = b a, a < b, a, b IR 1. 1.69 Twierdzenie (Całka Riemanna a całka Lebesgue a) Niech f : [a, b] IR 1 będzie ograniczona i całkowalna w sensie Riemanna. Wówczas istnieje funkcja borelowska f, prawie wszędzie na [a, b] (względem miary Lebesgue a) równa f i całkowalna względem miary Lebesgue a, przy czym [a,b] f dl = b a f(x) dx.
Całkowanie ciągów funkcyjnych 15 (Po lewej stronie mamy całkę Lebesgue a po zbiorze [a, b], a po prawej całkę Riemanna). Co więcej, f jest l-prawie wszędzie ciągła na [a, b], tzn. l{x [a, b] ; f nie jest ciągła w x} = 0. 1.70 Zadanie Podać przykład funkcji całkowalnej w sensie Riemanna na zbiorze niezwartym, która nie jest całkowalna w sensie Lebesgue a na tym zbiorze. 1.71 Zadanie Podać przykład, że twierdzenie Lebesgue a o zbieżności majoryzowanej nie jest prawdziwe dla całki Riemanna. 1.72 Uwaga Jeżeli f jest ograniczona i całkowalna w sensie Riemanna na [a, b], to jest równa prawie wszędzie funkcji borelowskiej, i wydaje się naturalne, żeby przyjąć b f dl = f(x) dx. [a,b] Jednak f nie musi być mierzalna względem σ-algebry zbiorów borelowskich. Powstaje pytanie, czy potrafimy umiejscowić całkowanie takich funkcji w ramach rozwiniętego formalizmu. Okazuje się, że tak. Pomocna okazuje się obserwacja, że takie funkcje spełniają warunek z poniższego twierdzenia, są więc mierzalne względem pewnego naturalnego rozszerzenia σ-algebry B 1. 1.73 Twierdzenie Niech (Ω, F, µ) będzie przestrzenią z miarą. Niech F będzie rodziną zbiorów postaci B N, gdzie B F, a N jest zbiorem µ-zerowym, tzn. istnieje nadzbiór C zbioru N, który jest mierzalny i ma miarę zero: N C, C F, µ(c) = 0. Wówczas F jest σ-algebrą. Co więcej, funkcja f jest mierzalna względem F dokładnie wtedy, gdy f = g + h, gdzie g jest funkcją F-mierzalną, a funkcja h ma następującą własność: istnieje zbiór C F taki, że µ(c) = 0 oraz (tzn. zbiór {h 0} jest µ-zerowy). C {ω ; h(ω) 0}. 1.74 Definicja Jeżeli (Ω, F, µ) jest przestrzenią z miarą, to przestrzeń (Ω, F, µ), gdzie F jest określona wyżej, a rozszerzenie miary µ jest zadane wzorem µ(b N) := µ(b), nazywamy uzupełnieniem przestrzeni (Ω, F, µ). Jeżeli F = F, to mówimy, że przestrzeń (Ω, F, µ) jest zupełna. a
16 1. Całka w sensie Lebesgue a 1.75 Definicja Rozważmy przestrzeń (IR 1, B 1, l) (która nie jest przestrzenią zupełną). Elementy σ-algebry uzupełnionej B 1 nazywamy zbiorami mierzalnymi w sensie Lebesgue a i oznaczamy L 1. Miarę rozszerzoną na L 1 nadal będziemy oznaczać l = l 1. 1.76 Uwaga Zbiorów lebegowskich jest 2 c (bo istnieje zbiór borelowski mocy c, który ma miarę Lebesgue a zero), ale przy założeniu pewnika wyboru można pokazać istnienie zbioru niemierzalnego w sensie Lebesgue a (zob. Rozdział 2, paragraf 2.33). 1.77 Wniosek Miara Lebesgue a na IR 1 jest jedyną miarą zupełną określoną na σ-algebrze podzbiorów IR 1 i spełniającą związek: l((a, b]) = b a, a < b, a, b IR 1. 1.78 Wniosek Funkcja mierzalna i całkowalna w sensie Riemanna jest mierzalna w sensie Lebesgue a.
2. Zagadnienie istnienia i jednoznaczności przedłużenia miar Zagadnienie przedłużenia miary 2.1 Wprowadzenie Nasz schemat konstrukcji miar będzie następujący: 1. Na pewnej klasie (półpierścieniu) zbiorów R 2 Ω, mamy zadaną, na ogół w naturalny sposób, funkcję µ 0 : C IR +, która jest σ-addytywna na R. 2. Za pomocą funkcji µ 0 konstruujemy miarę zewnętrzną µ, określoną na wszystkich podzbiorach zbioru Ω. 3. Stosujemy konstrukcję Caratheodory ego, która wyróżnia σ-algebrę F µ zbiorów µ -mierzalnych. Miara zewnętrzna µ na F µ jest już σ- addytywna, tzn. jest już miarą. 4. Korzystając z σ-addytywności µ 0 na R sprawdzamy, że (a) R F µ, a więc i σ(r) F µ. (b) µ = µ 0 na R, a więc µ = µ σ(r) jest przedłużeniem funkcji µ 0 do miary µ na σ(r). 5. Stosując lemat o λ- i π-układach uzyskujemy jednoznaczność przedłużenia µ 0 do µ. 6. Korzystając z tw. o pokryciu mierzalnym wnioskujemy, że przestrzeń (Ω, F µ, µ ) jest uzupełnieniem przestrzeni (Ω, σ(r), µ). 2.2 Definicja Półpierścieniem zbiorów nazywamy rodzinę R 2 Ω spełniającą następujące warunki. SR0) R. SR1) Jeżeli A, B R, to A B R. SR2) Jeżeli A, B R, A B, to istnieją parami rozłączne elementy C 1, C 2,..., C m R takie, że m B \ A = C j. j=1 17
18 2. Istnienie miar 2.3 Uwaga Może nie istnieć najmniejszy półpierścień zawierający daną klasę zbiorów C. 2.4 Przykład Rodzina jest półpierścieniem generatorów B 1. I 1 = {(a, b] ; a < b, a, b IR 1 } 2.5 Definicja Niech µ 0 : R IR + będzie określona na półpierścieniu R. Mówimy, że µ 0 jest addytywna, jeśli µ( ) = 0 i dla każdego układu parami rozłącznych elementów A 1, A 2,..., A m R, takiego że m j=1 A j R, ma miejsce równość m m µ 0 ( A j ) = µ 0 (A j ). j=1 Mówimy, że funkcja µ 0 jest σ-addytywna na R, jeśli µ( ) = 0 i dla każdego układu parami rozłącznych elementów A 1, A 2,... R, takiego że j=1 A j R, ma miejsce równość j=1 µ 0 ( A j ) = µ 0 (A j ). j=1 j=1 2.6 Twierdzenie Niech µ 0 : R IR + będzie σ-addytywna na półpierścieniu R. Wówczas istnieje miara µ określona na σ(r), taka że µ(a) = µ 0 (A), A R (tzn. funkcję µ 0 można rozszerzyć z R do miary na σ(r)). Konstrukcja Caratheodory ego 2.7 Definicja Miarą zewnętrzną na Ω nazywamy funkcję µ : 2 Ω IR + spełniającą następujące warunki. MZ0) µ ( ) = 0. MZ1) Jeżeli A B, to µ (A) µ (B). MZ2) Jeżeli A 1, A 2,... Ω, to µ ( A j ) µ (A j ). j=1 j=1 2.8 Definicja Niech µ będzie miara zewnętrzną na Ω. Zbiór A Ω nazywamy µ -mierzalnym, jeśli dla każdego zbioru E Ω µ (E) = µ (E A) + µ (E A c ). Rodzinę zbiorów µ -mierzalnych oznaczać będziemy symbolem F µ.
Jednoznaczność rozszerzenia 19 2.9 Twierdzenie (Caratheodory) Jeżeli µ jest miarą zewnętrzną na Ω, to F µ jest σ-algebrą, a µ obcięta do F µ jest miarą. 2.10 Fakt Niech C 2 Ω, C. Niech η : C IR + będzie takie, że η( ) = 0. Określamy µ (A) = inf{ η(c j ) ; A C j, C j C}. j=1 (Kres dolny wzięty jest po wszystkich przeliczalnych pokryciach zbioru A elementami klasy C. Jeżeli takie pokrycie zbioru A nie istnieje, to z definicji µ (A) = + ). Funkcja µ określona powyżej jest miarą zewnętrzną na Ω. 2.11 Uwaga Niech R będzie półpierścieniem. Niech µ 0 : R IR + będzie σ-addytywna na R. Funkcja zbioru j=1 µ (E) = inf{ µ 0 (A j ) ; E A j, A j R} j=1 j=1 jest miarą zewnętrzną. W istocie, σ-addytywność funkcji µ 0 pozwala ograniczyć się w powyższej definicji do przeliczalnych pokryć sumami parami rozłącznych elementów R: µ (E) = inf{ µ 0 (A j ) ; E A j, A j R, A i A j =, i, j IN}. j=1 j=1 Jednoznaczność rozszerzenia 2.12 Definicja π-układem nazywamy klasę podzbiorów zbioru Ω zamkniętą ze względu na przekroje skończone. 2.13 Przykłady 1. Półpierścień jest π-układem. W szczególności rodzina I 1 = {(a, b] ; a < b, a, b IR 1 } jest π-układem generatorów σ-algebry B 1. 2. Rodzina S 1 = {(, a] ; a IR 1 } jest π-układem generatorów σ- algebry B 1. 2.14 Definicja λ-układem nazywamy klasę podzbiorów Λ zbioru Ω spełniającą następujące warunki. LU0) Λ.
20 2. Istnienie miar LU1) Jeżeli A, B Λ i A B, to B \ A Λ. LU2) Jeżeli A 1, A 2,... Λ są parami rozłączne, to j=1 A j Λ. Najmniejszy λ-układ zawierający daną klasę zbiorów C oznaczać będziemy λ(c). 2.15 Przykłady 1. Niech µ i ν będą dwiema skończonymi miarami na (Ω, F). Wówczas rodzina Λ µ,ν = {A F ; µ(a) = ν(a)} jest λ-układem. 2. Jeśli µ i ν są miarami probabilistycznymi, to Ω Λ µ,ν. 2.16 Twierdzenie Jeżeli C jest π-układem, to λ(c) też jest π-układem. Jeżeli ponadto Ω C, to λ(c) = σ(c). 2.17 Uwaga Twierdzenie 2.16 zwykle nazywane jest lematem Dynkina o λ- i π-układach. W istocie udowodnione zostało ono przez Wacława Sierpińskiego już w latach dwudziestych. 2.18 Wniosek Jeżeli C jest π-układem generatorów σ-algebry F, a µ i ν sa miarami probabilistycznymi równymi na C, to µ = ν na F. 2.19 Wniosek Jeżeli C jest π-układem generatorów σ-algebry F, a µ i ν sa miarami skończonymi równymi na C, przy czym µ(ω) = ν(ω), to µ = ν na F. 2.20 Zadanie Podać przykład dwóch miar nieskończonych, dla których nie jest prawdziwy Wniosek 2.19. 2.21 Wniosek Niech σ-algebra F będzie generowana przez π-układ C. Niech µ i ν będą miarami na (Ω, F). Przypuśćmy, że miara µ jest σ-skończona względem C, tzn. istnieją zbiory C 1, C 2,... C, takie że Ω = j=1 C j i µ(c j ) < +, j = 1, 2,.... Jeżeli µ = ν na C, to µ = ν na F.
Struktura F µ 21 Struktura F µ 2.22 Wprowadzenie Niech R będzie półpierścieniem. Niech µ 0 : R IR + będzie σ-addytywna na R. Funkcja zbioru µ (E) = inf{ µ 0 (A j ) ; E A j, A j R, A i A j =, i, j IN}. j=1 j=1 jest miarą zewnętrzną. Wiemy już, że µ jest przedłużeniem funkcji µ 0 z półpierścienia R do miary na σ-algebrze F µ σ(r). Pytamy o strukturę elementów F µ. 2.23 Twierdzenie (O pokryciu mierzalnym) Niech µ (E) < +. Wówczas istnieje zbiór F σ(r) (nazywany pokryciem mierzalnym E), taki że E F i µ (F ) = µ (E). 2.24 Wniosek Jeżeli E F µ, µ (E) < +, to istnieją zbiory F, C σ(r) oraz N C, takie że E = F N i µ (C) = 0. 2.25 Wniosek Jeżeli µ 0 : R IR + jest σ-skończona, to (Ω, F µ, µ ) jest uzupełnieniem przestrzeni (Ω, σ(r), µ ). Miara Lebesgue a na IR 1 2.26 Wprowadzenie Możemy teraz jeszcze raz powrócić do zagadnień rozdziału 1, dyskutowanych w paragrafach 1.75-1.77. 2.27 Fakt Niech l 0 : I 1 IR + będzie długością odcinka: Funkcja l 0 jest σ-addytywna na I 1. l 0 ((a, b]) = b a. 2.28 Twierdzenie Istnieje dokładnie jedna miara l określona na σ-algebrze L 1 podzbiorów IR 1 o następujących własnościach: (i) l((a, b]) = b a, a < b, a, b IR 1. (ii) (IR 1, L 1, l) jest uzupełnieniem przestrzeni (IR 1, B 1, l).
22 2. Istnienie miar Proszę podać twierdzenia, z których korzysta się w konstrukcji miary Lebesgue a. 2.29 Definicja Miarę l, o której mowa w powyższym twierdzeniu, nazywamy miarą Lebesgue a, a elementy σ-algebry L 1 zbiorami mierzalnymi w sensie Lebesgue a. 2.30 Zadanie Wskazać nieprzeliczalny zbiór o mierze Lebesgue a zero. Wywnioskować stąd, że moc σ-algebry L 1 zbiorów mierzalnych w sensie Lebesgue a wynosi 2 c. 2.31 Umowa Dla liczby rzeczywistej r i podzbioru E IR 1 określamy: E + r = {x + r ; x e}, r E = {r x ; x E}. 2.32 Fakt Niech E L 1. Dla dowolnego r IR 1, zbiory E + r i r E są mierzalne w sensie Lebesgue a i maja miejsce równości l(e + r) = l(e), l(r E) = r l(e). 2.33 Fakt Przy założeniu pewnika wyboru istnieje podzbiór IR 1, który nie jest mierzalny w sensie Lebesgue a. Produkt miar i miara Lebesgue a na IR d 2.34 Definicja Niech (Ω 1, F 1 ) i (Ω 2, F 2 ) będą przestrzeniami mierzalnymi. 1. Prostokątem mierzalnym nazywamy zbiór postaci A 1 A 2, gdzie A 1 F 1, A 2 F 2. Rodzinę prostokątów mierzalnych oznaczamy F 1 F 2. 2. Produktem σ-algebr F 1 i F 2 nazywamy σ-algebrę podzbiorów Ω 1 Ω 2 generowaną przez prostokąty mierzalne. Oznaczamy tę σ-algebrę symbolem F 1 F 2. Mamy więc z definicji: F 1 F 2 = σ(f 1 F 2 ). 3. Produktem przestrzeni mierzalnych (Ω 1, F 1 ) i (Ω 2, F 2 ) nazywamy przestrzeń (Ω 1 Ω 2, F 1 F 2 ). 2.35 Fakt Prostokąty mierzalne tworzą półpierścień (generatorów σ-algebry F 1 F 2 ).
Produkt miar 23 2.36 Twierdzenie Niech (Ω 1, F 1, µ 1 ) i (Ω 2, F 2, µ 2 ) będą przestrzeniami z miarą. 1. Istnieje miara ν na (Ω 1 Ω 2, F 1 F 2 ) spełniająca warunek ν(a 1 A 2 ) = µ 1 (A 1 ) µ 2 (A 2 ), A 1 F 1, A 2 F 2. 2. Jeżeli µ 1 i µ 2 są σ-skończone, to miara ν jest jedyna. 2.37 Definicja Niech µ 1 i µ 2 będą σ-skończonymi miarami na przestrzeniach mierzalnych odpowiednio (Ω 1, F 1 ) i (Ω 2, F 2 ). Produktem miar µ 1 i µ 2 nazywamy jedyną miarę µ 1 µ 2 na (Ω 1 Ω 2, F 1 F 2 ) zadaną wzorem µ 1 µ 2 (A 1 A 2 ) = µ 1 (A 1 ) µ 2 (A 2 ), A 1 F 1, A 2 F 2. Przestrzeń (Ω 1 Ω 2, F 1 F 2, µ 1 µ 2 ) nazywamy produktem przestrzeni z miarą (Ω 1, F 1, µ 1 ) i (Ω 2, F 2, µ 2 ). 2.38 Uwaga Produkt zupełnych przestrzeni z miarą nie musi być przestrzenią zupełną. 2.39 Definicja Miarą Lebesgue a na IR d nazywamy uzupełnienie miary produktowej l d = l 1 l 1 l 1. Miara Lebesgue a na IR d zadana jest na σ-algebrze L d podzbiorów IR d mierzalnych w sensie Lebesgue a, która określona jest jako uzupełnienie σ-algebry produktowej L 1 L 1 L 1 względem miary produktowej. 2.40 Uwagi 1. Miarę Lebesgue a na IR d oznaczać będziemy tym samym symbolem l d, co produkt l 1 l 1 l 1. 2. Można pokazać, że uzupełniając przestrzeń produktową (IR d, d B 1, l d ) również otrzymujemy miarę Lebesgue a i zbiory mierzalne w sensie Lebesgue a na IR d (tutaj punktem wyjściowym jest produkt niezupełnych przestrzeni z miarą (IR 1, B 1, l)). 3. σ-algebrę produktową d B 1 = B 1... B 1 oznaczać będziemy B d. Można pokazać, że, podobnie jak w przypadku d = 1, B d jest generowana przez podzbiory otwarte IR d. Dlatego σ-algebrę B d nazywamy σ-algebrą podzbiorów borelowskich IR d.
24 2. Istnienie miar 2.41 Zadanie Pokazać, że rodzina S d = {(, a 1 ] (, a 2 ] (, a d ] ; a j IR 1, j = 1, 2,..., d} jest π układem generatorów B d. 2.42 Zadanie Pokazać, że rodzina I d = {(a 1, b 1 ] (a 2, b 2 ] (a d, b d ] ; a i < b i, a i, b i IR 1, i = 1, 2,..., d} jest półpierścieniem generatorów B d. 2.43 Wniosek Miarę Lebesgue a na IR d można skonstruować w sposób podobny jak l, bezpośrednio z twierdzeń tego rozdziału, rozpoczynając konstrukcję od d-wymiarowej objętości V d ((a 1, b 1 ] (a 2, b 2 ] (a d, b d ]) = Π d i=1(b i a i ). Twierdzenie Fubiniego i twierdzenie o zmianie zmiennych 2.44 Twierdzenie (Tonellego) Niech µ 1 i µ 2 będą σ-skończonymi miarami na przestrzeniach mierzalnych odpowiednio (Ω 1, F 1 ) i (Ω 2, F 2 ). Niech f będzie nieujemną funkcją numeryczną na (Ω 1 Ω 2, F 1 F 2 ). Wówczas ( ) f d(µ 1 µ 2 ) = f ω 1 (ω 2 ) dµ 2 (ω 2 ) dµ 1 (ω 1 ) Ω 1 Ω 2 Ω 1 Ω ( 2 ) = f ω2 (ω 1 ) dµ 1 (ω 1 ) dµ 2 (ω 2 ), Ω 1 gdzie Ω 2 f ω 1 ( ) = f(ω 1, ) : (Ω 2, F 2 ) (IR +, B + ), f ω2 ( ) = f(, ω 2 ) : (Ω 1, F 1 ) (IR +, B + ). 2.45 Twierdzenie (Fubiniego) Niech µ 1 i µ 2 będą σ-skończonymi miarami na przestrzeniach mierzalnych odpowiednio (Ω 1, F 1 ) i (Ω 2, F 2 ). Niech f będzie funkcją numeryczną na (Ω 1 Ω 2, F 1 F 2 ). Jeżeli f d(µ 1 µ 2 ) < +, to istnieją całki iterowane ( ) f ω 1 (ω 2 ) dµ 2 (ω 2 ) dµ 1 (ω 1 ), Ω 2 Ω 1 Ω 2 ( ) f ω2 (ω 1 ) dµ 1 (ω 1 ) dµ 2 (ω 2 ), Ω 1 są one równe, i ich wspólna wartość wynosi Ω 1 Ω 2 f d(µ 1 µ 2 ).
Twierdzenie Fubiniego 25 2.46 Uwaga W twierdzeniu Fubiniego założenie o całkowalności funkcji f można sprawdzić stosując twierdzenie Tonellego. 2.47 Umowa Podobnie, jak w przypadku d = 1, dwuwymiarowa całka w sensie Riemanna pokrywa się z całką w sensie Lebesgue a, jeśli tylko funkcja i zbiór po którym całkujemy są dostatecznie regularne (np. gdy funkcja jest ciągła i ograniczona). Dlatego będziemy używać standardowych oznaczeń V f dl d = V f(x) dx, gdzie x = (x 1, x 2,..., x d ) i dx = dx 1 dx 2... dx d. 2.48 Twierdzenie (O zmianie zmiennych w całce Lebesgue a) Niech V będzie zbiorem otwartym w IR d i niech f : V IR 1 będzie funkcją mierzalną. Jeżeli T : U T U = V jest dyfeomorfizmem zbiorów otwartych (tzn. odwzorowanie T jest klasy C 1, jest różnowartościowe i det DT (x) 0 dla x U), to całki V f(y) dy i U f(t (x)) det DT (x) dx istnieją jednocześnie, i jeśli istnieją, to są równe: f(y) dy = f(t (x)) det DT (x) dx. V U 2.49 Uwaga Z tzw. twierdzenia Sarda wynika, że twierdzenie o zmianie zmiennych pozostaje prawdziwe przy następujących słabszych założeniach. 1. T jest klasy C 1. 2. T jest różnowartościowe na zbiorze {x ; det DT (x) 0}. 2.50 Zadanie Jak zmieniają się całki wielokrotne przy liniowej odwracalnej zmianie zmiennych?
26 2. Istnienie miar
3. Przestrzenie funkcyjne i rodzaje zbieżności funkcji mierzalnych Przestrzenie funkcji całkowalnych 3.1 Definicja Niech (Ω, F, µ) będzie przestrzenią z miarą. Określamy przestrzeń funkcji całkowalnych. L 1 (Ω, F, µ) = L 1 (µ) = {f : (Ω, F) (IR 1, B 1 ) ; f dµ < + }. Niech f g oznacza, że f = g µ-prawie wszędzie. Relacja jest relacją równoważności w L 1 (µ). Określamy przestrzeń L 1 (µ) jako przestrzeń ilorazową L 1 (µ)/. 3.2 Lemat Niech f 1 = f dµ. Nieujemna funkcja 1 jest półnormą na przestrzeni L 1 (µ), tzn. spełnia następujące dwa warunki. 1. f + g 1 f 1 + g 1, f, g L 1 (µ). 2. a f 1 = a f 1, f L 1 (µ), a IR 1. Funkcja 1 nie jest na ogół normą, gdyż f 1 = 0 pociąga jedynie f = 0 µ-prawie wszędzie. Stąd jednak wynika, że określając funkcję 1 : L 1 (µ) IR + wzorem [f] 1 = f 1, definiujemy normę na L 1 (µ). 3.3 Twierdzenie Przestrzeń (L 1 (µ), 1 ) jest zupełna (tzn. każdy ciąg Cauchy ego w normie 1 jest zbieżny). Przestrzeń ta jest więc tzw. przestrzenią Banacha. 3.4 Definicja Niech (Ω, F, µ) będzie przestrzenią z miarą. Określamy przestrzeń funkcji całkowalnych z kwadratem. L 2 (Ω, F, µ) = L 2 (µ) = {f : (Ω, F) (IR 1, B 1 ) ; f 2 dµ < + }. Podobnie jak w przypadku przestrzeni L 1, określamy L 2 (µ) jako przestrzeń ilorazową L 2 (µ)/, gdzie f g dokładnie wtedy, gdy f = g µ-prawie wszędzie. 27
28 3. Przestrzenie funkcyjne 3.5 Lemat Niech f, g = f g dµ i f 2 = f 2 dµ. Funkcja f, g jest formą dwuliniową i symetryczną, a 2 jest półnormą na przestrzeni L 2 (µ). Tak więc określając [f], [g] = f, g otrzymujemy iloczyn skalarny na przestrzeni L 2 (µ). 3.6 Uwaga Dla funkcji całkowalnych z kwadratem o wartościach zespolonych iloczyn skalarny w L 2 (µ) zadajemy wzorem f, g = fg dµ. 3.7 Twierdzenie Przestrzeń (L 2 (µ), 2 ) jest zupełna (jest więc przestrzenią Hilberta). 3.8 Przykład Jeżeli µ jest miarą Lebesgue a na IR d, to odpowiednie przestrzenie funkcyjne oznaczamy symbolami L 1 (IR d ) i L 2 (IR d ). Podobnie, jeśli rozważamy miarę Lebesgue a na podzbiorze A IR d, piszemy L 2 (A), np. L 2 (0, 1), L 2 (0, 2π) itp. 3.9 Zadanie Pokazać (wskazując odpowiednie przykłady), że L 1 (IR 1 ) L 2 (IR 1 ) i L 2 (IR 1 ) L 1 (IR 1 ). 3.10 Przykład Niech Λ będzie miarą liczącą na IN. Przestrzeń L 1 (Λ) = {f : IN IR 1 ; j=1 f(j) < + } oznaczamy przez l 1. Podobnie, przestrzeń L 2 (Λ) = {f : IN IR 1 ; j=1 f(j) 2 < + } oznaczamy przez l 2. 3.11 Zadanie Pokazać, że l 1 l 2, i że l 2 l 1. 3.12 Zadanie Pokazać, że jeśli µ jest miarą skończoną, to L 2 (µ) L 1 (µ). 3.13 Definicja Przestrzeń L p (µ), 0 < p < +, dla przestrzeni z miarą (Ω, F, µ) określamy jako L p (µ) = {f : (Ω, F) (IR 1, B 1 ) ; f p dµ < + }. Podobnie jak w przypadku przestrzeni L 1 i L 2, określamy L p (µ) jako przestrzeń ilorazową L p (µ)/, gdzie f g wtedy, gdy f = g µ-prawie wszędzie. 3.14 Uwagi 1. Dla 0 < p < 1, przestrzenie L p (µ) są zupełnymi przestrzeniami metrycznymi z metryką d p (f, g) = f g p dµ.
Przestrzenie funkcji całkowalnych 29 2. Dla 1 p < +, przestrzenie L p (µ) są zupełnymi przestrzeniami unormowanymi (przestrzeniami Banacha) z normą określoną wzorem ( 1/p f p = f dµ) p. Fakt, że tak określona funkcja spełnia nierówność trójkąta nie jest oczywisty. 3.15 Fakt (Nierówność Minkowskiego) Niech p [1, ). Jeżeli f p, g p < +, to f + g p f p + g p. Nierówność Minkowskiego wynika z kolei z 3.16 Fakt (Nierówność Höldera) Niech p, q > 1 będą takie, że 1 p + 1 q = 1. Dla dowolnych funkcji numerycznych na (Ω, F, µ) ( ) 1/p ( 1/q f g dµ f p dµ g dµ) q. 3.17 Wniosek Jeżeli f L p (µ) i g L q (µ), gdzie 1/p + 1/q = 1, to f g L 1 (µ). 3.18 Uwaga Można pokazać, że nierówność Höldera wynika z nierówności Jensena. 3.19 Fakt (Nierówność Jensena) Niech φ : IR 1 IR 1 będzie funkcją wypukłą. Niech µ będzie miarą probabilistyczną na (IR 1, B 1 ) taką, że x dµ(x) < +. Wówczas φ( x dµ(x)) φ(x) dµ(x). 3.20 Wniosek Jeżeli µ jest miarą probabilistyczną na IR 1 i 1 p r < +, to x p dµ(x) x r dµ(x).
30 3. Przestrzenie funkcyjne Rodzaje zbieżności funkcji mierzalnych i relacje między nimi Ciągi funkcji mierzalnych rozważane w niniejszym paragrafie są określone na wspólnej przestrzeni z miarą (Ω, F, µ). 3.21 Definicja Mówimy, że f n f 0 µ-prawie wszędzie, jeśli istnieje zbiór Ω 0 F taki, że µ(ω c 0 ) = 0 i dla każdego ω Ω 0, f n (ω) f 0 (ω) (zob. Definicję 1.53). 3.22 Definicja Ciąg f n jest zbieżny do f 0 według miary, jeśli dla każdego ε > 0 µ{ω ; f n (ω) f 0 (ω) > ε} 0, gdy n +. Zapisujemy: f n µ f 0. 3.23 Definicja Zbieżność w L p, 0 < p < +, to zbieżność w przestrzeni L p (µ). Tak więc f n L p f 0 wtedy i tylko wtedy, gdy f n f 0 p dµ 0, gdy n +. 3.24 Fakt Jeżeli µ jest miarą skończoną, to zbieżność w L r, r > 0 pociąga zbieżność w L p, 0 < p r. 3.25 Fakt Zbieżność w L p pociąga zbieżność według miary. 3.26 Zadanie Podać przykład ciągu zbieżnego według miary, ale nie w L 1. 3.27 Fakt Jeżeli miara µ jest skończona, to zbieżność µ-prawie wszędzie pociąga zbieżność według miary µ. 3.28 Zadanie Podać przykład ciągu zbieżnego µ-prawie wszędzie, który nie jest zbieżny według miary µ. 3.29 Zadanie Podać przykład ciągu zbieżnego według miary, ale nie prawie wszędzie. 3.30 Twierdzenie (Riesza-Fischera) Ciąg zbieżny według miary zawiera podciąg zbieżny prawie wszędzie. 3.31 Wniosek Niech µ będzie miarą skończoną. Wówczas ciąg {f n } jest zbieżny według miary do f 0 wtedy i tylko wtedy, gdy w każdym podciągu {f nk } ciągu {f n } można znaleźć podciąg {f nkl } zbieżny do f 0 prawie wszędzie.
Gęstość funkcji gładkich w L p (IR d ) 31 Gęstość funkcji gładkich w L p (IR d ) 3.32 Twierdzenie W przestrzeniach L p (IR d ) funkcje gładkie (klasy C ) są gęste, tzn. dla każdej funkcji f L p (IR d ) i każdego ε > 0 istnieje funkcja f ε klasy C, całkowalna z p-tą potęgą, taka że IR d f(x) f ε (x) p dx < ε. 3.33 Wniosek (Riemanna-Lebesgue a) Niech f L 1 (a, b). Wówczas b lim f(x)e 2iπnx dx = 0. n a
32 3. Przestrzenie funkcyjne
4. Formalizm teorii prawdopodobieństwa i częstościowa interpretacja prawdopodobieństwa Charakterystyki zmiennych losowych 4.1 Definicja Przestrzenią probabilistyczną nazywamy przestrzeń (Ω, F, P ) z miarą probabilistyczną (P (Ω) = 1). Elementy przestrzeni Ω nazywamy zdarzeniami elementarnymi, elementy σ-algebry F nazywamy zdarzeniami, a miarę P nazywamy prawdopodobieństwem. 4.2 Definicja Zmienną losową na przestrzeni probabilistycznej (Ω, F, P ) nazywamy funkcję mierzalną X : (Ω, F) (IR 1, B 1 ). 4.3 Definicja Wartością oczekiwaną zmiennej losowej X, określonej na przestrzeni (Ω, F, P ), nazywamy całkę X względem P (jeśli istnieje). Zachowując tradycję oznaczamy EX := X dp. 4.4 Definicja Momentem absolutnym rzędu p > 0 zmiennej losowej nazywamy liczbę m p = m p (X) = E X p. 4.5 Definicja Wariancją całkowalnej z kwadratem zmiennej losowej X nazywamy liczbę D 2 (X) = Var (X) := E(X EX) 2 = EX 2 (EX) 2. 4.6 Definicja Odchyleniem standardowym całkowalnej z kwadratem zmiennej losowej X nazywamy liczbę D(X) := Ω Var (X) = E(X EX) 2. 33
34 4. Formalizm teorii prawdopodobieństwa 4.7 Definicja Niech X będzie zmienną losową na (Ω, F, P ). Rozkładem zmiennej losowej X nazywamy miarę probabilistyczną P X na (IR 1, B 1 ) daną wzorem P X (A) := P X 1 (A) = P (X A). 4.8 Twierdzenie (O transporcie miary) Niech X : (Ω, F, P ) (IR 1, B 1 ) będzie zmienną losową o rozkładzie P X. Niech f : (IR 1, B 1 ) (IR 1, B 1 ) będzie funkcją borelowską. Wartość oczekiwana E f(x) istnieje dokładnie wtedy, gdy istnieje całka IR 1 f(x) dp X (x). Jeśli te całki istnieją, to są równe: Ef(X) = f(x) dp X (x). IR 1 4.9 Wniosek Mają miejsce równości EX = x dp X (x), m p (X) = x p dp X (x), Var (X) = x 2 dp X (x) ( x dp X (x)) 2, itp. 4.10 Zadanie Niech µ będzie miarą probabilistyczną na (IR 1, B 1 ). Wskazać zmienną losową X o rozkładzie P X = µ. 4.11 Definicja Miary probabilistyczne na (IR 1, B 1 ) nazywamy rozkładami na IR 1. 4.12 Uwaga Jeżeli µ jest rozkładem na IR 1, to fakt, że zmienna losowa X ma rozkład µ zapisujemy często w postaci X µ. 4.13 Definicja 1. Dystrybuantą zmiennej losowej X nazywamy funkcję F X : IR 1 [0, 1] zadaną wzorem F X (x) = P (X x), x IR 1. 2. Dystrybuantą rozkładu µ na IR 1 nazywamy funkcję F µ : IR 1 [0, 1] zadaną wzorem F µ (x) = µ((, x]), x IR 1.
Klasyfikacja rozkładów na prostej 35 4.14 Uwaga Oczywiście dystrybuanta zmiennej losowej jest dystrybuantą rozkładu tej zmiennej, jest więc w istocie funkcją rozkładu zmiennej losowej. Dlatego wystarczy badać tylko dystrybuanty rozkładów na IR 1. 4.15 Twierdzenie Niech µ i ν będą rozkładami na IR 1. Jeżeli F µ = F ν, to µ = ν. 4.16 Twierdzenie Niech µ będzie rozkładem na IR 1. Dystrybuanta F µ ma następujące własności: 1. F µ jest funkcją niemalejącą; 2. F µ jest prawostronnie ciągła; 3. lim x F µ (x) = 0, lim x + F µ (x) = 1. 4.17 Definicja Dystrybuantą nazywamy funkcję F : IR 1 [0, 1] spełniającą warunki 1.-3. z poprzedniego twierdzenia. 4.18 Twierdzenie Niech F będzie dystrybuantą. Istnieje dokładnie jeden rozkład µ na IR 1 taki, że F = F µ. Proszę podać kroki dowodu z odwołaniem się do odpowiednich twierdzeń rozdziału 2. 4.19 Definicja Medianą zmiennej losowej X (właściwie: rozkładu zmiennej losowej) nazywamy taką liczbę x 1/2, że P (X x 1/2 ) 1/2, P (X x 1/2 ) 1/2. 4.20 Definicja Kwantylem rzędu p, p (0, 1), rozkładu zmiennej losowej X nazywamy taką liczbę x p, że P (X x p ) p, P (X x p ) 1 x p. 4.21 Zadanie Przypuśćmy, że znamy dystrybuantę F X zmiennej losowej X. Jak znaleźć medianę i kwantyle tej zmiennej? Klasyfikacja rozkładów na prostej 4.22 Definicja Zmienna losowa X ma rozkład dyskretny, jeśli istnieją liczby x 1, x 2,... IR 1 i prawdopodobieństwa p 1, p 2,... 0, j=1 p j = 1, takie, że P (X = x j ) = p j, j = 1, 2,....
36 4. Formalizm teorii prawdopodobieństwa 4.23 Fakt Jeżeli X ma rozkład dyskretny, to dla dowolnej funkcji f : IR 1 IR 1 Ef(X) = f(x) P X (dx) = f(x i )P (X = x i ) = f(x i )p i, i=1 i=1 przy czym całka istnieje dokładnie wtedy, gdy i=1 f(x i ) p i < +. 4.24 Fakt P X {x} = P (X = x) > 0 wtedy i tylko wtedy, gdy dystrybuanta F X ma skok w punkcie x i F X (x) F X (x ) = P (X = x). 4.25 Definicja Zmienna losowa X ma rozkład absolutnie ciągły o gęstości p(x), jeśli dla każdego A B 1 P (X A) = A p(x) dx. (Wtedy p(x) 0 l-prawie wszędzie i p(x) dx = 1). 4.26 Fakt Gęstość rozkładu absolutnie ciągłego jest wyznaczona jednoznacznie z dokładnością do równości l-prawie wszędzie. 4.27 Uwaga Można pokazać, że każda dystrybuanta F jest prawie wszędzie różniczkowalna i pochodna F (określona l-prawie wszędzie) spełnia warunek F (x) (,x] F (x) dx. Może się więc zdarzyć, że IR 1 F (x) dx < 1 (przykład!). Jeżeli IR 1 F (x) dx = 1, to rozkład odpowiadający dystrybuancie F jest absolutnie ciągły z gęstością p(x) = F (x). 4.28 Fakt Jeżeli X ma rozkład absolutnie ciągły o gęstości p(x), to dla dowolnej funkcji borelowskiej f : IR 1 IR 1 Ef(X) = f(x) P X (dx) = + f(x)p(x) dx, przy czym całka istnieje dokładnie wtedy, gdy + f(x) p(x) dx < +. 4.29 Definicja Zmienna losowa X ma rozkład osobliwy, jeśli rozkład X jest ciągły (tzn. P (X = x) = 0 dla każdego x IR 1 ) oraz istnieje zbiór B B 1 miary Lebesgue a 0 taki, że P (X B) = 1.
Klasyfikacja rozkładów na prostej 37 4.30 Twierdzenie (Lebesgue a o rozkładzie) Niech µ będzie rozkładem na IR 1. Istnieją liczby α 1, α 2, α 3 0, α 1 + α 2 + α 3 = 1, oraz rozkłady µ 1 - dyskretny, µ 2 - absolutnie ciągły i µ 3 - osobliwy, takie, że µ = α 1 µ 1 + α 2 µ 2 + α 3 µ 3. 4.31 Przykłady rozkładów dyskretnych. 1. Rozkład zdegenerowany w punkcie C IR 1 albo miara delta Diraca δ C : P (X = C) = 1. 2. Rozkład 0 1 lub Bernoullego: P (X = 1) = p = 1 P (X = 0). 3. Rozkład dwumianowy: P (X = k) = 4. Rozkład Poissona: ( ) N p k (1 p) N k, k = 0, 1, 2,..., N. k P (X = k) = e 5. Rozkład geometryczny: λ λk, k = 0, 1, 2,.... k! P (X = k) = p(1 p) k 1, k = 1, 2,.... 4.32 Przykłady rozkładów absolutnie ciągłych. 1. Rozkład jednostajny U(a, b) na odcinku (a, b): p(x) = 1 b a I (a,b)(x). 2. Rozkład normalny N (m, σ 2 ) z parametrami m IR 1 i σ 2 > 0: p(x) = 1 2πσ e (x m)2 2σ 2. 3. Rozkład wykładniczy z parametrem λ > 0. p(x) = λe λx I (0,+ ) (x).
38 4. Formalizm teorii prawdopodobieństwa 4. Rozkłady gamma z parametrami α, λ > 0: p(x) = αλ Γ(λ) xλ 1 e αx I (0,+ ) (x). 5. Rozkład χ 2 z n stopniami swobody (χ 2 n), to rozkład gamma z parametrami α = n/2, λ = 1/2. 4.33 Zadanie Pokazać, że jeśli X N (0, 1), to X 2 χ 2 1. 4.34 Zadanie Niech zmienna losowa X ma rozkład absolutnie ciągły o gęstości p(x). Jakie warunki musi spełniać funkcja f : IR 1 IR 1, aby zmienna losowa f(x) miała rozkład absolutnie ciągły? Znaleźć postać gęstości. 4.35 Zadanie Znaleźć wartości oczekiwane i wariancje rozkładów wymienionych w przykładach 4.31 i 4.32. Rozkłady wielowymiarowe i niezależność stochastyczna 4.36 Definicja Wektorem losowym nazywamy odwzorowanie mierzalne X : (Ω, F, P ) (IR d, B d ). Rozkład P X wektora losowego, to miara P X 1 na (IR d, B d ). 4.37 Fakt X = (X 1, X 2,..., X d ) T jest wektorem losowym dokładnie wtedy, gdy jego składowe X 1, X 2,..., X d są zmiennymi losowymi. 4.38 Uwagi 1. Produkt σ-algebr podzbiorów borelowskich IR 1 ( czyli σ-algebra generowana przez prostokąty mierzalne) pokrywa się z σ-algebrą podzbiorów borelowskich przestrzeni IR d, (czyli σ-algebrą generowaną przez podzbiory otwarte IR d ): B d = B IR d. 2. Podobnie jak w przypadku jednowymiarowym, znajomość rozkładu wektora losowego pozwala obliczać całki z funkcji od wektora losowego: Ef( X) = f(x) dp X (x). IR d Wystarczy w tym celu zauważyć, że twierdzenie 4.8 pozostaje prawdziwe i dla wektorów losowych.
Niezależność stochastyczna 39 4.39 Definicja 1. Wektor losowy X ma rozkład dyskretny, jeśli istnieją x 1, x 2,... IR d i prawdopodobieństwa p 1, p 2,... 0, j=1 p j = 1, takie, że P ( X = x j ) = p j, j = 1, 2,.... 2. Wektor losowy X ma rozkład absolutnie ciągły o gęstości p(x), jeśli dla każdego A B d P ( X A) = A p(x) dx. (Wtedy p(x) 0 l d -prawie wszędzie i p(x) dx = 1). 3. Wektor losowy X ma rozkład osobliwy, jeśli rozkład X jest ciągły (tzn. P ( X = x ) = 0 dla każdego x IR d ) oraz istnieje zbiór B B d d-wymiarowej miary Lebesgue a 0 taki, że P ( X B) = 1. 4.40 Uwaga Twierdzenie 4.30 o rozkładzie miar na części dyskretną, absolutnie ciągłą i osobliwą przenosi się bez zmian z przypadku jednowymiarowego na przypadek IR d. Jedyna różnica polega tym, że w przypadku wielowymiarowym dużo łatwiej o przykłady rozkładów osobliwych - każdy rozkład skoncentrowany na właściwej hiperpłaszczyźnie wymiaru d 1 jest już osobliwy! (przykład!) 4.41 Definicja Rozkład P X wektora losowego X = (X 1, X 2,..., X d ) T nazywamy rozkładem łącznym zmiennych losowych X 1, X 2,..., X d. Rozkłady (jednowymiarowe) P X1, P X2,..., P Xd składowych wektora losowego nazywamy rozkładami brzegowymi rozkładu P X. 4.42 Uwaga Na ogół rozkłady brzegowe nie determinują rozkładu łącznego, tzn. istnieje wiele rozkładów na (IR d, B d ) o tych samych rozkładach brzegowych (przykład!). 4.43 Definicja Zmienne losowe X 1, X 2,..., X d są niezależne (lub stochastycznie niezależne), jeśli ich rozkład łączny jest produktem rozkładów brzegowych: P (X1,X 2,...,X d ) = P X1 P X2 P Xd. Rodzina zmiennych losowych {X i } i II jest niezależna, jeśli każda jej skończona podrodzina składa się ze zmiennych losowych niezależnych. 4.44 Twierdzenie Niech X 1, X 2,..., X d będą zmiennymi losowymi określonymi na tej samej przestrzeni probabilistycznej (Ω, F, P ). Następujące warunki są równoważne:
40 4. Formalizm teorii prawdopodobieństwa (i) Zmienne X 1, X 2,..., X d są niezależne. (ii) Dla dowolnych zbiorów borelowskich A 1, A 2,..., A d ma miejsce równość P (X 1 A 1, X 2 A 2,..., X d A d ) = P (X 1 A 1 )P (X 2 A 2 ) P (X d A d ). (iii) Dla dowolnych liczb x 1, x 2,..., x d ma miejsce równość P (X 1 x 1, X 2 x 2,..., X d x d ) = P (X 1 x 1 )P (X 2 x 2 ) P (X d x d ). 4.45 Definicja Dystrybuantą wektora losowego X nazywamy funkcję IR d x = (x 1, x 2,..., x d ) T F X (x) = P (X 1 x 1, X 2 x 2,..., X d x d ). 4.46 Uwaga Na mocy warunku (iii) twierdzenia 4.44, zmienne losowe są niezależne dokładnie wtedy, gdy dystrybuanta ich rozkładu łącznego jest iloczynem dystrybuant rozkładów brzegowych. W dalszym ciągu nie będziemy jednak zajmować się dystrybuantami rozkładów na IR d, gdyż są one znacznie mniej wygodnym narzędziem niż dystrybuanty na IR 1. 4.47 Fakt Jeżeli zmienne losowe X 1, X 2,..., X d są niezależne, to dla dowolnych funkcji borelowskich f 1, f 2,..., f d zmienne losowe też są niezależne. f 1 (X 1 ), f 2 (X 2 ),..., f d (X d ) 4.48 Twierdzenie Niech rozkłady zmiennych X 1, X 2,..., X d będą dyskretne. Zmienne losowe X 1, X 2,..., X d są niezależne dokładnie wtedy, gdy dla dowolnych x 1, x 2,..., x d IR 1 ma miejsce związek P (X 1 = x 1, X 2 = x 2,..., X d = x d ) = P (X 1 = x 1 )P (X 2 = x 2 ) P (X d = x d ). 4.49 Twierdzenie Niech rozkłady zmiennych X 1, X 2,..., X d będą absolutnie ciągłe z gęstościami p 1 (x), p 2 (x),..., p d (x). Zmienne losowe X 1, X 2,..., X d są niezależne dokładnie wtedy, gdy rozkład łączny tych zmiennych jest absolutnie ciągły i jego gęstość ma postać p X (x 1, x 2,..., x d ) = p 1 (x 1 )p 2 (x 2 ) p d (x d ).
Niezależność stochastyczna 41 4.50 Definicja Rodzina zdarzeń {A i } i I jest niezależna, jeśli funkcje charakterystyczne {I Ai } i II tych zdarzeń są niezależne. 4.51 Twierdzenie Zdarzenia {A i } i II są niezależne dokładnie wtedy, gdy dla dowolnego skończonego podzbioru II 0 II ( ) P A i = Π i II0 P (A i ). i II 0 4.52 Definicja Zmienne losowe {X i } i II są niezależne parami, jeśli dla każdych i, j II, i j, zmienne X i i X j są niezależne. Podobnie, zdarzenia {A i } i II sa niezależne parami, jeśli każde dwa zdarzenia A i i A j, i j są niezależne. 4.53 Zadanie Podać przykład zdarzeń niezależnych parami, ale zależnych zespołowo (np. przykład Bernsteina). 4.54 Definicja Splotem rozkładów µ i ν nazywamy miarę probabilistyczną µ ν zadaną wzorem (µ ν)(a) = µ(a y)ν(dy) = ν(a x)µ(dx). Równoważnie: splot µ ν jest transportem miary produktowej µ ν z IR 1 IR 1 na IR 1 za pomocą funkcji h(x, y) = x + y. 4.55 Wniosek Jeżeli zmienne losowe X i Y są niezależne, to rozkład sumy X + Y jest splotem rozkładów zmiennych X i Y : P X+Y = P X P Y. 4.56 Twierdzenie Jeżeli p(x) i q(y) są gęstościami niezależnych zmiennych losowych X i Y, to rozkład sumy X + Y jest splotem gęstości p i q. p X+Y (z) = + p(z y)q(y) dy = + q(z x)p(x) dx. 4.57 Zadanie Niech T : IR 2 IR 2 spełnia założenia tw. o zmianie zmiennych w całce Lebesgue a. Niech rozkład wektora losowego (X, Y ) będzie absolutnie ciągły o gęstości p(x, y). Znaleźć gęstość wektora T (X, Y ). 4.58 Zadanie Pokazać, że jeśli X i Y są niezależne i mają rozkład N (0, 1), to zmienne X+Y 2 i X Y 2 mają też rozkład normalny N (0, 1) i są niezależne.