Teoria miary WPPT/Matematyka, rok II Wykład 5 Funkcje mierzalne Niech (X, F) będzie przestrzenią mierzalną i niech f : X R. Twierdzenie 1. NWSR 1. {x X : f(x) > a} F dla każdego a R 2. {x X : f(x) a} F dla każdego a R 3. {x X : f(x) < a} F dla każdego a R 4. {x X : f(x) a} F dla każdego a R Dowód. (1 2) (2 3) ( f 1 ([a, + ]) = f 1 (a 1 ) n, + ]) = f 1 ( (a 1 n, + ]) ) F f 1 ([, a)) = f 1 (R \ [a, ]) = X \ f 1 ([a, ]) F Pozostałe wynikania mają podobne uzasadnienie. Polecam jako ćwiczenie. Definicja 1. Funkcja f : X R jest mierzalna, gdy zachodzi dowolny z powyższych warunków. Inaczej, f jest mierzalna, gdy f 1 ((a, + ]) F dla każdego a R, gdy f 1 ([a, + ]) F itd. Uwaga. Dlaczego definicja wygląda w taki sposób? Rozważmy następujący przykład: rzucamy monetą sprawiedliwą tak długo aż wypadnie nam orzeł. Możliwe do zaobserwowania wyniki takiego eksperymentu zapisujemy jako: O, RO, RRO, RRRO,... Rozważamy więc przestrzeń X wszystkich takich ciągów. W naturalny sposób określamy miarę na tej przestrzeni (na σ-ciele wszystkich podzbiorów) prawdopodobieństwo orła w pierwszym rzucie to 1/2, prawdopodobieństwo ciągu RO to 1/4 itd. Niech f(x) oznacza liczbę wykonanych rzutów. Naturalne jest na przykład pytanie: jakie jest prawdopodobieństwo, że wykonamy nie więcej niż n (np.)5 rzutów, czyli jaka jest miara zbioru {x : f(x) n}. Czyli chcemy, by zbiór tego typu był mierzalny! Tu nie ma z tym problemu, bo w naszej przestrzeni miara jest określona na wszystkich podzbiorach przestrzeni. Ale w bardziej skomplikowanym przypadku f(x) może oznaczać cenę pewnego papieru wartościowego i zmieniać się w sposób ciągły (a przynajmniej tak jest wygodnie przyjąć). Naturalne jest pytanie, jakie jest prawdopodobieństwo, że cena przekroczy wartość a, czyli pytanie o miarę zbioru {x : f(x) a}. Zbiory w definicji mierzalności funkcji formalizują w istocie najprostsze pytania, jakie można zadawać na temat funkcji rzeczywistych. Chcemy umieć odpowiadać na te pytania, tzn. chcemy, by odpowiadające im zbiory były mierzalne. 1
Fakt 1. f 1 ([a, b]) F dla dowolnych a, b R. Dowód. f 1 ([a, b]) = f 1 ([a, ] [, b]) = f 1 ([a, ]) f 1 ([, b]) F Fakt 2. f 1 ({a}) F dla każdego a R. f 1 ({ }) F i f 1 ({+ }) F. Dowód. Pierwsze stwierdzenie wynika z poprzedniego faktu, bo {a} = [a, a]. ( ) f 1 ({ }) = f 1 [, n] = f 1 ([, n]) F Podobnie dla f 1 ({ }). Fakt 3. f 1 ((a, b)), f 1 ([a, b]), f 1 ((a, b]), f 1 ([a, b)) F dla dowolnych a, b R. Dowód. Wynika z poprzednich faktów. Przykładowo, f 1 ((a, b]) = f 1 ([a, b]) \ f 1 ({a}), a różnica zbiorów mierzalnych jest zbiorem mierzalnym. Uwaga: Wszystie powyższe stwierdzenia działają, gdy funkcja przyjmuje tylko wartości rzeczywiste (bez nieskończoności), bo każda funkcja o wartościach rzeczywistych jest jednocześnie funkcją w zbiór R. Wtedy na przykład f 1 ([a, + ]) = f 1 ([a, + )). Twierdzenie 2. Funkcja f : X R jest mierzalna wtedy i tylko wtedy, gdy f 1 (B) F dla każdego B B(R). Dowód. Warunek jest wystarczający, bo półprosta {y R: y > a} = (a, + ) jest zbiorem borelowskim. Na odwrót, rozważmy rodzinę A = {B B(R): f 1 (B) F}. Można pokazać, że jest to σ-ciało. Z powyższych faktów, A zawiera odcinki otwarte, zatem A = B(R). Czyli f 1 (B) F dla każdego B B(R). Twierdzenie 3. Niech f i g będą mierzalnymi funkcjami rzeczywistymi o tej samej dziedzinie i niech c R. Wtedy funkcje f + c, cf, f + g, f g, fg są również mierzalne. Dowód. Ustalmy a R. 1) Pokażemy najpierw mierzalność f + c, c R, gdy f jest mierzalna. {x: f(x) + c > a} = {x: f(x) > a c} F 2) Podobnie dla cf, ale rozumowanie trzeba podzielić na przypadki. Jeśli c = 0, to cf 0, więc X, gdy a 0 {x : cf(x) > a} =, gdy a > 0 Zarówno X jak i są mierzalne, więc zbiór {x : cf(x) > a} musi być mierzalny. Dla c > 0 mamy {x : cf(x) > a} = {x : f(x) > a } F, a dla c < 0 zachodzi {x : cf(x) > a} = {x : c f(x) < a} F. c 2
3) Rozważmy sumę funkcji mierzalnych f i g. {x: (f + g)(x) > a} = {x: f(x) > a g(x)} = {x: f(x) < r < a g(x)} r Q = {x: f(x) < r} {x: r < a g(x)} F, r Q bo {x: f(x) < r} F oraz {x: r < a g(x)} = {x: g(x) < a r} F dla dowolnej liczby r, a przekrój oraz suma przeliczalna nie wyprowadzają poza σ-ciało. Dla f g wystarczy pokazać, że g jest mierzalna. 4) Teraz fg. Zauważmy, że fg = 1((f + 2 g)2 f 2 g 2 ), więc wystarczy pokazać, że f 2 jest mierzalna. {x : f 2 X, gdy a 0 (x) > a} = {x : f(x) < a} {x : f(x) > a}, gdy a > 0 W obu przypadkach otrzymujemy zbiór mierzalny. 5) Aby pokazać mierzalność ilorazu, należy najpierw uzasadnić, że jeśli g jest mierzalna i różna od zera, to także 1/g jest mierzalna. Następnie korzystamy z uzasadnionej już mierzalności iloczynu funkcji mierzalnych, w tym wypadku f i 1/g. Twierdzenie 4. Niech (X, F) będzie przestrzenią mierzalną, a (f n ) n N będzie ciągiem funkcji mierzalnych X R. Wtedy funkcje inf,...,n f n, sup,...,n f n, inf n N f n, sup n N f n, lim inf n f n, lim sup n f n (a więc też lim n f n, jeśli istnieje) są mierzalne. Dowód. {x : inf,...,n f n(x) < a} = {x : n {1,..., N} f n (x) < a} = Pozostałe na ćwiczeniach. Przykłady N {x : f n (x) < a} F 1. Funkcja charakterystyczna 1 A jest mierzalna wtedy i tylko wtedy, gdy A jest zbiorem mierzalnym. W szczególności funkcja charakterystyczna zbioru Vitalego jest niemierzalna. 2. Rozważmy R z σ-ciałem zbiorów przeliczalnych i koprzeliczalnych. Wtedy f(x) = x nie jest mierzalna, bo np. {x : f(x) > 0} = (0, ) nie jest zbiorem mierzalnym. Niech µ będzie miarą na przestrzeni mierzalnej (X, F). Definicja 2. Mówimy, że pewna własność zachodzi prawie wszędzie, gdy zbiór, na którym ta własność nie zachodzi ma miarę zero. Innymi słowy, istnieje E F taki, że µ(e) = 0 i własność zachodzi na E c. W szczególności, funkcje f : X R i g : X R są równe prawie wszędzie, gdy µ({x X : f(x) g(x)}) = 0. Będziemy wtedy pisać: f = g µ-p.w. 3
Fakt 4. Relacja równości prawie wszędzie jest relacją równoważności na zbiorze wszystkich funkcji mierzalnych na ustalonej przestrzeni X. Dowód. Sprawdzimy tylko przechodniość tej relacji. Jeśli f = g µ-p.w., to istnieje zbiór E, µ(e) = 0, taki że f(x) = g(x) dla wszystkich x E c. Podobnie, jeśli g = h µ- p.w., to istnieje zbiór F, µ(f ) = 0, taki że g(x) = h(x) dla wszystkich x F c. Wtedy dla x E c F c mamy f(x) = h(x). Przy tym, µ((e c F c ) c ) = µ(e F ) µ(e)+µ(f ) = 0. Twierdzenie 5. Załóżmy, że miara µ jest zupełna na (X, F) (tzn. jeśli µ(e) = 0 i F E, to F F). Jeśli f = g µ-p.w. i f jest mierzalna, to g jest również mierzalna. Dowód. Niech E = {x X : f(x) g(x)}. Z założenia µ(e) = 0. Wtedy dla dowolnego a R mamy {x: g(x) > a} = {x E c : g(x) > a} {x E : g(x) > a} = (E c {x X : f(x) > a}) {x E : g(x) > a} Pierwszy składnik sumy to przekrój dwóch zbiorów mierzalnych jest więc mierzalny a drugi jest mierzalny jako podzbiór zbioru E miary zero. Rozważając funkcje f : R R przez funkcję mierzalną będziemy domyślnie rozumieć funkcję mierzalną względem σ-ciała L(R) zbiorów mierzalnych w sensie Lebesgue a. Dlatego na przykład powyższe twierdzenie zachodzi w szczególności dla funkcji f : R R. Ponieważ jednak na R mamy dwa ważne σ-ciała, wprowadzimy drugą definicję: Definicja 3. Funkcja f : R R jest borelowska, gdy {x: f(x) > a} jest borelowski. Twierdzenie 6. Każda funkcja borelowska jest mierzalna w sensie Lebesgue a. Dowód. Wiemy, że B(R) L(R), więc jeśli {x: f(x) > a} jest borelowski, to tym bardziej mierzalny w sensie Lebesgue a. Uwaga. Funkcje borelowskie to po prostu funkcje mierzalne względem σ-ciała borelowskiego, więc mają wszystkie powyższe włąsności: suma, różnica, iloczyn i iloraz (o ile mianownik różny od zera) funkcji borelowskich jest funkcją borelowską; warunkiem równoważnym borelowskości jest warunek B B(R) zbiór f 1 (B) jest borelowski. Twierdzenie 7. Jeśli f : X R jest funkcją mierzalną, a g : R R funkcją borelowską, to złożenie g f : X R, g f(x) = g(f(x)), jest funkcją mierzalną. Dowód. {x X : g f(x) > a} = {x: f(x) g 1( (a, ) ) } = f 1( g 1 ((a, )) ) Funkcja g jest borelowska, więc zbiór g 1 ((a, )) jest borelowski, a stąd wobec mierzalności f zbiór f 1( g 1 ((a, )) ) jest mierzalny. Twierdzenie 8. Każda funkcja ciągła jest borelowska. 4
Dowód. Jeśli wiemy coś niecoś z topologii, to wystarczy zauważyć, że B(R) jest generowane przez zbiory otwarte, a przeciwobraz każdej półprostej otwartej (lub odcinka otwartego) przez funkcję ciągła jest zbiorem otwartym. My udowodnimy, że dla dowolnej liczby a R przeciwobraz półprostej {x: f(x) > a} jest przeliczalną sumą odcinków otwartych, zatem jest borelowski. Istotnie, jeśli y (a, + ), to istnieje ɛ y > 0, dla którego odcinek (y ɛ y, y + ɛ y ) zawiera się w (a, + ). Niech x należy do {x: f(x) > a}. Z ciągłości (definicja Cauchy ego) znajdujemy δ > 0, dla której (x δ, x + δ) f 1 (f(x) ɛ f(x), f(x) + ɛ f(x) ). Wobec gęstości liczb wymiernych przedział wokół x można zmniejszyć tak, by uzyskać końce wymierne: x (q x, r x ) f 1 (f(x) ɛ f(x), f(x)+ɛ f(x) ), q x, r x Q. Ponieważ przedziałów o końcach wymiernych jest tylko przeliczalnie wiele, a {x: f(x) > a} = x(q x, r x ) otrzymujemy, że {x: f(x) > a} jest borelowski. Naturalne jest pytanie o odwrotne relacje: jak daleko leży dowolna funkcja borelowska, czy mierzalna od funkcji ciągłej? Niedaleko, a formalną odpowiedź zapewnia twierdzenie Łuzina. Twierdzenie 9 (Łuzin). Niech f : [a, b] R będzie funkcją mierzalną. Dla każdego ɛ > 0 istnieje zbiór domknięty (zwarty) E taki, że obcięcie f do E jest funkcją ciągłą i λ(e c ) < ɛ. Inne sformułowanie, dla każdego ɛ > 0 istnieje funkcja ciągła g : [a, b] R, taka że λ({x [a, b]: f(x) g(x)}) < ɛ. To twierdzenie można uogólniać, ale nie zawsze te dwa sformułowania są równoważne (drugie jest wyraźnie silniejsze). Aby zrozumieć różnicę, warto rozważyć funkcję Dirichleta na [0, 1]. Jasne jest że spełnia drugą tezę - funkcja stale równa zero jest tu odpowiednią funkcją ciągłą. Ale trudno się dopatrzyć odpowiedniego zbioru domkniętego. Do dowodu być może jeszcze wrócimy, ale najpierw przejdziemy do pytań o zbiory - jak daleko leżą zbiory mierzalne od borelowskich. Albo inaczej, co trzeba dorzucić do σ-ciała borelowskiego, by uzyskać σ-ciało zbiorów Lebesgue a. Definicja 4. Rodzinę I podzbiorów X nazywamy ideałem, gdy 1. φ I 2. jeśli E F i F I, to E I, 3. jeśli E I i F I, to E F I. I jest σ-ideałem, gdy ostatni warunek zastąpimy przez E 1, E 2,... I E n I. Definicja 5. Zbiór F X nazwiemy µ-zerowym, gdy istnieje E F taki, że F E oraz µ(e) = 0. Twierdzenie 10. Rodzina N wszystkich zbiorów µ-zerowych jest σ-ideałem. Dowód. Dowód przez sprawdzenie aksjomatów. 5
Niech (X, F, µ) będzie przestrzenią miarową, a N rodziną zbiorów µ-zerowych. Definiujemy F = σ(f N ) (tzn. σ ciało generowane przez rodziny F i N ), F 1 = {E X : A, B F A E B µ(b \ A) = 0}, F 2 = {E X : C F E C N }. Twierdzenie 11. F 1 = F 2 = F, a µ można przedłużyć do miary µ na F w taki sposób, aby otrzymana przestrzeń miarowa (X, F, µ) była zupełna (tzn. tak aby każdy podzbiór zbioru miary zero był mierzalny i miał także miarę zero). Powyższą konstrukcję nazywa się uzupełnianiem miary. Twierdzenie 12. Uzupełnieniem σ-ciała borelowskiego B R na prostej R jest σ-ciało L R zbiorów mierzalnych względem miary Lebesgue a. 6