Koncentracja Miary. Rafał Latała. 23 maja 2009

Koncentracja Miary Rafał Latała 23 maja 29 Poniższe notatki powstają na podstawie wybranych) wykładów z Koncentracji Miary, prowadzonych w semestrze wiosennym 28/9. Przepraszam za wszystkie nieścisłości i omyłki mogące pojawić się w tekście i jednocześnie zwracam się z prośbą do czytelników, którzy zauważyli błędy lub mają jakieś inne uwagi na temat notatek o kontakt mailowy na adres rlatala@mimuw.edu.pl z podaniem wersji notatek daty) do której chcą się ustosunkować. Dziękuje panom Kamilowi Kosińskiemu i Piotrowi Nayarowi za nadesłane komentarze. Rafał Latała 1

Spis treści 1 Wprowadzenie 3 1.1 Koncentracja funkcji lipschitzowskich...................... 5 1.2 Obserwowalna średnica zbioru.......................... 7 1.3 Transport miary................................. 8 2 Nierówności izoperymetryczne 8 2.1 Klasyczna izoperymetria............................. 8 2.2 Izoperymetria sferyczna............................. 11 2.3 Izoperymetria gaussowska............................ 12 3 Koncentracja w przestrzeniach produktowych 15 3.1 Transformata Laplace a............................. 15 3.2 Metody Martyngałowe.............................. 15 3.3 Nierówność Poincaré............................... 19 3.3.1 Charakteryzacja na prostej....................... 24 3.4 Logarytmiczna Nierówność Sobolewa...................... 27 3.5 Nierówność Bobkowa............................... 32 3.6 Nierówności Splotu Infimum........................... 32 3.7 Nierówności Splotu Infimum dla Funkcji Wypukłych............. 37 3.8 Nierówność Logarytmiczna Sobolewa dla Funkcji Wypukłych........ 37 3.9 Aproksymacja przez otoczkę wypukłą..................... 38 4 Wybrane Zastosowania 42 4.1 Twierdzenie Dvoretzky ego........................... 42 4.2 Wektory i Procesy Gaussowskie......................... 46 4.3 Procesy Empiryczne............................... 5 4.3.1 Sumy niezależnych zmiennych losowych................ 5 4.3.2 Oszacowania supremów procesów empirycznych............ 51 2

1 Wprowadzenie Zacznijmy od następującej definicji otoczki zbioru. Definicja 1.1. Niech X, d) będzie przestrzenią metryczną, zaś A dowolnym podzbiorem X. Dla t > określamy t-otoczenie zbioru A wzorem A t := {x X : dx, A) < t} = y A By, t), gdzie By, t) oznacza kulę otwartą w X o środku w y i promieniu t. Okazuje się, że dla wielu ważnych przykładów miar probabilistycznych µ na X, d) miara µa t ) szybko zbiega do 1 jeśli tylko µa) 1/2. Badanie tego zjawiska, zwanego fenomenem koncentracji miary i jego konsekwencji będzie celem tego wykładu. Na początek wykładu podamy kilka przykładów, których dowody przedstawimy później. Przykład 1. Niech d oznacza odległość geodezyjną na n wymiarowej sferze S n = {x R n+1 : x = 1}, zaś σ n oznacza unormowaną miarę powierzcniową na S n. Wówczas okazuje się, że jeśli chcemy zminimalizować σ n A t ) po wszystkich zbiorach ustalonej miary ekstremalne są kule zwane też czapeczkami), to znaczy σ n A) = σ n Bx, r)) σ n A t ) σ n Bx, r) t ) = σ n Bx, r + t)). W szczególności jeśli σ n A) 1/2, to σ n A t ) σ n B x, π )) 2 + t 1 exp Wprowadźmy kluczową definicję: n 1)t2 ). 2 Definicja 1.2. Niech µ będzie miarą probabilistyczną na X, d). Funkcją koncentracji miary µ definiujemy jako { α µ t) = α X,d,µ) t) := sup 1 µa t ): µa) 1 }. 2 Zatem α σn t) exp n 1 2 t2 ). Uwaga 1.3. Zauważmy, że funkcja koncentracji σ n szybko zbiega do przy n. Jedną z przyczyn tego zjawiska jest to, że miara ta nie jest dobrze unormowana. Jeśli przez σ n,r określimy rozkład jednostajny na sferze RS n, to ponieważ jest on obrazem σ n przy jednokładności o skali R, to α σn,r t) = α σn t R ) exp n 1 2R 2 t2). 3

Zauważmy też, że RSn x i x j dσ n,r x) = R2 n δ i,j. Zatem miara jednostajna na ns n ma dobrą normalizację, to znaczy taką, że macierz kowariancji jest identycznością. Dla tej miary dla n 2, α σn, n t) exp n 1 2n t2) exp 1 4 t2). Przykład 2. Niech γ k oznacza kanoniczny rozkład gaussowski na R k tzn. rozkład z gęstością 2π) k/2 exp x 2 /2). Wówczas ekstremalnymi zbiorami w problemie izoperymetrycznym okazują się półprzestrzenie, tzn. jeśli to W szczególności γ k A) = γ k, r] R k 1) = Φr),, γ k A t ) γ k r] R k 1 ) ) = γ t k, r + t] R k 1) = Φr + t). α γk t) 1 Φt) 1 2 e t2 /2. Zauważmy, że powyższe oszacowania nie zależą od wymiaru przestrzeni. Przykład 3. Niech ν będzie symetrycznym rozkładem wykładniczym, tzn. rozkładem na R z gęstością 1 2 exp x ). Przez νk będziemy oznaczać rozkład produktowy ν... ν na R k. Wyznaczenie ekstremalnych zbiorów dla problemu izoperymetrycznego związanego z tą miarą jest trudne i nieznane dla k 1. Choć wiadomo, że ekstremalne nie są półprzestrzenie postaci, r] R k 1, to są one optymalne z dokładnością do stałej, tzn. ν k A) = ν, r]) ν k A t ) ν, r + 1 2 ]) 6 t. W szczególności 1 α ν kt) 1 ν, 2 ]) 6 t = 1 2 exp 1 2 ) 6 t. Zauważmy, że znowu uzyskane oszacowanie nie zależy od wymiaru przestrzeni. Przykład 4. Niech µ będzie unormowaną miarą liczącą na kostce dyskretnej {, 1} n z metryką dx, y) = 1 n #{i: x i y i }. Tu problem izoperymetryczny daje się rozwiązać optymalne są kule, ewentualnie z dodanymi punktami na brzegu). W tym przypadku można pokazać, że α µ t) e 2nt2. Krótki przegląd wyników pokazuje, że w wielu ważnych zastosowaniach można wykazać, że α µ t) C 1 exp t 2 /C 2 ) mówimy wtedy, że funkcja koncentracji jest typu gaussowskiego. Widzielismy też przykład, w którym α µ t) C 1 exp t/c 2 ) mówimy wtedy o koncentracji wykładniczej. 4

1.1 Koncentracja funkcji lipschitzowskich W wielu zastosowaniach nie interesuje nas jak zmienia się miara otoczenia zbioru, a raczej jak szybko maleją ogony funkcji określonych na przestrzeni. W tej części powiążemy ze sobą te zjawiska. Zacznijmy od definicji mediany i modułu ciągłości. Definicja 1.4. Niech µ będzie miarą probabilistyczną na X, d) oraz f : X R. Medianą funkcji f względem miary µ nazywamy taką liczbę M = Med µ f) dla której µ{x: fx) M}) 1 2 oraz µ{x: fx) M}) 1 2. Modułem ciągłości f nazywamy funkcję w f t) := sup{ fx) fy) : dx, y) t}. Fakt 1.5. Dla dowolnej funkcji F : X R, µ{x: F x) > Med µ F ) + w F t)}) α µ t) oraz µ{x: F x) Med µ F ) > w F t)}) 2α µ t). Dowód. Niech A := {x: F x) Med µ F )} wówczas µa) 1/2 zatem µa t ) 1 α µ t). Ponadto, jeśli x A t, to istnieje y A takie, że dx, y) < t i wówczas F x) F y) + w F t) Med µ F ) + w F t), stąd pierwsza nierówność w fakcie. Stosując ją do F i zauważając, że Med µ F ) = Med µ F ) oraz w F = w F dostajemy µ{x: F x) < Med µ F ) w F t)}) α µ t). Dodając powyższą nierówność do poprzedniej otrzymamy ostatnią część faktu. Przypomnijmy definicję funkcji lipschitzowskiej Definicja 1.6. Funkcję F : X, d) R nazywamy lipschitzowską, jeśli F x) F y) F Lip := sup <. x y dx, y) Mówimy, że funkcja jest L-lipschitzowska jeśli F Lip L, tzn. F x) F y) Ldx, y) dla wszystkich x, y X. Analogicznie można zdefiniować funkcje lipschitzowskie między przestrzeniami metrycznymi. 5

Fakt 1.7. i) Jeśli F jest lipschitzowska ze stałą L, to dla t >, oraz µ{x: F x) > Med µ F ) + t}) α µ t/l) µ{x: F x) Med µ F ) > t}) 2α µ t/l). ii) Na odwrót, jeśli dla każdej funkcji 1-lipschitzowskiej F i ustalonego t >, to α µ t) α. µ{x: F x) Med µ F ) + t}) α, Dowód. i) Wynika z Faktu 1.5 i oczywistego szacowania w f t) tl. ii) Ustalmy zbiór A taki, że µa) 1/2 i określmy F x) := dx, A). Wówczas F jest 1-lipschitzowska oraz Med µ F ) =, zatem α µ{f t}) = µ{x: dx, A) t}) = 1 µa t ). Często łatwiej i naturalniej jest wykazywać koncentrację funkcji lipschitzowskich wokół średniej a nie mediany. Kolejny fakt pokazuje jak odzyskać funkcję koncentracji w takim przypadku. Fakt 1.8. Załóżmy, że µ jest miarą probabilistyczną na przestrzeni metrycznej X, d) oraz dla ograniczonych funkcji 1-lipschitzowskich F i t > zachodzi { }) µ x: F x) > F dµ + t αt). 1) Wówczas dla dowolnego zbioru borelowskiego A takiego, że µa) > zachodzi 1 µa t ) αµa)t). W szczególności t α µ t) α. 2) Ponadto, jeśli lim t αt) =, to dowolna funkcja 1-lipschitzowska jest całkowalna i jeśli dodatkowo α jest ciągła, to 1) zachodzi dla wszystkich funkcji 1-lipschitzowskich. Dowód. Ustalmy zbiór borelowski A taki, że µa) > oraz liczbę t >. Zdefiniujmy F x) := min{dx, A), t}, wówczas funkcja F jest ograniczona, 1-lipschitzowska i F dµ t1 µa)). Stąd na mocy 1), { 1 µa t ) = µ{f t}) µ F }) F dµ + µa)t αµa)t). 6

W szczególności, jeśli µa) 1/2, to 1 µa t ) αt/2). By udowodnić drugą część faktu, ustalmy funkcję 1-lipschitzowską F i niech F n := min{ F, n}. Z 1) zastosowanej do F n dostajemy { µ x: F n x) }) F n dµ t αt). Wybierzmy t takie, że αt ) < 1/2 oraz m := Med µ F. Wówczas µ{f n m}) 1/2, czyli zbiory {F n m} oraz {F n > F n dµ t } mają niepuste przecięcie. Zatem F n dµ m+t i z twierdzenia Lebesgue a o zbieżności monotonicznej dostajemy F dµ m + t <. Ostatnią część tezy dostajemy stosując 1) do min{max{f, n}, n} i przechodząc z n. 1.2 Obserwowalna średnica zbioru Średnicą zbioru A w przestrzeni metrycznej X, d) nazywamy DiamA) := sup{dx, y): x, y A}. Jeśli próbujemy obserwować jakiś obiekt, to możemy przyjąć, że zbiory miary mniejszej niż pewne κ > są dla nas niezauważalne założenie to np. dla κ = 1 1 wydaje się całkiem uzasadnione, jeśli miara µ jest związana ze stopniem oświetlenia obiektu). Motywuje to definicje częściowej średnicy PartDiam µ X, d) = inf{diama): µa) 1 κ}. W praktyce również nie jesteśmy w stanie obserwować obiektów wielowymiarowych, a jedynie ich przekroje. Stosując pewne uproszczenie możemy założyć, że przestrzeń obserwujemy za pomocą funkcji 1-lipschitzowskich F, tzn. badamy rozkład µ F 1 na F X) np. natężenie światła). Stąd wprowadzamy Definicja 1.9. Obserwowalną średnicą przestrzeni X, d) względem miary µ nazywamy wielkość ObsDiam µ X, d) := sup { PartDiam µ F 1F X)): F : X R, F Lip 1 }. Fakt 1.1. gdzie α 1 µ ε) = inf{r > : α µ r) ε}. ObsDiam µ X, d) 2α 1 µ κ/2), Dowód. Ustalmy funkcję 1-lipschitzowską F na X i niech M = Med µ F ), wówczas na podstawie Faktu 1.7, µ F 1 [M + r, M r]) = µ F M r) 1 2α µ r). 7

Zatem ObsDiam µ X, d) 2 inf{r : 2α µ r) κ} = 2α 1 µ κ/2). Przykład. Dla gaussowskiej funkcji koncentracji α X,d,µ) t) C 1 exp t 2 /C 2 ) mamy ObsDiam µ X, d) 2 C 2 ln2c 1 /κ). W szczególności ObsDiam σn S n ) jest rzędu 1/ n, podczas gdy nietrudno sprawdzić, że DiamS n ) = π i PartDiam µ S n ) π/2. 1.3 Transport miary W wielu zagadnieniach będziemy używali pojęcia transportu miary. Definicja 1.11. Niech µ i ν będą miarami na przestrzeniach metrycznych X i Y. Powiemy, że funkcja borelowska ϕ: X Y transportuje miarę µ na miarę ν ew. miara ν jest obrazem miary µ przy przekształceniu ϕ) jeśli νa) = µ ϕ 1 A) dla wszystkich A BY ). Szczególnie wygodny jest transport lipschitzowski. Fakt 1.12. Jeśli ϕ: X Y jest L-lipschitzowska oraz ϕ transportuje miarę µ na ν, to α ν t) α µ t/l). Dowód. Wystarczy zauważyć, że ϕ 1 A)) t/l ϕ 1 A t ). 2 Nierówności izoperymetryczne W tej części omówimy kilka nierówności izoperymetrycznych, pokazując różne sposoby ich dowodzenia - poprzez powiązane nierówności funkcyjne, symetryzacje czy transport miary. 2.1 Klasyczna izoperymetria Chociaż w tym wykładzie będziemy się zajmować miarami probabilistycznymi, to przegląd nierówności izoperymetrycznych zaczniemy od klasycznego przypadku n-wymiarowej miary Lebesgue a λ n. Twierdzenie 2.1. Jeśli A jest podzbiorem borelowskim R n takim, że λ n A) = λ n Bx, r)), to dla dowolnego t >, λ n A t ) λ n Bx, r) t ) = λ n Bx, r + t)). Twierdzenie 2.2 Nierówność Prekopy-Leindlera). Jeśli s [, 1] oraz f, g, h: R n [, ) spełniają warunek hsx + 1 s)y) fx) s gy) 1 s dla x, y R n, 2) 8

to ) s hx)dx fx)dx gx)dx R n R n R n ) 1 s Dowód. Najpierw wykażemy, że dla niepustych zbiorów A, B BR n ) zachodzi λ 1 A + B) λ 1 A) + λ 1 B). Ponieważ λ 1 A) = sup{λ 1 K): K A, K zwarty}, to możemy przyjąc, że zbiory A i B są zwarte. Ponadto odpowiednio je przesuwając możemy też zakładać, że sup A = inf B =. Wówczas A B = oraz λ 1 A + B) λ 1 A B) = λ 1 A) + λ 1 B). Nierówność Prekopy-Leindlera udowodnimy przez indukcje po n. Najpierw rozważmy n = 1. Możemy zakładać, że f, g i h są ograniczone, a z uwagi na jednorodność, że sup fx) = sup gx) = sup hx) = 1. Zauważmy, że dla r < 1, {h r} s{f r} + 1 s){g r}, więc całkując przez części dostajemy 1 1 hx)dx = λ 1 {h r})dr λ 1 s{f r} + 1 s){g r})dr = s 1 λ 1 s{f r}) + λ 1 1 s){g r})dr ) s ) 1 s. fdx + 1 s) gdx fdx gdx Załóżmy teraz, że n 2 oraz teza twierdzenia zachodzi dla n 1. Niech f, g, h spełniają 2) i określmy dla x R F x) = fx, z)dz, Gx) = R n 1 gx, z)dz oraz Hx) = R n 1 gx, z)dz. R n 1 Zauważmy, że dla ustalonego x, y R hsx + 1 s)y, sz 1 + 1 s)z 2 ) fx, z 1 ) s gy, z 2 ) 1 s dla z 1, z 2 R n 1. Zatem na mocy założenia indukcyjnego Hsx + 1 s)y) F x) s Gy) 1 s. Stosując nierówność Prekopy-Leindlera w udowodnionym wcześniej przypadku n = 1 dostajemy ) s ) 1 s hx)dx = Hx)dx F x)dx Gx)dx R n R R R ) s ) 1 s = fx)dx gx)dx R n R n 9

Wniosek 2.3 Nierówność Brunna-Minkowskiego). Dla dowolnych niepustych zbiorów borelowskich A, B R n, λ n sa + 1 s)b) λ n A) s λ n B) 1 s dla s [, 1] oraz λ n A + B) 1/n λ n A) 1/n + λ n B) 1/n. Dowód. Pierwsza nierówność natychmiast wynika z nierówności Prekopy-Leindlera zastosowanej do funkcji f = 1 A, g = 1 B oraz h = 1 sa+1 s)b. By udowodnić drugą wystarczy rozważyć przypadek, gdy A i B są zbiorami skończonej i niezerowej miary. Przyjmijmy wtedy Ã = A s, B = B 1 s oraz s = λ n A) 1/n λ n A) 1/n + λ n B) 1/n. Wówczas λ n Ã) = λ n B) = λ n A) 1/n + λ n B) 1/n ) n, więc na podstawie wykazanej poprzednio nierówności λ n A + B) = λ n sã + 1 s) B) λ n Ã)s λ n B) 1 s = λ n A) 1/n + λ n B) 1/n ) n. Uwaga 2.4. Suma dwu zbiorów borelowskich nie musi być zbiorem borelowskim, ale można wykazać, że jest zbiorem mierzalnym w sensie Lebesgue a. Dowód Twierdzenia 2.1. Niech c n = λ n B, 1)), wówczas λ n A) = c n r n i na podstawie Wniosku 2.3, λ n A t ) = λ n A + B, t)) λ n A) 1/n + λ n B, t)) 1/n ) n = c n r + t) n = λ n Bx, r + t)). Definicja 2.5. Dla miary µ na przestrzeni probabilistycznej X, d) określamy zewnętzną miarę brzegową µ + wzorem µ + A) := lim inf t + µa t ) µa). t Uwaga 2.6. Jeśli miara µ na R n ma ciągłą gęstość gx) oraz zbiór A ma gładki brzeg, to µ + A) = gx)dh n 1 x), gdzie H n 1 oznacza n 1 wymiarową miarę Haussdorffa. A 1

Równoważna różniczkowa forma klasycznej nierówności izoperymetrycznej mówi, że spośród zbiorów ustalonej objętości najmniejszą powierzchnię brzegu ma kula. Dokładniej: Twierdzenie 2.7. Jeśli A jest podzbiorem borelowskim R n takim, że λ n A) = λ n Bx, r)), to λ + n A) λ + n Bx, r)) = nc 1/n n λ n A)) n 1)/n, gdzie 2.2 Izoperymetria sferyczna c n = λ n B, 1)) = π n/2 Γn/2 + 1). Twierdzenie 2.8. Jeśli A jest podzbiorem borelowskim S n takim, że σ n A) = σ n Bx, r)) to dla dowolnego t >, Wniosek 2.9. σ n A t ) σ n Bx, r) t ) = σ n Bx, r + t)). α σn t) π 8 exp n 1) t 2). 2 Dowód. Dla n = 1 nie ma co dowodzić bo zawsze α µ t) 1/2). Będziemy więc zakładać, że n 2. Zauważmy, że r σ n Bx, r)) = s 1 n sin n 1 tdt, gdzie s n = π sinn 1 tdt. Zatem π π/2 α σn t) = 1 σ n Bx, t + π/2)) = s 1 n sin n 1 udu = s 1 n cos n 1 udu. t+π/2 t Stosując oszacowanie cos u exp u 2 /2) dla t [, π/2] dostajemy π/2 t cos n 1 udu = π/2 t e n 1)u2 /2 du 2π n 1 1 Φt n 1)) 1 n 1 t n 1 e s2 /2 ds π 2n 1) e n 1)t2 /2. Ponadto łatwe całkowanie przez części daje, że dla n 3, s n = n 2 n 1 s n 2, stąd n 1sn = n 2 n 1 s n 2 n 3s n 2, zatem inf n 1sn = min{s 2, 2s 3 } = min{2, π/ 2} = 2. n 2 11

2.3 Izoperymetria gaussowska Przypomnijmy, że przez γ k oznaczamy kanoniczny rozkład gaussowski na R k, tzn. rozkład z gęstością 2π) k/2 exp x 2 /2). Głównym wynikiem, który wykażemy jest to, że dla rozkładów gaussowskich optymalne dla problemu izoperymetrycznego są półprzestrzenie afiniczne, to znaczy zbiory postaci H = {x R k : x, u < r} dla pewnych u S k 1 i r [, ]. 3) Twierdzenie 2.1. Niech H będzie półprzestrzenią afiniczną, a A zbiorem borelowskim w R k takim, że γ k H) = γ k A). Wówczas dla dowolnego t >, γ k H t ) γ k A t ) Zanim przystąpimy do dowodu twierdzenia pokażemy, że γ k jest granicą rzutowań rozkładów jednostajnych na ns n 1. Niech P = P k,n oznacza kanoniczny rzut R n na R k dla k < n, zaś σ n 1 oznacza unormowaną miarę powierzchniową na ns n 1. Oznaczmy przez µ k,n obraz σ n 1 przy tym rzutowaniu tzn. µ k,n A) = σ n 1 P 1 k,n A) ) dla A BR k ). Fakt 2.11 Lemat Poincaré). Miara µ k,n zbiega słabo przy n do miary γ k, co więcej lim µ k,na) = γ k A) dla dowolnego zbioru borelowskiego A. n Dowód. Proste rozumowanie pokazuje, że miara µ k,n ma gęstość g k,n x) = c 1 k,n g n,kx), gdzie g n,k = n x 2 n ) n k)/2 1 { x n} oraz c k,n = R k g n,k x)dx. Oczywiście lim n g k,n x) = exp x 2 /2), ponadto g k,n x) exp n k) x 2 /2n)) exp x 2 /2n)) dla n > k. Z twierdzenia Lebesgue a o zbieżności zmajoryzowanej otrzymujemy lim n c n,k = R k exp x 2 /2)dx, czyli gęstość miary µ k,n zbiega punktowo do gęstości miary γ k. Teza faktu wynika z twierdzenia Scheffé go zob. zad.8.1.7 w [1]). Dowód Twierdzenia 2.1. Ze względu na rotacyjną niezmienniczość miary γ k możemy dla uproszczenia notacji założyć, że H = {x: x 1 < r}. Ustalmy dowolne r < r i niech H = {x: x 1 < r }. Zauważmy, że γ k H ) < γ k A) zatem na podstawie Lematu Poincaré µ k,n H ) µ k,n A) dla dużych n. Ponieważ Pk,n 1 H ) ns n 1 jest kulą w ns n 1, więc na mocy izoperymetrii sferycznej ) σ n 1 Pk,n 1 A)) t σ n 1 Pk,n 1 H )) t ). Zauważmy, że przekształcenie P k,n jest oczywiście 1-lipschitzowskie, więc µ k,n A t ) µ k,n P k,n P 1 k,n A)) t)) µ k,n P k,n P 1 k,n H )) t )). 12

Nietrudno zauważyć, że oraz r n r + t przy n. Stąd P k,n P 1 k,n H )) t ) = {x: x 1 < r n } γ k A t ) = lim n µ k,na t ) lim n µ k,n{x: x 1 < r n }) = γ k {x: x 1 < r + t}), z dowolności r < r wynika teza. Twierdzenie 2.12. Jeśli γ k A) = Φx) to γ k A t ) Φx + t) oraz γ + k A) I γγ k A)), gdzie I γ x) := ϕφ 1 x)) oraz ϕx) = Φ x) = 1 2π exp x 2 /2). Dowód. Wystarczy zauważyć, że jeśli γ k H) = Φx) i H jest postaci 3), to H t = {x R k : x, u < r + t} i γ k H t ) = Φx + t). Zauważając, że Φ) = 1/2 otrzymujemy: Wniosek 2.13. α γk t) 1 Φt) 1 2 exp t2 /2). Na podstawie Faktu 1.7 dostajemy: Wniosek 2.14. Jeśli F : R k R jest funkcją L-lipschitzowską oraz t to oraz γ k {x: F x) Med γk F ) + t}) 1 Φt/L) 1 t2 e 2L 2 2 γ k {x: F x) Med γk F ) t}) 21 Φt/L)) e t2 2L 2 Transportując w sposób lipschitzowski miarę gaussowską można uzyskać oszacowania funkcji koncentracji dla innych miar. Pokażemy dwa przykłady. Wniosek 2.15. Niech µ [,1] n oznacza rozkład jednostajny na kostce [, 1] n. Wówczas µ [,1] n jest 2π) 1/2 -lipschitzowskim obrazem γ n. W szczególności α µ[,1] n 1 2 exp πt2 ). Dowód. Określmy f : R, 1) wzorem fx) = µ [,1] [, fx)]) = γ 1, x]) = Φx). Wówczas funkcja f transportuje miarę gaussowską γ 1 na µ [,1], to znaczy µ [,1] = γ 1 f 1. Ponadto f x) = 2π) 1/2 exp x 2 /2) 2π) 1/2, czyli f jest 2π) 1/2 -lipschitzowska. Jeśli teraz określimy F : R n, 1) n wzorem F x) = fx 1 ),..., fx n )), to F transportuje γ n na µ oraz F jest 2π) 1/2 -lipschitzowska. Ostatnie oszacowanie w tezie wniosku jest konsekwencją Faktu 1.12 i Wniosku 2.13. Wniosek 2.16. Niech B n = {x R n : x 1} oznacza kulę jednostkową w R n, zaś µ Bn będzie rozkładem jednostajnym na B n. Wówczas istnieje stała C taka, że µ Bn jest Cn 1/2 - lipschitzowskim obrazem γ n. W szczególności α µbn 1 2 exp nt2 /2C)). 13

Dowód. Ponieważ obie miary γ n i µ Bn są rotacyjnie niezmiennicze, będziemy szukać funkcji T : R n B n transportującej γ n na µ Bn postaci T x = x x ϕ x ). Wystarczy sprawdzić, że γ n B, t)) = µ n B, ϕt))), czyli całkując we współrzęsnych sferycznych, że dla t, gdzie Z 4) wynika, że c n = ϕt) n = 1 t r n 1 e r2 /2 dr, 4) c n ϕt) n 1 t e t2 /2 c n r n 1 e r2 /2 dr = 2 n 2)/2 Γ n 2 ). r n 1 dr = 1 nc n t n e t2 /2. Różniczkując stronami 4) dostajemy nϕ t)ϕt) n 1 = t n 1 e t2 /2 /c n, zatem ϕ t) = 1 t ) n 1e t 2 /2 1 nc n e t2 /2 ) n 1)/n e t2 /2 nc n ) 1/n. nc n ϕt) nc n Ze wzoru Stirlinga dostajemy nc n = 2 n/2 Γ n 2 + 1) n e )n/2, więc ϕ Lip = sup ϕ t) t e n. Otwarty problem. Rozwiązać zagadnienie izoperymetryczne dla zbiorów symetrycznych, to znaczy znaleźć dla ustalonego t >, c [, 1], oraz inf { γ k A t ): γ k A) = c, A = A } inf { γ + k A): γ ka) = c, A = A }. Dość naturalna hipoteza mówi, że dla c 1/2 rozwiązaniem obu problemów są zbiory postaci [ a, a] R k 1 zaś dla c < 1/2 drugi problem się optymalizuje dla R\[ a, a]) R k 1. Podobny problem można postawić dla miary σ n, ale tam analogiczna hipoteza okazuje się być niestety fałszywa. 14

3 Koncentracja w przestrzeniach produktowych 3.1 Transformata Laplace a Wiele dalszych szacowań będzie oparte na transformacie Laplace a zmiennej losowej. Definicja 3.1. Transformatą Laplace a zmiennej losowej Z nazywamy funkcję L Z λ) := Ee λz λ R. Podobnie jeśli µ jest miarą probabilistyczną na pewnej przestrzeni X oraz F : X R, to transformatę Laplace a F względem µ określamy L F,µ λ) := e λf x) dµx). Fakt 3.2. Dla dowolnej zmiennej losowej Z, W szczególności, jeśli dla pewnego a >, to dla t X PZ t) inf λ e λt L Z λ) dla t. L Z λ) expaλ 2 ) λ R, PZ t) exp t2 ) oraz P Z t) 2 exp t2 ). 4a 4a Dowód. Pierwsza część wynika z nierówności Czebyszewa, a druga z pierwszej i prostego rachunku. Zatem by udowodnić, że funkcja koncentracji miary µ jest gaussowska wystarczy wykazać, że L F,µ λ) expaλ 2 ) dla pewnego a > i wszystkich funkcji 1-lipschitzowskich F takich, że F dµ =. 3.2 Metody Martyngałowe Twierdzenie 3.3 Nierówność Azumy). Niech M k, F k ) n k= będzie martyngałem o ograniczonych przyrostach takim, że M k M k 1 a k. Wówczas PM n M t) exp t 2 2 n a 2 i ). 15

Dowód. Określmy dla 1 k n, d k := M k M k 1, wówczas Ed k F k 1 ) =. Mamy 1 u 1+u 2 x) + 2 x = ux, więc z wypukłości expx), e ux 1 u 2 e x + 1 + u e x = u sinhx) + coshx) dla u 1. 2 Stosując tę nierówność dla u = d k /a k i x = λa k dostajemy Liczymy Ee λd dk ) k Fk 1 F k 1 ) E sinhλa k ) + coshλa k ) = coshλa k ). a k Ee λmn M ) = Ee λm n 1 M +d n) = Ee λm n 1 M ) Ee λdn F n 1 )) coshλa n )Ee λm n 1 M ). Zatem iterując powyższą nierówność i stosując oszacowanie wynikające np. z rozwinięcia w szereg Taylora) coshx) expx 2 /2) dostajemy n L Mn M λ) = Ee λmn M) coshλa k ) exp 1 a 2 2 kλ 2 ). k=1 k=1 Teza twierdzenia wynika z Faktu 3.2. Uwaga 3.4. Najczęściej będziemy mieli F = {, Ω}, wówczas M jest stałe, a ponieważ martyngał ma stałą wartość oczekiwaną, to M = EM n. W poniższych zastosowaniach będziemy przyjmować M k = E µ F F k ) dla całkowalnej funkcji F : X R i odpowiednio dobranego F k ) ciągu σ-ciał podzbiorów X. Wniosek 3.5. Niech X i, d i ) będą przetrzeniami metrycznymi, X = X 1 X n z odległością l 1, to znaczy dx, y) = n d i x i, y i ) dla x, y X oraz niech µ = µ 1... µ n będzie produktem miar probabilistycznych µ i na X i. Wówczas dla dowolnej funkcji 1- lipschitzowskiej F na X { µ x: F x) gdzie D = n DiamX i ) 2 ) 1/2. W szczególności }) F dµ + t exp t2 2D 2 ), α µ t) exp t2 ) 8D 2. 16

Dowód. Na mocy Faktu 1.8 wystarczy wykazać pierwszą nierówność tezy. Niech F k będzie σ ciałem generowanym przez pierwsze k-współrzędnych oraz M k := E µ F F k ). Wówczas oczywiście M k x) = M k x 1,..., x k ) = F x)dµ i+1 x i+1 ) dµ n x n ), X k+1... X n stąd M k x) M k 1 x) = M k x 1,..., x k ) Mk x 1,..., x k )dµ k x k ) X k sup M k x 1,..., x k 1, y k ) M k x 1,..., x k 1, z k ) y k,z k X k sup F x 1,..., x k 1, y k, y k+1,..., y n ) F x 1,..., x k 1, z k, y k+1,..., y n ) y X,z k X k sup d k y k, z k ) DiamX k ) y k,z k X k i teza wynika z Twierdzenia 3.3. Definicja 3.6. Mówimy, że skończona przestrzeń metryczna X, d) ma długość conajwyżej l, jeśli istnieje rosnący ciąg podziałów X, {X} = A, A 1,..., A n = {{x}: x X} A i jest podpodziałem A i 1 ) oraz liczby a 1,..., a n spełniające n a 2 i )1/2 l takie, że dla dowolnego A A i 1 oraz B, C A i, B, C A istnieje bijekcja Φ: B C dla której dx, Φx)) a i dla x B. Uwaga 3.7. Biorąc A = {X} i A 1 = {{x}: x X} widzimy, że każda skończona przestrzeń metryczna ma długość nie większą niż DiamX). Twierdzenie 3.8. Jeśli X, d) jest skończoną przestrzenią metryczną o długości co najwyżej l, zaś µ unormowaną miarą liczącą na X, to dla funkcji 1-lipschitzowskich F na X, w szczególności { µ x: F x) }) F dµ + t exp t2 2l 2 ), α µ t) exp t2 ) 8l 2. Dowód. Ustalmy funkcję 1-lipschitzowską F. Niech F i będzie σ-ciałem generowanym przez A i oraz M i := E µ F F i ) dla i =,..., n. Wówczas M i x) = 1 F y) dla x A A i. #A y A 17

Zatem, jeśli A A i 1, B, C A i, B, C A oraz Φ: B C jest bijekcją jak w Definicji 3.6, to dla x B, y C, 1 M i x) M i y) = F z) F Φz)) sup F z) F Φz)) #B z B z B sup dz, Φz)) a i. z B Ponieważ M i 1 na A A i 1 jest uśrednieniem M i po B A, B A i, to mamy M i x) M i 1 x) a i, czyli M i M i 1 a i 1. Teza wynika z Twierdzenia 3.3 oraz Faktu 1.8. Przykład 1. Niech X = {, 1} n z odległością dx, y) = 1 n #{i: x i y i }. Możemy wtedy położyć A i = {{x 1,..., x i )} {, 1} n i : x 1,..., x i {, 1}} i łatwo sprawdzić, że założenia definicji są spełnione z a i = 1 n. Zatem l = 1/ n i α {,1} n,d,µ) exp nt2 8 ). Przykład 2. Ogólniej niech X i będą skończonymi zbiorami, X = X 1 X n, dx, y) = #{i: x i y i } oraz µ będzie unormowaną miarą liczącą na X. Analogicznie jak poprzednio oraz a i = 1. Zatem l = n i A i = {{x 1,..., x i )} X i+1 X n : x j X j, 1 j i} α X,d,µ) exp t2 8n ). Przykład 3. Niech Π n będzie grupą permutacji zbioru {1,..., n} z metryką dσ, π) = #{i: σ i π i }, a µ unormowaną miarą liczącą na Π n. Niech A i składa się ze zbiorów postaci A j1,...,j i = {σ Π n : σ1) = j 1,..., σi) = j i }. Wówczas jeśli B, C A i są podzbiorami pewnego A A i 1 to B = A j1,...,j i 1,p, C = A j1,...,j i 1,q i możemy zdefiniować bijekcję Φ między B i C jako Φ = τ p,q σ, gdzie τ p,q jest transpozycją zamieniającą p z q. Łatwo sprawdzić, że dσ, Φσ)) 2/n, zatem l = 2/ n i α Π n,d,µ) exp nt2 32 ). Ostatnie twierdzenie z tej części wiąże się z miarą Haara na zwartej grupie metrycznej G, d), to znaczy taką miarą probabilistyczną µ, że µga) = µa) = µag) dla dowolnego A BG) i g G. Zakładamy, że d jest niezmiennicza na translacje, tzn 18

dhg 1, hg 2 ) = dg 1, g 2 ) = dg 1 h, g 2 h) dla g 1, g 2, h G. Dla podgrupy domkniętej H G można wprowadzić odległość na G/H wzorem ρg 1 H, g 2 H) = dg 1, g 2 H) = dg 1 2 g 1, H). Twierdzenie 3.9. Niech µ będzie miarą Haara na zwartej grupie metrycznej G, d) oraz G = G G 1 G n = {e} będzie ciągiem domkniętych podgrup. Wówczas gdzie l = n DiamG i 1 /G i ) 2 ) 1/2. α G,d,µ) exp t2 ) 8l 2, Dowód. Niech F będzie funkcją 1-lipschitzowską, M i = E µ F F i ) gdzie F i jest σ-ciałem generowanym przez zbiory gg i. Załóżmy, że g 1 G i, g 2 G i g G i 1 wówczas g 1 g 1, g 1 g 2 G i 1, więc ze zwartości G i DiamG i 1 /G i ) dg 1 g 1, g 1 g 2G i ) = dg 1 g 1, g 1 g 2h) = dg 1, g 2 h) dla pewnego h G i. Określmy przekształcenie Φ wzorem Φg) = g 2 hg1 1 g, wówczas Φ zachowuje miarę µ oraz jest homeomorfizmem między g 1 G i g 2 G. Ponadto F g) F Φg)) dg, Φg)) = dg, g 2 hg 1 1 g) = dg 1, g 2 h) DiamG i 1 /G i ). Stąd oscylacja M i na g G i 1 jest nie większa niż a i = DiamG i 1 /G i ) czyli po uśrednieniu M i M i 1 a i i możemy stosować Twierdzenie 3.3 3.3 Nierówność Poincaré Definicja 3.1. Mówimy, że miara probabilistyczna µ na X, d) spełnia nierówność Poincaré ze stałą C, jeśli dla wszystkich ograniczonych lipschitzowskich funkcji f na X zachodzi Var µ f) C f 2 dµ, 5) gdzie f x) := lim sup y x fx) fy), dx, y) jeśli x jest punktem skupienia X i f x) =, jeśli x jest punktem izolowanym X. Uwaga 3.11. W przypadku, gdy X = R n ze standardową metryką euklidesową możemy użyć twierdzenia Rademachera, które mówi, że każda funkcja Lipchitzowska jest różniczkowalna prawie wszędzie i wtedy f x) jest dla prawie wszystkich x równy długości zwykłego gradientu f. Ponadto standardowy argument aproksymacyjny pokazuje, że by wykazać nierówność Poincaré dla miar probabilistycznych na R n wystarczy sprawdzić 5) dla ograniczonych funkcji klasy C 1 R n ) o ograniczonych pochodnych rzędu jeden. 19

Uwaga 3.12. Będziemy wykorzystywali tylko dwie własności f. Mianowicie, że dla funkcji 1-lipschitzowskich f 1 oraz, że dla dowolnej funkcji klasy C 1 R), gf ) g F ) F w szczególności f + c) = f ). Uwaga 3.13. Załóżmy, że miara µ ma gęstość postaci e V na R n. Wówczas proste całkowanie przez części pokazuje, że f 2 dµ = f + V, f )fdµ. Definiując operator Lf := f + V, f widzimy, że L1 =. Nierówność Poincaré mówi, że dla funkcji f o średniej, czyli prostopadłych do 1, flfdµ C 1 f 2 dµ. Biorąc pod uwagę samosprzężoność L nierówność 5) jest równoważna temu, że kolejna wartość własna L to conajmniej 1/C. Dlatego nierówność Poincaré się nazywa nierównością luki spektralnej spectral gap inequality). Czasem wygodniej w nierówności Poincaré zastąpić wariancję funkcji przez całkę kwadratu odchylenia od mediany, okazuje się, że prowadzi to do równoważnej nierówności. Fakt 3.14. Nierówność Poincaré jest równoważna nierówności E µ f Med µ f 2 C f 2 dµ. f LipX) Co więcej optymalne stałe w obu nierównościach spełniają C opt C opt 1 + 2) 2 C opt. Dowód. Ponieważ Var µ f) = inf c R E µf c) 2 E µ f Med µ f 2, więc oczywiście C opt C opt. By udowodnić przeciwne oszacowanie zauważmy, że Stąd Var µ f) Med µ f E µ f 2 µ{ f E µ f Med µ f E µ f}) 1 2 Med µf E µ f 2. E µ f Med µ f 2 ) 1/2 Var µ f) 1/2 + Med µ f E µ f 1 + 2)Var µ f) 1/2 i otrzymujemy C opt 1 + 2) 2 C opt. Twierdzenie 3.15. Załóżmy, że miara µ spełnia nierówność Poincaré ze stałą C. Wówczas dla każdej funkcji 1-lipschitzowskiej F i t > { }) µ F F dµ + t 2 exp t ). C W szczególności α X t) 2 exp t/2 C). 2

Dowód. Rozpatrując F F dµ możemy założyć, że F ma średnią zero. Zauważmy, że dla dowolnej funkcji różniczkowalnej g mamy gf ) g F ) F g F ). Niech Mλ) := M µ,f λ) = e λf dµ. Stosując nierówność Poincaré do e λf/2 dostajemy λ ) 2 Var µ e λf/2 ) = Mλ) M C 2 Zatem dla λ < 2/ C dostajemy Mλ) Iterując tę nierówność n razy dostajemy Mλ) n 1 k= 1 λ ) 2. 1 Cλ 2 /4 M 2 e λf/2 2 dµ Cλ2 4 Mλ). 1 ) 2k λ ) 2 n 1 Cλ 2 /4 k+1 M 2 n. Ponieważ M) = 1 i M ) = F dµ =, to Mλ/2 n ) 2n 1 przy n i Zauważmy, że Mλ) k= 1 1 Cλ 2 /4 k+1 ) 2k. 1 Cλ 2 4 k 1) 2 k 1 Cλ 2 2 k 4 k 1 = 1 C 2 λ2. k= W szczególności M1/ C) 2 i teza wynika z nierówności Czebyszewa. Fakt 3.16. Symetryczny rozkład wykładniczy ν na R z gęstością 1 2 e x spełnia nierówność Poincaré ze stałą 4. Dowód. Proste całkowanie przez części pokazuje, że dla funkcji h CogrR), 1 hx)dνx) = h) + sgnx)h x)dνx). Niech f CogrR) 1 i gx) = fx) f) wówczas g 2 dν = 2 sgnx)g x)gx)dνx) 2 1/2 g dν) 1/2, 2 g dν) 2 k= stąd Var ν f) g 2 dν 4 g 2 dν = 4 f 2 dν. 21

Fakt 3.17. Załóżmy, że µ i są miarami probabilistycznymi na X i, X = X 1... X n oraz µ = µ 1 µ 2 µ n. Wówczas dla dowolnej funkcji f L 2 X, µ) Var µ f) E µ Var µi f). Dowód. Prosta indukcja pokazuje, że wystarczy rozpatrzeć przypadek n = 2. Wówczas Var µ f) = E µ2 E µ1 f E µ f) 2 = E µ2 [Var µ1 f) + E µ1 f E µ f) 2 ] = E µ Var µ1 f) + E µ2 [E µ1 f E µ2 f)] 2 E µ Var µ1 f) + E µ2 E µ1 [f E µ2 f) 2 ] = E µ Var µ1 f) + E µ Var µ2 f), gdzie ostatnia nierówność wynika np. z nierówności Jensena. Wniosek 3.18. Załóżmy, że miary probabilistyczne µ i na X i, d i ) spełniają nierówność Poincaré ze stałą C i względem gradientu i. Wówczas miara µ = µ 1 µ n spełnia nierówność Poincaré ze stałą C = max i C i względem gradientu f danego wzorem f 2 = i f 2. Dowód. Z Faktu 3.17 dostajemy Var µ f) E µ Var µi f) E µ C i E µi i f 2 n CE µ i f 2. Wniosek 3.19. Produktowy rozkład wykładniczy ν n spełnia nierówność Poincaré na R n ze stałą 4. W szczególności α ν nt) 2 exp t/4). Kolejną przyjemną własnością nierówności Poincaré jest jej stabilność ze względu na zaburzenia miary µ. Fakt 3.2. Załóżmy, że µ jest miarą probabilistyczną na X, V jest ograniczoną funkcją borelowską oraz dν = Z 1 e V dµ, gdzie Z = e V dµ. Wówczas jeśli miara µ spełnia nierówność Poincaré ze stałą C to ν spełnia nierówność Poincaré ze stałą Ce 2 V. Dowód. Weźmy funkcję lipschitzowską f, odejmując stałą możemy założyć, że E µ f =. Wówczas Var ν f) E ν f 2 = 1 f 2 e V dµ 1 Z Z e V f 2 dµ 1 Z e V C f 2 dµ = Ce V f 2 e V dν Ce 2 V f 2 dν. 22

Fakt 3.21. Jeśli miara ν na Y, ρ) jest L-lipschitzowskim obrazem miary µ na X, d) oraz µ spełnia nierówność Poincaré ze stałą C, to ν spełnia nierówność Poincaré ze stałą CL 2. Dowód. Niech ν = µ ϕ 1, gdzie ϕ: X Y i ϕ Lip L. Dla funkcji lipschitzowskich f na Y otrzymujemy Var ν f) = Var µ f ϕ) C f ϕ 2 dµ CL 2 f 2 ϕx))dµx) = CL 2 f 2 dν, gdzie przedostatnia nierówność wynika z oszacowania f ϕ x) L f ϕx)). Wniosek 3.22. Istnieje stała uniwersalna L 12.5 taka, że dowolna miara symetryczna log-wklęsła µ o wariancji 1 na prostej jest L -lipschitzowskim obrazem symetrycznej miary wykładniczej ν. Stąd µ spełnia nierówność Poincare ze stałą 4L 2 62. Dowód. Niech g będzie gęstością miary µ, wówczas g = e h, gdzie h: R, ] jest funkcją parzystą wypukłą, w szczególności g) = g. Określmy x := inf{x > : gx) g)/e}. Zauważmy, że z log-wklęsłości wynika, że gx) e x/x g) dla x > x oraz g) gx) g)/e dla x < x. Stąd 2x g) e x x gx)dx 1 = 2 2x g) + x + )gx)dx x x e x/x g)dx) = 2x g 1 + 1 e ). Analogicznie Zatem skąd wnioskujemy, że 2 g) x 3 x3 x 2 gx)dx 1 = 2 e x 2g) x x 2 dx + x + )x 2 gx)dx x x x 2 e x/x dx) = 2x 3 g 1 3 + 5 e ). e 2e + 1) x g) e 2, 3e 2e + 15) x3 g) 3e 2, 3 e + 15 x 3e + 1) oraz e 2 e e + 15 g) 3e + 1) 3/2 2. 3 23

Określmy ϕ: R R wzorem ν, x] = µ, ϕx)]. Wówczas ϕ transportuje ν na µ, jest nieparzysta i niemalejąca, zatem ϕ Lip = sup ϕ x) = sup x x Rozpatrzmy dwie możliwości: i) ϕx) x. Wówczas gϕx)) g)/e i 1 2 gϕx)) e x 1 2 gϕx)). e x e 2g) 3e + 1) 3/2. ii) ϕx) > x. Zauważmy, że z logarytmicznej wklęsłości g wynika, że gϕx) + t) gϕx))e t/x dla t >, stąd Zatem 1 2 e x = ν[x, )) = µ[ϕx), )) = gϕx))e t/x dt = x gϕx)). 1 2 gϕx)) x e x 3e + 1). gϕx) + t)dt Podsumowując oba przypadki otrzymujemy ϕ Lip 3e + 1) 3/2 12.5. Uwaga 3.23. Wniosek 3.22 z nieco gorszą stałą) jest prawdziwy bez założenia symetrii miary µ. Dowód jest bardzo podobny, choć nieco bardziej żmudny. 3.3.1 Charakteryzacja na prostej Okazuje się, że daje się podać prostą charakteryzację miar na R, które spełniają nierówność Poincaré. Zanim ją sformułujemy podamy ściśle związany fakt dotyczący tak zwanych ważonych nierówności Hardy ego. Twierdzenie 3.24 Muckenhoupt). Załóżmy, że µ i ν są miarami na [, ). Wówczas istnieje stała C < taka, że dla każdej funkcji ograniczonej f, x ft)dt 2 dµ C fx) 2 dνx) 6) wtedy i tylko wtedy gdy r 1 B := sup µ[r, ) dx <, r px) gdzie p oznacza gęstość części absolutnej ν. Co więcej, jeśli C opt jest najmniejszą stałą C taką, że zachodzi 6), to B C opt 4B. 24

Dowód. Zamieniając f na f i zauważając, że wyzerowanie f na nośniku części singularnej ν nie zmienia lewej strony 6) wnioskujemy, że wystarczy badać nierówność x ft)dt 2 dµ C dla nieujemnych f. Zauważmy, że dla f 7) implikuje r ) 2 r µ[r, ) ft)dt C fx) 2 px)dx fx) 2 px)dx 7) Przyjmując fx) = 1 px) 1 {px) 1/n} i biorąc najlepszą możliwą stałą dostajemy r 1 µ[r, ) px) 1 {px) 1/n}dx C opt, skąd po przejściu z n i wzięciu supremum po r dostajemy B C opt. By udowodnić, że C opt 4B wystarczy wykazać, że 7) zachodzi z C = 4B. Załóżmy wpierw, że miara µ ma gęstość g i przyjmijmy x 1 ) 1/2 hx) := pt) dt wówczas na mocy nierówności Schwarza i twierdzenia Fubiniego Zauważmy, że x ft)dt 2 dµ = x = x [ x gx) więc na mocy definicji B użytej dwa razy) t gx) 2 B =4 B x t ft)dt 2 gx)dx f 2 t)pt)ht)dt [ f 2 t)pt)ht) gx) t x x 1 x pu)hu) du = 2h u)du = 2hx), 1 gu)hu) dudx = 2 x 1 ) 1/2 gx) t pu) du dx ) 1/2dx d gx) gu)du = 4 B dx t gx)dx x ) 1/2 4B t t 1 ] pu)hu) du dx 1 ] pu)hu) dudx dt 1 px) dx ) 1/2 = 4Bh 1 t). x gu)du) 1/2dx 25

Zatem x ft)dt 2 dµ f 2 t)pt)ht)4bh 1 t) = 4B f 2 t)pt)dt. Jeśli miara µ nie ma gęstości, to znajdujemy miary µ n z gęstościami zbieżne słabo do µ takie, że µ n [x, ) µ[x, ) Można np przyjąć Wówczas więc x r sup µ n [r, ) r ft)dt 2 dµ = lim 1/n µ n A) = n µa + t)dt 1 px) x n r dx sup µ[r, ) r ft)dt 2 dµ n 4B 1 dx = B, px) fx) 2 px)dx. Twierdzenie 3.25. Załóżmy, że µ jest miarą probabilistyczną na R o medianie m, zaś p oznacza gęstość jej części absolutnie ciągłej. Wówczas miara µ spełnia nierówność Poincaré ze skończoną stałą C wtedy i tylko wtedy gdy max{b +, B } <, gdzie x 1 B + = sup µ[x, ) x>m m py) dy m 1 B = sup µ, x] x<m x py) dy. Co więcej optymalna stała C opt w nierówności Poincaré spełnia 1 1 + 2) 2 max{b +, B } C opt 4 max{b +, B }. Dowód. Z Twierdzenia 3.24 zastosowanego do miary µ obciętej do [m, ) i f zamiast f) wynika, że dla dowolnej funkcji Lipschitzowskiej f, m fx) fm)) 2 dµx) = x Analogicznie rozpatrując miarę µ na odcinku, m), m m m ) 2dµx) f t)dt 4B+ f 2 x)dµx). fx) fm)) 2 dµx) 4B f 2 x)dµx). m m 26

Dodając stronami dostajemy Var µ f) fx) fm)) 2 dµx) 4 max{b +, B } f 2 x)dµx), czyli C opt 4 max{b +, B }. By udowodnić nierówność w drugą stronę zauważmy, że jeśli f jest ograniczoną funkcją oraz gx) = dla x m i gx) = x m ft)dt dla x > m, to g jest lipschitzowska, g x) = fx)1 {x m} p.w. oraz Med µ g) =. Stąd na podstawie Faktu 3.14, x m m ft)dt 2 dµ = gx) Med µ g 2 dµx) 1 + 2) 2 C opt g 2 x)dµx) = 1 + 2) 2 C opt fx) 2 dµx). Stąd Twierdzenie 3.24 implikuje B + 1 + 2) 2 C opt, analogicznie pokazujemy B 1 + 2) 2 C opt. 3.4 Logarytmiczna Nierówność Sobolewa Definicja 3.26. Załóżmy, że µ jest miarą probabilistyczną na X, zaś f nieujemną funkcją mierzalną na X. Entropię f względem µ definiujemy wzorem { f log fdµ fdµ log fdµ jeśli f log1 + f)dµ < Ent µ f) := jeśli f log1 + f)dµ =. Z wypukłości funkcji x log x na [, ) wynika, że Ent µ f), łatwo też zauważyć, że Ent µ λf) = λent µ f) dla λ. Definicja 3.27. Mówimy, że miara probabilistyczna na X, d) spełnia logarytmiczną nierówność Sobolewa ze stałą C, jeśli dla wszystkich ograniczonych lipschitzowskich funkcji f na X zachodzi Ent µ f 2 ) 2C f 2 dµ. 8) Twierdzenie 3.28. Załóżmy, że miara µ spełnia logarytmiczną nierówność Sobolewa ze stałą C. Wówczas dla każdej funkcji 1-lipschitzowskiej F i t > { µ F W szczególności α X t) exp t 2 /8C). m }) F dµ + t exp t2 ). 2C 27

Dowód. Ustalmy ograniczoną funkcję 1-Lipschitzowską F taką, że F dµ =. Wystarczy, że pokażemy iż dla λ Mλ) := M F,λ = e λf dµ e Cλ2 /2. Zastosujmy logarytmiczną nierówność Sobolewa do f 2 := e λf. Wówczas oraz Zatem 8) daje Ent µ f 2 ) = λe µ F e λf E µ e λf log E µ e λf = λm λ) Mλ) log Mλ) f 2 dµ = λ2 4 Określmy Hλ) := 1 λ log Mλ) dla λ >. Wówczas oraz na podstawie 9) F 2 e λf λ2 4 Mλ). λm λ) Mλ) log Mλ) C λ2 Mλ). 9) 2 lim Hλ) = M ) λ M) = F dµ = H λ) = 1 λ 2 log Mλ) + 1 M λ) λ Mλ) C 2. Zatem Hλ) Cλ/2 czyli Mλ) expcλ 2 /2). Lemat 3.29. Dla dowolnej funkcji nieujemnej na X, { } Ent µ f) = sup fgdµ: e g dµ 1. 1) Dowód. Z jednorodności obu stron tożsamości 1) możemy zakładać, że fdµ = 1, wówczas Ent µ f) = f log fdµ. Nietrudno sprawdzić, że dla u >, sup v R uv e v ) = u log u u, zatem uv u log u u + e v dla u, v R. 11) Zatem biorąc g takie, że e g dµ 1 dostajemy fgdµ f log f f + e g )dµ = Ent µ f) 1 + e g dµ Ent µ f). By udowodnić nierówność w przeciwną stronę wystarczy przyjąć g = log f. 28

Z powyższego lematu łatwo wykazać tensoryzowalność entropii: Fakt 3.3. Załóżmy, że µ i są miarami probabilistycznymi na X i, X = X 1... X n oraz µ = µ 1 µ 2 µ n. Wówczas dla dowolnej nieujemnej funkcji f na X Ent µ f) E µ Ent µi f). Dowód. Weźmy funkcję g na X taką, że e g dµ 1 oraz przyjmijmy dla i = 1,..., n, g i x 1,..., x n ) := log e gx 1,...,x n) dµ 1 x 1 ) dµ i 1 x i 1 )). e gx 1,...,x n) dµ 1 x 1 ) dµ i x i ) Wówczas g n g i oraz e gi dµ i 1, stąd fgdµ fg i dµ = fg i dµ i )dµ Ent µi f)dµ. Wniosek 3.31. Załóżmy, że miary probabilistyczne µ i na X i, d i ) spełniają logarytmiczną nierówność Sobolewa ze stałą C i względem gradientu i. Wówczas miara µ = µ 1 µ n spełnia logarytmiczną nierówność Sobolewa ze stałą C = max i C i względem gradientu f danego wzorem f 2 = i f 2. Dowód. Z Faktu 3.3 dostajemy Ent µ f 2 ) E µ Ent µi f 2 ) E µ 2C i E µi i f 2 n 2CE µ i f 2. Fakt 3.32. i) Niech µ 1 = 1 2 δ 1 + 1 2 δ 1, wówczas dla dowolnego f : { 1, 1} R, Ent µ1 f 2 ) 2Ent µ1 Df 2, gdzie Dfx) = 1 2 fx) f x)). ii) Niech µ n = µ 1 µ 1 będzie rozkładem jednostajnym na { 1, 1} n, wówczas dla dowolnego f : { 1, 1} n R, Ent µn f 2 ) 2Ent µn Df 2, gdzie Df 2 x) = 1 fx) fs i x))) 2, 4 oraz s i x 1,..., x n )) = x 1,..., x i 1, x i, x i+1,..., x n ) dla 1 i n. 29

Dowód. i) Z uwagi na jednorodność możemy zakładać, że E µ1 f 2 = 1, wówczas istnieje t [ 1, 1] takie, że f1) = 1 + t oraz f 1) = 1 t i nierówność z punktu i) ma postać αt), gdzie αt) := 1 1 t 2 1 + t 2 Nietrudno sprawdzić, że α) = α ) = oraz więc istotnie αt). ii) Wynika z punktu i) i Faktu 3.3. log1 + t) 1 t 2 α t) = 1 t 2 1 t 2 t 2 1 t 2 1 + ), 1 t 2 log1 t). Twierdzenie 3.33. Miara γ n spełnia logarytmiczną nierówność Sobolewa z C = 1. Dowód. Z uwagi na Fakt 3.3 wystarczy rozważyć przypadek n = 1. Niech f C 1 ogrr). Określmy g n : { 1, 1} n R wzorem g n x) := f x 1 +... + x n n ). Niech µ n i Df będą jak w Fakcie 3.32. Wówczas na mocy centralnego twierdzenia granicznego Ent µn gn) 2 = gn 2 log gndµ 2 n gndµ 2 n log gndµ 2 n Ent γ1 f 2 ). Ponadto kładąc T n x) = n 1/2 x 1 +... + x n ) Dg n x) 2 = 1 ft n x)) ft n x) 2 x i )) 2 = f T n x)) 2 + r n 4 n gdzie r n zbiega do zera jednostajnie względem T n x). Zatem lim E µ n n Dg n x) 2 = lim E µ n n f T n x)) 2 = E γ1 f x) 2. Fakt 3.34. Załóżmy, że µ jest miarą probabilistyczną na X, V jest ograniczoną funkcją borelowską oraz dν = Z 1 e V dµ, gdzie Z = e V dµ. Wówczas jeśli miara µ spełnia logaryticzną nierówność Sobolewa ze stałą C to ν spełnia logarytmiczną nierówność Sobolewa ze stałą Ce 4 V. 3

Dowód. Funkcja ϕu) = u log u jest wypukła na [, ) stąd dla dowolnych s, t, ϕs + t) ϕt) + ϕ t)s, więc ϕ ) ) f 2 dν = ϕ t + f 2 t)dν ϕt) + ϕ t) f 2 t)dν. Zatem Ent ν f 2 ) = inf [ϕf) ϕt) t R ϕ t)f 2 t)]dν 1 Z e V inf [ϕf) ϕt) ϕ t)f 2 t)]ze V dν t R = 1 Z e V Ent µ f 2 ) 2C Z e V f 2 dµ 2Ce 2 V f 2 dν. Kolejny fakt dowodzimy tak samo jak dla nierówności Poincaré. Fakt 3.35. Jeśli miara ν na Y, ρ) jest L-lipschitzowskim obrazem miary µ na X, d) oraz µ spełnia logarytmiczną nierówność Sobolewa ze stałą C, to ν spełnia logarytmiczną nierówność Sobolewa ze stałą CL 2. Stosując nierówność logarytmiczną Sobolewa do funkcji f = 1 + εg dowodzimy Fakt 3.36. Jeśli miara probabilistyczna µ spełnia logarytmiczną nierówność Sobolewa ze stałą C, to spełnia również nierówność Poincaré ze stałą C. Opierając się na twierdzeniu Muckenhoupta da się wyprowadzić kryterium równoważne nierówności logarytmicznej Sobolewa dla miar na prostej. Twierdzenie 3.37. Załóżmy, że µ jest miarą probabilistyczną na R o medianie m, zaś p oznacza gęstość jej części absolutnie ciągłej. Wówczas miara µ spełnia logarytmiczną nierówność Sobolewa ze skończoną stałą C wtedy i tylko wtedy gdy max{b +, B } <, gdzie 1 B + = sup µ[x, ) ln x>m B = sup µ, x] ln x<m µ[x, ) 1 µ, x] ) x m ) m x 1 py) dy Co więcej optymalna stała C opt w nierówności Poincaré spełnia 1 py) dy. 1 15 B + + B ) C opt 468B + + B ). 31

3.5 Nierówność Bobkowa Nierówność logarytmiczna Sobolewa implikuje koncentrację gaussowską, ale nie implikuje gaussowskiej izoperymetrii. Okazuje się, że jest silniejsza nierówność, która implikuje gaussowską izoperymetrię, a jednocześnie ma szereg równie dobrych własności jak nierówność Poincaré czy logarytmiczna nierówność Sobolewa. Przedstawione poniżej rozumowania można podobnie jak w poprzednich sekcjach prowadzić w większej ogólności, jednak by uniknąć szczegółów technicznych ograniczymy się do miar na R n i funkcji gładkich. W tej części przez I będziemy oznaczać gaussowską funckję izoperymetryczną, tzn Ix) = ϕφ 1 x)), gdzie ϕ = 2π) 1/2 exp x 2 /2). Dodatkowo określamy I) = I1) =. Definicja 3.38. Mówimy, że miara probabilistyczna µ na R n spełnia nierówność Bobkowa ze stałą C, jeśli dla wszystkich f CogrR 1 n ) o wartościach w przedziale [, 1] zachodzi I ) fdµ If) 2 + C f 2 dµ. 12) Fakt 3.39. Jeśli miary µ i spełniają nierówność Bobkowa ze stałymi C i, to miara µ 1 µ n spełnia nierówność Bobkowa ze stałą max i C i. Twierdzenie 3.4. Jeśli miara probabilistyczna µ na R n spełnia nierówność Bobkowa na ze stałą C, to µ + A) IµA)) dla A BR n ) oraz µa t ) ΦΦ 1 µa)) + t) dla A BR n ), t >. Twierdzenie 3.41. Kanoniczna miara gaussowska γ n spełnia nierówność Bobkowa z C = 1. 3.6 Nierówności Splotu Infimum Zacznijmy od zaproponowanej przez Maureya definicji. Definicja 3.42. Splotem infimum dwu funkcji f i g określonych na R n nazywamy funkcję f g daną wzorem f gx) := inf{fy) + gx y): y R n }. Niech µ będzie miarą probabilistyczną na R n oraz ϕ: R n [, ]. Mówimy, że para µ, ϕ) ma własność τ) bądź, że miara µ spełnia nierówność splotu infimum z funkcją kosztu ϕ jeśli e f ϕ dµ e f dµ 1 dla dowolnej ograniczonej mierzalnej funkcji f na R n. 32

Pierwszą użyteczną cechą własności τ) jest jej tensoryzowalność. Fakt 3.43. Jeśli pary µ i, ϕ i ) mają własność τ), µ = µ 1 µ n oraz to również para µ, ϕ) ma własność τ). ϕx 1,..., x n ) = ϕ 1 x 1 ) +... + ϕ n x n ), Dowód. Prosty argument indukcyjny pokazuje, że wystarczy udowodnić tezę dla n = 2. Niech f = fx, y) będzie ograniczoną funkcją na R n 1 R n 2, określmy g na R n 2 jako ) gy) := ln e fx,y) dµ 1 x). Dodatkowo wprowadźmy oznaczenie f y x) = fx, y). Wówczas dla dowolnych y, ỹ e f ϕx,y) dµ 1 x) e f ỹ ϕ 1 x)+ϕ 2 y ỹ) dµ 1 x) e gỹ)+ϕ 2y ỹ) na mocy własności τ) dla µ 1, ϕ 1 ). Stąd e f ϕx,y) dµ 1 x) e g ϕ 2y) i korzystając z Twierdzenia Fubiniego i τ) dla µ 1, ϕ 2 ). 1 e f ϕ dµ 1 µ 2 e g ϕ2y) dµ 2 y) e gy) dµ 2 y)) = e f dµ 1 µ 2 ) 1. Następny fakt pokazuje w jaki sposób można transportować τ). Fakt 3.44. Załóżmy, że µ jest miarą probabilistyczną na R n, zaś ϕ funkcją kosztu na R n taką, że µ, ϕ) spełnia własność τ). Jeśli T : R n R m oraz funkcja ψ na R m spełnia ψt x T y) ϕx y) dla wszystkich x, y, to para µ T 1, ψ) ma własność τ). Dowód. Niech f będzie ograniczoną funkcją na R m. Zauważmy, że f T ϕx) = inf y ft y) + ϕx y)) infft y) + ψt x T y)) f ψt x). y Zatem 1 e f ψ dµ T 1 = e f ψt x) dµx) e f T ϕx) dµx) e dµ) f T = e f dµ T 1) 1. 33

By sformułować związki nierówności splotu infimum z koncentracją określmy zbiór Zacznijmy od prostego faktu B ϕ t) = {x: ϕx) t}. Fakt 3.45. Jeśli µ, ϕ) ma własność τ) to dla dowolnego zbioru borelowskiego A takiego, że µa) > mamy 1 µa + B ϕ t)) 1 µa) e t. Dowód. Zastosujmy własność τ) do funkcji f = na zbiorze A i f = poza zbiorem A. Zauważmy, że f ϕ t poza zbiorem A + B ϕ t), zatem 1 e f ϕ dµ e f dµ e t 1 µa + B ϕ t))µa). Uwaga 3.46. Funkcja f w poprzednim dowodzie nie była oczywiście ograniczona, ale łatwo ominąć ten problem stosując nierówność τ) do f n = n1 R n \A dla n t. Poprzedni Fakt daje dobre oszacowanie tylko dla dużych wartości t. Nieco modyfikując jego dowód da się uzyskać też nierówności koncentracyjne dla małych t. Fakt 3.47. Załóżmy, że para µ, ϕ) ma własność τ). Wówczas dla dowolnego zbioru borelowskiego A i t >, e t µa) µa + B ϕ t)) e t 1)µA) + 1. 13) W szczególności oraz µa + B ϕ t)) > min{e t/2 µa), 1/2} 14) µa) 1 2 1 µa + B ϕt)) < e t/2 1 µa)). 15) Ponadto µa) = ν, x] µa + B ϕ t)) ν, x + t/2]. 16) Dowód. Niech fx) = t1 R n \A. Wówczas f jest nieujemna, więc f ϕ też jest nieujemna rozpatrujemy tylko nieujemne funkcje kosztu). Dla x A + B ϕ t) mamy f ϕx) t. Zatem własność τ) daje 1 e f ϕx) dµx) e fx) dµx) [ µ A + B ϕ t) ) + e t 1 µa + B ϕ t)) )] [ µa) + e t 1 µa)) ], 34

skąd bezpośredni rachunek prowadzi do 13). Niech f t p) := e t p/e t 1)p + 1), zauważmy, że f t is rosnąca względem p oraz dla p e t/2 /2, e t 1)p + 1 e t/2 + 1 1 2 et/2 + e t/2 ) < e t/2, skąd otrzymujemy 14). Ponadto dla p 1/2, 1 f t p) = 1 p e t 1)p + 1 1 p e t + 1)/2 < e t/2 1 p) i dostajemy 15). Niech F x) = ν, x] i g t p) = F F 1 p) + t). Poprzednie rachunki pokazują, że dla t, p >, f t p) g t/2 p), jeśli F 1 p) + t/2 lub F 1 p). Ponieważ g t+s = g t g s i f t+s = f t f s, otrzymujemy f t p) g t/2 p) dla wszystkich t, p >, zatem 13) implikuje 16). Niech jak do tej pory ν oznacza miarę na R z gęstością 1 2 e x, zaś ν +, ν miary z gęstościami odpowiednio e x 1 [, ) i e x 1,]. Fakt 3.48. Para ν +, ϕ ) ma własność τ), gdzie ϕ x) = { 1 18 x2 dla x 2 x 1) dla x > 2. Lemat 3.49. Dla wszystkich x R mamy 2 ϕ x) 1 oraz 2 9 1 4ϕ x) 2 )e ϕ x) 1. Dowód. Pierwszą nierówność otrzymujemy przez łatwe sprawdzenie. By udowodnić drugą, z uwagi na symetrię ϕ, wystarczy rozpatrywać przypadek x. Ponadto ϕ x) jest stałe dla x 2 a ϕ rosnące na tym przedziale, więc możemy zakładać, że x 2. Wówczas nierówność po podstawieniu y = x 2 /18 ma postać e y 1 8 9 y, y 2 9. Funkcja e y jest wypukła, więc wystarczy sprawdzić tylko y = i y = 2/9. Dowód Faktu 3.48. Ustalmy funkcję ograniczoną f, przyjmijmy g := f ϕ i niech I := e fx) x dx, I 1 := e gx) x dx. 35

Musimy pokazać, że I I 1 1. Dla t, 1) zdefiniujmy xt) i yt) wzorami Wówczas xt) e fx) x dx = ti oraz yt) e gx) x dx = ti 1. x t) = I e fxt))+xt), y t) = I 1 e gyt))+yt). Na mocy definicji g, gyt)) fxt)) + ϕ yt) xt)), więc y t) I 1 e fxt)) ϕ yt) xt))+yt). Niech zt) = 1 2 xt) + yt)) ϕ xt) yt)), wówczas z t) = 1 1 ) 2 ϕ xt) yt))) x t) + 2 + ϕ xt) yt)) y t). Pisząc dla uproszczenia x i y zamiast xt) i yt) stosując poprzednie oszacowanie y t) oraz nierówność między średnia arytmetyczną i geometryczną dostajemy wykorzystując parzystość ϕ ) z t) 1 2 1 2ϕ x y))i e x+fx) + 1 2 1 + 2ϕ x y))i 1 e ϕ x y)+y fx) 1 4ϕ x y)2 I I 1 e 1 2 x+y) 1 2 ϕ x y) = I I 1 e zt) 1 4ϕ x y)2 e 1 2 ϕ x y). Zatem na mocy Lematu 3.49, e zt) ) = e zt) z t) I I 1, co po odcałkowaniu daje I I 1 1. Uwaga 3.5. Funkcja g jest ciągła, więc y jest różniczkowalna. Funkcja f nie musi być ciągła więc x nie musi być różniczkowalna. Jednak z ograniczoności f łatwo wywnioskować lokalną Lipschitzowskość x stąd też z), a zatem różniczkowalność x prawie wszędzie. Funkcja e zt) jest zatem lokalnie lipschitzowska, czyli jest całką swojej pochodnej, która istnieje p.w.. Wniosek 3.51. Miara ν spełnia nierówność infimum z funkcją kosztu ϕ 1 postaci ϕ 1 t) = 2ϕ t { 1 2 ) = 36 t2 dla t 4 t 2) dla t > 4. 2 9 Dowód. Z wypukłości funkcji ϕ łatwo wynika, że ϕ 1 = ϕ ϕ. Ponieważ miara ν jest symetrycznym odbiciem ν + a funkcja ϕ jest symetryczna, to ν, ϕ ) ma własność τ), więc ν + ν, ϕ x) + ϕ y)) też ma τ). Miara ν jest splotem miar ν + i ν, czyli obrazem ν + ν przy przekształceniu T x, y) = x + y. Teza wynika z Faktu 3.44 36

Wiemy, że miara ν a zatem i miara produktowa ν n spełniają nierówność Poincaré, więc jeśli ν n A) 1 2, to νn A + tb n 2 ) 1 e t/c dla pewnej stałej absolutnej C. Okazuje się, że można tę nierówność wzmocnić. Zanim sformułujemy twierdzenie które pierwszy z gorszymi stałymi udowodnił Talagrand) wprowadźmy następujące oznaczenie kuli jednostkowej w l n p dla 1 p < B n p := {x R n : x i p 1}. Twierdzenie 3.52. Dla dowolnego zbioru borelowskiego A w R n takiego, że ν n A) > mamy dla t, 1 ν n A + 6 tb n 2 + 9tB n 1 ) 1 ν n A) e t. Ponadto ν n A) = ν, x] ν n A + 6 2tB n 2 + 18tB n 1 ) ν, x + t]. Dowód. Para ν n, ϕ n ) ma własność τ), gdzie ϕ n x 1,..., x n ) = ϕ 1 x 1 )+...+ϕ 1 x n ). Łatwo sprawdzić, że B ϕn t) 6 tb n 2 + 9tB n 1. Teza wynika zatem z Faktów 3.45 i 3.47. 3.7 Nierówności Splotu Infimum dla Funkcji Wypukłych 3.8 Nierówność Logarytmiczna Sobolewa dla Funkcji Wypukłych Fakt 3.53. Załóżmy, że F : R n R jest lipschitzowska oraz wypukła po każdej współrzędnej. Wówczas dla dowolnej produktowej miary probabilistycznej µ na R n, Ent µ e f n ) x i y i ) 2 i f) 2 x)e fx) dµx)dµy). Twierdzenie 3.54. Załóżmy, że F : [, 1] n R jest L-lipschitzowska oraz wypukła po każdej współrzędnej. Wówczas dla dowolnej produktowej miary probabilistycznej µ na [, 1] n, { }) µ F F dµ + t exp t2 ) 4L 2 dla t. Dowód. Bez straty ogólności zastępując F przez af + b) możemy zakładać, że L = 1 oraz F =. Wówczas F 1 p.w., więc Fakt 3.53 implikuje, że dla λ >, Ent µ e λf ) λ 2 λ 2 n x i y i ) 2 i F ) 2 x)e λf x) dµx)dµy) F 2 x)e λf x) dµx)dµy) λ 2 e λf dµ. 37