Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016
Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja X : Ω R 1 posiadająca własność X 1 ((a, + )) = {ω ; X (ω) > a} F, a R 1. Dowiedzielismy się, że ten fakt pociąga dużo więcej: X 1 (B) F, dla każdego B B 1, gdzie B 1 = σ{(a, + ) ; a IR 1 } jest σ-algebrą podzbiorów borelowskich IR 1. Jeśli X jest zmienną lsową, to f (X ) też jest zmienną losową, o ile f : IR 1 IR 1 jest funkcją borelowską, tzn. f 1 ((a, + )) = {f > a} B 1, dla każdego a IR 1. Funkcje monotoniczne, schodkowe i ciągłe są funkcjami borelowskimi.
Uprzednio wprowadzone pojęcia i ich własności Definicja wartości oczekiwanej Wartość oczekiwana lub wartość średnia nieujemnej zmiennej losowe X jest określona jako całka EX := + 0 P(X > u) du [0, + ]. Niech f będzie funkcją o wartościach rzeczywistych. Część dodatnia f + i część ujemna f funkcji f są określone jako h + (f ) h (f ), gdzie h + (x) = 0 x i h (x) = 0 ( x). Niech X będzie zmienna losową. Jeśli EX + < + oraz EX < +, to mówimy, że wartość oczekiwana X istnieje i definiujemy ją jako EX := EX + EX (, + ).
Własności wartości oczekiwanej Twierdzenie 1 Jeśli X 0, to EX 0. 2 Jeśli X 0 i EX = 0, to P(X = 0) = 1. 3 EX E X. 4 Jeśli E X < + i E Y < +, to dla dowolnych liczb α, β R 1 funkcja αx + βy jest całkowalną zmienna losową i mamy: E (αx + βy ) = αex + βey. 5 Jeśli Y X i wartości oczekiwane istnieją, to EY EX.
Dystrubuanta zmiennej losowej Niech X 0. Jak obliczyć EX 2? Odpowiedź: EX 2 = 2 up ( X > u ) du. 0 W ogólności możemy obliczyć Ef (X ) gdy znamy prawdopodobieństwa P ( X > u ), lub, równoważnie, 1 P ( X > u ) = P ( X u ). Definicja dystrybuanty Dystrybuantą zmiennej losowej X nazywamy funkcję F X : R 1 [0, 1] określoną wzorem F X (u) = P(X u) ( = P X ((, u]) ).
Własności dystrybuanty Twierdzenie 1 Jeżeli u v, to F X (u) F X (v) (monotoniczność). 2 F X jest funkcją prawostronnie ciągłą. 3 lim F X (u) = 0, u lim F X (u) = 1. u + Twierdzenie (O dystrybuantach) Jeżeli funkcja F : R 1 [0, 1] spełnia warunki 1-3 z powyższego twierdzenia, to istnieje zmienna losowa X taka, że F = F X.
Rozkład zmiennej losowej Wiemy, że B 1 = σ{(u, + ) ; u IR 1 } = σ{(, u] ; u IR 1 }. Mając daną F X (u) możemy określić funkcję P X na pewnym podzbiorze B 1, n.p. P X ( (, u] ) = FX (u), P X ( (u, + ) ) = 1 FX (u), P X ( (u, v] ) = FX (v) F X (u), ( ) P X (, u) = lim F X (t) =: F X (u ), t u ( ) P X (u, v) = lim F X (t) F X (u) = F X (v ) F X (u), t v ( ) P X [u, v] = FX (v) lim F X (u) = F X (v) F X (u ), t u P X ( {u} ) = FX (u) F X (u ).
Rozkład zmiennej losowej Twierdzenie Niech F będzie dystrybuantą na IR 1. Istnieje dokładnie jedna miara probabilistyczna P F na B 1 taka, że P F ( (u, v] ) = F (v) F (u). Definicja Rozkładem zmiennej losowej X nazywamy jedyną miarę probabilistyczną P X na B 1 zadaną na odcinkach wzorem P X ((u, v]) := P(u < X v) = P ({ω ; X (ω) (u, v]}).
Rozkład zmiennej losowej Wniosek 1 Znamy P X dokładnie wtedy, gdy znamy F X. 2 Jeśli X 0, to EX = + 0 P X ( (u, + ) ) du i, bardziej ogólnie, dla f dostatecznie regularnej Ef (X ) = + 0 f (u)p X ( (u, + ) ) du. Wartość oczekiwana jest więc funkcją rozkładu (albo dystrubuanty) zmiennej losowej. Wynika stąd, że miary probabilistyczne na (IR 1, B 1 ) odgrywaja szczególną rolę. Nazywamy je rozkładami lub rozkładami prawdopodobieństwa.
Rozkłady dyskretne i absolutnie ciągłe Rozkłady dyskretne Zmienna losowa X ma rozkład dyskretny, jeśli istnieją liczby x 1, x 2,... R 1 i prawdopodobieństwa p 1, p 2,... 0, j=1 p j = 1, takie, że P(X = x j ) = p j, j = 1, 2,.... Rozkłady absolutnie ciągłe Zmienna losowa X ma rozkład absolutnie ciągły o gęstości p(x), jeśli dla każdych a < b P(a < X b) = b a p(x) dx. (Wtedy p(x) 0 l-prawie wszędzie i p(x) dx = 1). Gęstość rozkładu absolutnie ciągłego jest wyznaczona jednoznacznie z dokładnością do równości l-prawie wszędzie (l jest miarą Lebesgue a).
Więcej o rozkładach prawdopodobieństwa Skoki dystrybuanty P X {x} = P(X = x) > 0 dokładnie wtedy, gdy dystrybuanta F X ma skok (nieciągłość) has w x i wtedy F X (x) F X (x ) = P(X = x). Pochodna dystrybuanty a gęstość Każda dystrybuanta F jest l-prawie wszędzie różniczkowalna i jej pochodna F (określona l-prawie wszędzie) spełnia następujący warunek. F (x) (,x] F (x) dx. Może się zdarzyć, że R 1 F (x) dx < 1. Jeśli R 1 F (x) dx = 1, to rozkład odpowiadający F jest absolutnie ciągły z gęstością p(x) = F (x).
Więcej o rozkładach prawdopodobieństwa Obliczanie EX dla rozkładów dyskretnych Jeśli X ma rozkład dyskretny, to dla dowolnej funkcji f : R 1 R 1 mamy Ef (X ) = f (x i )P(X = x i ) = f (x i )p i, i=1 i=1 przy czym Ef (X ) istnieje (jest skończona) dokładnie wtedy, gdy f (x i ) p i < +. i=1
Więcej o rozkładach prawdopodobieństwa Obliczanie EX dla rozkładów absolutnie ciągłych Jeśli rozkład X jest absolutnie ciągły z gęstością p(x), to dla każdej funkcji borelowskiej f : R 1 R 1 mamy Ef (X ) = + f (x)p(x) dx, przy czym Ef (X ) istnieje dokładnie wtedy, gdy f (x) p(x) dx < +. +
Najważniejsze rozkłady dyskretne 1 Rozkład zdegenerowany w C ( miara Diraca δ C ): P(X = C) = 1. 2 Rozkład B(p) ( 0 1 lub Bernoullego): P(X = 1) = p = 1 P(X = 0). 3 Rozkład dwumianowy Bi(N, p): ( ) N P(X = k) = p k (1 p) N k, k = 0, 1, 2,..., N. k 4 Rozkład Poissona Po(λ): λ λk P(X = k) = e, k = 0, 1, 2,.... k! 5 Rozkład geometryczny Ge(p): P(X = k) = p(1 p) k 1, k = 1, 2,....
Najważniejsze rozkłady absolutnie ciągłe 1 Rozkład jednostajny U(a, b) na odcinku (a, b): p(x) = 1 b a I (a,b)(x). 2 Rozkład normalny (lub gaussowski) N (m, σ 2 ) z parametrami m IR 1 i σ 2 > 0: 3 Rozkład Cauchy ego Ca(θ): p(x) = 1 2πσ e (x m)2 2σ 2. p(x) = θ π ( x 2 + θ 2 ).
Najważniejsze rozkłady absolutnie ciągłe 4 Rozkład wykładniczy Ex (λ) z parametrem λ > 0. p(x) = λe λx I (0,+ ) (x). 5 Rozkład gamma G(α, λ) z parametrami α, λ > 0: p(x) = λα Γ(α) x α 1 e λx I (0,+ ) (x). 6 Rozkład χ-kwadrat z n stopniami swobody (χ 2 (n)) jest rozkładem gamma z α = n/2, λ = 1/2. 7 Zauważmy również, że Ex (λ) = G(1, λ).
Słowniczek teorii prawdopodobieństwa Definicje Moment absolutny rzędu p > 0 zmiennej losowej X jest określony wzorem m p = m p (X ) = E X p. Jeśli X jest całkowalna z kwadratem (tzn. EX 2 < + ), wtedy jej wariancja jest określona wzorem D 2 (X ) = VarX := E(X EX ) 2 = EX 2 (EX ) 2. Odchylenie standardowe całkowalnej z kwadratem zmiennej losowej X jest dane wzorem D(X ) := VarX = E(X EX ) 2.
Słowniczek teorii prawdopodobieństwa Definicje Medianą zmiennej losowej X (właściwie: rozkładu zmiennej losowej) nazywamy taką liczbę x 1/2, że P(X x 1/2 ) 1/2, P(X x 1/2 ) 1/2. Kwantylem rzędu p, p (0, 1), rozkładu zmiennej losowej X nazywamy taką liczbę x p, że P(X x p ) p, P(X x p ) 1 p. Zadanie: Przypuśćmy, że znamy dystrybuantę F X zmiennej losowej X. Jak znaleźć medianę i kwantyle tej zmiennej?