Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014
Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej rozkładu Zmienną losową na przestrzeni probabilistycznej (Ω, F, P) nazywamy funkcję X : Ω R 1 dla której określone są prawdopodobieństwa P(X > u) = P ({ω ; X (ω) > u}), u R 1. Rozkładem zmiennej losowej X nazywamy prawdopodobieństwo P X na R 1 zadane na odcinkach wzorem P X ((a, b]) := P(a < X b) = P ({ω ; X (ω) (a, b]}). Uwaga: P X ((a, + )) = P(X (a, + )), P X ((, a]) = P(X (, a]).
Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II, cd. Definicja wartości oczekiwanej zmiennej losowej Wartością oczekiwaną nieujemnej zmiennej losowej X nazywamy całkę EX := + 0 P(X > u) du [0, + ]. Niech X będzie zmienną losową. Symbolem X + oznaczamy złożenie tej zmiennej z funkcją h + (x) = 0 x. Podobnie X jest złożeniem X z funkcją h (x) = 0 ( x). Niech X będzie zmienna losową i niech EX + < + i EX < +. Wartością oczekiwaną zmiennej losowej X nazywamy liczbę EX := EX + EX (, + ).
Interpretacja formalizmu Zmienne losowe Wartość oczekiwana Dystrybuanty Wartość zmiennej losowej X (ω) to liczbowa (na ogół niepełna) charakterystyka wyniku eksperymentu losowego ω Ω. Rozkład zmiennej losowej określa wartości oczekiwane Ef (X ) (w szczególności prawdopodobieństwa zdarzeń P(X A)). Dzięki prawom wielkich liczb i innym rezultatom teoretycznym możemy przyjąć, że potrafimy obliczać Ef (X ). Wynika stąd, że w ramach eksperymentów losowych potrafimy badać własności rozkładów zmiennych losowych.
Własności wartości oczekiwanej Zmienne losowe Wartość oczekiwana Dystrybuanty Uwaga: zmienna losowa X ma skończoną wartość oczekiwaną dokładnie wtedy, gdy E X < +. Mówimy również, że zmienna X jest całkowalna i piszemy X L 1 (P). Twierdzenie (Własności wartości oczekiwanej) 1 Jeżeli X 0, to EX 0. Jeżeli X 0 i EX = 0, to P(X = 0) = 1. 2 EX E X. 3 Jeżeli E X < + i E Y < +, to dla dowolnych liczb α, β R 1 funkcja αx + βy jest zmienna losową i ma miejsce równość: E (αx + βy ) = αex + βey. 4 Jeżeli Y X, to EY EX pod warunkiem, że wartości oczekiwane istnieją.
Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II, cd. Definicja dystrybuanty zmiennej losowej Dystrybuantą zmiennej losowej X nazywamy funkcję F X : R 1 [0, 1] określoną wzorem F X (u) = P(X u) ( = P X ((, u]) ). Wniosek: rozkład P X zmiennej losowej jest znany dokładnie wtedy gdy znana jest dystrybuanta F X tej zmiennej. Wniosek: jeśli X 0, to EX = + 0 (1 F X (u)) du. Wniosek: Wartość oczekiwana jest funkcją rozkładu (dystrybuanty) zmiennej losowej, a nie samej zmiennej. W ten sposób prawdopodobieństwa na (R 1, B 1 ) pełnią szczególną rolę. Nazywamy je rozkładami prawdopodobieństwa.
Własności dystrybuanty Zmienne losowe Wartość oczekiwana Dystrybuanty Twierdzenie (Własności dystrybuanty zmiennej losowej) 1 Jeżeli u v, to F X (u) F X (v) (monotoniczność). 2 F X jest funkcją prawostronnie ciągłą. 3 lim F X (u) = 0, u lim F X (u) = 1. u + Twierdzenie (O dystrybuantach) Jeżeli funkcja F : R 1 [0, 1] spełnia warunki 1-3 z powyższego twierdzenia, to istnieje zmienna losowa X taka, że F = F X.
Obliczenia Charakterystyki liczbowe Rozkłady dyskretne Zmienna losowa X ma rozkład dyskretny, jeśli istnieją liczby x 1, x 2,... R 1 i prawdopodobieństwa p 1, p 2,... 0, j=1 p j = 1, takie, że P(X = x j ) = p j, j = 1, 2,.... Rozkłady absolutnie ciągłe Zmienna losowa X ma rozkład absolutnie ciągły o gęstości p(x), jeśli dla każdych a < b P(a < X b) = b a p(x) dx. (Wtedy p(x) 0 i p(x) dx = 1). Gęstość rozkładu absolutnie ciągłego jest wyznaczona jednoznacznie z dokładnością do równości l-prawie wszędzie (gdzie l jest miarą Lebesgue a).
Obliczenia Charakterystyki liczbowe cd. P X {x} = P(X = x) > 0 wtedy i tylko wtedy, gdy dystrybuanta F X ma skok w punkcie x i F X (x) F X (x ) = P(X = x). Gęstość a pochodna dystrybuanty Można pokazać, że każda dystrybuanta F jest l-prawie wszędzie różniczkowalna i pochodna F (określona l-prawie wszędzie) spełnia warunek F (x) F (x) dx. (,x] Może się więc zdarzyć, że R 1 F (x) dx < 1. Jeżeli R 1 F (x) dx = 1, to rozkład odpowiadający dystrybuancie F jest absolutnie ciągły z gęstością p(x) = F (x).
Jak liczyć EX? Obliczenia Charakterystyki liczbowe Jeżeli X ma rozkład dyskretny, to dla dowolnej funkcji f : R 1 R 1 Ef (X ) = f (x i )P(X = x i ) = f (x i )p i, i=1 i=1 przy czym Ef (X ) istnieje dokładnie wtedy, gdy f (x i ) p i < +. i=1
Jak liczyć EX? cd. Obliczenia Charakterystyki liczbowe Jeżeli X ma rozkład absolutnie ciągły o gęstości p(x), to dla dowolnej funkcji (borelowskiej) f : R 1 R 1 Ef (X ) = + f (x)p(x) dx, przy czym Ef (X ) istnieje dokładnie wtedy, gdy f (x) p(x) dx < +. +
Obliczenia Charakterystyki liczbowe Słowniczek teorii prawdopodobieństwa, cz. III Definicja Momentem absolutnym rzędu p > 0 zmiennej losowej X nazywamy liczbę m p = m p (X ) = E X p. Uwaga: E X p = 0 P( X p > u) du = = p 0 0 P( X > u 1/p ) du v p 1 P( X > v) dv. Skończoność momentu oznacza więc odpowiednie tempo malenia ogonów rozkładu.
Obliczenia Charakterystyki liczbowe Słowniczek teorii prawdopodobieństwa, cz. III Niech zmienna losowa X będzie całkowalna z kwadratem (EX 2 < + ). Wariancją X nazywamy liczbę D 2 (X ) = VarX := E(X EX ) 2 = EX 2 (EX ) 2. Odchyleniem standardowym X nazywamy liczbę D(X ) := VarX = E(X EX ) 2. Uwaga: Jeżeli 0 < D(X ) < +, to zmienna standaryzowana spełnia EY = 0, D(Y ) = 1. Y = X EX D(X )
Obliczenia Charakterystyki liczbowe Słowniczek teorii prawdopodobieństwa, cz. III, cd. Medianą zmiennej losowej X (właściwie: rozkładu zmiennej losowej) nazywamy taką liczbę x 1/2, że P(X x 1/2 ) 1/2, P(X x 1/2 ) 1/2. Kwantylem rzędu p, p (0, 1), rozkładu zmiennej losowej X nazywamy taką liczbę x p, że P(X x p ) p, P(X x p ) 1 p. Zadanie: Przypuśćmy, że znamy dystrybuantę F X zmiennej losowej X. Jak znaleźć medianę i kwantyle tej zmiennej?
Najważniejsze rozkłady dyskretne Najważniejsze rozkłady dyskretne Najważniejsze rozkłady absolutnie ciągłe 1 Rozkład zdegenerowany w C ( miara delta Diraca δ C ): P(X = C) = 1. 2 Rozkład B(p) ( 0 1 lub Bernoullego): P(X = 1) = p = 1 P(X = 0). 3 Rozkład dwumianowy Bi(N, p): ( ) N P(X = k) = p k (1 p) N k, k = 0, 1, 2,..., N. k 4 Rozkład Poissona Po(λ): λ λk P(X = k) = e, k = 0, 1, 2,.... k! 5 Rozkład geometryczny Ge(p): P(X = k) = p(1 p) k 1, k = 1, 2,....
Najważniejsze rozkłady dyskretne Najważniejsze rozkłady absolutnie ciągłe Najważniejsze rozkłady absolutnie ciągłe 1 Rozkład jednostajny U(a, b) na odcinku (a, b): p(x) = 1 b a I (a,b)(x). 2 Rozkład normalny N (m, σ 2 ) z parametrami m R 1 i σ 2 > 0: p(x) = 1 2πσ e (x m)2 2σ 2. 3 Rozkład Cauchy ego Ca(θ): p(x) = θ π ( x 2 + θ 2).
Najważniejsze rozkłady dyskretne Najważniejsze rozkłady absolutnie ciągłe Najważniejsze rozkłady absolutnie ciągłe - cd. 4 Rozkład wykładniczy Ex (λ) z parametrem λ > 0. p(x) = λe λx I (0,+ ) (x). 5 Rozkłady gamma G(α, λ) z parametrami α, λ > 0: p(x) = λα Γ(α) x α 1 e λx I (0,+ ) (x). 6 Rozkład χ 2 (n) z n stopniami swobody, to rozkład gamma z parametrami α = n/2, λ = 1/2. 7 Zauważmy, że również Ex (λ) = G(1, λ).