3 Rozklady ciagle 1. Wstep 2. Rozklad wykladniczy 3. Rozklad normalny 4. Aproksymacja rozkladem normalnym 5. Inne rozklady ciagle 1
3.1 Wstep Zmienne dyskretne: Ω skonczony lub przeliczalny Zmienne ciagle: Ω jest odcinkiem Przyklad: Czas oczekiwania na nastepnego pacjenta Wzrost lub wiek Obrot firmy Ciezar 2
Dystrybuanta Zmienne ciagle maja ciagla dystrybuante: F(x) = P(X x) ciagla wzgledem x Przyklad: Rozklad jednostajny na [0, 1] 2 1.5 1 F(x) 0.5 0 0.5 1 1 0.5 0 0.5 1 1.5 2 x 3
Wyznaczanie p-stw P(X = x) = F(x) F(x ) = 0 bo F jest ciagla P(a X b) = F(b) F(a) Dla rozkladu jednostajnego X J in [0,1] mamy dla 0 a < b 1: P(a < X J < b) = b a Uwaga: P(X b) = P(X < b)+p(x = b) = P(X < b) 4
Funkcja gestosci Zalozmy, ze F(x) jest rozniczkowalna. Definicja: f(x) := F (x) - gestosc zmiennej losowej X F(x) = x f(t)dt i P(a < X b) = F(b) F(a) = b f(x)dx a Porownanie ze zmiennymi dyskretnymi P(a < X b) = F(b) F(a) = P(x) a<x b 5
Wlasnosci funkcji gestosci Zachodzi f(x) 0, x R lim f(x) = 0, lim f(x) = 0 x x f(x)dx = 1 Wartosc gestosci f(x) nie jest p-stwem, ze X jest rowne x Ale dla malego ǫ mamy P(x ǫ < X x+ǫ) f(x) 2ǫ 6
Przyklady 1) X ma rozklad jednostajny na [0,1] F(x) = x, x [0,1] f(x) = 1, x [0,1] 2) X ma rozklad jednostajny na [l,r], l < r R f(x) = c, x [l,r] Wyznaczyc c 3) X ma gestosc f(x) = cx 2, x [0,1] 0 w przeciwnym przypadku Wyznaczyc c Wyznaczyc P(0.25 < X < 0.75) 7
Wartosc oczekiwana i wariancja Zgodnie z definicja w przypadku dyskretnym: E(X) = xf(x)dx i Var (X) = (x µ) 2 f(x)dx Znowu: E(aX +b) = ae(x)+b Var (ax +b) = a 2 Var (X) Cwiczenie: X ma rozklad jednostajny na [0, 1]. Wyznaczyc wartosc oczekiwana i wariancje. 8
Wartosc oczekiwana funkcji zmiennej losowej Tak jak w przypadku zmiennych dyskretnych: E(g(X)) = g(x)f(x)dx Zatem: Var (X) = E(X E(X)) 2 Dalej: Var (X) = E(X 2 ) E(X) 2 (x µ) 2 f(x)dx = (x 2 2µx+µ 2 )f(x)dx = x 2 f(x)dx 2µ xf(x)dx+µ 2 9
Funkcje ciaglych zmiennych losowych Niech g bedzie funkcja rzeczywista zmiennej X, g : Ω X R Jezeli g jest scisle rosnaca istnieje funkcja odwrotna...g 1 : Ω Y Ω X Dystrybuante Y wyznaczamy jako P(g(X) < y) = P(X < g 1 (y)) = F(g 1 (y)) Przyklad: X ma rozklad jednostajny na [0,1], Y := g(x) = e X g : R R +, g 1 : R + R, g 1 (y) = ln(y) Ω Y = g(ω) = [e 0,e 1 ] = [1,e] F Y (y) = P(Y y) = F X (ln(y)) = ln(y), y [1,e] 10
Przeksztalcenia ciaglych zmiennych losowych W przypadku funkcji scisle rosnacych p-stwa przeksztalconych odcinkow pozostaja bez zmian. 2 2 1.5 1.5 1 1 F(x) 0.5 F Y (y) 0.5 0 0 0.5 0.5 1 1 0.5 0 0.5 1 1.5 2 x 1 0.5 1 1.5 2 2.5 3 y = g(x) 11
Przeksztalcenia ciaglych zmiennych losowych Jezeli g jest scisle malejaca g 1 istnieje P(g(X) < y) = P(X > g 1 (y)) = 1 F(g 1 (y)) Przypadek ogolny: (g nie jest monotoniczna): Przyklad: X ma rozklad jednostajny na [0,1], Y := g(x) = (X 1 2 )2 g jest malejaca na [0, 1 2 ], rosnaca na [1 2,1] g 1 (y) = 1 2 ± y P((X 1/2) 2 y) = P( y +1/2 X y +1/2) = F X (1/2+ y) F X (1/2 y) 12
Gestosc przeksztalconej zmiennej losowej g jest scisle rosnaca i rozniczkowalna Wyznacz gestosc Y = g(x) f Y (y) = d dy F(g 1 (y)) = f X (g 1 (y)) d dy g 1 (y) Przyklad: (kontynuacja) X ma rozklad jednostajny na [0,1], Y = e X F Y (y) = ln(y), y [1,e] f Y (y) = 1 y, y [1,e] Za pomoca wzoru: F X (g 1 (y)) = 1 dla 0 ln(y) 1 d dy g 1 (y) = 1 y 13
3.2 Rozklad wykladniczy Zmienna X ma rozklad wykladniczy z parametrem λ > 0 jezeli jej gestosc wyraza sie wzorem λe λx, x 0 f(x) = 0, x < 0 Dystrybuanta rozkladu wykladniczego 1 e λx, x 0 F(x) = 0, x < 0 14
Wykresy rozkladu wykladniczego Gestosc i dystrybuanta dla λ = 1,2 i 3. 3 1 0.9 2.5 2 λ = 1 λ = 2 λ = 3 0.8 0.7 0.6 f(x) 1.5 F(x) 0.5 1 0.4 0.3 0.5 0.2 0.1 λ = 1 λ = 2 λ = 3 0 0 0.5 1 1.5 2 2.5 3 x 0 0 0.5 1 1.5 2 2.5 3 x Wieksze λ - szybciej opadajacy wykres gestosci Przypuszczenie: Rosnaca λ malejace µ i σ 15
Wartosc oczekiwana X ma rozklad wykladniczy z parametrem λ calkowanie przez czesci E(X) = xλe λx dx = xe λx + 0 e λx dx x=0 = 0 e λx λ 0 = 1 λ x=0 E(X 2 ) = x 2 λe λx dx = x 2 e λx + 0 2xe λx dx x=0 x=0 = 0+ 2 λ E(X) = 2 λ 2 i w rezultacie Var (X) = 2 λ 2 1 λ 2 = 1 λ 2 16
Cwiczenie Zalozmy, ze dlugosc rozmowy telefonicznej ma rozklad wykladniczy o wartosci oczekiwanej 10 minut. Podszedles do budki telefonicznej dokladnie gdy ktos zaczal rozmawiac. Wyznacz p-stwo, ze bedziesz musial czekac 1. mniej niz 10 minut 2. dokladnie 10 minut 3. miedzy 10 a 20 minut 4. ponad 20 minut. 17
Zwiazek z rozkladem Poissona Czas T miedzy kolejnymi zdarzeniami ma rozklad wykladniczy z parametrem λ. Na kazdym odcinku czasu [t 1,t 2 ] liczba zdarzen ma rozklad Poissona z parametrem λ(t 2 t 1 ). T t 1 t 2 x 1 x 2 18
Przyklad X... Liczba awarii pewnych maszyn w pewnym odcinku czasu (Maszyny pracuja 24h w ciagu dnia) Srednio obserwujemy 3 awarie w ciagu jednego dnia Zalozenie: X - ma rozklad Poissona a) Jaki ma rozklad dlugosc odcinka czasu miedzy dwiema kolejnymi awariami? b) Wyznacz p-stwo, ze nie bedzie awarii przez 5 godzin (lub wiecej). c) Wyznacz p-stwo, ze ciagu 5 godzin wydarza sie dwie awarie. 19
Brak pamieci Definicja P(X > s+t X > t) = P(X > s) tzn. historia nie dostarcza informacji Rozklad wykladniczy nie ma pamieci: Rownowaznie brak pamieci mozna wyrazic P(X > s+t) = P(X > s)p(x > t) a dla rozkladu wykladniczego e λ(s+t) = e λs e λt Rozklad wykladniczy jest jedynym rozkladem ciaglym bez pamieci! Rozklad dyskretny rozklad geometryczny (dyskretny odpowiednik rozkladu wykladniczego) 20
3.3 Rozklad normalny X N(µ,σ 2 ) if f(x) = 1 2π σ e (x µ)2 /2σ 2 Standardowy rozklad normalny N(0, 1): 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 3 2 1 0 1 2 3 Krzywa Gaussa 21
Rozklad normalny Bardzo wazny w rachunku p-stwa i statystyce z powodu centralnego twierdzenia granicznego! f jest gestoscia: 1 2π σ x= e (x µ)2 /2σ 2 dx = 1 2π x= e z2 /2 dz = 1 Zastepujemy z x µ σ Nie ma jawnego wzoru umozliwiajacego wyznaczenie dystrybuanty x F(x) = f(y)dy tabele rozkladu normalnego lub komputer y= 22
Standardowy rozklad normalny X N(0,1), zwykla notacja: Φ(x) := P(X x) Tabele Φ(x) podaje sie zwykle dla x (0,4) Powod: f jest symetryczna i dlatego f( x) = f(x) Φ( x) = 1 Φ(x) Przyklad: Jakie jest p-stwo, ze X jest miedzy -1 a 2? P( 1 X 2) = P(X 2) P(X < 1) = Φ(2) {1 Φ(1)} = 0.9772 1+0.8413 = 0.8186 Wartosci Φ(2) i Φ(1) mozna odczytac z tabeli 23
Dystrybuanta standardowego rozkladu normalnego Niektore wazne wartosci Φ(x): Φ(0) = 0.5; Φ(1.645) = 0.95; Φ(1.96) = 0.975 Wykres Φ(x): 1 0.8 0.6 0.4 0.2 0 3 2 1 0 1 2 3 24
Niech X N(µ,σ 2 ) Wartosc oczekiwana Podstawienie z x µ σ daje E(X) = 1 2π σ xe (x µ)2 /2σ 2 dx = x= 1 2π (σz +µ)e z2 /2 dz = µ z= poniewaz g(z) := z e z2 /2 jest nieparzysta (i.e. g( z) = g(z)) e z2 /2 dz = 1 a 1 2π x= 25
Wariancja Po podstawieniu z x µ σ i calkowaniu przez czesci Var (X) = 1 2π σ (x µ) 2 e (x µ)2 /2σ 2 dx = = x= σ 2 2π σ 2 2π z= z 2 e z2 /2 dz /2 ze z2 + z= e z2 /2 dz = σ2 Tak wiec: X N(µ,σ 2 ) E(X) = µ, Var (X) = σ 2 26
Przeksztalcenia liniowe Wazna wlasnosc: Dowod: X N(µ,σ 2 ) Y := ax +b N(aµ+b,a 2 σ 2 ) P(Y y) = P(aX +b y) = P(X y b a ) = 1 2π σ y b a e (x µ)2 /2σ 2 dx = 1 2π σa x= y z= e (z aµ b)2 /2a 2 σ 2 dz przez podstawienie z ax+b (dz = a dx a x = (z b)/a) 27
Standardyzacja X N(µ,σ 2 ) Z := X µ σ N(0,1) Rozklad normalny dla roznych µ i σ 0.45 0.4 µ = 2 µ = 0 µ = 2 0.8 0.35 0.3 0.7 0.6 σ = 1/2 0.25 0.5 0.2 0.15 0.1 0.05 0.4 0.3 0.2 σ = 1 σ = 2 0 5 4 3 2 1 0 1 2 3 4 5 µ... Wartosc oczekiwana 0.1 0 3 2 1 0 1 2 3 σ 2... Wariancja 28
Przyklad Niech X N(3, 9), wyliczymy nastepujace p-stwa: 1. P(2 < X < 5) 2. P(X > 0) 3. P( X 3 > 6) Rozwiazania 1) P ( 2 3 3 < X 3 3 < 5 3 3 ) = Φ ( ) 2 3 Φ 0.7486 (1 0.6293) = 0.3779 ( 0 3 2) P < X 3 ) = Φ(1) 0.8413 3 3 ( 6 3) 2 P 3 < X 3 ) = 2 (1 Φ(2)) 0.0456 3 ( 1 ) 3 29
Kwantyle rozkladu normalnego Definicja: Niech X ma dystrybuante F i niech γ [0,1] γ - kwantyl x γ : liczba rzeczywista t.ze F(x γ ) = γ Fukcja odwrotna do dystrybuanty Rozklad normalny: jawne rachunki nie mozliwe Tabele lub komputer 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 γ x γ = Q N (γ) 0.05 0 3 2 1 0 1 x γ 2 3 30
Odcinki symetryczne X N(µ,σ 2 ) P( X µ x) = 2 Φ( x σ ) 1 Dowod: P( x+µ X x+µ) = 2 P(X x+µ) 1 Niech γ [0,1]. Wtedy: P( X µ x γ ) = γ dla x γ = σ Q N ( 1+γ 2 ) Cwiczenie: Niech X ma rozklad normalny z σ 2 = 4 Ustal x takie, ze P( X µ x) = 0.95 31
3.4 Aproksymacja rozkladem normalnym Rozwazmy rozklad dwumianowy B(n,p) i porownajmy jego histogram z gestoscia rozkladu normalnego 0.09 0.45 0.08 0.4 0.07 0.35 0.06 0.3 0.05 0.25 0.04 0.2 0.03 0.15 0.02 0.1 0.01 0.05 0 30 35 40 45 50 55 60 65 70 X B(100,0.5) 0 3 2 1 0 1 2 3 X N(0,1) 32
Centralne Twierdzenie Graniczne Moivre a- Laplace a S n... liczba sukcesow w n niezaleznych probach Bernoulliego z p-stwem sukceu p. Wtedy dla a < b: P ( ) a S n np npq b Φ(b) Φ(a) for n tzn. Rozklad dwumianowy po standardyzacji (S n µ)/σ zbiega do standardowego rozkladu normalnego. Dowod: Specjalny przyklad Centralnego Twierdzenia Granicznego Aproksymacje mozna stosowac gdy npq 9 33
Korekta na ciaglosc B(n, p) jest dyskretny, tzn. dystrybuanta jest funkcja schodkowa N(0, 1) jest ciagly, tzn. dystrtybuanta jest funkcja ciagla Korekta na ciaglosc: P (a S n b) Φ ( ) Φ( ) b+0.5 np a 0.5 np npq npq 1 0.9 niebieski: B(40, 0.5) czerwony: N(20,10) 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 15 16 17 18 19 20 21 22 23 24 25 34
Cwiczenie 30% populacji zna pewien produkt Ankieta na 200 osobach; Oblicz p-stwo, ze 1. dokladnie 55 osob zna produkt 2. ponad 55 osob zna produkt 3. miedzy 55 a 64 osoby znaja ten produkt 35
Aproksymacja dla rozkladu hipergeometrycznego Rozklad hipergeometryczny z parametrami N, M i n: P (a S n b) Φ ( ) b+0.5 µ σ Φ ( ) a 0.5 µ σ gdzie µ = n M N and σ2 = n M N (1 M N )N n N 1 Mozna ja stosowac gdy σ 2 9 i N 2n Cwiczenie: Dostawa 2500 produktow mlecznych, 12 % zepsutych Losowo wybieramy 100 paczek, p - procent zepsutych w wylosowanej probie Policzmy p-stwo, ze p zawiera sie miedzy 5% a 15% 36
3.5 Inne rozklady ciagle Omowimy jeszcze jedna rodzine: Rozklad Gamma Uogolnienie rozkladu wykladniczego 37
Rozklad Gamma X ma rozklad Γ z parametrami λ > 0 i t > 0 jezeli gestosc wyraza sie wzorem λe λx (λx) t 1 Γ(t), x 0 f(x) = 0, x < 0 gdzie Γ(t) = x=0 e x x t 1 dx Ta definicja gwarantuje, ze f ma wszystkie wlasnosci gestosci t = 1 rozklad wykladniczy t = n N czas oczekiwania na n zdarzen 38
Wlasnosci funkcji Γ i rozkladu Γ Funkcja Γ : Γ(t) = x=0 e x x t 1 dx Po scalkowaniu przez czesci : Γ(t) = (t 1)Γ(t 1) Gdy t = n N : Γ(n) = (n 1)Γ(n 1) = = (n 1)(n 2) Γ(1) = (n 1)! bo Γ(1) = 1 Notacja: X Γ(t,λ)... Rozklad Γ z parametrami λ and t E(X) = t λ, t Var (X) = λ 2 39
Przyklady rozkladow Gamma Γ(1,λ)... rozklad wykladniczy Γ(n,λ)... czas oczekiwania na n-te zdarzenie Γ( n 2, 1 2 ) - Rozklad χ2 z n stopniami swobody 0.8 0.7 0.6 t=1 t=2 t=3 t=4 t=6 0.8 0.7 0.6 t=1/2 t=1 t=3/2 t=2 t=3 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 1 2 3 4 5 0 0 1 2 3 4 5 t N, λ = 1 2t N, λ = 1/2 40
Przyklady rozkladow gamma 2 Γ(t,1)... Standardowy rozklad Γ Zachodzi: X Γ(t,λ) λx Γ(t,1) Zaleznosc od t Zaleznosc od λ 4 3.5 3 t=1 t=2 t=3 t=4 t=6 4 3.5 3 λ=1 λ=2 λ=3 λ=4 λ=6 2.5 2.5 2 2 1.5 1.5 1 1 0.5 0.5 0 0 0.5 1 1.5 0 0 0.5 1 1.5 t N, λ = 5 t = 4/3, λ N 41
Rozklad χ 2 Twierdzenie: Z N(0,1) Y = Z 2 Γ( 1 2, 1 2 ) tzn.: Kwadrat zmiennej losowej o rozkladzie standardowym normalnym ma rozklad Γ z parametrami λ = 1/2 i t = 1/2. Dowod: P(Y y) = P( y Z y) = Φ( y) Φ( y) f Y (y) = φ( y) = 1 2 y +φ( 1 y) 2 y = φ( y) 1 y 1 2πy e y/2 = 1 2 e y 2( y 2 )1 2 1 Γ( 1 2 ), bo Γ( 1 2 ) = π. Definicja: Γ( n 2, 1 2 ) - rozklad χ2 z n stopniami swobody 42