Rachunek p-stwa 2010-2011 1 Rozklady dyskretne 1. Przeksztalcenia zmiennych losowych 2. Rozklad dwumianowy 3. Rozklad Poissona 4. Inne rozklady dyskretne 1
Przeksztalcenia zmiennych losowych Zmienna losowa X na przestrzeni probabilistycznej Ω, P Dla kazdego x Ω : P(x) = p x Ponadto okreslamy funkcje f : Ω R, Obraz: f(ω) Definicja: Y = f(x) jest zmienna losowa P Y (y) = x Ω:f(x)=y p x 2
Przyklady przekszalcen 1) Symetryczna kostka, f(x) = x 2, Y = X 2 : Ω Y := {1,4,9,16,25,36} P(1) = P(4) = P(9) = P(16) = P(25) = P(36) = 1/6 2) Symetryczna kostka, g(x) = (x 3.5) 2, Z = (X 3.5) 2 : Ω Z := {2.5 2,1.5 2,0.5 2 } = {6.25,2.25,0.25} P(6.25) = p 1 +p 6 = 1/3 P(2.25) = p 2 +p 5 = 1/3 P(0.25) = p 3 +p 4 = 1/3 Cwiczenie: Ω = { 1,0,1}, P(X = 1) = P(X = 1) = 1/4,P(X = 0) = 1/2 Wyznacz rozklad Y = X 2 i Z = X 3 3
Wartosc oczekiwana funkcji zmiennej losowej Przyklad: Symetryczna kostka kontynuacja: 1) E(f(X)) = E(Y) = 1 1/6+4 1/6+ +36 1/6 = 1+4+9+16+25+36 = 91/6 = 15.1667 6 2) E(g(X)) = E(Z) = 6.25/3+2.25/3+0.25/3 = 2.9167 Ogolnie: E(f(X)) = Uwaga: x Ω,f(x)=y x Ω f(x)p(x) = y f(ω) f(x)p(x) yp Y (y) 4
Transformacje liniowe Dla dowolnych a,b R: E(aX +b) = ae(x)+b Dowod: E(aX +b) = x Ω(ax+b)P(x) = a x Ω xp(x)+b x ΩP(x) = ae(x)+b W szczegolnosci: E(X µ) = E(X E(X)) = 0 5
Momenty k-ty moment zmiennej losowej: m k := E(X k ) k-ty moment centralny: z k = E((X µ) k ) m 1... srednia (wartosc oczekiwana) z 2 = m 2 m 2 1... wariancja Skosnosc: ν(x) := z 3 σ 3 = E(X 3 ) gdzie X := (X µ)/σ ν(x) = 0... sugeruje symetrie ν(x) < 0... lewostronnie skosny ν(x) > 0... prawostronnie skosny Kurtoza: z 4 σ 4 = E(X 4 ) 6
Cwiczenie: Skosnosc Zmienna losowa X ma nastepujacy rozklad: P(1) = 0.05,P(2) = 0.1,P(3) = 0.3,P(4) = 0.5,P(5) = 0.05 Narysuj rozklad, dystrybuante i oblicz skosnosc. Wyznacz skosnosc lekko zmodyfikowanego rozkladu P(1) = 0.05,P(2) = 0.3,P(3) = 0.3,P(4) = 0.3,P(5) = 0.05 7
1.1 Rozklad dwumianowy (binom) Proby Bernoulliego: Dwa mozliwe wyniki (0 lub 1) P(X = 0) = p, P(X = 1) = q gdzie q = 1 p Np. symetryczna moneta: p = 1/2 Przyklad: Rzucamy dwa razy niesymetryczna moneta. P(reszka) = p = 0.7 Wyznacz rozklad liczby reszek Z Przestrzen probkowa Ω Z = {0,1,2} 8
Wyniki obu rzutow sa niezalezne! P(Z = 0) = P(X 1 =0,X 2 =0) = P(X 1 =0)P(X 2 =0) = 0.3 2 = 0.09 P(Z = 1) = P(X 1 =0,X 2 =1)+P(X 1 =1,X 2 =0) = = 2 P(X 1 =0)P(X 2 =1) = 2 0.3 0.7 = 0.42 P(Z = 2) = P(X 1 =1,X 2 =1) = P(X 1 =1)P(X 2 =1) = 0.7 2 = 0.49 9
Rozklad dwumianowy n niezaleznych prob Bernoulliego, P(X = 1) = p Y : Liczba sukcesow (prob o wyniku 1) ma rozklad dwumianowy: P(Y = k) = ( ) n k p k q n k Dowod: Niezaleznosc Prawdopodobienstwo dowolnego ciagu z k sukcesami i n k porazkami dane jest wzorem p k (1 p) n k Liczba takich ciagow: liczba podzbiorow k elementowych w zbiorze n elementowym (kombinacje) Notacja: Y B(n, p) Cwiczenie: Rzucamy niezaleznie piecioma symetrycznymi kostkami Wyznacz rozklad liczby reszek 10
Przyklad rozkladu dwumianowego Egzamin ktory srednio oblewa 20% studentow Rozklad liczby sukcesow wsrod 10 studentow? ( ) 10 P(X = 7) = 0.8 7 0.2 3 = 0.2013 7 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11
Przyklady rozkladu dwumianowego: n = 10 0.4 0.4 0.35 0.35 0.3 0.3 p = 0.1 0.25 0.2 0.25 0.2 p = 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 0 0 1 2 3 4 5 6 7 8 9 10 0.4 0.4 0.35 0.35 0.3 0.3 p = 0.3 0.25 0.2 0.25 0.2 p = 0.5 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 0 0 1 2 3 4 5 6 7 8 9 10 12
Zastosowanie: Losowanie ze zwracaniem populacja skladajaca sie z N obiektow M sposrod N obiektow posiada pewna wlasnosc E Losujemy n obiektow ze zwracaniem Liczba X wylosowanych obiektow ktore posiadaja wlasnosc E ma rozklad dwumianowy: X B(n,M/N) Cwiczenie: Urna z 3 czarnymi i 9 bialymi kulami; losujemy 5 kul ze zwracaniem, X... liczba wylosowanych czarnych kul Rozklad p-stwa X? Wartosc oczekiwana X? 13
Wartosc oczekiwana i wariancje rozkladu dwumianowego X B(n,p) E(X) = np X B(n,p) Var (X) = npq 14
1.2 Rozklad Poissona (pois, mean) Definicja: Ω = N 0 = {0,1,2, } P(X = k) = λk k! e λ, λ > 0 Notacja: X P(λ) Przyklad: λ = 2 P(X 1) = 20 0! e 2 + 21 1! e 2 = (1+2)e 2 = 0.4060 P(X > 4) = 1 P(X 4) = 1 (1+2+ 4 2 + 8 6 + 16 24 )e 2 = 1 0.9473 = 0.0527 15
Przyklady rozkladu Poissona 0.4 0.4 0.35 0.35 0.3 0.3 λ = 1 0.25 0.2 0.25 0.2 λ = 1.5 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 0 0 1 2 3 4 5 6 7 8 9 10 11 12 0.4 0.4 0.35 0.35 0.3 0.3 λ = 3 0.25 0.2 0.25 0.2 λ = 5 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 0 0 1 2 3 4 5 6 7 8 9 10 11 12 16
Zastosowania Modelowanie rzadkich zdarzen Przyklady Liczba klientow pojawiajacych sie w pewnym przedziale czasu Rozpad radioaktywny Liczba bledow na slajdach Liczba ludzi ktorzy maja ponad 100 lat (na 1 000 000) liczba falszywych alarmow w ciagu dnia itd. 17
Srednia i wariancja X P(λ) E(X) = λ Dowod: E(X) = k=0 k λk k! e λ = e λ k=1 λ k (k 1)! = λe λ j=0 λ j j! Dowod: X P(λ) Var (X) = λ E(X 2 )= k=0 k 2λk k! e λ =e λ k=1 kλ k (k 1)! =λe λ j=0 (j +1)λ j j! =λ(λ+1) E(X 2 ) E(X) 2 = λ(λ+1) λ 2 = λ 18
Przyblizenie rozkladu dwumianowego X B(n,p), gdzie n jest duze a p male (np. n > 10 i p < 0.05) X P(np) tzn. X ma w przyblizeniu rozklad Poissona z parametrem λ = np Motywacja: Let λ := np P(X = k) = = n! k! (n k)! pk q n k n(n 1) (n k +1) k! λk n k (1 λ/n)n (1 λ/n) k Dla duzych n i umiarkowanych wartosci λ (tzn. malych p) zachodzi n(n 1) (n k +1) n k 1 (1 λ/n) k 1 (1 λ/n) n e λ i dalej P(X = k) λk k! e λ 19
Przyklad Porownanie dystrybuanty rozkladu Poissona (λ = 0.5) z dystrybuanta rozkladu dwumianowego (n = 10, p = 0.05) Dwumianowy: 1 0.95 0.9 0.85 0.8 0.75 P(X 3) = 0.95 10 +10 0.05 0.95 9 + 45 0.05 2 0.95 8 +120 0.05 3 0.95 7 = 0.99897150206211 0.7 0.65 0.6 0.55 0 1 2 3 4 5 6 Niebieski: P B(10, 0.05) Zielony: P P(0.5) Przyblizenie rozkladem Poissona: P(X 3) ) (1+0.5+ 0.52 2 + 0.53 6 = 0.99824837744371 e 0.5 20
1.3 Inne rozklady dyskretne Omowimy Geometryczny Hipergeometryczny Oprocz tego Ujemny dwumianowy Uogolniony Poissona itd. Patrz np. Wikipedia 21
Rozklad geometryczny (geom) Niezalezne proby Bernoulliego - p-stwo sukcesu = p X... liczba prob do pierwszego sukcesu P(X = k) = q k 1 p k 1 porazek o p-stwach q = 1 p Cwiczenie: Urna z N bialymi i M czarnymi kulami Losowanie ze zwracaniem a) P-stwo, ze bedzie potrzeba dokladnie k prob do wyrzucenia czarnej kuli b) P-stwo, ze bedzie potrzeba co najwyzej k prob do wyrzucenia czarnej kuli 22
Zauwazmy ze Rozniczkujemy: j=0 Srednia i wariancja q j = 1 1 q. Zatem k=1 kq k 1 = d dq k=0 k=1 q k = 1 (1 q) 2 q k 1 p = p 1 q = p p = 1 E(X) = kq k 1 p = k=1 p (1 q) 2 = 1 p Rozniczkujemy drugi raz: k=1 k(k 1)q k 2 = d2 dq 2 k=0 q k = 2 (1 q) 3 E(X 2 ) = k 2 q k 1 p = pq k=1 k(k 1)q k 2 +p k=1 k=1 kq k 1 = 2pq p 3 + 1 p Zatem Var (X) = E(X 2 ) E(X) 2 = 2 p 2 1 p 1 p 2 = 1 p p 2 23
Rozklad hipergeometryczny (hyper, M, N-M, n) Rozklad dwumianowy: Losowanie ze zwracaniem Cwiczenie: Urna, 3 czarne kule, 5 bialych kul, Losujemy 4 kule ze zwracaniem i bez zwracanie W obu przypadkach wyznacz rozklad liczby wylosowanych czarnych kul! 0.45 0.45 0.4 0.4 0.35 0.35 0.3 0.3 0.25 0.25 0.2 0.2 0.15 0.15 0.1 0.1 0.05 0.05 0 0 1 2 3 4 0 0 1 2 3 4 ze zwracaniem bez zwracania 24
Rozklad hipergeometryczny N obiektow sposrod ktorych M ma wlasnosc E. Losujemy n obiektow bez zwracania, X liczba wylosowanych obiektow ktore posiadaja wlasnosc E. P(X = k) = (M k)( N M n k) ( N n) Uzywamy definicji ( a b) = 0, gdy a < b Oczywiscie P(X = k) = 0 gdy M < k i P(X = k) = 0 if N M < n k Zatem: Ω = {k : max(0,n N +M) k min(n,m)} 25
Srednia i wariacja Bez dowodu E(X) = nm N, Var (X) = nm N (1 M N )N n N 1, Zdefiniujmy p := M N i porownajmy z rozkladem dwumianowym E(X) = np tak samo jak w rozkladzie dwumianowym Var (X) = np(1 p) N n N 1 rozkladzie dwumianowym asymptotycznie tak samo jak w poniewaz lim N N n N 1 = 1 Jezeli N i M sa bardzo duze w porownaniu do n, to mamy w przyblizeniu X B(n, M N ) (bez dowodu) 26
Przyklad rozkladu hipergeometrycznego Kontrola jakosci: Mamy 30 paczek z jajkami, 10 paczek zawiera co najmniej jedno zbite jajko, Wybieramy losowo 6 paczek Wyznacz p-stwo, ze w dokladnie dwoch wybranych paczkach beda zbite jajka. N = 30,M = 10,n = 6 P(X = 2) = ( 10 )( 20 2 4 ) ( 30 6) = 0.3672 Wartosc oczekiwana i wariancja liczby paczek ze zbitymi jajkami w naszej probie E(X) = 6 10 30 = 2; Var (X) = 6 1 3 2 3 24 29 = 1.1034 27
Cwiczenie: Przyblizenie rozkladem dwumianowym Loteria z 1000 losow, 200 losow wygrywa Kupujesz 5 losow 1. Wyznacz p-stwo, ze co najmniej jeden z twoich losow wygra Wynik: 0.6731 2. To samo z wykorzystaniem rozkladu dwumianowego Wynik: 0.6723 28
Podsumowanie rozkladow dyskretnych Jednostajny: Ω = {x 1,...,x n }, P(X = x k ) = 1/n Dwumianowy: X B(n,p), E(X) = np, Var (X) = npq P(X = k) = ( ) n k p k q n k Ω = {0,...,n} Poissona: X P(λ), P(X = k) = λk k! e λ E(X) = λ, Var (X) = λ Ω = {0,1,2...} Geometryczny: P(X = k) = p q k 1 E(X) = p 1, Var (X) = q p 2 Ω = {1,2...} Hipergeometryczny: P(X = k) = ( M k )( N M ) ( n k / N n) E(X) = np, Var (X) = np(1 p) N n N 1, p = M N 29