PROB2 Zmienne losowe dyskretne 1 plik dyskretne.tex 9 grudnia 2005, ELEMENTY PROBABILISTYKI R.2 2 Zmienne losowe dyskretne 2.1 Ogólne definicje i w lasności Zmienna losowa X jest zmienna losowa dyskretna, jeśli przyjmuje tylko skończona (lub przeliczalna) liczbe wartości x 0, x 1,..., x k z określonymi prawdopodobieństwami p 0, p 2,..., p k. Tak wiec mamy: x 0, x 1,..., x k możliwe wartości zmiennej losowej, p 0, p 1,..., p k p-stwa wystapienia poszczególnych wartości. Liczba k może oznaczać dowolnie duża liczbe ca lkowita, w szczególności możliwych wartości x i może być nieskończenie wiele. Piszemy wtedy x 0, x 1,...,. Zbiór wszystkich możliwych wartości zmiennej losowej X bedziemy oznaczać symbolem H i nazywać nośnikiem rozk ladu zmiennej X. Prawdopodobieństwa p i, i = 0,..., k (lub i = 0,..., ) musza spe lniać warunki: 1) 0 p i 1, 2) i H p i = 1. Równoważne oznaczenia prawdopodobieństw p i : p i = P (X = x i ), lub p i = P (X = i). Przyk lad. Zmienna losowa przyjmujaca 4 wartości. Zmienna losowa X określona w tabelce poniżej przyjmuje tylko 4 wartości, podane w pierwszym wierszu tabelki. Drugi wiersz tabelki zawiera odpowiednie prawdopodobieństwa. W trzecim wierszu tabelki (cum p i ) zsumowano kolejne prawdopodobieństwa. Jak widać, sumuja sie one do jedności. x i 0 2 3 5 zbiór H, nośnik rozk ladu p i 0.1 0.3 0.4 0.2 kolejne prawdopodobieństwa sum p i 0.1 0.4 0.8 1.0 skumulowane p-stwa Tak wiec, rozk lad prawdopodobieństwa zmiennej losowej X jest określony za pomoca par {x i, p i }. Dla omawianego przyk ladu rozk lad ten jest przedstawiony graficznie na rys. 2.1, lewy wykres: 0.5 Discrete probabilities 1 Cumulative p.d.f. 0.4 0.8 p(x) 0.3 0.2 F(x) 0.6 0.4 0.1 0.2 0 0 2 3 5 x 0 2 0 2 4 6 x Rysunek 2.1: Przyk ladowy rozk lad dyskretnej zmiennej losowej X (lewa strona) oraz jego skumulowane wartości (prawy strona).
PROB2 Zmienne losowe dyskretne 2 Na tym samym rysunku (2.1), na wykresie z prawej strony, jest przedstawiony wykres skumulowanych wartości dla omawianego rozk ladu. Jak widzimy, dla zmiennej losowej dyskretnej wykres ten przedstawia niemalejac a funkcje schodkowa. Funkcja ta ma punkty nieciag lości dla wartości x 1, x 2,..., x k ; wielkości skoków sa równe wartościom p i przyjmowanym przez X w tych punktach. Funkcja F(x) przedstawiajaca skumulowane wartości zosta la w tym przypadku zdefiniowana jako F (x) = P (X x) = P (X = x i ) (2.1) x i x Typowymi przyk ladami zmiennych losowych dyskretnych sa: 1. rozk lad binarny, czyli zerojedynkowy 2. rozk lad dwumianowy, rozk lad Poissona 3. rozk lad Pascala, czyli ujemny dwumianowy 4. rozk lad geometryczny 5. rozk lad hipergeometryczny 2.2 Wartość oczekiwana i wariancja zmiennej losowej dyskretnej Zanim przejdziemy do omówienie niektórych z wymienionych rozk ladów, Wprowadzimy bardzo ważne określenia charakteryzujace rozk lady zmiennych losowych. Sa nimi wartość oczekiwana i wariancja zmiennej losowej X. Deficje te podajemy dla zmiennych losowych dyskretnych. Wartość oczekiwana µ wskazuje na wartość średnia rozk ladu, natomiast odchylenie standardowe σ na rozproszenie wartości x i wokó l średniej µ. Definicja. Wartościa oczekiwana dyskretnej zmiennej losowej X nazywa sie wyrażenie (H oznacza nośnik wartości zmiennej losowej X): Sumowanie możemy również zapisać z wyszczególnieniem elementów sumowanych, np. ki=1, lub i=0. E(X) = x i H x i p i. Wartość oczekiwana oznacza sie czesto symbolem µ. Mamy wiec: µ = E(X). Definicja. Wariancja dyskretnej zmiennej losowej X nazywa sie wyrażenie: V ar(x) = E[(X µ) 2 ] = x i H (x i µ) 2 p i. Wariancja jest oznaczana również symbolem σ 2. Pierwiastek z wariancji nazywa si e odchyleniem standardowym. Przyklad z poprzedniej sekcji, kontynuacja. Obliczamy E(X) i V ar(x) Wartość oczekiwana: E(X) = 0 0.1 + 2 0.3 + 3 0.4 + 5 0.2 = 2.8. Wariancja: V ar(x) = ( 2.8) 2 0.1 + 0.8 2 0.3 + 0.2 2 0.4 + 2.2 2 0.2 = 0.784 + 0.192 + 0.016 + 0.968 = 1.960. Odchylenie standardowe: σ = V ar(x) = 1.960 = 1.4.
PROB2 Zmienne losowe dyskretne 3 Obliczenia najlepiej zorganizować w tabelce, wtedy trudniej o omy lke: x i p i x i p i (x i µ) (x i µ) 2 (x i µ) 2 p i 0 0.1 0.0-2.8 7.84 0.784 2 0.3 0.6-0.8 0.64 0.192 3 0.4 1.2 0.2 0.02 0.016 5 0.2 1.0 2.2 4.84 0.968 suma 2.8 1.960 Otrzymamy wtedy: E(X) µ = 2.8, V ar(x) σ 2 = 1.96, czyli te same wyniki co poprzednio. Zadania Zadanie 2.1. Loteria zawiera 1 los wygrywajacy 1000 $, dwa losy wygrywajace 500 $, 5 losów wygrywajacych 100 $, oraz 50 losów wygrywajacych 5 $. Poza tym sa losy puste, czyli nie wygrywajace nic. Jaka jest oczekiwana wygrana? Ile powinien kosztować los, aby organizatorzy nie stracili na loterii? Zadanie 2.2. W urnie znajduja sie: 4 kule czerwone, 3 bia le i 1 czarna. Grajacy otrzymuje 10 centów, gdy wyciagnie kule czerwona, nie otrzymuje nic, gdy wyciagnie kule bia l a, i p laci 50 centów, gdy wyciagnie kule czarna. Jaka jest oczekiwana wygrana? Zadanie 2.3. W zakladzie opracowano nowy produkt. Jest on wart (można go sprzedać) za 1000 $. Wylansowanie i wprowadzenie na rynek produktu kosztuje 1500 $. Cz eść A. Produkt wprowadzony na rynek może a) odnieść duży sukces z p-stwem =.2, b) odnieść umiarkowany sukces z p-stwem 0.5, c) nie spotkać si e z żadnym zainteresowaniem z p-stwem 0.3. Ocena zysków: w przypadku a): 10000 $, w przypadku b): 4000 $, w przypadku c): 6000 $. Cześć B. Postanowiono przed ostateczna decyzja (sprzedać produkt czy lansować go samodzielnie) przeprowadzić odpowiednie badania rynkowe. Badania takie kosztuja 500 $. Badania rynkowe moga być pozytywne (że rynek jest zainteresowany produktem) lub negatywne (że rynek nie jest zainteresowany produktem). Niezależnie od opinii z badań rynkowych zak lad może chcieć mimo wszystko wprowadzić swój produkt na rynek. Wtedy p-stwa dużego sukcesu, umiarkowanego sukcesu i porażki, oceniane osobno dla przypadków pozytywnej i negatywnej opinii badań, przedstawiaja sie nastepuj aco: Projekt może odnieść Duży sukces Umiarkowany sukces Ma ly sukces Gdy badania rynkowe pozytywne 0.6 0.2 0.2 Gdy badania rynkowe negatywne 0.1 0.3 0.6 Jakie s a oczekiwane zyski w obu przypadkach? Czy zaklad powinien wprowadzać swój produkt na rynek, czy też sprzedać go?
PROB2 Zmienne losowe dyskretne 4 2.3 Rozk lad binomialny (dwumianowy lub Bernoulliego) Mamy serie n niezależnych doświadczeń. Wynikiem każdego doświadczenia jest sukces lub porażka (np. orze l lub reszka). Prawdopodobieństwo sukcesu jest takie samo w każdym doświadczeniu i wynosi p, gdzie 0 < p < 1. Określamy zmienna losowa X jako liczbe sukcesów w opisanej serii n doświadczeń. Zmienna losowe X może przyjmować wartości 0, 1,... n z prawdopodobieństwami p 0, p 1,..., p n określonymi nastepuj aco: ( ) n p i = P (X = i) = p i (1 p) n i, i = 0, 1,..., n. i Parametrami rozk ladu binomialnego sa: n d lugość serii, oraz p prawdopodobieństwo sukcesu w jednym doświadczeniu, dlatego też zmienna o rozk ladzie binomialnym oznacza sie jako funkcje b(i; n, p). Chcac zaznaczyć wyraźnie, że zmienna losowa X ma rozk lad binomialny, dajemy literke b jako wskaźnik dolny symbolu oznaczajacego te zmienna i piszemy X b jako oznaczenie tej zmiennej losowej X b b(n, p). Dla przyk ladu pokazujemy rozk lad binomialny b(i; 24, 0.75) i jego dystrybuante. Argumenty obu funkcji sa oznaczone symbolem x. Latwo sprawdzić, że wartość oczekiwana tego rozk ladu wynosi np = 24 0.75 = 18.00, a wariancja np(1 p) = 24 0.75 0.25 = 4.50. Rysunek 2.2. Rozk lad prawdopodobieństwa (góra) i skumulowane prawdopodobieństwa (dó l) dla rozk ladu binomialnego z parametrami n = 24, p = 0.75, czyli rozk ladu b(i; 24, 0.75). i prob[x=i] prob[x<=i] prob[x>i] 0 0.00000 0.00000 1.00000 1 0.00000 0.00000 1.00000 2 0.00000 0.00000 1.00000 3 0.00000 0.00000 1.00000 4 0.00000 0.00000 1.00000 5 0.00000 0.00000 1.00000 6 0.00000 0.00000 1.00000 7 0.00000 0.00000 1.00000 8 0.00002 0.00002 0.99998 9 0.00009 0.00011 0.99989 10 0.00041 0.00052 0.99948 11 0.00157 0.00209 0.99791 12 0.00511 0.00720 0.99280 13 0.01414 0.02134 0.97866 14 0.03333 0.05466 0.94534 15 0.06665 0.12132 0.87868 16 0.11248 0.23380 0.76620 17 0.15879 0.39259 0.60741 18 0.18526 0.57784 0.42216 19 0.17551 0.75335 0.24665 20 0.13163 0.88498 0.11502 21 0.07522 0.96020 0.03980 22 0.03077 0.99097 0.00903 23 0.00803 0.99900 0.00100 24 0.00100 1.00000 0.00000
PROB2 Zmienne losowe dyskretne 5 Rysunki i tabele otrzymano za pomoca pakietu WINSTATS. Pokazuje sie, że wartość oczekiwana zmiennej X o rozk ladzie b(n,p) wynosi µ = np, a wariancja σ 2 = np(1 p). Podstawiajac q = 1 p otrzymujemy: E(X b ) = np, V ar(x b ) = npq. Można pokazać, że rozk lad binomialny jest rozk ladem symetrycznym. W przypadku n parzystego rozk lad binomialny posiada dwie takie same wartości modalne, natomiast w przypadku n nieparzystego dok ladnie jedna wartośc modalna. 2.4 Rozk lady graniczne rozk ladu binomialnego przy n + Co si e dzieje z rozk ladem binomialnym, gdy liczba doświadczeń n rośnie nieograniczenie, czyli staje si e bardzo duża? W zależności od p, prawdopodobieństwa sukcesu, wyróżniamy tu dwa przypadki: A. Parametr p wykazuje wartośc umiarkowana, tj. ani bardzo ma l a, ani bardzo duża. Na ogó l oznacza to, że 0.05 < p < 0.95. Wtedy można wykazać, że rozk lad binomialny daży asymptotycznie do rozk ladu normalnego (Gaussa Laplace a) o parametrach µ = np i σ 2 = npq, gdzie q = 1 p. Oznacza to, że dla dużego n prawdopodobieństwa z rozk ladu binomialnego b(n, p) moga być wyznaczane za pomoca prawdopodobieństw w rozk ladzie normalnym N (µ = np, σ 2 = npq) {rozk ladem tym bedziemy sie zajmować w rozdziale 4}. Przyk ladowo na rysunku 2.2 (góra) można zobaczyć, że dla n = 24, p = 0.75 przedstawiony rozk lad binomialny jest już dość dobrze aproksymowany rozk ladem normalnym. Dalsze przyk lady rozk ladu binomialnego sa pokazane na końcu tego rozdzia lu. B. Parametr p jest ma ly, czyli wystapienie sukcesu jest zjawiskiem rzadkim. Po lóżmy: np = λ i obliczmy granice, gdy n (odpowiada to sytuacji, gdy do partii towaru zawierajacego pewien procent braków bedziemy dodawać coraz to wiecej sztuk dobrych). Otrzymujemy wtedy lim n ( ) n p i (1 p) n i = lim i n ( n i ) ( λ n ) i ( 1 λ n ) n i =... = λi i! e λ. Otrzymujemy ostatecznie rozk lad noszacy nazwe rozk ladu Poissona: P (X = i λ) = λi i! e λ, i = 0, 1,.... Rozk lad ten jest opisywany w nast epnej podsekcji jako kolejny przyk lad rozk ladu dyskretnego, którego nośnik zawiera nieskończenie wiele wartości.
PROB2 Zmienne losowe dyskretne 6 2.5 Rozk lad Poissona Definicja. Zmienna losowa X ma rozk lad Poissona, jeśli przyjmuje wartości i = 0, 1, 2,... z prawdopodobieństwami p i wyznaczonymi nastepuj acym wzorem: p i = P (X = i λ) = λi i! e λ, i = 0, 1,.... Wartość λ > 0 jest parametrem rozk ladu. Oczywiście i=0 p i = λ i i=0 e λ 1. i! Wartość oczekiwana i wariancja zmiennej o rozk ladzie Poissona wynosza odpowiednio: E(X P oisson ) = λ, V ar(x P oisson ) = λ. Rysunek 2.3: Rozk lad prawdopodobieństwa (lewa) i jego wartości skumulowane (prawa) dla rozk ladu Poissona z parametrami λ = 2.5 i λ = 5.0. Na lożono również aproksymacj e rozk ladem normalnym lambda = 2.5 lambda = 5.0 i prob[x=i] prob[x<=i] prob[x>i] i prob[x=i] prob[x<=i] prob[x>i] 0 0.08208 0.08208 0.91792 0 0.00674 0.00674 0.99326 1 0.20521 0.28730 0.71270 1 0.03369 0.04043 0.95957 2 0.25652 0.54381 0.45619 2 0.08422 0.12465 0.87535 3 0.21376 0.75758 0.24242 3 0.14037 0.26503 0.73497 4 0.13360 0.89118 0.10882 4 0.17547 0.44049 0.55951 5 0.06680 0.95798 0.04202 5 0.17547 0.61596 0.38404 6 0.02783 0.98581 0.01419 6 0.14622 0.76218 0.23782 7 0.00994 0.99575 0.00425 7 0.10444 0.86663 0.13337 8 0.00311 0.99886 0.00114 8 0.06528 0.93191 0.06809 9 0.00086 0.99972 0.00028 9 0.03627 0.96817 0.03183 10 0.00022 0.99994 0.00006 10 0.01813 0.98630 0.01370 11 0.00005 0.99999 0.00001 11 0.00824 0.99455 0.00545 12 0.00001 1.00000 0.00000 12 0.00343 0.99798 0.00202 13 0.00000 1.00000 0.00000 13 0.00132 0.99930 0.00070 14 0.00000 1.00000 0.00000 14 0.00047 0.99977 0.00023
PROB2 Zmienne losowe dyskretne 7 Rysunek 2.3 pokazuje wykresy rozk ladu Poissona dla parametrów λ = 2.5 i λ = 5.0 oraz odpowiednie wartości prawdopodobieństw. Rozk lad Poissona otrzymuje sie jako rozk lad graniczny rozk ladu dwumianowego, gdy d lugość serii (n) jest duża, a prawdopodobieństwo sukcesu (p) ma le. Duże n oznacza wartości wieksze niż 30, ma le p oznacza wartości mniejsze niż 0.05. Pojecia duże i ma le sa pojeciami rozmytymi ( fuzzy ) i zależa od stopnia przybliżenia jaki chcemy osiagnć. Z kolei, przy dużych wartościach λ, rozk lad Poissona może być aproksymowany rozk ladem normalnym N (µ = λ, σ 2 = λ). Przyk lad takiej aproksymacji jest pokazany na rysunku 3.3; nie jest ona jeszcze bardzo dok ladna. Zadania Zadanie 2.4. Liczba b l edów pope lnianych przez studentów kursu jez. angielskiego przy dyktandzie pewnego testu opisuje sie rozk ladem Poissona z parametrem λ = 5.0. Jakie jest prawdopodobieństwo, że osoba piszaca dyktando a) nie pope lni żadnego b l edu, b) pope lni 10 b l edów lub wiecej, c) pope lni dok ladnie 4 lub 5 b l edów? Zadanie 2.5. Producent twierdzi, że jego produkty (zapalniczki) nie zawieraja wiecej, niż 2,5 procent wadliwych sztuk. Zbadano karton zapalniczek zawierajacy 100 sztuk i znaleziono 5 wadliwych zapalniczek. Czy można mieć watpliwość co do twierdzenia producenta, że jego towar zawiera nie wiecej niź 2,5 procent wadliwych sztuk? Zadanie 2.6. Na podstawie przeprowadzonej wyrywkowej kontroli ocenia si e wadliwość masowo produkowanych wkr etów na 2,5 %. Wkr ety pakuje si e w pude leczka po 50 sztuk. Obliczyć prawdopodobieństwo, że w pude leczku nie b edzie wadliwej sztuki. Rachunek można przeprowadzić w oparciu o rozk lad Poissona lub rozk lad dwumianowy (dlaczego?). Porównaj wyniki. Literatura [1] Bobrowski D., Elementy rachunku prawdopodobieństwa z elementami statystyki matematycznej. Wydawnictwo Naukowe WSNHID, Poznań 2002. s. X+159. [2] Pakiet winstats http://math.exeter.edu/rparris Dodatek. Inne przyk ladowe wykresy i tablice wartości zmiennych losowych o rozk ladzie binomialnym
PROB2 Zmienne losowe dyskretne 8 i prob[x=i] prob[x<=i] prob[i<x] i prob[x=i] prob[x<=i] prob[i<x] BINOMIAL b[12, 0.25] BINOMIAL b[12, 0.75] 0 0.03168 0.03168 0.96832 4 0.00239 0.00278 0.99722 1 0.12671 0.15838 0.84162 5 0.01147 0.01425 0.98575 2 0.23229 0.39068 0.60932 6 0.04015 0.05440 0.94560 3 0.25810 0.64878 0.35122 7 0.10324 0.15764 0.84236 4 0.19358 0.84236 0.15764 8 0.19358 0.35122 0.64878 5 0.10324 0.94560 0.05440 9 0.25810 0.60932 0.39068 6 0.04015 0.98575 0.01425 10 0.23229 0.84162 0.15838 7 0.01147 0.99722 0.00278 11 0.12671 0.96832 0.03168 8 0.00239 0.99961 0.00039 12 0.03168 1.00000 0.00000 BINOMIAL b[16, 0.25] BINOMIAL b[16, 0.75] 0 0.01002 0.01002 0.98998 6 0.00136 0.00164 0.99836 1 0.05345 0.06348 0.93652 7 0.00583 0.00747 0.99253 2 0.13363 0.19711 0.80289 8 0.01966 0.02713 0.97287 3 0.20788 0.40499 0.59501 9 0.05243 0.07956 0.92044 4 0.22520 0.63019 0.36981 10 0.11010 0.18965 0.81035 5 0.18016 0.81035 0.18965 11 0.18016 0.36981 0.63019 6 0.11010 0.92044 0.07956 12 0.22520 0.59501 0.40499 7 0.05243 0.97287 0.02713 13 0.20788 0.80289 0.19711 8 0.01966 0.99253 0.00747 14 0.13363 0.93652 0.06348 9 0.00583 0.99836 0.00164 15 0.05345 0.98998 0.01002 10 0.00136 0.99971 0.00029 16 0.01002 1.00000 0.00000