Rozkªady i warto± oczekiwana Piotr Wilkin Zmienne losowe i rozkªady. Wst p Zmienn losow nazywamy zmienn X przyjmuj c dowolne warto±ci z pewnego zbioru D, która speªnia wªasno± y D P (X = y) = (innymi sªowy - prawdopodobie«stwa przyj cia wszystkich warto±ci z dziedziny sumuj si do jedynki). Rozkªadem zmiennej losowej nazywamy opis prawdopodobie«stw, z jakim zmienna losowa przyjmuje okre±lone warto±ci. O zmiennej losowej warto my±le jako o zmiennej opisuj cy pewien parametr procesu losowego. W szczególno±ci, wa»nym elementem znalezienia rozkªadu zmiennej losowej jest odpowiedni opis procesu losowego, który ta zmienna opisuje. Rozkªady zmiennych losowych mo»emy podawa na dwa podstawowe sposoby - za pomoc funkcji rozkªadu (dla przypadków dyskretnych zwana jest ona te» funkcj masy prawdopodobie«stwa), czyli po prostu funkcji f takiej,»e f(y) = P (X = y) oraz za pomoc dystrybuanty (któr zwyczajowo oznacza si za pomoc wielkiej litery F ), czyli funkcji F (y) = P (X y). Rozpatrzmy to najpierw na najprostszym przykªadzie, czyli rzutu kostk. W przypadku rzutu kostk ka»dy element dziedziny przyjmowany jest z równym prawdopodobie«stwem, czyli mamy do czynienia z rozkªadem równomiernym: Warto± 4 Funkcja masy Dystrybuanta 4 W przypadku rozkªadów sko«czonych mo»na je przedstawia za pomoc tabelki - w przypadku rozkªadów niesko«czonych trzeba poda wzór ogólny.. Przykªady rozkªadów Poni»ej przeanalizujemy kilka typowych przykªadów rozkªadów oraz zobaczymy, jak rozwi zywa zadania, w których te rozkªady wyst puj... Rozkªad dwupunktowy Rozkªad dwupunktowy to obok rozkªadu równomiernego jeden z najprostszych rozkªadów; charakteryzuje go nast puj ca tabelka (dla dowolnych dwóch warto±ci a < b): Warto± a b Funkcja masy p - p Dystrybuanta p
Szczególnym przykªadem rozkªadu dwupunktowego jest rozkªad zero-jedynkowy - wówczas a = 0 i b =. Rozkªad dwupunktowy rzadko jest stosowany sam z siebie, bywa natomiast bardzo u»yteczny przy rozwi - zywaniu zada«z wykorzystaniem addytywno±ci warto±ci oczekiwanej zmiennych losowych... Rozkªad dwumianowy (Bernoulliego) Rozkªad Bernoulliego to rozkªad, którego funkcja masy charakteryzuje si wzorem znanym ze schematu Bernoulliego. Innymi sªowy, w przypadku rozkªadu Bernoulliego zmienna X przyjmuje warto± k wtw., gdy w procesie losowym, który ta zmienna opisuje, wyst piªo k sukcesów. Rozkªad Bernoulliego opisuje proces losowy o parametrach n i p, gdzie n to ª czna liczba prób, a p to prawdopodobie«stwo sukcesu w ka»dej z prób. Zakªadamy,»e próby s zdarzeniami niezale»nymi. Funkcja masy w przypadku rozkªadu Bernoulliego to po prostu dobrze ju» znany schemat Bernoulliego: ( n k) p k ( p) n k. Dystrybuanta nie wyra»a si niestety»adnym prostym wzorem (przynajmniej na naszym obecnym poziomie wtajemniczenia), za to warto± oczekiwana w przypadku zmiennej o rozkªadzie Bernoulliego wynosi po prostu n p czyli w przypadku 00 prób i prawdopodobie«stwa sukcesu w pojedynczej próbie równego, warto± oczekiwana wynosi 40. Pó¹niej zobaczymy, jak uzyska ten wynik wyª cznie z wykorzystaniem addytywno±ci zmiennej losowej, bez»adnych skomplikowanych wzorów. Dwóch graczy niezale»nie od siebie rzuca n razy monet. Pierwszy gracz rzuca symetryczn monet, drugi oszukuje - jego moneta ma prawdopodobie«stwo wyrzucenia wªa±ciwej strony równe. Jaki b dzie rozkªad prawdopodobie«stwa zmiennej X = ró»nica mi dzy wynikiem pierwszego a drugiego gracza? Zauwa»my,»e mamy tutaj dwie zmienne losowe: X okre±la liczb sukcesów gracza pierwszego, a X - gracza drugiego. Warto± naszej zmiennej X wynosi po prostu X X. Przyjmuje zatem warto±ci od -0 do 0. eby uzyska na zmiennej X warto± k, ró»nica mi dzy liczbami sukcesów pierwszego i drugiego gracza musi wynosi k - czyli np. dla ró»nicy i n = 0 pierwszy gracz musi mie sukcesów, a drugi. Prawdopodobie«stwo dla X = k b dzie sum po wszystkich takich mo»liwych przypadkach (czyli dla wspomnianego n = 0 i k = sum z przypadku X =, X = 0, X =, X = itd. a» do X = 0, X = 8. Je±li pami tamy,»e ( n k) wynosi 0, je±li k > n lub k < 0, to mo»emy to zapisa za pomoc sumy: [( n (n i=0 i ) ( ) i ( ) ) ( n i ( n i + k ) ( ) i+k ( ) )] n (i+k) Je±li masz problemy ze zrozumieniem powy»szego zapisu, to w ramach wiczenia rozbij sobie ten przykªad dla maªych liczb, np. dla n =. Narysuj tabelk dla obu rozkªadów X i X, a nast pnie tabelk dla X.. Rozkªad geometryczny Rozkªad geometryczny opisuje proces, w którym czekamy na wyst pienie pierwszego sukcesu (w sekwencji zdarze«niezale»nych). W przeciwie«stwie do wielu opisywanych tutaj rozkªadów, rozkªad geometryczny jest niesko«czony - teoretycznie mo»e wyst pi dowolnie dªuga sekwencja prób, zanim odniesiemy pierwszy sukces. Jedynym parametrem rozkªadu geometrycznego jest prawdopodobie«stwo p odniesienia sukcesu w ka»dej z kolejnych niezale»nych prób. Funkcja masy dla rozkªadu geometrycznego to ( p) k p, gdzie k oznacza liczb prób, po których wyst piª pierwszy sukces (czyli w tym wypadku k pora»ek, a nast pnie sukces. Dystrybuanta dla rozkªadu geometrycznego to P (X k) = ( p) k. Warto± oczekiwana dla rozkªadu geometrycznego to p.
Dwóch tenisistów - lepszy i sªabszy - rozgrywa ze sob pojedynek. Rozgrywaj pi ciosetowe pojedynki do momentu, w którym sªabszy z tenisistów nie zwyci»y (czyli nie wygra przynajmniej :). Wyznacz rozkªad zmiennej X = liczba rozegranych pi ciosetowych pojedynków, je±li prawdopodobie«stwo wygranej gracza sªabszego wynosi 0%. Zauwa»my,»e zwyci stwo w pojedynku (czyli pojedynczy sukces w naszym procesie geometrycznym) to po prostu odpowiednia liczba sukcesów w schemacie Bernoulliego - w tym wypadku prawdopodobie«stwo sukcesu p = ( ) ( ) ( 4 ) + ( ) 4 ( )4 ( 4 ) + ( ) ( ) ( 4 )0. Po wyliczeniu p dalej mamy ju» zwyczajny rozkªad geometryczny...4 Rozkªad hipergeometryczny Rozkªad hipergeometryczny to rozkªad, który opisuje proces losowy, w którym wybieramy (bez zwracania) elementy z wi kszej puli, w której istnieje binarny podziaª (na elementy posiadaj ce dan cech i elementy jej nieposiadaj ce), a nas interesuje liczba sukcesów (czyli wyci gni tych elementów z dan cech ). Przykªadowo, je±li ze zbioru 000 samochodów 400 jest czerwonych, a my wybieramy na chybiª-traª 0 samochodów, to rozkªad hipergeometryczny opisze nam, ile spo±ród wybranych samochodów b dzie czerwonych. Funkcja masy dla rozkªadu hipergeometrycznego wyra»a si wzorem: ( K )( N K ) k gdzie N to rozmiar populacji (w naszym przykªadzie - 000), K - liczba elementów z dan cech w populacji (u nas - 400), a n to rozmiar próbki (czyli 0). Warto± oczekiwana dla rozkªadu hipergeometrycznego to n K N. n k ( N n) Z urny, w której byªo 0 kul, z czego czerwonych, wyrzucono na chybiª traª 0 kul. Wyznacz rozkªad zmiennej X = liczba wybranych kul czerwonych. W tym przypadku nasza populacja to 0, a rozmiar próbki 0-0 = 0 (zauwa»my,»e wybór próbki o rozmiarze n to to samo, co odrzucenie z populacji N n elementów). Mamy zatem rozkªad hipergeometryczny, w którym N = 0, K =, n = 0... Rozkªad Pascala Rozkªad Pascala to uogólnienie rozkªadu geometrycznego. O ile w przypadku rozkªadu geometrycznego interesuje nas moment pierwszej pora»ki (b d¹ pierwszego sukcesu), to w przypadku rozkªadu Pascala interesuje nas moment, w którym wyst piªa dokªadnie n-ta pora»ka. Funkcja masy dla rozkªadu Pascala to: ( ) n + k ( p) n p k n gdzie funkcja przyjmuje warto±c k, je±li dokªadnie w n + k-tym momencie wyst piªa n-ta pora»ka (czyli w n + k tej próbie wyst piªa pora»ka oraz we wcze±niejszych próbach wyst piªo ª cznie n pora»ek). Parametrami dla rozkªadu Pascala s : n - oczekiwana liczba pora»ek oraz p - prawdopodobie«stwo sukcesu w pojedynczej próbie. Przy n = rozkªad Pascala redukuje si do rozkªadu geometrycznego (w którym prawdopodobie«stwo sukcesu zast pujemy prawdopodobie«stwem pora»ki). Warto± oczekiwana wyra»a si wzorem r p p.
rzutów, po których osi gniemy ª cznie 0 dubletów. Rzucamy parami ko±ci sze±cio±ciennych. Wyznacz rozkªad zmiennej X = liczba Dublet to sytuacja, w której na obu ko±ciach wyst pi te same oczka. Prawdopodobie«stwo takiego zdarzenia wynosi =. To zdarzenie to nasza pora»ka w procesie Pascala. Mamy zatem p = i n = 0 dla rozkªadu Pascala - pami tajmy jednak,»e w rozkªadzie Pascala warto± zmiennej X = k oznacza,»e n-ta pora»ka wyst pi w n+k-tej próbie, musimy wi c przesun nasz zmienn losow. Je±li X p to b dzie zmienna reprezentuj ca rozkªad Pascala, to nasza zmienna b dzie speªniaªa wªasno± P (X p = k n) (w szczególno±ci dla ujemnych k prawdopodobie«stwo w rozkªadzie Pascala jest zerowe ze wzgl du na wªa±ciwo±ci dwumianu).. Warto±ci oczekiwane Warto± oczekiwana to ±rednia wa»ona dla zmiennej losowej, w której ka»da warto± zmiennej dostaje tak wag, jakie jest jej prawdopodobie«stwo. Warto± oczekiwan mo»na liczy na dwa sposoby: z denicji, czyli wykonuj c sumowanie: d D P (X = d) d korzystaj c z addytywno±ci zmiennej losowej.. Liczenie warto±ci oczekiwanej z denicji W przypadku wielu rozkªadów, do liczenia warto±ci oczekiwanej z denicji brakuje nam narz dzi - dotyczy to przede wszystkim rozkªadów niesko«czonych, nie potramy bowiem jeszcze sumowa niesko«czonych szeregów. Dlatego liczenie warto±ci oczekiwanej w ten sposób musimy ograniczy do przypadków sko«czonych. Metoda ta sprawdza si najlepiej dla rozkªadów tabelkowych, czyli takich, dla których caªy rozkªad mo-»emy przedstawi w postaci tabelki (tak jak rozkªad równomierny rzutu kostk we wst pie). Rozpatrzmy dla przykªadu rzut dwiema ko± mi cztero±ciennymi. Wyznaczmy rozkª d zmiennej X = suma oczek: Warto± 4 7 8 Funkcja masy Warto± wa»ona (warto± * prawdopodobie«stwo) Teraz wystarczy tylko zsumowa warto±ci z ostatniego wiersza tabeli, aby uzyska warto± oczekiwan - wynosi ona 80 =, zgodnie z oczekiwaniami... Liczenie warto±ci oczekiwanej z addytywno±ci Istnieje jednak inne, bardzo pot»ne narz dzie liczenia warto±ci oczekiwanej, które bazuje na wªasno±ci zmiennych oczekiwanych zwanej addytywno±ci. Otó» w przypadku zmiennych losowych zachodzi równanie: 4 0 8 4 8 E(X + Y ) = EX + EY Co wi cej, zachodzi ono tak»e wtedy, kiedy zmienne X i Y nie s od siebie probabilistycznie niezale»ne, tzn. kiedy zdarzenia opisywane przez zmienne X i Y nie s niezale»ne. Je±li wi c jeste±my w stanie rozbi nasz zmienn X na sko«czon sum zmiennych X...X n, których warto±ci oczekiwane potramy ªatwo policzy, to potramy te» ªatwo policzy zmienn b d c ich sum. W szczególno±ci b dziemy tu bardzo cz sto korzysta z rozkªadu dwupunktowego.
Przykªad We fragmencie dotycz cym rozkªadu Bernoulliego wspominaªem,»e poka», jak policzy warto± oczekiwan tego rozkªadu za pomoc prostych narz dzi. Zauwa»my teraz,»e nasza zmienna X przyjmuj ca warto± k wtw., gdy proces Bernoulliego odnosi k prób da si rozbi na sum n zmiennych X i o rozkªadzie zero-jedynkowym: X i = wtw., gdy w i-tej próbie odnie±li±my sukces i 0 w przeciwnym przypadku. Poniewa» P (X i = ) = p, zatem ka»da z tych zmiennych ma warto± oczekiwan p, zatem ostatecznie dostajemy: EX = n i= EX i. Mamy zatem sum n zmiennych o warto±ci oczekiwanej p, czyli nasza warto± oczekiwana wynosi n p. Przykªad Zadanie z wicze«z 7 XII. W tym zadaniu mo»na wprawdzie policzy warto± oczekiwan ze rozkªadu, ale wymaga to znajomo±ci wzoru na tzw. nieporz dki oraz skomplikowanych przeksztaªce«na dwumianach. Zamiast tego wystarczy zauwa»y,»e nasza zmienna to suma n zmiennych o rozkªadzie zerojedynkowym, z których ka»da ma warto± oczekiwan n (gdy» dla ka»dej z kartek prawdopodobie«stwo,»e tra ona do wªa±ciwej koperty wynosi n ). Zatem warto± oczekiwana wynosi n n = (je±li kto± chce to zwerykowa i po wiczy na podstawie rozkªadu, mo»e znale¹ w sieci wzór na liczb nieporz dków - tzw. podsilni - i spróbowa wykona przeksztaªcenia tak, aby otrzyma, ale jest to zadanie mocno pracochªonne).