Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 2 Przygotowując wykład korzystam głównie z książki Jakubowski, Sztencel Wstęp do teorii prawdopodobieństwa. Prawdopodobieństwo geometryczne Gdy przestrzeń zdarzeń elementarnych Ω jest nieprzeliczalna, nie da się skorzystać z prawdopodobieństwa klasycznego określonego na poprzednim wykładzie. Jeśli przestrzeń jest podzbiorem prostej, płaszczyzna, czy przestrzeni trójwymiarowej, możemy skorzystać z prawdopodobieństwa geometrycznego: jeśli A oznacza miarę A (długość, pole lub objętość, w zależności od rozważanego przypadku) to P (A) = A Ω. Ta definicja zapewnia, podobnie jak przy prawdopodobieństwie klasycznym, jednostajny rozkład prawdopodobieństwa. Odpowiednią miarę na prostej R nazywamy miarą Lebesgue a jest to funkcja zbioru, przeliczalnie addytywna i przypisująca zbiorowi pustemu zero, taka że miarą dowolnego odcinka jest jego długość. Poniższa definicja precyzuje na jakiej rodzinie zbiorów ta miara jest określona. Definicja. Najmniejsze σ-ciało zawierające wszystkie odcinki nazywamy σ-ciałem borelowskim. Będziemy oznaczać je przez B. Miarę Lebesgue a można też określić w przypadku wielowymiarowym, np. miara Lebesgue a na R 2 określona jest na σ-ciele zawierającym wszystkie prostokąty, przy czym miara prostokąta [a, b] [c, d] to (b a) (d c). Przykłady. Powróćmy do przykładu z pierwszego wykładu: przychodzimy na przystanek autobusowy. Autobus kursuje co 5 minut. Jakie jest prawdopodobieństwo, że będziemy czekać dłużej niż 0 minut? Ponieważ sytuacja powtarza się co 5 minut, możemy uznać, że rozważaną przestrzenią Ω jest 5-minutowy odcinek czasu pomiędzy dwoma kursami autobusu. Tzn. Ω = [0, 5]. Oznaczmy przez A oczekiwanie dłuższe niż 5 minut. Dłużej niż 5 minut będziemy czekać, gdy przyjdziemy w ciągu pierwszych 5 minut po odjeździe autobusu, czyli w odcinku (0, 5). Mamy więc: P (A) = (0, 5) [0, 5] = 5 5 = 3 2. Umawiam się z kolegą w Rynku między 6 a 7. Kto przyjdzie pierwszy, czeka 20 minut, a jeśli ten drugi się nie pojawi wraca do domu. Jakie jest prawdopodobieństwo spotkania? Przedstawmy możliwe pory przyjścia każdego z nas jako punkty (, y) z kwadratu [6, 7] [6, 7] ( - to moja pora przyjścia, a y kolegi). Ten kwadrat jest przestrzenią Ω. 20 minut stanowi /3 godziny. Spotkanie zajdzie jeśli y /3, czyli, gdy punkty leżą między prostymi y = 3 a y = + 3. Ten pas wokół przekątnej (zawarty w kwadracie Ω) ma pole równe 5/9, a cała Ω ma pole równe, więc prawdopodobieństwo spotkania wynosi 5/9.
Różnice w modelach probabilistycznych paradoks Bertranda Zastanówmy się teraz, co w ogóle oznacza wybieranie losowe i jak rozumieć pytanie: jakie jest prawdopodobieństwo zdarzenia. W istocie odpowiedź na nie zależy od tego, jaki sposób opisu doświadczenia przyjmiemy lub raczej, jaka przestrzeń probabilistyczna najlepiej opisuje dane doświadczenie. Dobrze ilustruje to paradoks Bertranda. Rozważmy okrąg o promieniu i wybierzmy z niego losowo jedną cięciwę. Jakie jest prawdopodobieństwo, że będzie dłuższa od boku trójkąta równobocznego wpisanego w ten okrąg? Możemy rozumować na trzy sposoby.. Wybór cięciwy to wybór dwóch punktów. Pierwszy wybieramy dowolnie, a potem drugi. Trójkąt równoboczny rysujemy tak, by jeden wierzchołek pokrywał się z pierwszym punktem cięciwy. Wierzchołki dzielą okrąg na trzy równe łuki. Cięciwa będzie dłuższa od boku trójkąta tylko wtedy, gdy drugi punkt leży na łuku przeciwległym pierwszemu punktowi, czyli prawdopodobieństwo (geometryczne) wynosi /3. 2. Można łatwo uzasadnić, że cięciwa jest dłuższa od boku trójkąta równobocznego, gdy jej odległość od środka okręgu jest mniejsza od /2 (połowa promienia). Prawdopodobieństwo wynosi więc /2. 3. Podobnie jak powyżej, cięciwa ma być odległa od środka o mniej niż /2, tzn. punkt najbliższy środkowi ma leżeć w kole o promieniu /2. Stosując ponownie prawdopodobieństwo geometryczne, otrzymujemy π ( 2 )2 π 2 = 4. Jak to możliwe, że wychodzą trzy różne wyniki? Po prostu w kolejnych punktach przyjmujemy różne modele probabilistyczne. To znaczy przeprowadzamy losowanie na zupełnie inne sposoby. W pierwszym wybieramy punkt z łuku okręgu, w drugim punkt z promienia, przez który przeprowadzamy odcinek, a w trzecim punkt z wnętrza koła to zupełnie inne losowania. Prawdopodobieństwo warunkowe i niezależność zdarzeń Przykład Mamy dwie urny. W jednej znajdują się wyłącznie białe kule, a w drugiej wyłącznie czarne. Wybieramy losowo (z jednakowym prawdopodobieństwem) jedną urnę, a następnie losujemy z niej kolejno dwie kule. Jakie jest prawdopodobieństwo, że druga wyciągnięta kula jest biała? Oczywiście prawdopodobieństwo to wynosi /2 wszystko rozstrzyga się przy wyborze urny. A teraz załóżmy, że przed odpowiedzią na pytanie znamy kolor pierwszej wylosowanej kuli. Jakie teraz jest prawdopodobieństwo, że wylosujemy białą? Zmienia się: jeśli wylosowaliśmy za pierwszym razem białą, to teraz też wylosujemy białą, wiec to prawdopodobieństwo wynosi. A jeśli czarną, to teraz prawdopodobieństwo białej wynosi 0. Definicja 2. Niech B będzie zdarzeniem w (Ω, F, P ), dla którego P (B) > 0. Prawdopodobieństwem warunkowym zdarzenia A pod warunkiem zdarzenia B nazywamy liczbę P (A B) = P (A B). P (B) 2
Można sprawdzić, że funkcja, która zbiorowi A przypisuje P (A B) jest prawdopodobieństwem na (Ω, F). Można też rozważać jako nową przestrzeń probabilistyczną trójkę (B, F B, P ( B)), gdzie F B = {A B : A F}. Twierdzenie. Jeśli P (A A 2... A n ) > 0, to P (A A 2... A n ) = P (A ) P (A 2 A ) P (A 3 A A 2 )... P (A n A A 2... A n ) Przykłady. Rzucamy dwukrotnie kostką k6. a) Jakie jest prawdopodobieństwo wyrzucenia różnej liczby oczek? b) Jakie jest prawdopodobieństwo wyrzucenia różnej liczby oczek, jeśli wiemy, że suma wyniosła? c) Jakie jest prawdopodobieństwo wyrzucenia różnej liczby oczek, jeśli wiemy, że suma wyniosła 0? Rozwiązanie: a) Ω to pary liczb,..., 6, Ω = 36. Jeśli A to zdarzenie, w którym na kostkach są różne liczby oczek, to A = 36 6 = 30. Zatem P (A) = 30 36 = 5 6. b) Jeśli B jest zdarzeniem, w którym suma oczek wynosi, to B = {(5, 6), (6, 5)}. W obu przypadkach liczby są różne, więc P (A B) =. c) Jeśli C oznacza zdarzenie, że suma wynosi 0, to C = {(4, 6), (5, 5), (6, 4)}, P (C) = 3 36 A C = {(4, 6), (6, 4)}, P (A C) = 2 36 P (A C) = 2 3 2. Losujemy dwie liczby i y z odcinka [0, ] (zgodnie z rozkładem geometrycznym, czyli jednostajnym). Jakie jest prawdopodobieństwo, że y 0, 09, jeśli wiemy, że + y? Rozwiązanie: Mamy Ω = {(, y) : 0, 0 y } A = {(, y) : y 0, 09} B = {(, y) : + y }, P (B) = 2 0, 09 A B = {(, y) : y } Można obliczyć, że krzywa y = 0,09 i prosta y = przescinają się w punktacho rzędnych 0, i 0, 9 (nieskomplikowane równanie kwadratowe). Zatem pole między wykresami tych funkcji, które reprezentuje prawdopodobieństwo geometryczne zdarzenia A B wynosi 0,9 0, (( ) 0, 09) d = 0, 4 0, 09 ln 9 3
Zdarzenia A i B o niezerowym prawdopodobieństwie nazywamy niezależnymi, gdy wynik jednego z nich nie wpływa na prawdopodobieństwo drugiego, tzn. P (A B) = P (A). Asymetria w definicji jest pozorna: jeśli zdarzenia są niezależne, to P (B A) = P (B A) P (A) = P (B A) P (B) P (B) P (A) = P } (A B) {{} =P (A) P (B) P (A) = P (B). Przyjmiemy następującą definicję, która pociąga powyższe równości, a nie wymaga założenia niezerowości prawdopodobieństw: Definicja 3. Zdarzenia A i B są niezależne, gdy P (A B) = P (A) P (B) Prawdopodobieństwo całkowite Niech H i, i =,..., r, będą parami rozłączne (wykluczające się) i r i= H i = Ω. Wtedy dla każdego zdarzenia A zachodzi: r P (A) = P (A H i ) P (H i ). i= Powyższa zależność, zwana wzorem na prawdopodobieństwo całkowite, zachodzi także w przypadku rozbicia przestrzeni Ω na przeliczalnie wiele parami rozłącznych zbiorów. Zbiory H i nazywane są niekiedy hipotezami. Przykład W pierwszej urnie mamy 3 białe kule i 2 czarne, a w drugiej białą i 4 czarne. Rzucamy kostką k6. Jeśli wypadła liczba mniejsza od 5, to losujemy kulę z pierwszej urny, a jeśli 5 lub 6, to z drugiej. Jakie jest prawdopodobieństwo zajścia zdarzenia A polegającego na wylosowaniu kuli białej? Niech H oznacza, że na kości wypadło 4 lub mniej, a H 2, że 5 lub 6. Zgodnie ze wzorem na prawdopodobieństwo całkowite mamy P (A) = P (A H )P (H ) + P (A H 2 )P (H 2 ) = 3 5 4 6 + 5 2 6 = 7 5 Wzór Bayesa Przy oznaczeniach jak w powyższym wzorze, zdarza się, że znamy wynik doświadczenia, a chcemy poznać prawdopodobieństwo, że przy takim wyniku ma miejsce hipoteza H i. Na przykład, w diagnostyce medycznej znamy prawdopodobieństwo choroby, znamy prawdopodobieństwo uzyskania pewnego wyniku w badaniu morfologii krwi (np. w kierunku markera nowotworowego) dla pacjenta zdrowego i pacjenta chorego, i chcemy oszacować prawdopodobieństwo, że pacjent jest chory przy konkretnym wyniku badania. Podobne zagadnienia pojawiają się przy testowaniu jakości sprzętu (kontroli produkcji). Wtedy pomocny jest wzór Bayesa: P (H j A) = P (A H j)p (H j ) ri= P (A H i )P (H i ), gdy P (A) > 0. 4
Wzór ten wynika ze wzoru na prawdopodobieństwo całkowite. Istotnie, mamy P (A H j )P (H j ) ri= P (A H i )P (H i ) = P (A H j)p (H j ) = P (A H j) = P (H j A). P (A) P (A) Przykłady. Mamy 00 monet, ale jedna jest wadliwa po obu stronach ma orły. Dziesięć kolejnych rzutów wybraną monetą dało 0 orłów. Jakie jest prawdopodobieństwo, że rzucano fałszywą monetą? Oznaczmy przez H hipotezę, że rzucano prawidłową monetą, a H 2, że fałszywą, zaś przez A zdarzenia polegające na wyrzuceniu 0 orłów w 0 rzutach. Wtedy P (H 2 A) = P (A H 2 )P (H 2 ) P (A H )P (H ) + P (A H 2 )P (H 2 ) = 00 00 + 2 0 99 00 = 024 0, 9 23 2. Wiadomo, że w pewnej partii produkcyjnej 3% elementów ma wadę. Test wskazuje wadę z prawdopodobieństwem 0,9, jeśli element jest wadliwy, a z prawdopodobieństwem 0,95 wskazuje poprawność, gdy element jest bez wady. a) Test wskazał wadę. Jakie jest prawdopodobieństwo, że element faktycznie ma wadę? b) Powtórzono test i powtórnie wskazał wadę. Ile teraz wynosi prawdopodobieństwo, że element jest wadliwy? Po obliczeniu stanie się jasne, dlaczego lekarze każą powtarzać wyniki jeśli wyszły złe. Niech H oznacza, że element jest dobry, a H 2, że wadliwy. Niech A oznacza, że test wskazał wadę. a) Wtedy P (H 2 A) = P (A H 2 )P (H 2 ) P (A H )P (H ) + P (A H 2 )P (H 2 ) = 0, 9 0, 03 = 0, 358 0, 05 0, 970, 9 0, 03 Zatem tylko 35,8% elementów wskazanych przez test faktycznie ma wadę fabryczną. b) Niech B oznacza, że dwukrotnie wskazano wadę. Testy przeprowadzane są niezależnie, więc P (B H ) = 0, 05 0, 05 = 0, 0025 P (B H 2 ) = 0, 9 0, 9 = 0, 8 P (B H 2 )P (H 2 ) P (H 2 B) = P (B H )P (H ) + P (B H 2 )P (H 2 ) 0, 8 0, 03 0, 0243 = = 0, 908 0, 0025 0, 97 + 0, 8 0, 03 0, 026725 Poprawność wskazania wady wzrosła do 90%. 5