Matematyka dla biologów Zajęcia nr 12.

Podobne dokumenty
12DRAP - parametry rozkładów wielowymiarowych

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Podstawy nauk przyrodniczych Matematyka

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Wykład 3 Jednowymiarowe zmienne losowe

Metody probabilistyczne

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Rozkłady prawdopodobieństwa zmiennych losowych

Zmienne losowe i ich rozkłady. Momenty zmiennych losowych. Wrocław, 10 października 2014

Metody probabilistyczne

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Przestrzeń probabilistyczna

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Zestaw 2: Zmienne losowe. 0, x < 1, 2, 2 x, 1 1 x, 1 x, F 9 (x) =

Zmienna losowa. Rozkład skokowy

Rozdział 1. Zmienne losowe, ich rozkłady i charakterystyki. 1.1 Definicja zmiennej losowej

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe

Rachunek Prawdopodobieństwa i Statystyka

Dyskretne zmienne losowe

Wykład 13. Podstawowe pojęcia rachunku prawdopodobieństwa

Rachunek prawdopodobieństwa

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

(C. Gauss, P. Laplace, Bernoulli, R. Fisher, J. Spława-Neyman) Wikipedia 2008

P (A B) = P (A), P (B) = P (A), skąd P (A B) = P (A) P (B). P (A)

Statystyka i eksploracja danych

Rachunek prawdopodobieństwa- wykład 2

Metody Rozmyte i Algorytmy Ewolucyjne

Ćwiczenia 7 - Zmienna losowa i jej rozkład. Parametry rozkładu.

Statystyka matematyczna

i=7 X i. Zachodzi EX i = P(X i = 1) = 1 2, i {1, 2,..., 11} oraz EX ix j = P(X i = 1, X j = 1) = 1 7 VarS 2 2 = 14 3 ( 5 2 =

Jednowymiarowa zmienna losowa

Sieci Mobilne i Bezprzewodowe laboratorium 1

Prawdopodobieństwo

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Biostatystyka, # 3 /Weterynaria I/

Matematyczne Podstawy Kognitywistyki

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 2 i 3 Zmienna losowa

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 3.

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Statystyka podstawowe wzory i definicje

Rachunek prawdopodobieństwa i statystyka

Elementy Rachunek prawdopodobieństwa

WYKŁAD 3. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Rozkłady statystyk z próby

Wartość oczekiwana Mediana i dominanta Wariancja Nierówności związane z momentami. Momenty zmiennych losowych Momenty wektorów losowych

Centralne twierdzenie graniczne

Matematyka dla biologów Zajęcia nr 13.

Zmienna losowa i jej rozkład Dystrybuanta zmiennej losowej Wartość oczekiwana zmiennej losowej

Statystyka matematyczna dla leśników

Matematyka dla biologów Zajęcia nr 11.

Prawdopodobieństwo i statystyka

Elementy rachunku prawdopodobieństwa (M. Skośkiewicz, A. Siejka, K. Walczak, A. Szpakowska)

Wykład 11: Martyngały: definicja, twierdzenia o zbieżności

Rozkłady prawdopodobieństwa

Statystyka w analizie i planowaniu eksperymentu

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Rozkłady zmiennych losowych

Wykład 12: Warunkowa wartość oczekiwana. Rozkłady warunkowe. Mieszanina rozkładów.

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

Rachunek prawdopodobieństwa Rozdział 4. Zmienne losowe

Wybrane rozkłady zmiennych losowych. Statystyka

III. ZMIENNE LOSOWE JEDNOWYMIAROWE

Prawdopodobieństwo i statystyka

PEWNE FAKTY Z RACHUNKU PRAWDOPODOBIEŃSTWA

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Moneta 1 Moneta 2 Kostka O, R O,R 1,2,3,4,5, Moneta 1 Moneta 2 Kostka O O ( )

Lista zadania nr 7 Metody probabilistyczne i statystyka studia I stopnia informatyka (rok 2) Wydziału Ekonomiczno-Informatycznego Filia UwB w Wilnie

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Statystyka Opisowa z Demografią oraz Biostatystyka. Zmienne losowe. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Metody Statystyczne. Metody Statystyczne.

Rozkłady łaczne wielu zmiennych losowych

Ćwiczenia z metodyki nauczania rachunku prawdopodobieństwa

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Wybrane rozkłady zmiennych losowych. Statystyka

= 10 9 = Ile jest wszystkich dwucyfrowych liczb naturalnych podzielnych przez 3? A. 12 B. 24 C. 29 D. 30. Sposób I = 30.

II WYKŁAD STATYSTYKA. 12/03/2014 B8 sala 0.10B Godz. 15:15

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

Ważne rozkłady i twierdzenia

STATYSTYKA I DOŚWIADCZALNICTWO

Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3

Prawdopodobieństwo i statystyka

zdarzenie losowe - zdarzenie którego przebiegu czy wyniku nie da się przewidzieć na pewno.

3. Podstawowe pojęcia statystyki matematycznej i rachunku prawdopodobieństwa wykład z Populacja i próba

Wykład 3 Momenty zmiennych losowych.

Wymagania egzaminacyjne z matematyki. Klasa 3C. MATeMATyka. Nowa Era. Klasa 3

Matematyka z el. statystyki, # 3 /Geodezja i kartografia II/

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Wykład 3 Momenty zmiennych losowych.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 2 Zmienne losowe i ich rozkłady

Statystyka matematyczna

Wykład 7: Warunkowa wartość oczekiwana. Rozkłady warunkowe.

Prawdopodobieństwo. Prawdopodobieństwo. Jacek Kłopotowski. Katedra Matematyki i Ekonomii Matematycznej SGH. 16 października 2018

Zadania zestaw 1: Zadania zestaw 2

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 2 ZADANIA - ZESTAW 2

Transkrypt:

Matematyka dla biologów Zajęcia nr 12. Rachunek prawdopodobieństwa Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 1 / 32

Zmienne losowe Przebieg różnych zjawisk losowych wygodnie jest opisywać za pomoca specjalnie wybranych funkcji, określonych na przestrzeni probabilistycznej, które zawieraja najważniejsze informacje o przebiegu danego zjawiska. Jako przykład może służyć funkcja, która po ustaleniu stawek, opisuje wartość wygranej przy grze polegajacej na rzutach moneta. Wartości tej funkcji niosa najważniejsza informacje dla gracza o rezultacie gry. Tego typu funkcje nazywa się zmiennymi losowymi. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 2 / 32

Definicja zmiennej losowej Definicja Zmienna losowa nazywamy funkcję przyjmujac a wartości w zbiorze liczb rzeczywistych określona na zbiorze zdarzeń elementarnych. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 3 / 32

Niech (Ω, P) będzie przestrzenia probabilistyczna. Jeśli zmienna losowa X : Ω przyjmuje wartości dyskretne tzn. jej zbiór wartości jest skończony x 1, x 2,... x n to wtedy rozkładem zmiennej losowej X nazywamy zbiór R X par, z których każda określa z jakim prawdopodobieństwem zmienna losowa przyjmuje dana wartość gdzie R X = {(x 1, p 1 ), (x 2, p 2 )... (x n, p n )} p i = P({ω : X(ω) = x i }) lub w skróconym zapisie p i = P(X = x i ). Zbiór R X ma tyle elementów ile różnych wartości przyjmuje zmienna X. Ze względu na to, że zbiór wartości zmiennej X jest skończony taki rozkład nazywa się rozkładem dyskretnym zmiennej losowej, a sama zmienna losowa nazywamy się wtedy zmienna losowa dyskretna. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 4 / 32

Trzeba podkreślić, że sam rozkład prawdopodobieństwa nie niesie pełnej informacji o zmiennej losowej jako o funkcji, określa jedynie z jakimi prawdopodobieństwami dana zmienna losowa przyjmuje swoje wartości. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 5 / 32

Przykład Wykorzystujac rzut kościa określimy grę losowa: jeśli wypadnie 6 gracz otrzymuje 90zł, a jeśli wypadnie nieparzysta liczba oczek otrzymuje 10 zł i nic nie traci ani nic nie otrzymuje w pozostałych przypadkach. Wtedy : Ω = {1, 2, 3, 4, 5, 6}, P({i}) = 1 6 ozn. = q i i = 1, 2..., 6. Zmienna losowa, która opisuje wartości wygranych, oznaczymy przez Y. Przyjmuje ona tylko trzy wartości: 0, 10, 90, a więc P(Y = 0) = q 2 + q 4 = 1 3, P(Y = 10) = q 1 + q 3 + q 5 = 1 2, P(Y = 90) = q 6 = 1 6 i jej rozkład jest następujacy {( 0, 1 ) (, 10, 1 ) (, 90, 1 )}. 3 2 6 Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 6 / 32

Duże znaczenie w rachunku prawdopodobieństwa maja charakterystyki liczbowe zmiennych losowych - wartość oczekiwana EX oraz wariancja, oznaczana jako VarX lub D 2 X. Można je wyrazić znajac jedynie ich rozkłady. Wartość oczekiwana zdefiniował w 1658 roku Huygens (Christiaan Huygens (1629-1695)) w pracy poświęconej teorii gry w kości. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 7 / 32

Wartość oczekiwana zmiennej losowej Definicja Wartościa oczekiwana dyskretnej zmiennej losowej X o rozkładzie R X nazywamy liczbę n EX = x i p i. Dla zmiennej Y z przykładu ; EY = 10 3 6 + 0 + 90 1 6 = 20. i=1 Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 8 / 32

Rozkład jednostajny Rozpatrzmy rozkład R J zmiennej losowej przyjmujacej n wartości z tym samym prawdopodobieństwem 1 n R J = {(x 1, 1 n ), (x 2, 1 n )... (x i, 1 n ), (x n, 1 n )}. Przykładem zmiennej losowej o takim rozkładzie jest zmienna losowa J określona na przestrzeni probabilistycznej Ω = {ω i : i = 1, 2,..., n} takiej, że zdarzenia sa jednakowo prawdopodobne tzn. P({ω i }) = 1 n dla każdego i. Wartościa oczekiwana zmiennej losowej określonej jako J(ω i ) = x i jest wartość średnia ze wszystkich wartości tej zmiennej EJ = n i=1 1 ni=1 x i n = x i. n Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 9 / 32

Prawdopodobieństwa jako wagi Z tego punktu widzenia w przypadku ogólnym ujętym w definicji można powiedzieć, że wartość oczekiwana jest średnia ważona, której wagi czyli prawdopodobieństwa p i określaja jak wielki jest wkład poszczególnych wartości x i do całkowitej średniej. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 10 / 32

Podstawowe własności wartości oczekiwanej 1 Jeśli G jest zmienna losowa będac a złożeniem zmiennej X : Ω i funkcji g : tzn. to G(ω i ) = g(x(ω i )), ω i Ω, EG = E(g(X)) = n g(x i )p i. 2 Nietrudno udowodnić wprost z definicji, że jeśli X i Y sa dwiema zmiennymi losowymi określonymi na tej samej przestrzeni probabilistycznej a a i b sa liczbami to i=1 E(aX + by) = aex + bey. 3 Jeśli X c jest zmienna losowa przyjmujac a tylko jedna wartość c to n EX c = c p i = c. i=1 Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 11 / 32

Wariancja Miara tego jak bardzo wartości zmiennej losowej X odbiegaja od wartości oczekiwanej jest wariancja oznaczana jako VarX lub D 2 X i dyspersja DX = D 2 X. Dyspersja określa innymi słowy średni rozrzut zmiennej losowej. Dyspersja bywa też nazywana odchyleniem standardowym. Definicja Oznaczajac przez m x wartość oczekiwana zmiennej X jej wariancja w przypadku dyskretnej zmiennej losowej nazywamy liczbę D 2 X = VarX := E((X m x ) 2 ) = n (x i m x ) 2 p i i=1 Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 12 / 32

Wariancja Dariusz Wrzosek zmiennej losowej z przykładu Zajęcia nr 12. 17.1 wynosi 9 stycznia 2019 13 / 32 Skoro definiowana wielkość ma być miara średniego rozrzutu wartości zmiennej losowej, to uzasadnione jest pytanie dlaczego nie określić jej jako wartości oczekiwanej odległości pomiędzy wartościa zmiennej od średniej tzn. n E X m x = x i m x p i. i=1 To nie jest zły pomysł, ale niepraktyczny z rachunkowego punktu wiedzenia, gdyż moduł nie ma tak dobrych własności arytmetycznych. Oto przykład obliczenia wariancji wprost z definicji VarX := E((X m x ) 2 ) = E(X 2 ) 2(m x )EX +(m x ) 2 = E(X 2 ) (m x ) 2. (1) Aby obliczyć wariancję wystarczy zatem obliczyć EX i E(X 2 ). Łatwo sprawdzić, inna ważna własność: jeśli X jest zmienna losowa, a a i b pewnymi liczbami to Var(aX + b) = a 2 VarX. (2)

Niezależność zmiennych losowych Skoro zmienne losowe opisuja rezultaty różnych zjawisk losowych to naturalne jest pytanie o wzajemne zwiazki pomiędzy różnymi zmiennymi losowymi (określonymi na tej samej przestrzeni zdarzeń elementarnych). Tego typu zwiazki moga wyrażać istnienie zwiazków przyczynowo-skutkowych pomiędzy tymi zjawiskami. Równie ważne bywa określenie braku tego typu zwiazku. Dobrym przykładem jest pobieranie próbek z jakiejś populacji. Posłużymy się przykładem zaczerpniętym z ksiażki Łomnickiego Statystyka dla Biologów. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 14 / 32

Płeć osobnika wybranego z jakiejś populacji możemy uznać za realizację zmiennej losowej dwuwartościowej. Niezależność prób oznacza tu, że odłowienie osobnika jednej płci nie ma wpływu na następny odłów. W przypadku ptaków, które występuja w czasie rozrodu parami (jest tak u synogarlic tureckich) warunek ten może nie być spełniony bo odławiajac samicę zwiększamy prawdopodobieństwo schwytania w następnym odłowie jej partnera. Jeśli zaś ptaki trzymaja się w grupach jednopłciowych, odłowienie samicy zwiększa prawdopodobieństwo schwytania w drugim odłowie następnej samicy, kolejne próby nie sa zatem niezależne. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 15 / 32

Niezależnośc zmiennych losowych Definicja Dwie zmienne losowe X : Ω i Y : Ω o rozkładach dyskretnych R X = {(x 1, p 1 ),... (x i, p i ),... (x n, p n )} (3) oraz R Y = {(y 1, q 1 ),... (y j, q i )..., (y m, q m )} (4) sa niezależne jeśli dla dowolnych wartości x i oraz y j które przyjmuja, zachodzi P(X = x i, Y = y j ) = p i q j gdzie P(X = x i, Y = y i ) oznacza prawdopodobieństwo zdarzenia, że X przyjęła wartość x i i zmienna losowa Y przyjęła wartość y j. Podobnie definiuje się niezależność dowolnej liczby zmiennych losowych większej od dwóch. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 16 / 32

Niezależne zmienne losowe maja kilka bardzo ważnych własności. Stwierdzenie Jeżeli zmienne losowe X i Y o rozkładach (3)-(4)sa niezależne to E XY = EX EY Dowód. Ustalmy iloczyn x i y j. Zauważmy, że wśród wartości zmiennych X i Y może być więcej par liczb, które po wymnożeniu daja x i y j np. x i = 5, y j = 10 oraz x k = 2 i y l = 25. Aby znaleźć rozkład zmiennej XY, dla każdego takiego iloczynu x i y j trzeba zatem posumować wszystkie prawdopodobieństwa zdarzeń postaci P(X = x k, Y = y l ) o tej własności, że x i y j = x k y l. Ponieważ zmienne losowe sa niezależne to P(X = x k, Y = y l ) = p k q l Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 17 / 32

Stad i z definicji wartości oczekiwanej można wydedukować, że E XY = x i y j p i q j, (5) gdzie suma brana jest po wszystkich i i j takich, że 1 i n, 1 j m. Z drugiej strony łatwo sprawdzić, że (EX)(EY) = ( n m x i p i )( y j q j ) równe jest właśnie (5). Pamiętamy, że wartość oczekiwana sumy zmiennych losowych jest suma ich wartości oczekiwanych. Odpowiemy teraz na pytanie postawione wcześniej. i=1 j=1 Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 18 / 32

Bardzo często w rachunku prawdopodobieństwa i statystyce rozważa się sumy S n = X 1 + X 2 +... X n, które reprezentować moga na przykład kolejne wyniki pomiarów jakieś wielkości i chcemy policzyć np. średnia tych wyników. Powstaje naturalne pytanie, jaki rozkład ma suma zmiennych losowych jeśli znamy rozkłady każdej ze zmiennych składowych? Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 19 / 32

Wariancja sumy Czy wariancja sumy zmiennych losowych jest suma wariancji? Okazuje się, że w ogólności tak być nie musi, ale jest to prawda jeśli zmienne losowe sa niezależne. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 20 / 32

Kowariancja zmiennych losowych Oznaczmy: EX = m x, EY = m y. Definicja Kowariancja zmiennych losowych X i Y nazywa się liczbę Cov(X, Y) = E((X m x )(Y m y )) Łatwo sprawdzić, że Cov(X, Y) = E(XY) m x m y Stad wynika ważny wniosek. Jeśli zmienne losowe X i Y sa niezależne to Cov(X, Y) = 0. Stwierdzenie Przyjmijmy założenia takie jak w poprzednim twierdzeniu i oznaczenia jak wyżej. Wtedy Var(X + Y) = VarX + VarY + 2Cov(X, Y). Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 21 / 32

Korelacje Współczynnikiem korelacji zmiennych losowych X i Y nazywamy liczbę z przedziału [ 1, 1] równa ϱ(x, Y) = Cov(X, Y) VarX VarY. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 22 / 32

Jeśli ϱ(x, Y) = 0 to zmienne losowe nazywa się nieskorelowanymi. Stad wynika, że jeśli dwie zmienne losowe sa niezależne to sa nieskorelowane. Jeśli ϱ(x, Y) = 1( 1) to zmienne nazywa się dodatnio (ujemnie) skorelowanymi. Łatwo sprawdzić, korzystajac z (1) i (2), że jeśli Y = ax, gdzie a to pewna liczba, to ϱ(x, Y) = { 1 gdy a > 0. 1 gdy a < 0, Zmienne X i ax sa zatem dodatnio lub ujemnie skorelowane w zależności od znaku a. Stwierdzenie, że dwa zjawiska (losowe) np. cechy osobnicze w badanej populacji sa dodatnio skorelowane oznacza w praktyce, że zjawiska te współwystępuja i może, ale nie musi występować pomiędzy nimi zwiazek przyczynowo skutkowy. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 23 / 32

Ciag prób Bernoulliego Szczególna rolę w rachunku prawdopodobieństwa i statystyce pełni opis rezultatów serii powtórzeń jakiegoś doświadczenia w przypadku gdy kolejne doświadczenia sa wzajemnie niezależne. Typowym przykładem jest seria rzutów moneta lub kościa do gry jeśli zapewni się przy każdym rzucie idealnie takie same warunki dotyczace stanu przedmiotu którym rzucamy. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 24 / 32

Rozważmy ciag n niezależnych doświadczeń taki, że w wyniku każdego doświadczenia może zajść zdarzenie A Ω lub przeciwne do niego zdarzenie Ā. Często jedno ze zdarzeń A lub Ā nazywa się umownie sukcesem. Przyjmijmy, że zdarzenie A (sukces) zachodzi z prawdopodobieństwem p a zdarzenie Ā z prawdopodobieństwem q, p + q = 1. Niech X i : Ω n {1, 0} będzie zmienna losowa równa 1 gdy w i-tym doświadczeniu zaszło zdarzenie A i równa 0 w przeciwnym przypadku. Definicja Ciag niezależnych zmiennych losowych X 1, X 2,... X n z których każda ma ten sam rozkład {(1, p), (0, q)} nazywa się ciagiem prób Bernoulliego. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 25 / 32

Ciag prób Bernoulliego dla p = q = 1 2 jest oczywiście modelem probabilistycznym opisujacym wyniki serii rzutów moneta symetryczna. Ponieważ zmienne losowe w ciagu prób Bernoulliego sa niezależne, prawdopodobieństwo wystapienia serii określonych wyników jest iloczynem prawdopodobieństw otrzymania każdego wyniku w poszczególnych próbach. Na przykład w przypadku czterech prób P(X 1 = 0, X 2 = 1, X 3 = 1, X 4 = 1) = P(X 1 = 0)P(X 2 = 1)P(X 3 = 1)P(X 4 = Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 26 / 32

Rozkład dwumianowy Rozkład ten ma kluczowe znaczenie w zastosowaniach rachunku prawdopodobieństwa gdyż opisuje liczbę sukcesów w ciagu prób Bernoulliego. Szukamy zatem rozkładu zmiennej losowej n S n = X i, i=1 która przyjmuje wartość k jeśli dokładnie k razy w ciagu prób Bernoulliego zaszło zdarzenie A. Aby znaleźć rozkład tej zmiennej obliczamy prawdopodobieństwo zdarzenia, że dokładnie k składników w powyższej sumie przyjmuje wartość 1 a pozostałe wartość 0. Prawdopodobieństwo zdarzenia, że wybrane k zmiennych przyjęło wartość 1 a pozostałe wartość 0 wynosi p k (1 p) n k. Zwróćmy uwagę, że k składników w n-składnikowej sumie można wybrać na tyle sposobów ile jest kombinacji k-elementowych ze zbioru n-elementowego, czyli ( n k ) = n! (n k)!k! Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 27 / 32

Sumujac prawdopodobieństwa rozłacznych zdarzeń odpowiadajacym seriom zawierajacym dokładnie k sukcesów osiagniętych w różnych próbach otrzymujemy P(S n = k) ozn. = b n,p (k) = ( n k ) p k (1 p) n k. Taki rozkład zmiennej losowej nazywamy rozkładem dwumianowym (ang. binomial distribution) o parametrach n i p. Łatwo sprawdzić stosujac Wniosek(1.8), że ES n = np VarS n = np(1 p). Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 28 / 32

Przykład Typowe zastosowanie rozkładu dwumianowego znajdujemy w klasycznej (mendlowskiej) genetyce populacyjnej. Rozpatrzmy mianowicie duża populację organizmów diploidalnych i zajmijmy się jednym locus, któremu odpowiadaja dwie alle A i a. Przyjmijmy, że allel A występuje w populacji z częstościa p a allel a z częstościa q, p + q = 1, oraz, że nie występuja mutacje. Wiemy, że zamiast częstości możemy tu mówić o prawdopodobieństwie występowania danego allelu. Przyjmujac całkowicie losowe kojarzenie w pary i brak sprzężeń pomiędzy genami możemy przyjać, że allel, który trafia na odpowiednie miejsce na jednym z chromosomów homologicznych jest losowany z puli genów, niezależnie dla każdego z dwóch homologicznych chromosomów. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 29 / 32

To tak jakbyśmy dla obsadzenia obu miejsc na chromosomach homologicznych dwukrotnie rzucali moneta. W przypadku allelu A prawdopodobieństwo jego wylosowania wynosi p a dla allelu a odpowiednio q. Jeśli wylosowanie A nazwiemy sukcesem to prawdopodobieństwo występowania w kolejnej generacji genotypu AA odpowiada prawdopodobieństwu wystapienia dwóch sukcesów w dwóch próbach Bernoulliego czyli ( ) 2 2 p 2 q 0 = p 2 ozn. = u, Aa odpowiada prawdopodobieństwu wystapienia jednego sukcesu w dwóch próbach Bernoulliego czyli ( ) 2 1 p 1 q 1 = 2pq ozn. = v, aa odpowiada prawdopodobieństwu nie wystapienia ani jednego sukcesu w dwóch próbach Bernoulliego czyli ( ) 2 0 p 0 q 2 = q 2 ozn. = w. Jest to rozkład dwumianowy. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 30 / 32

Rozkład dwumianowy 0,3250 0,3000 0,2750 0,2500 0,2250 0,2000 0,1750 0,1500 0,1250 0,1000 0,0750 0,0500 0,0250 Rozkład dwumianowy 0,0000 0 1 2 3 4 5 6 7 8 9 10 0,2 0,4 0,5 0,8 Rozkład dwumianowy: n = 10, p = 0, 2, 0, 4, 0, 5, 0, 8.. Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 31 / 32

Zadania 1. W pewnym lesie występuje N zwierzat danego gatunku, w tym M zaobraczkowanych. Znaleźć wzór, który określa prawdopodobieństwo, że wśród n losowo schwytanych zwierzat k jest niezaobraczkowanych. (wskaz. Zastosować schemat Bernoulliego.) 2. Wykonujemy niezależne rzuty moneta symetryczna. W czterech kolejnych rzutach otrzymaliśmy orły. Czy prawdopodobieństwo wyrzucenia reszki w piatym rzucie jest większe od 1 2? 3. Pewna gra polega na rzucie kostka i moneta. Wygrana występuje przy łacznym wyrzuceniu piatki i orła. Jakie jest prawdopodobieństwo, że w trzech grach wygrana wystapi dokładnie raz? wskaz. Zastosować schemat Bernoulliego do ciagu doświadczeń, w którym sukcesem jest jednoczesne wyrzucenie orła i piatki. Rzuty kościa i moneta traktujemy jako zdarzenia niezależne. Odp Dariusz Wrzosek Zajęcia nr 12. 9 stycznia 2019 32 / 32