1 STYSTYSTYKA dla ZOM II dr inż Krzysztof Bryś Wykad 1 Klasyczny Rachunek Prawdopodobieństwa. 1. Pojȩcia wstȩpne. Doświadczeniem losowym nazywamy doświadczenie, którego wynik nie jest znany. Posiadamy jedynie informacje o zbiorze możliwych wyników tego doświadczenia. Wynik doświadczenia losowego wykluczaj acy inne możliwe wyniki nazywamy zdarzeniem elementarnym. UWAGA: Zak lada siȩ, że w wyniku doświadczenia losowego zachodzi dok ladnie jedno zdarzenie elementarne. Zbiór wszystkich zdarzeń losowych nazywamy przestrzeni a zdarzeń elementarnych i oznaczamy przez Ω. Zdarzeniem losowym nazywamy dowolny wynik doświadczenia losowego. Każde zdarzenie losowe jest zbiorem zdarzeń elementarnych UWAGA: Jeżeli Ω jest zbiorem skończonym lub przeliczalnym, to zdarzeniem losowym jest dowolny podzbiór zbioru Ω Zdarzenie nazywamy zdarzeniem niemożliwym. Zdarzenie Ω nazywamy zdarzeniem pewnym. Zdarzenie A = Ω \ A nazywamy zdarzeniem przeciwnym do A. Jeżeli dla dwóch zdarzeń A i B zachodzi A B =, to mówimy, że zdarzenia te wykluczaj a siȩ (s a roz l aczne). Przyk lady. Zdarzenie A = miesi ac kwiecień ma 31 dni jest zdarzeniem niemożliwym. Zdarzenie B = miesi ac kwiecień ma 30 dni jest zdarzeniem pewnym. Zdarzeniem przeciwnym do C = dzisiaj jest niedziela jest zdarzenie C = dzisiaj jest inny dzień tygodnia niż niedziela. Przyk lad. Rozważmy doświadczenie losowe polegaj ace na jednokrotnym rzucie monet a. Przestrzeń zdarzeń elementarnych sk lada sie z dwóch elementów, zdarzenia ω O polegajacego na wypadniȩciu or la i ω O, które oznacza wypadniȩcie reszki. Wypiszmy wszystkie możliwe podzbiory zbioru Ω (zdarzenia losowe): A 1 = Ω = {ω O, ω R }, A 2 = {ω O }, A 3 = {ω R }, A 4 =. Zdarzenie A 1 polega na wypadniȩciu or la lub reszki. Jest to zdarzenie pewne. Zdarzenie A 4 polegaj ace na niewypadniȩciu ani or la ani reszki nie może zajść w wyniku naszego doświadczenia losowego. Jest to zdarzenie niemożliwe. Zdarzeniem przeciwnym do A 2 - wypad l orze l jest zdarzenie A 3 - wypad la reszka. Zwróćmy uwagȩ na to, że A 2 A 3 = Ω (w wyniku rzutu monet a wypadnie orze l lub reszka) oraz A 2 A 3 = (nie może wypaść jednocześnie orze l i reszka). 2. Klasyczna definicja prawdopodobieństwa. Niech Ω bȩdzie zbiorem skończonym, to znaczy Ω = {ω 1, ω 2..., ω N }. Dla dowolnego zdarzenia A Ω takiego, że A = {ω i1, ω i2,..., ω ik }, gdzie i 1, i 2,..., i k {1, 2,... N}, definiuje siȩ funkcjȩ prawdopodobieństwa w nastȩpuj acy sposób: P (A) = P ({ω i1 }) + P ({ω i2 }) +... + P ({ω ik }). W przypadku, gdy zdarzenia elementarne s a jednakowo prawdopodobne, to znaczy P (ω 1 ) = P (ω 2 ) =... = P (ω N ) = 1, otrzymujemy nastȩpuj acy wzór: N P (A) = A Ω = k N liczba zdarzeń elementarnych sprzyjaj acych zdarzeniu A =. liczba wszystkich zdarzeń elementarnych Powyższa definicja prawdopodobieństwa nie jest poprawna w ogólności, gdyż zbiór Ω nie musi być skończony a zdarzenia elementarne nie musz a byċ jednakowo prawdopodobne.
2 3. Aksjomatyczna definicja prawdopodobieństwa. Niech Ω bȩdzie przestrzeni a zdarzeń elementarnych, Z zbiorem zdarzeń losowych. Funkcj a prawdopodobieństwa nazywamy funkcjȩ P : Z [0, 1] spe lniaj ac a nastȩpuj ace trzy aksjomaty: P 1) P (A) 0 dla każdego A Z, P 2) P (Ω) = 1 P 3) jeżeli A 1, A 2,..., A n... jest ci agiem zdarzeń roz l acznych (to znaczy A i A j = dla i j), to P (A 1 A 2... A n...) = P (A 1 ) + P (A 2 ) +... + P (A n ) +... Wartość funkcji P na zbiorze A nazywamy prawdopodobieństwem zdarzenia A 4. W lasności funkcji prawdopodobieństwa. 1. P ( ) = 0. 2. Jeśli A B, to P (A) P (B). 3. Dla dowolnego A Ω P (A) 1. 4. Jeśli A B, to P (B \ A) = P (B) P (A). 5. Dla dowolnego A Ω P (A) + P (A) = 1. 6. P (A B) = P (A) + P (B) P (A B). 7. Jeżeli zdarzenia A 1, A 2,..., A n s a parami roz l aczne, to P (A 1 A 2... A n ) = P (A 1 ) + P (A 2 ) +... + P (A n ). 5. Prawdopodobieństwo warunkowe i niezależnośċ. Prawdopodobieństwo zajścia zdarzenia A pod warunkiem, że zasz lo zdarzenie B: P (A B) = P (A B) P (B) albo Doświadczenia niezależne = dowolny wynik jednego z nich nie wpywa na wynik drugiego. Zdarzenia niezależne = zdarzenia A, B, dla których: P (A B) = P (A) P (B) P (A B) = P (A) lub P (B A) = P (B) Informacja o zajściu jednego z nich nie zmienia szans wyst apienia drugiego. 5. Zupe lny uk lad zdarzeń. Wzór Bayesa Zdarzenia A 1,..., A n tworz a zupe lny uk lad zdarzeń jeśli: 1. A 1... A n = Ω, 2. A i A j = dla każdego i j, i, j = 1, 2,..., n
3 Twierdzenie o prawdopodobieństwie zupe lnym Jeśli zdarzenia A 1,..., A n tworz a zupe lny uk lad zdarzeń, to dla każdego zdarzenia B : P (B) = P (A 1 B) +... + P (A n B) = P (A 1 ) P (B A 1 ) +... + P (A n ) P (B A n ) Wzór Bayesa Jeśli zdarzenia A 1,..., A n tworz a zupe lny uk lad zdarzeń, to dla każdego zdarzenia B takiego, że P (B) > 0 oraz dowolnego j = 1, 2,..., n zachodzi wzór : = P (A j B) = P (A j B) P (A 1 B) +... + P (A j B) +... + P (A n B) = P (A j ) P (B A j ) P (A 1 ) P (B A 1 ) +... P (A j ) P (B A j ) +... + P (A n ) P (B A n ) Zmienna losowa jednowymiarowa Intuicyjnie: zmienna, która przyjmuje pewn a wartość liczbow a w wyniku doświadczenia losowego. Formalnie: Funkcja X : Ω R przyporz adkowuj aca każdemu zdarzeniu losowemu pewn a wartość liczbow a Dystrybuanta zmiennej losowej X - funkcja F X : R R zdefiniowana nastȩpuj aco: F (x) = P (X < x) dla każdego x R Zmienna losowa typu skokowego Zmienna X, dla której zbiór wartości przyjmowanych przez t a zmienn a jest skończony lub przeliczalny, tzn W X = {x 1, x 2,..., x n } albo W X = {x 1, x 2,..., x n, ldots} Rozk lad prawdopodobieństwa: funkcja P, która każdemu punktowi skokowemu x i W X przyporz adkowuje skok prawdopodobieństwa p i = P (X = x i ) w taki sposób, że: 1) dla każdego i : p i > 0 oraz. 2) i p i = 1 Zmienna losowa typu ci ag lego Zmienna X, dla której zbiór wartości przyjmowanych przez t a zmienn a jest przedzia lem liczbowym lub sum a przedzia lów. Rozk lad prawdopodobieństwa: funkcja f zwana gȩstości a prawdopodobieństwa taka, że. 1) dla każdego x R : f(x) 0 oraz 2) + f(x)dx = 1 Podstawowe parametry zmiennej losowej 1. Wartość oczekiwana zmiennej losowej X = liczba E(X) bȩd aca średnia ważon a rozk ladu prawdopodobieństwa przy za lożeniu, że wag a jest prawdopodobieństwo (dla zmiennej losowej typu skokowego) albo środkiem ciȩżkości rozk ladu prawdopodobieństwa przy za lożeniu, że gȩstości a jest funkcja gȩstości prawdopodobieństwa (dla zmiennej losowej typu ci ag lego).
2. Wariancja zmiennej losowej X= D 2 (X) = wartość oczekiwana kwadratu odchylenia zmiennej od jej wartości oczekiwanej - miara średniego odchylenia kwadratowego. 3. Odchylenie standardowe zmiennej losowej X = D(X)= pierwiastek z wariancji - miara średniego odchylenia zmiennej od jej wartości oczekiwanej. 4. Kwantyl rzȩdu p = x p = punkt, w którym skumulowane prawdopodobieństwo (dystrybuanta) osi aga (przekracza) wartość p. mediana=me=kwantyl rzȩdu 1 2 kwartyl dolny=q 1 =kwantyl rzȩdu 1 4 kwartyl dolny=q 3 =kwantyl rzedu 3 4 i-ty decyl= przedzia l miȩdzy kwantylem rzȩdu (i 1) 0.1 a kwantylem rzȩdu i 0.1 i-ty percentyl= przedzia l miȩdzy kwantylem rzȩdu (i 1) 0.01 a kwantylem rzȩdu i 0.01 5. Moda (dominanta; wartośċ modalna) = punkt, w którym funkcja prawdopodobieństwa osi aga najwiȩksz a wartośċ. Podstawowe teoretyczne rozk lady prawdopodobieństwa zmiennej losowej jednowymiarowej Typu skokowego 1. Rozk lad jednopunktowy. Funkcja prawdopodobieństwa : P (X = c) = 1 dla pewnej sta lej c Wartośċ oczekiwana: E(X) = c Wariancja: D 2 (X) = 0 Interpretacja: Rozk lad dowolnej sta lej liczbowej X. 2. Rozk lad dwupunktowy (zerojedynkowy). Funkcja prawdopodobieństwa : P (X = 1) = p, P (X = 0) = q = 1 p Wartośċ oczekiwana: E(X) = p Wariancja: D 2 (X) = p q = p (1 p) Interpretacja: Rozk lad dowolnej zmiennej X, która odpowiada na pewne pytanie albo TAK (X = 1- sukces ) albo NIE (X = 0- porażka ), rozk lad dowolnej cechy zero-jedynkowej (obiekt albo j a posiada (X = 1) albo nie posiada (X = 0). 3. Rozk lad Bernoulliego (dwumianowy) - B(n, p) Schemat doświadczeń Bernoulliego: - n niezależnych doświadczeń, - w każdym doświadczeniu albo sukces z prawdopodobieństwem p albo porażka (z prawdopodobieństwem q = 1 p); Interpretacja: Zmienna losowa X ma rozk lad B(n, p) jeśli mówi o liczbie sukcesów w schemacie n niezależnych doświadczeń Bernoulliego z prawdopodobieństwem sukcesu p w każdym z nich. Jest sum a n niezależnych zmiennych losowych o rozk ladzie zerojedynkowym. ) pk q n k dla k = 0, 1, 2,..., n, q = 1 p. Funkcja prawdopodobieństwa : P (X = k) = ( n k Wartośċ oczekiwana: E(X) = np Wariancja: D 2 (X) = n p q 4. Rozk lad Poissona - Po(λ) Funkcja prawdopodobieństwa : P (X = k) = e λ λk k! dla k = 0, 1, 2,... Wartośċ oczekiwana: E(X) = λ Wariancja: D 2 (X) = λ Interpretacja: Rozk lad graniczny dla rozk laadu B(n, p) przy n +. Dla dostatecznie dużych n, zmienna losowa o rozk ladzie B(n, p) ma w przybliżeniu rozk lad Poissona z 4
5 parametrem λ = n p. Typu ci ag lego 1. Rozk lad jednostajny na przedziale (a; b) - U(a, b) Funkcja gȩstości prawdopodobieństwa : f(x) = { 1 b a, dla a < x < b 0, dla pozosta lych x Wartośċ oczekiwana: E(X) = a+b 2 Wariancja: D 2 (X) = (b a)2 12 Interpretacja Zmienna losowa X ma rozk lad U(a, b) jeśli przyjȩcie przez t a zmienn a dowolnej wartości z przedzia lu (a; b) jest jednakowo prawdopodobne. 2. Rozk lad normalny (Gaussa) - N(m, σ) Funkcja gȩstości prawdopodobieństwa : f(x) = 1 2πσ e (x m)2 2σ 2 dla x R Wartośċ oczekiwana: E(X) = m Wariancja: D 2 (X) = σ 2 Wykresem powyższej funkcji gȩstości prawdopodobieństwa jest krzywa Gaussa Zmienna losowa standaryzowa dla zmiennej losowej o rozk ladzie N(m, σ): ma rozk lad normalny standardowy N(0, 1). X = X m σ Dystrybuanta rozk ladu normalnego standardowego N(0, 1): Φ(x) = x 1 2π e t2 2 dt dla x R Z parzystości funkcji gȩstości prawdopodobieństwa rozk ladu N(0, 1) wynika, że: Φ( x) = 1 Φ(x). u α - kwantyl rzȩdu α zmiennej losowej o rozk ladzie N(0, 1) (tzn. Φ(u α ) = α) 3. Rozk lad chi kwadrat o n stopniach swobody Zmienna losowa χ 2 = X 2 1 +X 2 2 +...+X 2 n, gdzie X 1, X 2,... X n zmienne o rozk ladzie N(0, 1) ma rozk lad chi-kwadrat o n stopniach swobody Wartośċ oczekiwana: E(χ 2 ) = n Wariancja: D 2 (χ 2 ) = 2n Dla dużych n (n > 40) rozk lad chi-kwadrat o n stopniach swobody można przybliżaċ rozk ladem N(n, 2n). χ 2 (α, n) = kwantyl rzȩdu 1 α zmiennej o rozk ladzie chi-kwadrat o n stopniach swobody 4. Rozk lad t-studenta o n stopniach swobody. Zmienna losowa T = X χ 2 n, gdzie X zmienna losowa o rozk ladzie N(0, 1) a zmienna χ 2 ma rozk lad chi-kwadrat o n stopniach swobody.
6 Wartośċ oczekiwana: E(T ) = 0. Wariancja: D 2 (T ) = n. n 2 Dla dużych n (n > 40) rozk lad t-studenta o n stopniach swobody można przybliżaċ rozk ladem N(0, 1). t(α, n) = kwantyl rzȩdu 1 α zmiennej o rozk ladzie t-studenta o n stopniach swobody. 2