Statystyka matematyczna Wykład 5 Magdalena Alama-Bućko 1 kwietnia 2019 Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 1 / 19
Rozkład Poissona Po(λ), λ > 0 - parametr tzw. rozkład zdarzeń rzadkich: stosowany, gdy w schemacie Bernoullego n jest bardzo duże, a p - bardzo małe (wtedy λ = n p) Zmienna losowa X ma rozkład Poissona, jeśli przyjmuje wartości k = 0, 1, 2, 3, 4,... z prawdopodobieństwami P(X = k) = e λ λk k!, gdzie λ - parametr, e 2.7182... np. liczba szkód w ubezpieczeniach np. liczba skradzionych samochodów w danym roku kalendarzowym np. liczba zachorowań na żadka chorobę np. liczba awarii pralek automatycznych wyprodukowanych w ciagu określonego czasu Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 2 / 19
Twierdzenie Jeżeli p 0.1 oraz n p(1 p) < 9, to przy dużych n rozkład liczby sukcesów w schemacie n prób Bernoulliego z prawdopodobieństwem sukcesu p może być przybliżany rozkładem Poisssona z parametrem λ = np. Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 3 / 19
Przykład: W pewnym procesie produkcji śrub prawdopodobieństwo wyprodukowania śruby wadliwej wynosi p = 0, 001. Kontroler sprawdza kolejno jakość 500 wyprodukowanych śrub. Oblicz prawdopodobieństwo, że kontroler znajdzie co najwyżej jedna wadliwa. Mamy tu schemat n = 500 prób Bernoulliego: sukces to znalezienie śruby wadliwej, prawdopodobieństwo sukcesu: p = 0, 001. P(S 500 1) = P(S 500 = 0) + P(S 500 = 1) ( ) ( ) 500 500 = 0, 001 0 0, 999 500 + 0, 001 1 0, 999 499 0 1 Trudno to policzyć! Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 4 / 19
Rozkład S 500 możemy przybliżać rozkładem Poissona z parametrem λ = np = 500 0, 001 = 0, 5, gdyż p = 0.001 0.1, np(1 p) = 500 0.001 0.999 = 0.4445 < 9. Zatem P(S 500 1) = P(S 500 = 0) + P(S 500 = 1) gdzie X Po(0.5) P(X = 0) + P(X = 1), P(X = 0) = e λ λ0 0! = e λ = e 0.5 = 0.606 P(X = 1) = e λ λ1 1! = λe λ = 0.5 e 0.5 = 0.5 0.60653 = 0.303 P(S 500 1) P(X 1) 0, 91. Wartość takiego p-stwa można również odczytać ze specjalnych tablic! Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 5 / 19
Parametry rozkładu zmiennej losowej Wartość oczekiwana zmiennej losowej skokowej X o wartościach {x 1, x 2,..., x k } z p-ami {p 1, p 2,..., p k } to (o ile istnieje) liczba EX = i x i p i = x 1 p 1 + x 2 p 2 +... + x k p k. Wariancja zmiennej losowej skokowej X o wartościach {x 1, x 2,..., x k } z p-ami {p 1, p 2,..., p k } nazywamy (o ile istnieje) liczbę VaxX = E(X m) 2 = (x i m) 2 p i i gdzie m = EX. Odchyleniem standardowym nazywamy VaxX. (o tyle średnio wartości zmiennej losowej różnia się od średniej). Równoważny wzór: VarX = EX 2 (EX) 2. Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 6 / 19
Jak liczyć VarX w praktyce? 1 sposób VaxX = E(X m) 2, gdzie m = EX. E(X m) 2 = (x 1 m) 2 p 1 + (x 2 m) 2 p 2 +... + (x k m) 2 p k 2 sposób VarX = EX 2 (EX) 2, gdzie EX 2 = x 2 1 p 1 + x 2 2 p 2 +... + x 2 k p k EX = x 1 p 1 + x 2 p 2 +... + x k p k Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 7 / 19
Przykład 1 Rzucamy 2- krotnie moneta. Niech X oznacza liczbę wyrzuconych orłów. Obliczyć EX i VarX. EX: X 0 1 2 p x 0.25 0.5 0.25 EX = 0 0.25 + 1 0.5 + 2 0.25 = 1. Wartość oczekiwana wyrzuconych orłów wynosi 1. Średnio wyrzucamy 1 orła. VarX = EX 2 (EX) 2 : EX 2 = 0 2 0.25 + 1 2 0.5 + 2 2 0.25 = 1.5. VarX = EX 2 (EX) 2 = 1.5 1 2 = 0.5 VarX = 0.5 = 0.707 zatem o tyle średnio liczba wyrzuconych orłów odbiega od średniej (czyli 1 orła) Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 8 / 19
Parametry znanych rozkładów dyskretnych 1) Rozkład dwupunktowy : P(X = 1) = p, P(X = 0) = 1 p, EX = p, VarX = p(1 p) 2) Rozkład Bernoullego (dwumianowy) B(n, p) EX = np, VarX = np(1 p) 3) Rozkład geometryczny G(p) 4) Rozkład Poissona P(λ) EX = 1 p, VarX = 1 p p 2 EX = λ, VarX = λ 2 Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 9 / 19
Przykład 2 Zmienna losowa X przyjmuje wartość równa liczbie sukcesów uzyskanych w czterech n = 4 próbach Bernoulliego z prawdopodobieństwem sukcesu p = 1 3. Oczywiście X {0, 1, 2, 3, 4}. X 0 1 2 3 4 p x 16 Obliczyć EX i VarX. Liczac bezpośrednio mamy 32 24 EX =0 16 + 1 32 + 2 24 + 3 8 + 4 1 EX 2 =0 16 32 24 +1 +4 +9 8 +16 1 zatem 8 1 = 0+32+48+24+4 = 0+32+96+72+16 VarX = EX 2 (EX) 2 = 8 3 (4 3 )2 = 24 9 16 9 = 8 9. = 108 = 4 3 = 216 = 8 3 Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 10 / 19
Ale możemy również skorzystać ze znanych wzorów. Ponieważ X ma rozkład Bernoullego z parametrami p = 1 3 i n = 4 (X B(n, p)), to EX = np = 4 1 3 = 4 3, VarX = np(1 p) = 4 3 2 3 = 8 9. Podsumowujac: EX = 4 3 = 1.33, VarX = 8 9, VarX = 2 2 3 = 0.94. Średnio uzyskujemy 1, 33 sukcesu. Liczba sukcesów odchyla się od średniej 1.33 o 0.94. Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 11 / 19
Przykład 3 Rzucamy kostka do gry. Wyrzucenie 6 oczek określamy sukcesem. Niech X oznacza liczbę prób do uzyskania pierwszego sukcesu. Oczywiście X {1, 2, 3,...}. X 1 2 3 4... p x 1 6 5 36 25 216 125 1296... Ponieważ X ma rozkład geometryczny (X G(p)) z parametrem p = 1 6, to EX = 1 p = 6, VarX = 1 p p 2 = 5 6 : 1 36 = 5 36 = 30. 6 Zatem średnio w 6 próbie uzyskamy sukces (tzn. wyrzucimy 6), natomiast średnio liczba prób do uzyskania pierwszego sukcesu różni się od średniej o 30 = 5, 48. Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 12 / 19
Dystrybuanta Rozkład zmiennej losowej wyznacza się jednoznacznie za pomoca dystrybuanty. Definicja Dystrybuanta zmiennej losowej X nazywamy funkcję F określona dla x R wzorem: F(x) = P(X x). Uwaga Można się spotkać również z tym, że dystrybuanta zdefiniowana jest następujaco: F(x) = P(X < x). Dystrybuanta w danym punkcie x określa zatem p-stwo, że zmienna losowa przyjmuje wartości co najwyżej równe x. Dystrybuanta rozkładu dyskretnego jest funkcja schodkowa o k + 1 schodkach ( jeśli zmienna losowa ma k wartości, czyli {x 1, x 2,..., x k }). Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 13 / 19
Własności dystrybuanty: ( zdefiniowanej F(x) = P(X x)) F jest funkcja niemalejac a. F jest funkcja prawostronnie ciagł a. lim F(x) = 0, lim x F(x) = 1. x 0 dla x < x 1, p 1 dla x 1 x < x 2 p 1 + p 2 dla x 2 x < x 3 F(x) =... p 1 + p 2 +... + p k 1 dla x k 1 x < x k 1 dla x x k p-stwo, że zmienna losowa przyjmuje wartości co najwyżej x (skumulowane p-stwa punktów znajdujacych się na lewo od x łacznie z x) Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 14 / 19
Przykład 1 Rzucamy 2- krotnie moneta. Niech X oznacza liczbę wyrzuconych orłów. Przykład 1, Rozkład X 0 1 2 p x 0.25 0.5 0.25 0.25 0.5 0.25 0 1 2 x Wyznaczyć dystrybuantę F(x) = P(X x). Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 15 / 19
0 dla x < x 1, p 1 dla x 1 x < x 2 F(x) = p 1 + p 2 dla x 2 x < x 3 p 1 + p 2 + p 3 = 1 dla x 3 x 0 dla x < 0 0.25 dla 0 x < 1 F(x) = 0.75 dla 1 x < 2 1 dla x 2 Przykład 1, Dystrybuanta 1 0.75 dystrybuanta F(x) 0.25 0 1 2 x P-stwo że wyrzucimy 0 orłów wynosi 0.25. P-stwo że wyrzucimy co najwyżej 1 orła wynosi 0.75. P-stwo że wyrzucimy co najwyżej 2 orły wynosi 1. Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 16 / 19
Przykład 2 Zmienna losowa X przyjmuje wartość równa liczbie sukcesów uzyskanych w czterech n = 4 próbach Bernoulliego z prawdopodobieństwem sukcesu p = 1 3. Oczywiście X {0, 1, 2, 3, 4}. X 0 1 2 3 4 p x 16 32 p 1 + p 2 dla x 2 x < x 3 F(x) = P(X x) = p 1 + p 2 + p 3 dla x 3 x < x 4 24 8 1 0 dla x < x 1, p 1 dla x 1 x < x 2 p 1 + p 2 + p 3 + p 4 dla x 4 x < x 5 1 dla x 5 x Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 17 / 19
0 dla x < 0, 16 dla 0 x < 1 48 dla 1 x < 2 F(x) = P(X x) = 72 dla 2 x < 3 80 dla 3 x < 4 1 dla 4 x P-stwo że nastapi co najwyżej 1 sukces wynosi 48. P-stwo że nastapi a co najwyżej 2 sukcesy wynosi 72 P-stwo że nastapi a co najwyżej 3 sukcesy wynosi 80 P-stwo że nastapi a co najwyżej 4 sukcesy wynosi 1... Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 18 / 19
Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka matematyczna 1 kwietnia 2019 19 / 19