Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1 Konrad Miziński, nr albumu 233703 1 maja 2015 Zadanie 1 Parametr λ wyestymowano jako średnia z próby: λ = X n = 3.73 Otrzymany w ten sposób rozkład Poissona wraz z rzeczywistym rozkładem ilości skrętów w prawo przedstawiono na rysunku 1. Rysunek 1: Zestawienie rzeczywistych oraz danych wyestymowanych ilości skrętów w prawo 1
Odchylenie standardowe estymatora λ oszacowano metoda bootstrapu parametrycznego jako odchylenie standardowe z próbki 1000 średnich policzonych na zbiorach wygenerowanych metoda losowania ze zwracaniem z oryginalnego zbioru danych. Liczność każdego z tych zbiorów równa była liczności zbioru oryginalnego. Otrzymano wartość: 0,132227. Następnie obliczono wartość odchylenia T dla oryginalnego zbioru skrętów w prawo: T base = (v i np i ) 2 = 64.62072 np i i=0 Stosujac metodę bootstrapu parametrycznego obliczono analogiczna wartość odchylenia T dla 200 000 zbiorów danych wygenerowanych z wykorzystaniem rozkładu Poissona z parametrem λ = λ. Liczność wygenerowanych zbiorów była równo liczności zbioru oryginalnego. Prawdopodobieństwo, że odchylenie T zaobserwowanych liczb skrętów w prawo od liczb spodziewanych jest co najmniej takie jak dla danej w zadaniu próby losowej, oszacowano wg wzoru: P = t T : t T base = 0.00024 T gdzie T oznacza oznacza wygenerowany wektor wartości odchylenia standardowego. 2
Zadanie 2 Histogram odstępów między fotonami przedstawiono na rysunku 2. Rysunek 2: Histogram odstępów między kolejnymi fotonami Porównujac powyższy rysunek z rodzina rozkładów gammna można stwierdzić, że rozkład Gamma byłby bardzo dobrym modelem dla zarejestrowanych danych. Parametry α i β wyznaczono najpierw metoda momentów: m 1 = X n = 77.81719 m 2 = X 2 n = 12069.32339 m 2 1 α = m 2 m 2 1 = 1.006935 β = m 2 m 2 1 m 1 = 77.281236 3
oraz metoda największej wiarygodności, gdzie parametr α był rozwiazaniem równania: i wynosił: Zaś β : lnx n lnx n = Γ (α) Γ(α) ln(α) α = 1.041746 β = X n α = 74.698840 Uzyskane w ten sposób rozkłady gamma oraz wygenerowany wcześniej histogram odstępów między fotonami przedstawiono na rysunku 3. Rysunek 3: Histogram odstępów między kolejnymi fotonami oraz wyniki ich estymacji rozkładem gamma Na podstawie powyższego wykresu można stwierdzić, że modelowanie zbioru odstępów między kolejnymi fotonami za pomoca rozkładu gamma daje bardzo dobre rezultaty. Oba uzyskane modele sa do siebie bardzo podobne i dość dobrze odwzorowuja modelowany zbiór. 4
Odchylenie standardowe otrzymanych estymatorów wyznaczono metoda bootstrapu parametrycznego. Posłużyło do tego 1000 zestawów próbek wygenerowanych na podstawie rozkładu gamma z wyestymowanymi parametrami. Liczność każdej próbki była równa liczności oryginalnego zbioru. Na podstawie wygenerowanych próbek wyznaczono również przedziały ufności (na poziomie uności 95%) dla poszczególnych parametrów. Dokonano tego przez odrzucenie z posortowanych wektorów wygenerowanych estymatorów po 2,5% wartości skrajnych z każdej strony. Wyniki przedstawiono w tablicy 1: Parametr Odchylenie standardowe Przedział ufności Długość p. u. α (m.m.) 0.0326506 [0.9463326, 1.0709516] 0.1246190 β (m.m.) 2.803572 [72.13519, 82.79810] 10.66291 α (n.w.) 0.02079334 [1.00383127, 1.08587621] 0.08204494 β (n.w.) 1.879972 [70.914798, 78.329585] 7.414787 Tablica 1: Odchylenie standardowe i przedziały ufności estymatorów parametrów rozkładu gammma 5
Zadanie 3 Wartość średnia i wariancję wyestymowano wg wzorów: µ = X n = 1.030086 S 2 = 1 n (X i X n ) 2 = 0.5484125 n 1 i=0 Przedziały ufności dla µ wyznaczono wg wzorów: zaś dla S 2 : przy czym przyjęto, że a = b = 1 γ 2. Wyniki przedstawiono w tablicach 2 i 3. [X n S F 1 n t n 1 ( 1 + γ ), X n + S F 1 2 n t n 1 ( 1 + γ )] 2 (n 1)S 2 (n 1)S2 [ F 1, (1 b) F 1 (a) ] χ 2 χ n 1 2 n 1 Poziom ufności Przedział ufności Długość przedziału ufności 90% [-1.354641, -0.7055315] 0.6491097 95% [-1.424697, -0.6354758] 0.7892212 99% [-1.575633, -0.4845402] 1.0910923 Tablica 2: Przedziały ufności dla µ Poziom ufności Przedział ufności Długość przedziału ufności 90% [0.3291029, 1.132936] 0.8038335 95% [0.2992604, 1.313639] 1.0143785 99% [0.2507883, 1.787946] 1.5371575 Tablica 3: Przedziały ufności dla S 2 6