Statystyka matematyczna Wykład 8 Magdalena Alama-Bućko 7 maja 2018 Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 1 / 19
Przypomnijmy najpierw omówione na poprzednim wykładzie postaci przedziałów ufności dla wartości średniej i dla wskaźnika struktury. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 2 / 19
Model 1 Jeżeli cecha X ma rozkład N(m, σ), gdzie wartość średnia m jest nieznana, a odchylenie standardowe σ jest znane. ( ) P x u 1 σ < m < x + u 2 1 σ = 1, n gdzie liczbę u 1 odczytujemy z tablic dystrybuanty rozkładu 2 normalnego N(0, 1): Φ(u 1 2 ) = 1 2. Model 2 Jeżeli cecha X ma rozkład N(m, σ), gdzie wartość średnia i odchylenie standardowe σ sa nieznane. ( tzw. mała próba n 120) ( ) s s P x t,n 1 < m < x + t,n 1 = 1, n 1 n 1 gdzie liczbę t,n 1 odczytujemy z tablic rozkładu t-studenta. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 3 / 19
Model 3 Jeżeli cecha X ma dowolny rozkład, gdzie wartość średnia i odchylenie standardowe σ sa nieznane. ( tzw. duża próba n > 120) ( ) P x u 1 s < m < x + u 2 1 s = 1, n gdzie liczbę u 1 2 odczytujemy z tablic rozkładu normalnego Φ(u 1 2 ) = 1 2. Model dla wsk. struktury Cecha X ma rozkład dwupunktowy z parametrem p. ( tzw. duża próba n > 100) ( m m P n u 1 n (1 m n ) < p < m m n +u 1 n (1 m n ) ) = 1, gdzie liczbę u 1 2 odczytujemy z tablic rozkładu normalnego Φ(u 1 2 ) = 1 2. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 4 / 19
Minimalna liczebność próby Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 5 / 19
Minimalna liczebność próby wyznacza się dla przedziału dla średniej i dla wskaźnika struktury oba przedziały ufności (dla średniej i wskaźnika strunktury) maja postać : m x ± d albo n ± d gdzie wartość d była wyznaczana w każdym przypadku inaczej d - precyzja szacunku, bezwzględny bład szacunku Ponieważ przeprowadzenie badań jest kosztowne, ustala się minimalna liczebność próby, przy której jesteśmy w stanie oszacować nieznany parametr, przyjmujac określona wartość : współczynnika ufności 1 precyzji szacunku ( czyli wartości d w przedziałach ufności) Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 6 / 19
Przedział ufności dla parametru średniej m ma postać (σ- znana) ( ) P x u 1 σ < m < x + u 2 1 σ = 1, n gdzie liczba u 1 2 spełnia równanie: Φ(u 1 2 ) = 1 2. Tutaj mamy: d = u 1 σ. Rozwiazuj ac to równanie względem n, otrzymujemy minimalna liczebność próby przy ustalonym d i 1 : n = u 2 1 2 σ2 d 2. Aby otrzymać liczbę naturalna, uzyskany wynik zaokraglamy zawsze do góry. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 7 / 19
Przykład 1 Czas świecenia żarówek jest zmienna losowa o rozkładzie N(m, 50). Jaka ilość żarówek należy zbadać, aby z p-stwem 1 = 0, 95 i dokładnościa 10h oszacować średni czas świecenia żarówek. n = u 2 1 2 d = 10h σ2 d 2 1 = 0.95 zatem = 0.05 u 1 2 : Φ(u 1 2 ) = 1 2 1 2 = 1 0.025 = 0.975 zatem u 0.975 = 1.96 n = u1 2 σ2 = 1.96 2 502 = 95.55 2 d 2 10 2 zatem przyjmujemy n = 96. Zadana dokładność oszacowania otrzymamy na podstawie próby 96-elementowej. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 8 / 19
Przedział ufności dla średniej (wariancja nieznana, mała próba pilotażowa n 0 120) ( ) s s P x t,n 1 < m < x + t,n 1 = 1, n 1 n 1 gdzie liczbę t,n 1 odczytujemy z tablic rozkładu t-studenta. Tutaj mamy: d = t,n0 1 s n 1. Na podstawie próby pilotażowej wyznaczamy wartość s i t,n0 1, i z powyższego równania wyznaczamy n. Zatem przy ustalonych d i 1 mamy: n = t 2,n 1 s2 d 2 + 1. Aby otrzymać liczbę naturalna, uzyskany wynik zaokraglamy zawsze do góry. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 9 / 19
Przykład 2 Czas świecenia żarówek jest zmienna losowa o rozkładzie N(m, σ). Jaka ilość żarówek należy zbadać, aby z p-stwem 1 = 0, 95 i dokładnościa 10h oszacować średni czas świecenia żarówek. Próba pilotażowa dała wyniki: n = 10, x = 2900, s = 49. n = t 2,n 1 s2 d 2 + 1 d = 10h 1 = 0.95 zatem = 0.05 t,n 1 = t 0.05;9 = 2.262 n = t,n 1 2 s2 d 2 + 1 = 2.2622 492 + 1 = 123, 85 102 Zatem przyjmujemy, że zadana precyzję oszacowania średniego czasu świecenia żarówek otrzymamy dla próby n = 124. Musimy dodatkowo przebadać jeszcze 114 żarówek. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 10 / 19
Przedział ufności dla średniej (wariancja nieznana, duża próba pilotażowa) ( ) P x u 1 s < m < x + u 2 1 s = 1, n gdzie liczbę u 1 2 spełnia równanie Φ(u 1 2 ) = 1 2. Tutaj mamy: d = u 1 s. zatem minimalna liczebność próby przy ustalonym d i 1 wynosi: n = u 2 1 2 s2 d 2. Aby otrzymać liczbę naturalna, uzyskany wynik zaokraglamy zawsze do góry. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 11 / 19
Przykład 3 Czas świecenia żarówek jest zmienna losowa o rozkładzie N(m, σ). Jaka ilość żarówek należy zbadać, aby z p-stwem 1 = 0, 95 i dokładnościa 10h oszacować średni czas świecenia żarówek. Próba pilotażowa dała wyniki: n 0 = 400, x = 2900, s = 49. n = u 2 1 2 d = 10h s2 d 2. 1 = 0.95 zatem = 0.05 u 1 2 = u 0.975 = 1.96 n = u1 2 s2 = 1.96 2 492 = 92.24. 2 d 2 10 2 przyjmujemy n = 93 Zatem próba 400-elementowa jest wystarczajaca aby otrzymać taka dokładność szacunku. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 12 / 19
Model dla wsk. struktury Przedział ufności dla wskaźnika struktury p ( m m P n u 1 n (1 m n ) < p < m m n +u 1 n (1 m n ) ) = 1, gdzie liczbę u 1 2 spełnia równanie: Φ(u 1 2 ) = 1 2. 13 Procedura badania minimalnej liczebności próby w tym przypadku różni się w zależności od tego, czy przeprowadzono badania pilotażowe, czy też nie. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 13 / 19
Jeżeli przeprowadziliśmy badanie pilotażowe na podstawie którego oszacowaliśmy wartość w = m n, to w (1 w) d = u 1, zatem minimalna liczebność próby przy ustalonym d i 1 wynosi: n = u 2 1 2 w(1 w) d 2. Aby otrzymać liczbę naturalna, uzyskany wynik zaokraglamy zawsze do góry. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 14 / 19
Zadanie W zwiazku za zbliżajacymi się wyborami parlamentarnymi oszacować popracie dla partii X. Na próbie 200 osób przeprowadzono badanie pilotażowe. Wśród tych osób dokładnie 30 popiera partię X. Czy pobrana próba jest wystarczajaca, aby z ufnościa 95% i przyjęciu maksymalnego błędu szacunku 3% oszacować odsetek popierajacych tę partię wśród wszystkich Polaków. 1 = 95% = 0.95 d = 3% = 0.03 m = 30, n = 200, zatem popracie na podstawie próby pilotażowej wynosi w = m n = 30 200 = 0.15 Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 15 / 19
w = 0.15 n = u1 2 2 w(1 w) d 2 u 1 2 spełnia równanie: Φ(u 1 2 ) = 1 2. = 0.05, zatem 1 2 = 1 0.025 = 0.975 Z tablic odczytujemy: u 0.975 = 1.96 n = u 2 1 2 w(1 w) d 2 = 1.96 2 0.15 0.85 0.03 2 = 544.23. Przyjmujemy zatem, że sondaż powinien być przeprowadzony na próbie 545 osobach, zatem nasza próbę należy uzypełnić o dodatkowe 545 200 = 345 osoby. Wówczas wartość m n wyliczone na podstawie próby co najmniej 545-elementowej daje oszacowanie popracia dla partii X z maksymalnym błędem szacunku 3%. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 16 / 19
Jeżeli nie jesteśmy w stanie przeprowadzić badania pilotażowego, to we wzorze na wartość d przyjmujemy w = 1 2 i wtedy d = u 1 2 w (1 w) n = u 1 2 1 4n = u 1 2 1 2 n zatem minimalna liczebność próby przy ustalonym d i 1 wynosi: n = u 2 1 2 1 4d 2. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 17 / 19
Zadanie W zwiazku za zbliżajacymi się wyborami parlamentarnymi oszacować popracie dla partii X. Przyjmujemy poziom ufności 95% i bezwzględny bład szacunku 3%. 1 = 95% = 0.95 d = 3% = 0.03 u 1 2 : Φ(u 1 2 ) = 1 2. = 0.05, zatem 1 2 = 1 0.025 = 0.975 Z tablic odczytujemy: u 0.975 = 1.96 n = u 2 1 2 1 4d 2 = 1 1.962 4 0.03 2 = 1067.11. Przyjmujemy zatem, że sondaż musimy przeprowadzić na próbie 1068 osób. Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 18 / 19
Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka matematyczna 7 maja 2018 19 / 19