Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012 wyniosła 3,95. Liczba populacji wynosi 580 osób. Dokonano losowego doboru 10 prób 50 osobowych uzyskując następujące średnie ocen z semestru letniego roku 2011/2012. Jaki jest błąd próby? Wyniki próba średnie 1 3,45 2 3,89 3 4,22 4 4,17 5 3,9 6 3,95 7 4,35 8 4,15 9 3,8 10 3,73 Zad. 2 Średnia ocen 1200 osobowej populacji studentów WNS wyniosła 3,68, odchylenie standardowe 0,5. Wylosowano 100 elementową próbę studentów, obliczono ich średnią, która wyniosła 3,78. Należy obliczyć wielkość błędu standardowego tej średniej. Zad. 3 Przeprowadzono badanie nad problemem ściągania w czasie egzaminów. W tym celu z populacji studentów WNS,, liczącej 1200 osób wylosowano 250 elementową próbę. W badaniach okazało się, że w czasie egzaminów ściąga 40 % badanych. Jak duży jest błąd standardowy. Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z dla określonych hipotez i ich poziomów istotności: a. H 0 : μ 1 = μ 2 ; H 1 : μ 1 μ 2 ; poziom istotności α 0,05 b. H 0 : μ 1 > μ 2 ; H 1 : μ 1 μ 2 ; poziom istotności α 0,1 c. H 0 : μ 1 μ 2 ; H 1 : μ 1 > μ 2 ; poziom istotności α 0,01 d. H 0 : μ 1 μ 2 = 0; H 1 : μ 1 μ 2 > 0; poziom istotności α 0,001 e. H 0 : μ 1 μ 2 > 0; H 1 : μ 1 μ 2 0; poziom istotności α 0,02 Zad. 5 Należy przedstawić hipotezy statystyczne ( hipotezę zerową i alternatywną) dla opisanych problemów: a. Dwie grupy różnią się przeciętną wielkością dochodów
b. Badana grupa ma dochody nie mniejsze niż reszta populacji c. Frakcja popierająca rząd PO-PSL w jednej grupie jest większa niż w drugiej grupie d. Dwie grupy złożone są z identycznych (z względu na jakąś cechę) jednostek Zad.6 Średnie zarobki osób zatrudnionych w pewnej fabryce wynoszą 3300 zł a odchylenie standardowe 1500 zł. Zarobki 250 pracowników pracujących w montowni tej fabryki wynoszą przeciętnie 3100 zł. Czy ich zarobki różnią się istotnie statystycznie od zarobków wszystkich pracowników (przy poziomie istotności α 0,05 i α 0,01)? Zad. 7 Średnia ocen studentów I roku wszystkich kierunków studiów na Uniwersytecie Wrocławskim wyniosła 4,2. Przebadano próbę 20 studentów socjologii U.Wr. uzyskując średnią 4,27 oraz odchylenie standardowe 0,6 Czy różnica między średnimi jest istotna statystycznie, na poziomie istotności α=0,01 (czy jest efektem błędu losowego próby)? Podsumowanie wykładu Błąd próby e Jest to różnica między wartością w populacji (parametrem), a konkretną wartością z próby (statystyką). - jeśli μ jest parametrem populacji a jest statystyką próby opartą na N liczebności, to błąd próby to różnica między parametrem a statystyką. Zazwyczaj parametr populacji μ jest nieznany i nie mamy możliwości określenia wielkości e dla konkretnej próby. Mimo to możemy sformułować sensowne twierdzenia na temat wielkości błędu e. Pojęcie błędu implikuje jakąś wartość prawdziwą (rzeczywistą) parametru, od której wartość obserwowana może odbiegać. Bez zdefiniowania, że istnieje taka wartość prawdziwa, nie miałoby bowiem sensu używanie terminu błąd ani również uprawianie nauki. Wielkość błędu można więc ocenić i oszacować. Szacowanie wielkości błędu podejście empiryczne Średnia również może być użyta jako estymator parametru. Powtarzając wielokrotnie pomiary możemy otrzymać różne wielkości przeciętne dla kolejnych prób, niemniej każda z nich jest estymatorem prawdziwego parametru. Różnice między poszczególnymi średnimi są efektem błędów próby. Każda z ich tylko w przybliżeniu opisuje wartość prawdziwego parametru, który jest stały, niezmienny. Różnice między estymatorami a parametrem można interpretować jako odchylenia pomiarów od parametru.
Odchylenie standardowe i wariancja średniej opisują zmienność tej statystyki, czyli opisują jej wielkość błędu. Opisują jakim błędem obarczona jest średnia jako estymator. Odchylenie standardowe średnich prób jest równe odchyleniu standardowemu błędów prób dlatego, że parametr μ jest stały. Błąd z próby jest więc błędem standardowym, opisującym odchylenie standardowe jakiejś statystyki. Szacowanie wielkości błędu podejście teoretyczne. teoretyczne: otrzymuje się go w efekcie rozważań nad możliwym (wynikającym z rachunku prawdopodobieństwa) rozkładem danej cechy. Wielkość błędu standardowego średnie z próby dla populacji skończenie wielkich, gdy znane jest σ (odchylenie standardowe w populacji Wielkość błędu standardowego średniej z próby dla populacji nieskończenie wielkich gdy znane jest σ (odchylenie standardowe w populacji Ustalanie wielkości błędu standardowego próby w populacji, gdy parametr σ jest nieznany, Populacja skończenie wielka Populacja nieskończenie wielka
Rozkład z próby proporcji (frakcji) znana frakcja ϴ w populacji Błąd standardowy próby dla populacji skończenie wielkich Błąd standardowy próby dla populacji nieskończenie wielkich Rozkład z próby proporcji (frakcji) nieznana frakcja ϴ w populacji Błąd standardowy próby dla populacji niekończenie wielkiej Błąd standardowy dla populacji skończenie wielkiej Przykład Prowadzono badania nad paleniem papierosów, w celu oszacowania, jak wiele osób pali. Dobrano z populacji dorosłych Polaków (23mln) próbę 1000 osób. Pomiar wykazał, że ten nawyk dotyczy 32% populacji. Jak duży jest błąd standardowy próby?
Testy statystyczne Test z i t dla jednej próby Badają, czy różnica między średnimi z próby a populacji jest wystarczająco duża, by wyeliminować wahania wynikające z losowego doboru próby. Wymaga podjęcia decyzji o charakterze testu (jedno czy dwustronny). Wymaga przyjęcia określonego poziomu istotności α (prawdopodobieństwa popełnienia błędu I rodzaju), wyznaczającego wartość krytyczną testu (np. α 0,05, wartość krytyczna z = =+-1,96 przy teście dwustronnym lub 1,65 przy teście jednostronnym) 1. Testy parametryczne - test z dla jednej próby przy znanym σ Test z stosujemy gdy: 1. próba jest duża (N>30) 2. znane jest odchylenie standardowe populacji σ 3. populacja ma rozkład normalny 2. Testy parametryczne - test z dla jednej próby przy nieznanym σ Test z stosujemy gdy: 1. próba jest duża (N>30) 2. nieznane jest odchylenie standardowe populacji σ 3. rozkład cechy w populacji jest normalny
3. Testy parametryczne - test t dla jednej próby przy znanym σ Test t stosujemy gdy: 1. próba jest mała (N 30) 2. gdy znane jest odchylenie standardowe populacji σ 3. rozkład cechy jest nieznany 4. Testy parametryczne - test t dla jednej próby przy nieznanym σ Test t stosujemy gdy: 1. próba jest mała (N 30) 2. gdy nieznane jest odchylenie standardowe populacji σ 3. rozkład cechy jest nieznany Test z dla frakcji w populacji Test z dla frakcji stosujemy gdy: 1. próba jest duża, co oznacza, że musi zostać spełniony warunek: 2. rozkład cechy może być nieznany w populacji