Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru na podstawie estymatora Statystyka indukcyjna: estymacja parametrów szacowanie wartości parametrów na podstawie wartości estymatora. Statystyka indukcyjna pozwala obliczyć błąd jakim obciążone są te szacunki! - punktowa - przedziałowa testowanie hipotez ESTYMATOR STATYSTYKA W PRÓBIE PARAMETR STATYSTYKA W POPULACJI Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Jeśli chcemy coś powiedzieć o średniej w populacji to informujemy o średniej w próbie. Jest to tak zwana ESTYMACJA PUNKTOWA Co z tego wynika: dalej nie wiemy ile wynosi średnia w populacji, ale zgadzamy się, że obliczona średnia jest pewnym przybliżeniem średniej w populacji. 1
Możemy również wyznaczyć zróżnicowanie w nieskończonej liczbie pomiarów czyli błąd standardowy. Jeśli wylosowalibyśmy nieskończenie wiele prób i dla każdej z prób obliczylibyśmy np. średnią, to otrzymamy nieskończenie wiele średnich. Tak otrzymany rozkład średnich jest tzw. rozkładem średnich z próby. Jest to rozkład teoretyczny! Jeśli obliczymy zróżnicowanie - czyli odchylenie standardowe - rozkładu tych średnich to otrzymamy wielkość błędu standardowego Rozkład średnich z próby jest rozkładem normalnym o średniej i odchyleniu standardowym równemu błędowi standardowemu Błąd standardowy średniej możemy wyznaczyć na podstawie wzoru - poszukiwana średnia w populacji (parametr) - odchylenie standardowe w populacji M i średnie z kolejnych prób s odchylenie standardowe w próbie N- liczebność próby 2
Im mniejszy błąd tym lepiej - większa dokładność szacowania Im mniejsze zróżnicowanie z próby czyli mniejszy błąd standardowy z tym większą dokładnością możemy określić wielkość statystyki w populacji Możemy estymować nie tylko średnią w populacji, ale inne statystyki: odchylenie standardowe, wariancję, medianę, proporcję, itd. Estymowany parametr przewidujemy za pomocą przedziału liczbowego, w którym z określonym stopniem pewności znajduje parametr w populacji. Przewidując, np. średnią liczbę dni urlopu w sierpniu możemy stwierdzić, że średnia liczba dni urlopu w sierpniu zawiera się w przedziale <1-31> i mamy wtedy 100% pewność, że tak jest. Ale choć jest to wiedza pewna, to żadnym stopniu nas ta informacja nie satysfakcjonuje. Jeśli skrócimy przedział w którym jak przypuszczamy zawierała się będzie średnia to stracimy tę 100% pewność. Informacja, że średnia zawiera się w przedziale <10-15> jest mniej pewna (obarczona błędem), bo może się zdarzyć, ze podany przez nas przedział nie zawiera prawdziwej średniej dni urlopu w sierpniu. Estymator przedziałowy parametru jest nazywany przedziałem ufności. Poziom ufności (1-alfa) jest miarą wiarygodności estymatora Nie wiemy ile dokładnie wynosi parametr w populacji (np. średnia), ale szacujemy ją podając pewien przedział, który jak przypuszczamy tę średnią zawiera. 3
Interpretując przedział ufności otrzymany dla danych z konkretnego badania należy pamiętać, że jest to jeden z wielu przedziałów, który możemy wyznaczyć dla przewidywanego parametru. Gdyby wylosowała się inna próba otrzymalibyśmy inny przedział ufności. Parametr jest stały, zmienia się - w zależności od próby - przedział ufności Przewidując parametr (a dokładnie, przedział, który będzie zawierał parametr) przyjmujemy pewne ryzyko popełnienia błędu czyli dopuszczamy że wyznaczony przedział nie zawiera parametru. Ryzyko, że pomylimy się w 5 przewidywaniach na 100, oznacza, że parametr przewidujemy z 95% poziomem ufności. Jeśli będziemy pobierać nieskończenie wiele prób i na ich podstawie wyznaczać przedziały ufności to 95% z nich zawiera prawdziwy (stały) parametr. Szansa, że przedział ufności zawiera prawdziwą średnią wynosi 95 na100 (wynika to z własności rozkładu normalnego). Konkretny (np. uzyskany w naszych badaniach) przedział, zawiera albo nie zawiera średnią z populacji. Ale tego nie wiemy. Ufamy jednak (?), że jest to jeden z tych 95% wszystkich przedziałów, które zawierają parametr populacji (np. średnią). Ilustracja graficzna przedziałów ufności otrzymanych w nieskończenie wielu próbach. Przy 95% poziomie ufności (z=1,96) 95% z nich zawiera średnią w populacji, 5 % nie Na rysunku znaczono przedziały ufności wyznaczone w przykładowych 7 próbach, spośród których jeden nie zawiera średniej. Teoretycznie takich przedziałów uzyskać możemy nieskończenie wiele. 4
2017-11-13 95% przedział ufności 95% p. ufn 9 9,2 9,4 9,6 9,8 10 10,2 10,4 10,6 10,8 11 99% p. ufn 99% przedział ufności Howell (1997) proponuje myślenie o parametrze jak o słupku, a o przedziałach ufności jako o krążkach, które badacze rzucają na słupek Na podstawie danych z próby badacze tworzą krążki o odpowiedniej średnicy. Posługując się np. 95% przedziałem ufności krążki trafiają na słupek w 95% razach, w 5% rzutów nie trafiają. Twierdzenie dotyczące przedziałów ufności mówią o prawdopodobieństwie z jakim krążek (przedział ufności) znajdzie się na słupku (będzie zawierał prawdziwą wartość parametru), a nie dotyczy prawdopodobieństwa z jakim słupek (parametr) znajdzie się w krążku (w przedziale ufności) Shaughnessy J. J., Zechmeister E. B. - Metody badawcze w psychologii, s. 449, za Howell D.C. Statistical methods for psychology. 5
Długość przedziału ufności zależy od przyjętego poziomu istotności (alfa) /poziomu ufności (1-alfa). Im większy poziom ufności tym dłuższy przedział, tym mniejsza precyzja szacowania. Jeśli jest duże zróżnicowanie cechy w populacji to nie można oczekiwać krótkich przedziałów ufności. 95% poziom ufności dla średniej oznacza, że gdybyśmy wyznaczyli przedziały ufności z (nieskończenie) wielu prób, to 95% tych przedziałów będzie zawierało prawdziwą wartość poszukiwanego parametru. Nie wiadomo dokładnie, który z przedziałów zawiera tę wartość. Wiadomo jedynie, ile z nich będzie w błędzie, a ile będzie zawierało prawdziwą wartość parametru. W praktyce nie przeprowadzamy losowania wielu prób. Losujemy JEDNĄ próbę i na jej podstawie przewidujemy to co dzieje się w populacji. Ufamy, że wyznaczony w naszej jednej próbie przedział ufności tą średnią zawiera. Mamy na to 95% szansę 95% przedział ufności oznacza 95% prawdopodobieństwo, że prawdziwa wartość parametru leży w podanych widełkach 95% przedział ufności oznacza, że możemy być w 95% pewni, że prawdziwy parametr leży w podanym przedziale. Przedział ufności to przedział wiarygodnych wartości dla średniej 95% przedział ufności oznacza, że interesujący nas parametr ma 95% prawdopodobieństwo znalezienia się w tym przedziale 6
Można sprawdzić, że końce przedziałów to 50,932 0,188 * 1,96 Opis wyników: Średnia indeksu męskości wynosi M=50,9, błąd standardowy średniej wynosi S M =0,188. Przedział ufności wyznaczony dla 95% poziomu ufności wynosi (50,563, 51,301). Istnieje 95% prawdopodobieństwo, że uzyskany przedział ufności (50,563, 51,301) zawiera prawdziwą średnią w populacji. Jak należy rozumieć, zinterpretować powyższe raportowanie wyników czyli co czytamy między wierszami. Przyjmujemy, że średnia w populacji wynosi 50,9. Ale ten wynik różni się od prawdziwego. Błąd standardowy S M =0,188 to wielkość zróżnicowania rozkładu średnich, które byśmy otrzymali pobierając nieskończenie wiele prób. Stwierdzamy, z 95% prawdopodobieństwem, że przedział (50,563, 51,301) jest przedziałem, który zawiera prawdziwą średnia w populacji. Szansa, że wyznaczony przedział ufności zawiera prawdziwą średnią wynosi 95 na 100. Czyli, że jest to jeden z tych 95% przedziałów, które zawierają prawdziwą średnią, a które byśmy wyznaczyli wyznaczając przedziały ufności pobierając nieskończenie wiele prób. 99% przedział ufności (50,44, 51,41) 95% p. ufności (50,56, 51,30) 50 50,4 50,8 51,2 51,6 52 Im szerszy przedział tym większa pewność, że zawiera parametr, niestety większa pewność powoduje, że spada precyzja szacowania 7
to w istocie połowa długości przedziału ufności Co raportujemy w wynikach (np. badan sondażowych)? Średnia wysokość kwoty przeznaczanej na wakacje wynosi 2000zł, a błąd statystyczny wynosi 150zł, poziom ufności 0,95. Co z tego wynika? Że wyznaczono przedział ufności dla średniej wakacyjnych wydatków (1850zł, 2150zł). Błąd standardowy średniej wydatków wynosi 76,53zł (=150zł/1,96) Zróżnicowanie nieskończenie wielu pomiarów (zmienność) wakacyjnych wydatków jest na poziomie 76,53zł. Odchylenie standardowe z próby wynosi 76,53zł Wysokość wydatków uzyskana w próbie (200zł) z nie różni się od rzeczywistej wielkości wydatków o więcej niż błąd statystyczny (+/- 150zł ) z prawdopodobieństwem 95% to w istocie połowa długości przedziału ufności Co raportujemy w wynikach (np. badan sondażowych)? Poparcie dla poglądu, że statystyka jest fajna wynosi 85%, a błąd statystyczny (błąd pomiaru) wynosi 3%, przyjęty w badaniach poziom ufności wynosi 0,95. Co z tego wynika? Że przedział ufności dla frakcji uważających, że statystyka jest fajna wynosi (82%, 88%). Błąd standardowy frakcji wynosi natomiast 1,53% (=3%/1,96) Zróżnicowanie nieskończenie wielu pomiarów (zmienność) frakcji jest na poziomie 1,53% Odsetek z próby (85%) nie różni się od prawdziwego odsetka w populacji o więcej niż jeden błąd statystyczny 3% (z prawdopodobieństwem 95%) 8
- Od wielkości populacji (wielkość dużych populacji nie wpływa znacząco na wielkość próby wielkość próby rośnie dla coraz większych populacji, ale tylko do pewnego momentu, potem rozmiar populacji nie wpływa na wielkość próby dzielimy przez bardzo duże N, jak bardzo nie ma znaczenia bo i tak otrzymam wartość bliska zera) - Od błędu standardowego (zwykle zakładamy jego maksymalną dopuszczalną wartość = błąd dopuszczalny/maksymalny) - od poziomu ufności, określanego za pomocą poziomu istotności alfa Alfa = 1 poziom ufności 9
Bardziej wnikliwe omówienie idei estymacji przedziałowej znajduje się w materiałach dodatkowych 10