Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane wyniki są rzeczywiste czy wynikają z błędu pomiaru. Marcin Zajenkowski () Testowanie hipotez 2 / 25
Przykłady zastosowań Porównanie średniej ocen pewnego ucznia ze średnią w całej klasie. Porównanie skuteczności dwóch metod psychoterapii. Sprawdzenie różnic między rozwiązywaniem zadania w warunkach stresujących i relaksujących. Badanie różnicy między kobietami a męźczyznami w nasileniu depresyjności. Marcin Zajenkowski () Testowanie hipotez 3 / 25
Hipoteza zerowa To twierdzenie o braku różnic. Np. uzyskujemy średnie z dwóch grup osób badanych. Hipoteza zerowa: H 0 : µ 1 - µ 2 = 0 Marcin Zajenkowski () Testowanie hipotez 4 / 25
Test istotności Jest testem hipotezy zerowej. Pokazuje jakie jest prawdopodobieństwo, że otrzymane różnice są wynikiem błędu. Kolejne kroki wnioskowania statystycznego: Zakładamy hipotezę zerową Badamy dane empiryczne Szacujemy jakie jest prawdopodobieństwo uzyskania różnicy równej lub większej niż otrzymana przy losowym pobieraniu prób z populacji przy założeniu prawdziwości H 0. Przy małym odrzucamy H 0. Mówimy że wynik jest istotny. Marcin Zajenkowski () Testowanie hipotez 5 / 25
Hipoteza alternatywna Po odrzuceniu H 0, możemy przyjąć hipotezę alternatywną: H 1 : µ 1 - µ 2 0 Marcin Zajenkowski () Testowanie hipotez 6 / 25
Dwa rodzaje błędu Błąd I rodzaju (α) przyjęcie H1 gdy H0 jest prawdziwa. Błąd II rodzaju (β) przyjęcie H0 gdy H1 jest prawdziwe. Marcin Zajenkowski () Testowanie hipotez 7 / 25
Poziomy istotności Najczęściej przyjmowane: 0,05 i 0,01. Np. poziom 0,05 oznacza to że istnieje 5% szans na to że przyjęcie hipotezy alternatywnej jest wynikiem błędu. Marcin Zajenkowski () Testowanie hipotez 8 / 25
Testy bezkierunkowe Aby przyjąć/odrzucić hipotezę zerową na poziomie istotności 0,05, musimy sprawdzić czy dany wynik nie leży, jeśli jest to rozkład normalny w przedziale +/- 1,96 odchylenia standardowego. Marcin Zajenkowski () Testowanie hipotez 9 / 25
Testy istotności dla jednej średniej W celu określenia czy średnia z próby różni się od średniej z populacji. Jest to porównanie jakiegoś wyniku (np. średniej ocen ze statystyki w pewnej grupie) ze średnią z populacji (np. ze średnią ocen ze statystyki wszystkich studentów I roku). Marcin Zajenkowski () Testowanie hipotez 10 / 25
Testy istotności dla jednej średniej 1 Jeżeli znamy średnią i odchylenie standardowe w populacji, możemy odnieść się do rozkładu normalnego i zastosować wzór:. z = X µ σ X Marcin Zajenkowski () Testowanie hipotez 11 / 25
Przykład 1 W klasie 25 osobowej średni IQ=110 a s=14. Czy różni się od IQ w populacji (średnia 100, s = 15)? z = 110 100/3 = 3,33 Wartość z leży poza granicami 1,96 i 2,58. Zatem różnica jest istotna statystycznie. Marcin Zajenkowski () Testowanie hipotez 12 / 25
Testy istotności dla jednej średniej 2 Gdy znamy tylko średnią w populacji, a nie znamy odchylenia, to wówczas odnosimy się do rozkładu t t = X µ s X Marcin Zajenkowski () Testowanie hipotez 13 / 25
Przykład 2 W klasie 25 osobowej średni IQ=110 a s=14. Czy różni się od IQ w populacji (średnia = 100)? Szacujemy błąd standardowy = 2,80 t = (110 100)/2,80 = 3,57 Wartość t przy df =24, wynosi 2,064 (dla 0,05) i 2,797 (dla 0,01). Różnica jest istotna. Marcin Zajenkowski () Testowanie hipotez 14 / 25
Test kierunkowy Wykorzystujemy tylko połowę rozkładu. Np. w rozkładzie normalnym 5 % obszaru znajduje się powyżej z = 1,64. 1% obszaru znajduje się powyżej z = 2,33 Marcin Zajenkowski () Testowanie hipotez 15 / 25
Przykład 3 Przypuszczamy że w badanej klasie (zob. przykład 1) dzieci są inteligentniejsze niże inne dzieci. Porównujemy uzyskany wynik z z odpowiednimi wartościami dla 5% obszaru po prawej stronie rozkładu. Test jest również istotny. Marcin Zajenkowski () Testowanie hipotez 16 / 25
Zadanie W próbie 16 studentów, średni wynik na egzaminie wynosił 15, a s = 3. Czy wynik ten różni się od średniej wśród wszystkich studentów równej 18? Zastosuj test kierunkowy dla 5% poziomu istotności. Marcin Zajenkowski () Testowanie hipotez 17 / 25
Dwie próby niezależne Porównujemy dwie grupy różnych osób, np.: Kobiety i męźczyzn pod względem IQ Osoby chore na Alzheimera i zdrowe pod względem pamięci. Studentów psychologii i matematyki pod względem nasilenia empatii. Marcin Zajenkowski () Testowanie hipotez 18 / 25
Założenia Jednorodności (homogeniczności) wariancji Normalności rozkładów w grupach Niezależności prób Równoliczności grup Marcin Zajenkowski () Testowanie hipotez 19 / 25
Dwie próby niezależne Jeżeli założenie o równości jest uzasadnione to stosuje się wzór na wspólną wariancję: s 2 = N 1 N 2 i=1(x - X 1 ) 2 + i=1(x - X 2 ) 2 N 1 + N 2-2 Marcin Zajenkowski () Testowanie hipotez 20 / 25
Dwie próby niezależne Następnie oblicza się wspólny błąd standardowy: s X 1 X 2 = s 2 N 1 + s2 N 2 Marcin Zajenkowski () Testowanie hipotez 21 / 25
Dwie próby niezależne Następnie oblicza się wartość testu t: t = X 1 X 2 s X 1 X 2 Liczba stopni swobody: N1 + N2-2 Marcin Zajenkowski () Testowanie hipotez 22 / 25
Zadanie 1 Sprawdź czy dwie grupy kurczaków A i B różnią się między sobą żółtością piór (ocenianą na skali 30 punktowej przez ekspertów): A: 16, 9, 4, 23, 19, 10, 5, 2 B: 20, 5, 1, 16, 2, 4 Marcin Zajenkowski () Testowanie hipotez 23 / 25
Zadanie 2 Czy dwie grupy szczurów różnią się w liczbie popełnianych błędów w labiryncie: A: 2, 5, 7, 9, 6, 7 B: 4, 16, 11, 9, 8 Marcin Zajenkowski () Testowanie hipotez 24 / 25
Zadanie 3 Zastosuj test kierunkowy dla dwóch grup wyników: A: 1, 6, 9, 6, 8 B: 7, 9, 12, 15, 8, 10, 9 Marcin Zajenkowski () Testowanie hipotez 25 / 25