STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test 8. Test F 9. Testy nieparametryczne 10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 11.Korelacja 1. Regresja liniowa i nieliniowa 13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14. Analiza wariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP Testy nieparametryczne 1. Test Manna-Whitneya. Test Wilcoxona 3. Test Kolmogorova Smirnova 4. Test Kruskala-Wallisa Copyright 010, Joanna Szyda
TESTY NIEPARAMETRYCZNE Testy nieparametryczne 1. Brak założeń dotyczących rozkładu zmiennej w próbie danych. Wykorzystanie rankingu obserwacji zamiast wartości zmiennych 3. Często bardziej czasochłonne obliczeniowo 4. Jeżeli próba danych spełnia założenia dotyczące testu parametrycznego - test nieparametryczny ma niższą moc (1-b) 5.... utrata informacji przez zastosowanie rang Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA
ZAKRES STOSOWALNOŚCI TESTU MANNA-WHITNEYA 1. Test nieparametryczny. Dane ciągłe lub porządkowe (rangi) 3. Dane nie mają rozkładu normalnego 4. Porównanie dwu niezależnych prób danych Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA ŚREDNIE WYSOKIE 5.5 6.0 6.0 7.0 5.0 7.5 7.0 6.0 5.5 7.5 6.0 8.0 7.0 11.0 6.0 9.0 8.0 8.0 7.0 11.0 6.0 8.0 7.0 8.0 6.0 7.0 8.0 7.0 6.0 7.0 7.0 9.0 PRÓBA DANYCH 1. Długość krewetki w zależności od zasolenia wody 3. Długość krewetki [mm] w wieku 4 tygodni N N 10 8 6 4 0 8 6 4 0 1 3 4 5 6 7 8 9 DŁUGOŚĆ 1 3 4 5 6 7 8 9 10 11 DŁUGOŚĆ Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA 1. Określenie hipotez H 0 i H 1 H 0 : średnia długość krewetki nie zależy do zasolenia wody H 1 : średnia długość krewetki zależy od zasolenia wody. Ustalenie poziomu istotności = 0.05 3. Wybór i obliczenie wartości testu statystycznego U n n 1 n n 1 n1 n 1 1 min n 1n r, n1n i1 i1 i r1 i Excel: przykład Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA U n n 1 n n 1 n1 n 1 1 min n 1n r, n1n i1 i1 i r1 i minimalna suma rang próby obserwowana suma rang próby 1 3 4 5 6 H 1 minimalna suma = obserwowana suma U mierzy odchylenie od H 1 Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA 3. Wybór i obliczenie wartości testu statystycznego U U 46, 10 46 n n 1 n n 1 n1 n 1 1 min n1n r, 1 i n n r i1 i1 16 17 min16*16 min 1617 18, 16*16 346 1i Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA 4. Określenie rozkładu testu Test nieparametryczny brak rozkładu Dla n 1 n > 0 aproksymowany przez rozkład normalny: U z ~ N U U U U, 1 U n n U n1n n1 n 1 1 ~ N 0,1 brak tablic tablice Copyright 010, Joanna Szyda
TEST MANNA-WHITNEYA 4. Określenie rozkładu testu z n n 1 U n1n 46 16*16 n n 1 16*1633 1 1 1 3.09 ~ N 0,1 5. Obliczenie wartości p: p=0.00 lub porównanie z wartością krytyczną: U 0.05, n 16, 16 181 1 n Ut 46 Excel: przykład Copyright 013, Joanna Szyda
TEST MANNA-WHITNEYA 6. Decyzja p< U t < U H 0 H 1 UWAGA!!! średnia długość krewetki zależy od zasolenia wody Copyright 010, Joanna Szyda
TEST WILCOXONA
ZAKRES STOSOWALNOŚCI TESTU WILCOXONA 1. Test nieparametryczny. Dane ciągłe lub porządkowe (rangi) 3. Dane nie mają rozkładu normalnego 4. Porównywane dwu zależnych = sparowanych prób danych Copyright 010, Joanna Szyda
TEST WILCOXONA NR OWCY BEZ JAGN Z JAGN 1 7.00 55.50 6.35 43.80 3 55.77 66.80 4 59.98 68.00 5 51.60 57.88 6 61.48 61.90 7 5.57 45.40 8 5.50 56.67 9 56.43 73.30 10 60.13 77.50 11 48.60 63.53 1 4.90 54.50 13 53.50 55.58 14 70.43 91.10 15 47.10 64.05 16 50.08 71.40 PRÓBA DANYCH 1. Próba danych zachowanie się pokarmowe ociec. Dane zebrano w latach 1994-1996 w stadzie owiec utrzymywanym u podnóża Rocky Mountains w Kanadzie 3. Różnice w czasie pasienia się owcy z jagnięciem i bez 4. % czasu spędzanego na pasieniu się Copyright 010, Joanna Szyda
TEST WILCOXONA NR OWCY BEZ JAGN Z JAGN PRÓBA DANYCH 1 7.00 55.50 6.35 43.80 3 55.77 66.80 4 59.98 68.00 5 51.60 57.88 6 61.48 61.90 7 5.57 45.40 8 5.50 56.67 9 56.43 73.30 10 60.13 77.50 11 48.60 63.53 1 4.90 54.50 13 53.50 55.58 14 70.43 91.10 15 47.10 64.05 16 50.08 71.40 N 3 1 0-5 -0-15 -10-5 0 5 10 15 0 RÓŻNICA W CZASIE Copyright 010, Joanna Szyda
TEST WILCOXONA 1. Określenie hipotez H 0 i H 1 H 0 : czas pasienia się owcy nie zależy od obecności jagnięcia H 1 : czas pasienie się owcy zależy od obecności jagnięcia. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego W min n 1 i1 N n1 r i, ri in 1 Excel: przykład Copyright 010, Joanna Szyda
TEST WILCOXONA W min n 1 i1 N n1 r i, ri in 1 + 1 + + 3 + 4 + 5 + 6 H 1 maksymalna suma rang = N(N+1)/ H 0 suma rang = 0 im bardziej prawdopodobna jest H 1 tym większa wartość W (zbliża się do N(N+1)/) Copyright 010, Joanna Szyda
TEST WILCOXONA 3. Wybór i obliczenie wartości testu statystycznego W min n 1 i1 N n in 1 r i, r 1 i 9 9 min 107, Copyright 010, Joanna Szyda
TEST WILCOXONA 4. Określenie rozkładu testu Test nieparametryczny brak rozkładu Dla N > 15 aproksymowany przez rozkład normalny: W ~ N, z z z W W N W W N N 1 N 1 4 ~ 16*17 9 4 16*17*33 4 W N 1 4 W N 0,1.0 ~ ~ N 0,1 N 0,1 Copyright 010, Joanna Szyda
TEST WILCOXONA 5. Obliczenie wartości p: p=0.0437 Excel: przykład lub porównanie z wartością krytyczną: W 0.05, N 16 9 Wt 9 6. Decyzja p< W t = W H 0 H 1? czas pasienie się owcy zależy od obecności jagnięcia? Copyright 010, Joanna Szyda
TEST KOŁMOGOROVA
TEST KOŁMOGOROVA- ZAKRES STOSOWANIA 1. Test nieparametryczny. Dane ciągłe lub porządkowe (rangi) 3. Porównanie rozkładu próby danych z oczekiwanym rozkładem 4. Porównanie zgodności rozkładów dwu prób danych A. Kolmogorov Copyright 014 Joanna Szyda
TEST KOŁMOGOROVA synowie ogiera X 75 84 80 77 68 87 9 77 9 86 78 76 80 81 7 77 PRÓBA DANYCH 1. Próba danych punkty bonitacyjne w próbie dzielności ogierów. Dane zebrano 000 r. na podstawie prób dzielności ogierów rasy śląskiej w Książu Copyright 010, Joanna Szyda
TEST KOŁMOGOROVA synowie ogiera X 75 84 80 77 68 87 9 77 9 86 78 76 80 81 7 77 N 3 1 0 70 7 74 76 78 80 8 84 86 88 90 9 94 PUNKTY BONITACYJNE PRÓBA DANYCH Copyright 010, Joanna Szyda
TEST KOŁMOGOROVA 1. Określenie hipotez H 0 i H 1 H 0 : punkty bonitacyjne synów ogiera X nie odbiegają od rozkładu normalnego dla wszystkich testowanych ogierków H 1 : punktu bonitacyjne synów ogiera X odbiegają od rozkładu normalnego dla wszystkich testowanych ogierków H 0 : F(x) = F[ N(80,6) ] H 1 : F(x) F[ N(80,6) ]. Ustalenie poziomu istotności = 0.05 Copyright 014, Joanna Szyda
TEST KOŁMOGOROVA 3. Wybór i obliczenie wartości testu statystycznego D max F x FN Mała różnica H 0 Duża różnica H 1 Excel: przykład 4. Określenie rozkładu testu Test nieparametryczny brak rozkładu tablice Copyright 010, Joanna Szyda
TEST KOŁMOGOROVA 5. Porównanie z wartością krytyczną: D 0.05, N 16 0.33 Dt 0.13 6. Decyzja D t < D H 0 H 1 bonitacja synów ogiera X nie różni się od całości testowanej stawki ogierków Copyright 010, Joanna Szyda
TEST KRUSKALA-WALLISA
TEST KRUSKALA-WALLISA - ZAKRES STOSOWANIA 1. Porównanie zmienności, różnice pomiędzy wieloma próbami danych. Dane ciągłe lub porządkowe (rangi) W. Kruskal 3. Dane nie mają rozkładu normalnego 4. Analiza wariancji W. Wallis Copyright 014, Joanna Szyda
TEST KRUSKALA-WALLISA 0-9 30-39 40-49 161.95 164.465 173.990 1. Wzrost dorosłych kobiet w USA. 3 przedziały wiekowe PRÓBA DANYCH 173.355 171.450 175.60 158.115 173.355 167.640 170.815 175.60 166.370 179.705 164.465 168.910 Copyright 013, Joanna Szyda
TEST KRUSKALA-WALLISA 1. Określenie hipotez H 0 i H 1 H 0 : wzrost jest jednakowy w każdym p. wiekowym H 1 : wzrost różni się w przedziałach wiekowych. Ustalenie poziomu istotności = 0.05 Copyright 013, Joanna Szyda
TEST KRUSKALA-WALLISA 3. Wybór i obliczenie wartości testu statystycznego N N R R i A H N A 1 ni Ri R ~ N A N N 1 i1 Liczba obserwacji Liczba grup Średni ranking obserwacji w grupie i Średni ranking wszystkich obserwacji 1 4. Określenie rozkładu testu Copyright 013, Joanna Szyda
TEST KRUSKALA-WALLISA 5. Porównanie z wartością krytyczną: max 0.0500 H 6.45 t 0.0398 6. Decyzja H 0 H 1 wzrost dorosłych kobiet różni się w poszczególnych przedziałach wieku Copyright 013, Joanna Szyda
TESTY NIEPARAMETRYCZNE CECHY CHARAKTERYSTYCZNE TESTÓW NIEPARAMETRYCZNYCH Wykorzystywanie rang Różnice między obserwacjami wyrażone jedynie kolejnością, a nie wartością rzeczywistą Stosujemy gdy obserwacje nie pochodzą z wymaganego rozkładu (najczęściej normalnego) Aby uzyskać wartość t transformujemy test żeby sprowadzić go do rozkładu normalnego N(0,1) Copyright 010, Joanna Szyda
Testy nieparametryczne 1. Test Manna-Whitneya. Test Wilcoxona 3. Test Kołmogorova 4. Test Kruskala-Wallisa