Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów oraz dla grup o małej liczebności.
Testy nieparametryczne Siła testów nieparametrycznych (1 minus wielkość błędu drugiego rodzaju) jest mniejsza niż siła testów parametrycznych.
Testy będące nieparametrycznymi odpowiednikami testu t-studenta Testy te służą do weryfikacji hipotezy, że dwie analizowane próby pochodzą z różnych populacji. Wymagają one założenia, że analizowane zmienne mogą być uporządkowane od wartości najmniejszej do wartości największej (tzn. są mierzone na skali porządkowej). Ich interpretacja jest taka sama, jak w przypadku testu t- Studenta dla prób niezależnych.
Testy będące nieparametrycznymi odpowiednikami testu t-studenta Można wyróżnić dwie grupy testów: 1. Do porównanie dwóch prób niezależnych (grup) 2. Do porównanie dwóch prób zależnych (zmiennych)
Testy do porównanie dwóch prób niezależnych test U Manna - Whitneya test serii Walda i Wolfowitza test dla dwóch prób Kołmogorowa i Smirnowa
Test U Manna i Whitneya Wśród testów nieparametrycznych ma największą moc.
Test Manna i Whitneya Stosujemy go w celu porównania dwóch grup danych, gdy: dane są mierzalne (ilościowe), ale ich rozkład zdecydowanie odbiega od rozkładu normalnego (czyli nie jest spełnione założenie testu t-studenta) dane są typu porządkowego - w tym przypadku hipoteza zerowa zakłada, że rozkłady danych w analizowanych grupach nie różnią się istotnie; dla danych porządkowych nie można bowiem obliczać wartości średniej, a prawidłową miarą tendencji centralnej jest mediana.
Test Manna i Whitneya (dla sumy rang) Punktem wyjścia w teście jest nadanie wynikom obserwacji rang. Rangowanie przeprowadza się następująco: 1. Porządkujemy rosnąco wartości obu prób. 2. Zaczynając od wartości najmniejszej (lub największej), przyporządkowujemy poszczególnym obserwacjom kolejne liczby naturalne. 3. W przypadku wystąpienia wartości jednakowych przyporządkowujemy im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno im się przypisać).
Wynik testu U - oznacza wartość testu dla małych liczebności (<20) Z - dla liczebności powyżej 20)
Przykład 2. Dane stężenie ozonu mierzone o godzinie 8 i 11. godz.8 12 12 13 15 12 14 12 14 12 17 17 15 godz.11 16 17 15 18 17 19 18 20 16 19 18 17
Chcemy zweryfikować hipotezę, że stężenie ozonu w obu grupach jest jednakowe. Hipoteza zerowa H 0 : m 1 =m 2 H 1 : m 1 m 2 Sprawdzamy założenia: normalność rozkładu - test W Shapiro i Wilka
Statystyki podstawowe i tabele - statystyki opisowe - zakładka Normalność Histogram: Stężenie godz.8 K-S d=.23653, p>.20; Lilliefors p<.10 Shapiro-Wilk W=.83447, p=.02373 5 4 Liczba obs. 3 2 1 0 11 12 13 14 15 16 17 X <= Granica klasy Ponieważ zmienna "stężenie ozonu o godz.8" nie ma rozkładu normalnego, nie możemy zastosować testu t-studenta.
Należy zmienić dane tak by w pierwszej kolumnie była zmienna grupująca tzn. Czas godzina stężenie 8 14 8 16 8 16 8 15 8 14 8 17 8 16 8 14 8 15 8 14 8 16 8 16 11 16 11 19 11 15
Testy nieparametryczne Wybieramy Statystyki Statystyki nieparametryczne Porównanie dwóch prób niezależnych (grup)
Test Manna i Whitneya U oznacza wartość testu dla małych liczebności (<20) Z - dla liczebności powyżej 20) Poziom prawdopodobieństwa p dla testu =0.00038 < =0,05 Wniosek: Na poziomie istotności = 0.00038 można odrzucić hipotezę zerową o takim samym stężeniu ozonu o godz.8 i 11.
Test Walda i Wolfowitza Hipoteza zerowa zakłada, że dwie próby pochodzą z tej samej populacji.
Test serii Walda i Wolfowitza Konstrukcja testu: 1. Porządkujemy dane według zmiennej, wedle której należy je porównać między sobą. Podobnie jak w teście serii wyodrębniamy serie Jeżeli nie ma różnic pomiędzy zmiennymi, wówczas liczba i długość takich sąsiadujących ze sobą serii będzie się układać w mniejszym lub większym stopniu w sposób losowy.
Test Walda i Wolfowitza Interpretacja testu polega na porównaniu wartości p z poziomem istotności.
Wyniki testu Walda- Przykład 1. Wolfowitza Ponieważ różnią się od wyników testu U M-W, bierzemy pod uwagę tylko test M-W.
Przykład 2. (ozon). Test serii Walda-Wolfowitza Z - wartość testu Walda i Wolfowitza, gdy liczebność obu grup jest >20 [6] poziom istotności wyliczony dla wartości testu [5] [7] wartość testu skorygowanego, stosowanego dla małych liczebności (<20) [8] poziom istotności dla testu poprawionego Wniosek: Hipotezę zerową należy odrzucić.
Testy nieparametryczne dla prób zależnych Testy te są przeznaczone do sprawdzania istotności różnic między dwoma zależnymi pomiarami Są to: test znaków test kolejności par Wilcoxona
Testy nieparametryczne dla prób zależnych Testy te stosujemy również wtedy, gdy nie są spełnione założenia testu t dla zmiennych powiązanych. Testy te wymagają jedynie założenia, że wartości badanych zmiennych możemy uporządkować (są mierzalne w skali porządkowej).
Test znaków oparty jest na znakach różnic między kolejnymi parami wyników (czy są ujemne, czy dodatnie). Test polega na ustaleniu liczby plusów i minusów oraz porównaniu ich z wartością teoretyczną podaną w odpowiednich tablicach.
Test znaków Test ten stosujemy więc przede wszystkim dla cech jakościowych. Wystarczy bowiem sprawdzić, że dana jednostka charakteryzuje się obecnością ("+") lub nieobecnością ("-") danego zjawiska. Dla danych mierzalnych nie uwzględniamy wartości różnic, lecz jedynie ich znaki. Różnice o wartości zero są pomijane.
Test Wilcoxona Test kolejności par Wilcoxona uwzględnia znak różnic, ich wielkość, jak również ich kolejność. Jest mocniejszy od testu znaków.
Test Wilcoxona W teście tym, po uporządkowaniu różnic w szereg rosnący przypisuje się im rangi. Następnie osobno sumuje się rangi różnic dodatnich i ujemnych. Mniejsza z otrzymanych sum to wartość testu Wilcoxona, która po porównaniu z odpowiednią wartością teoretyczną w tablicach decyduje o odrzuceniu hipotezy zerowej lub nie.
Testy nieparametryczne dla prób zależnych Uruchomienie Statystyka - Testy nieparametryczne Porównanie dwóch prób zależnych
Test znaków
[1] - liczebność grup [2] - wartość testu Wilcoxona dla grup n =<25 [3] - wartość testu Wilcoxona dla grup n >25 [4] - poziom istotności dla testu Wilcoxona
ANOVA nieparametryczna Do nieparametrycznych odpowiedników analizy wariancji zaliczamy: test ANOVA rang Kruskala-Wallisa test ANOVA Friedmana
Test Kruskala-Wallisa Jest nieparametrycznym odpowiednikiem jednoczynnikowej analizy wariancji. Za pomocą tego testu sprawdzamy czy n niezależnych próbek pochodzi z tej samej populacji, czy z populacji z taką samą medianą. Poszczególne próbki nie muszą mieć takiej samej liczebności. Maksymalnie możemy porównywać 10 grup.
Test Kruskala-Wallisa Danymi wejściowymi jest n-elementowa próba statystyczna podzielona na k rozłącznych grup o licznościach n 1,..., n k. Zakłada się, że każda grupa jest losowana z innej populacji. Wykonywane jest rangowanie całej próby. (połączone wszystkie grupy).
Wyniki
Test Friedmana Jest nieparametrycznym odpowiednikiem jednoczynnikowej analizy wariancji dla pomiarów powtarzanych. Uważany jest za najlepszy nieparametryczny test dla danych tego rodzaju.
Test parametryczny Test nieparametryczny Test t Studenta dla prób niezależnych Test U Manna Whitneya Test serii Walda i Wolfowitza Test t Studenta dla prób zależnych Jednoczynnikowa analiza wariancji Test znaków rangowanych Wilcoxona Test znaków Test H Kruskala Wallisa Analiza wariancji z powtarzanymi pomiarami Test Friedmanna
Zadanie. Należy sprawdzić czy rzeki województwa śląskiego są bardziej zanieczyszczone od rzek województwa mazowieckiego. Jakim testem przeprowadzisz analizę statystyczną wiedząc, że stan zanieczyszczenia rzek wg wskaźników fizyko-chemicznych podawany jest w skali: Klasa 1 = niski, Klasa 2 = średni, Klasa 3 = wysoki testem U Manna Whitneya testem znaków rangowanych Wilcoxona testem t dla prób zależnych testem t dla prób niezależnych
Chcąc sprawdzić czy rozkład badanej zmiennej odbiega od rozkładu normalnego użyjemy testu: a) Kruskala Wallisa b) Friedmana c) Kołmogorowa Smirnowa