TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe miały rozkład normalny. Jeżeli wielkość próby jest mała, to znaczenie tego założenia dla poprawności testu (pytanie: co w tym przypadku oznacza określenie poprawność testu?) jest duże.

Testy Manna-Whitney a oraz Kruskala-Wallisa stanowią, odpowiednio, alternatywę dla testu równości dwóch średnich wykorzystującego statystykę t oraz ANOVA. Ich istotą jest porównywanie rang zmiennych zamiast porównań ich wartości. Jednym z celów tego zabiegu jest osłabienie wpływu wartości nietypowych na wynik oraz uniezależnienie tego wyniku od typu rozkładu badanych zmiennych. W obu testach hipoteza zerowa mówi o identyczności porównywanych rozkładów, przy założeniu jednorodności wariancji (podobnie jak w przypadku testów t i ANOVA). Formalnie, są to zatem testy nieparametryczne, jednak w przypadku gdy wariancja i wartość oczekiwana jednoznacznie definiują rozkład, to można je również uznać ze testy równości średnich.

Test Manna-Whitney a Służy on do weryfikacji hipotezy o zgodności rozkładów w dwóch porównywanych populacjach, przy założeniu równości ich wariancji. Po wylosowaniu dwóch niezależnych prób łączymy je w jedną, nadając im rangi w ten sposób aby najmniejsza wartość miała rangę 1. Konstrukcja statystyki testowej opiera się na następującym rozumowaniu: jeżeli rozkłady w obydwu populacjach są jednakowe, to rangi obserwacji pochodzących tylko z jednej próby są próbą losową pobrana z próby połączonej. Tym samym, średnia ranga tych obserwacji nie powinna znacznie odbiegać od średniej rangi dla próby połączonej.

Jeżeli hipoteza zerowa (mówiąca o identyczności rozkładów) jest prawdziwa, to wartość oczekiwana sumy rang elementów pierwszej próby (T) jest równa: m T n 1( n1 2 n 2 gdzie n 1 i n 2 oznaczają liczebności obu prób. 1)

Suma rang T jest statystyką testową i jeżeli jej wartość znacznie odbiega od m T, to H 0 należy odrzucić. Wartości krytyczne wyznacza się za pomocą specjalnych tablic, np.: http://www.watpon.com/table/wilcoxonmannwhitney.pdf Podają one minimalną wartość T jeżeli wartość wyznaczona dla pierwszej próby jest mniejsza. W przypadku gdy jest większa należy obliczyć T dla drugiej próby lub skorzystać z tablic podających również wartość maksymalną i wyznaczyć prawostronny obszar krytyczny. Jeżeli liczebności obu prób są jednakowe, to test Manna-Whitney a (z 1947 r.) jest tożsamy z testem opracowanym dwa lata wcześniejszym przez Wilcoxona. We współczesnej literaturze nazwy tych testów są stosowane wymiennie.

Przykład: Zmienna X1 rangi 1 Zmienna X2 rangi 2 1 10 1 15 2 2 20 4 18 3 3 30 6 25 5 4 40 7 45 8 5 60 11 55 9 6-56 10 Średnia 32 35,7 - Wariancja 370-345,5 - Suma (T) - 29 - - Przy liczebnościach prób 5 i 6 (kolejność nie ma znaczenia przy korzystaniu z tablic) wartość krytyczna wynosi 19. Ponieważ statystyka testowa T jest wyższa, to nie ma podstaw do odrzucenia hipotezy zerowej przy żadnym akceptowalnym poziomie istotności. Tym samym, nie ma powodów aby uznać, że próby zostały wylosowane z populacji o różnych rozkładach.

Test Kruskala-Wallisa Test ten jest uogólnieniem testu Manna-Whitney a do przypadku porównań więcej niż dwóch populacji i może być traktowany jako nieparametryczna alternatywa dla analizy wariancji. Hipoteza zerowa mówi o zgodności wszystkich rozkładów. Podobnie jak w przypadku testu Manna-Whitney a, należy utworzyć połączoną próbę i wszystkim jej elementom nadać rangi.

Statystyka testu Kruskala-Wallisa ma następującą postać: H 12 N( N 1) r i1 2 i T n i 3( N 1) gdzie n i oraz T i oznaczają, odpowiednio, liczebność i-tej próby i sumę rang pochodzących z i-tej próby w łącznej próbie (i = 1, 2,..., r), N jest liczebnością próby łącznej. Statystyka H ma rozkład χ 2 o r -1 stopniach swobody (r oznacza liczbę porównywanych populacji).

2. Test serii Test serii jest testem losowości rozumianej dwojako. Hipoteza zerowa może mówić, że: a/ elementy znajdujące się w dwóch próbach zostały wylosowane z tej samej populacji, b/ elementy znajdujące się w próbie znalazły się w niej w wyniku niezależnego losowania. Pierwszy rodzaj testu ma zastosowanie m. in. w eksperymentach mających na celu porównanie skuteczności dwóch metod postępowania (np. stosowania leków, środków ochrony roślin itp.). Drugi rodzaj testu ma m. in. zastosowanie w weryfikacji hipotezy o autokorelacji w modelu regresji.

Zastosowanie testu serii w weryfikacji hipotez na temat reszt modelu regresji polega na badaniu liczby serii znaków reszt modelu. Jeżeli reszty są wynikiem niezależnego losowania, to liczba serii nie powinna być ani zbyt mała, ani zbyt duża. Ewentualna ich losowość wynika z faktu iż wartości zmiennej objaśnianej (y i ) są traktowane jako wynik losowania z populacji o wartości oczekiwanej αx i + β i wariancji σ 2, losowe więc są także różnice między y i oraz αx i + β. Jeżeli wartości zmiennej objaśniającej są nielosowe lub losowane niezależnie (najczęściej przyjmowane założenia), to losowość reszt powinna objawiać się m. in. właściwą liczbą serii. Test serii pozwala zatem zweryfikować hipotezę mówiącą, że reszty są losowane z niezależnych populacji. Ergo, test serii może być użyty jako test autokorelacji reszt. Zbyt duża liczba serii wskazuje na autokorelację ujemną, zbyt mała na dodatnią.

3. Test Kołmogorowa-Smirnowa Test ten jest jednym z testów zgodności. Hipoteza zerowa mówi, iż dany rozkład empiryczny jest zgodny z założonym rozkładem teoretycznym o ciągłej funkcji prawdopodobieństwa. Statystyka testowa jest rosnąca funkcją maksymalnej odległości miedzy dystrybuantą empiryczną oraz teoretyczną i ma rozkład Kołmogorowa (λ). Ma ona następująca postać: D sup Fn ( x) F0 ( X ) X n gdzie F n (x) i F 0 (x) oznaczają, odpowiednio, dystrybuantę empiryczną i teoretyczną zaś n jest liczbnościa próby. Statystyka D ma rozkład Kołmogorowa, który jest stablicowany. Przekroczenie wartości krytycznej stanowi podstawę do odrzucenia hipotezy zerowej, mówiącej, że rzeczywista dystrybuanta jest określona przez funkcję F 0.