Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa Test serii (test Walda-Wolfowitza) Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane ciągi danych statystycznych... oraz y1 y... ym łączymy je w jeden x 1 x x n ciąg uporządkowany niemalejąco. W otrzymanym ciągu elementom z pierwszej sekwencji przyporządkowujemy 0 a elementom z drugiej sekwencji przyporządkowujemy 1. Obliczamy liczbę serii w otrzymanym ciągu zerojedynkowym. 1
Rozpatrujemy hipotezy: H 0 (pobrane próbki pochodzą z populacji o tym samym rozkładzie), H 1 (pobrane próbki pochodzą z populacji o różnych rozkładach),
Serie to podciągi złożone z jednakowych symboli. Stosujemy statystykę: U n,m = liczba serii Zbiór krytyczny: K = (-; k> gdzie k odczytujemy z tablicy rozkładu serii dla poziomu istotności i liczb n, m. Decyzje: Jeśli Jeśli u n m u n m, K to H 0 odrzucamy,, K to nie ma podstaw do odrzucenia H 0. 3
Uwaga. Gdy n i m są większe od 0, to statystyka U n,m ma w przybliżeniu rozkład nmnm n m n m n m nm N 1; n m 1 W naszym przypadku skorzystamy z powyższej uwagi i dla pobranej próby obliczamy wartość u * u nmnm n m n m n m 1 n, m Statystyka ta ma rozkład N(0, 1) Zbiór krytyczny: nm 1 n m K = (-; -k> gdzie k odczytujemy z tablicy dystrybuanty N(0, 1) dla poziomu istotności (k ) 1. 4
TEST MEDIANY Mamy dwa uporządkowane ciągi danych statystycznych... oraz y1 y... ym (n m), łączymy je w x 1 x x n jeden ciąg uporządkowany niemalejąco i wyznaczamy medianę m e. Rozpatrujemy hipotezy: H 0 (pobrane próbki pochodzą z populacji o tym samym rozkładzie), H 1 (pobrane próbki pochodzą z populacji o różnych rozkładach), 5
Tworzymy tablicę: X Y n i >m e n 11 n 1 n 1 m e n 1 n n n j n 1 n n+m 6
Na podstawie próby obliczamy wartość statystyki (*) u n n ij nˆ i1 j1 ij nˆ ij (rozpatrywana statystyka ma rozkład Y 1 ) gdzie nˆ ij ni n j (suma i tego wiersza) (suma j tej kolumny) n m liczebność próby 7
- poziom istotności. Zbiór krytyczny ma postać K k ; ) ; gdzie P ( Y 1 k) = Jeśli un K to H 0 odrzucamy, w przeciwnym przypadku nie ma podstaw do odrzucenia H 0. 8
Uwaga. Dla tablicy korelacyjnej 1 1 A B A+B C D C+D A+C B+D n+m Statystyka U n ma postać: U n ( n m)( AD BC) ( A B)( A C)( B D)( C D) i ma rozkład Y 1. 9
Test Wilcoxona Założenie. Rozpatrywane rozkłady są ciągłe. Mamy dwa uporządkowane ciągi danych statystycznych... oraz y1 y... ym (n m), łączymy je w x 1 x x n jeden ciąg uporządkowany niemalejąco i nadajemy rangi. Rozpatrujemy hipotezy: H 0 (pobrane próbki pochodzą z populacji o tym samym rozkładzie), H 1 (pobrane próbki pochodzą z populacji o różnych rozkładach), 10
Stosujemy statystykę: Zbiór krytyczny: U = suma rang elementów z I próbki K = (-; k 1 > < k ; ) gdzie k 1, k odczytujemy z tablicy rozkładu sumy rang dla poziomu istotności i liczb n oraz m, Decyzje: Jeśli Jeśli u K to H 0 odrzucamy, u K to nie ma podstaw do odrzucenia H 0. 11
Uwaga. Gdy n i m są większe od 10, to suma rang elementów z I próbki ma w przybliżeniu rozkład n( n m 1) nm n m 1 N ; 1 W naszym przypadku skorzystamy z powyższej uwagi i dla pobranej próby obliczamy wartość u * n( n m 1) u nm( n m 1) 1 * statystyki U, gdzie u jest wartością zmiennej losowej U (suma rang elementów z I próbki). Zbiór krytyczny: K = (-; -k> < k ; ) gdzie k odczytujemy z tablicy dystrybuanty rozkładu N(0, 1) ( k) 1. 1
Uwaga o decyzji. Wyznaczamy liczbę ˆ (krytyczny poziom istotności) * ˆ spełniającą równość P X u n, gdzie X ~ N(0, 1). Podejmujemy decyzję: nie ma podstaw do odrzucenia hipotezy H 0, gdy ˆ jest istotnie większe od zera (standardowo większe od 0,05) odrzucamy hipotezę H 0, gdy ˆ jest bliskie zeru. 13
Test (sumy rang) Kruskala-Wallisa Jest to uogólnienie testu Wilcoxona. Założenie. Rozpatrywane rozkłady są ciągłe. Rozpatrujemy m cech w m populacjach o rozkładach wyznaczonych przez dystrybuanty F 1, F,..., F m. Mamy m ciągów danych statystycznych o liczebnościach n i, (n 1 + n +... + n m = n), łączymy je w jeden ciąg uporządkowany niemalejąco i nadajemy rangi. Rozpatrujemy hipotezy: H 0 (F 1 = F =... = F m ), H 1 (co najmniej dwie cechy mają różne rozkłady), 14
Niech T i - suma rang w poszczególnych próbach. Stosujemy statystykę: u 1 n( n 1) m i1 T n i i 3( n 1) dla n i 0 rozpatrywana statystyka ma rozkład Y m-1. Zbiór krytyczny: K = <k ; ) Decyzje: Jeśli Jeśli u K to H 0 odrzucamy, u K to nie ma podstaw do odrzucenia H 0. 15