Wykład 10 Testy jednorodności rozkładów Wrocław, 16 maja 2018
Test Znaków test jednorodności rozkładów nieparametryczny odpowiednik testu t-studenta dla prób zależnych brak normalności rozkładów
Test Znaków Z = (X, Y ) wektor losowy, którego współrzędne X i Y są typu ciągłego, D = Y X - zmienna losowa o dystrybuancie F D. Niech ((X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n )) będzie ciągiem niezależnych par obserwacji, rozmiaru n oraz D i = Y i X i.
Test Znaków Z = (X, Y ) wektor losowy, którego współrzędne X i Y są typu ciągłego, D = Y X - zmienna losowa o dystrybuancie F D. Niech ((X 1, Y 1 ), (X 2, Y 2 ),..., (X n, Y n )) będzie ciągiem niezależnych par obserwacji, rozmiaru n oraz D i = Y i X i. Testujemy hipotezę: Przy możliwych alternatywach: H 0 : D = st D H 1 : D st D i D D H 2 : D st D i D D H 3 : D st D lub D st D i w obu przypadkach D D
Test Znaków Uwaga: Przy prawdziwości H 0 P(X i < Y i ) = 1 2 = P(X i > Y i ).
Test Znaków Uwaga: Przy prawdziwości H 0 P(X i < Y i ) = 1 2 = P(X i > Y i ). Statystyka testowa postaci S = n S i, gdzie S i = i=1 { 1, gdy Xi < Y i, 0, gdy X i Y i. przy prawdziwości H 0, ma rozkład dwumianowy b(n, 1 2 ).
Test Znaków Uwaga: Przy prawdziwości H 0 P(X i < Y i ) = 1 2 = P(X i > Y i ). Statystyka testowa postaci S = n S i, gdzie S i = i=1 { 1, gdy Xi < Y i, 0, gdy X i Y i. przy prawdziwości H 0, ma rozkład dwumianowy b(n, 1 2 ). Uwaga! W teście tym istotna jest wyłącznie liczba dodatnich i ujemnych różnic między kolejnymi parami wyników.
Test Znaków Uwaga: Przy prawdziwości H 0 P(X i < Y i ) = 1 2 = P(X i > Y i ). Statystyka testowa postaci S = n S i, gdzie S i = i=1 { 1, gdy Xi < Y i, 0, gdy X i Y i. przy prawdziwości H 0, ma rozkład dwumianowy b(n, 1 2 ). Uwaga! W teście tym istotna jest wyłącznie liczba dodatnich i ujemnych różnic między kolejnymi parami wyników. Statystyka testowa jest liczbą dodatnich wartości zmiennych losowych D i.
Test Znaków Obszar odrzucenia hipotezy zerowej Zbiór krytyczny przyjmuje postać (w zależności od alternatywy): C 1 : [0, b α (n, 1/2)] dla alternatywy H 1 C 2 : [b 1 α (n, 1/2), ) dla alternatywy H 2 C 3 : [0, b α/2 (n, 1/2)] [b 1 α/2 (n, 1/2), ) dla alternatywy H 3, gdzie b α (n, 1/2) oznacza kwantyl rzędu α z rozkładu dwumianowego B(n, 1/2)
Test Znaków Przy prawdziwości H 0, statystyka Z = 2 (S n/2) n ma asymptotycznie rozkład normalny N(0, 1).
Test Znaków Test znaków może być stosowany w przypadku rozkładów nieciągłych. Niech n 0 oznacza liczbę tych par (X i, Y i ), dla których D i = 0. Obszar krytyczny wyznacza się w oparciu o kwantyle rozkładu B(n n 0, 1/2). W przypadku dużych prób rozważamy statystykę testową: Z = 2S n n 0, n n0 która przy prawdziwości H 0 ma rozkład N(0, 1).
Przykład - cd Przykład 9.3 Testujemy hipotezę: Przy alternatywie: H 0 : D = st D H 1 : D st D i D D
Przykład - cd Przykład 9.3 Testujemy hipotezę: H 0 : D = st D Przy alternatywie: H 1 : D st D i D D Wektor różnic jest postaci: D = (6, 14, 2, 18, 15, 2, 10, 3, 24, 2)
Przykład - cd Przykład 9.3 Testujemy hipotezę: H 0 : D = st D Przy alternatywie: H 1 : D st D i D D Wektor różnic jest postaci: D = (6, 14, 2, 18, 15, 2, 10, 3, 24, 2) Patrząc wyłącznie na znaki mamy: (+, +, +,, +, +,,, +, +),
Przykład - cd Przykład 9.3 Testujemy hipotezę: H 0 : D = st D Przy alternatywie: H 1 : D st D i D D Wektor różnic jest postaci: D = (6, 14, 2, 18, 15, 2, 10, 3, 24, 2) Patrząc wyłącznie na znaki mamy: (+, +, +,, +, +,,, +, +), a stąd S = 10 i=1 S i = 7
Przykład 9.3 - cd Wartość statystyki testowej to S = 10 i=1 S i = 7.
Przykład 9.3 - cd Wartość statystyki testowej to S = Zbiór krytyczny jest postaci: 10 i=1 S i = 7. C : [b 1 α (10, 0.5), ) = [8, ), a zatem nie ma podstaw do odrzucenia hipotezy zerowej, firmie produkującej herbatę A nie opłaca się wprowadzanie jej na rynek.
Test medianowy test jednorodności rozkładów test dla prób niezależnych brak normalności rozkładów
Test medianowy Niech X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y m ) będą próbami losowymi, niezależnymi, pochodzącymi z dwóch populacji o rozkładach określonych przez dystrybuanty typu ciągłego oznaczanych przez F i G odpowiednio.
Test medianowy Niech X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y m ) będą próbami losowymi, niezależnymi, pochodzącymi z dwóch populacji o rozkładach określonych przez dystrybuanty typu ciągłego oznaczanych przez F i G odpowiednio. Testujemy hipotezę: Przy alternatywie: H 0 : F = st G H 1 : F st G i D D
Test medianowy Statystyka testowa jest postaci: W = m W j, gdzie W j = j=1 { 1, gdy Sj > n+m+1 2 0, gdy S j n+m+1 2 gdzie S j jest rangą elementu Y j w próbie połączonej. Statystyka W określa liczbę obserwacji z próby Y, które są większe od mediany.
Test Kołmogorowa - Smirnova Niech X = (X 1, X 2,, X n ) oraz Y = (Y 1, Y 2,, Y n ) oznaczają próby niezależne z populacji o rozkładach ciągłych oznaczonych przez F i G.
Test Kołmogorowa - Smirnova Niech X = (X 1, X 2,, X n ) oraz Y = (Y 1, Y 2,, Y n ) oznaczają próby niezależne z populacji o rozkładach ciągłych oznaczonych przez F i G. Testujemy hipotezę: H 0 : F (t) = G(t), H 1 : F (t) G(t), dla wszystkich t R dla co najmniej jednej wartości t R
Test Kołmogorowa - Smirnova Statystyka testowa jest postaci: D n,m = sup F n (t, X) G m (t, X) t R Odrzucamy H 0 przy dużych wartościach statystyki testowej, tj. obszarem odrzucenia H 0 jest zbiór C : [d α (n, m), 1]. Uwaga W tablicach podawane są wartości krytyczne d α (n, m) przemnożone przez nm
Test Kołmogorowa - Smirnova Asymptotycznie, ciąg dystrybuant: P ( ) nm n + m D n,m t K(t), gdzie K oznacza dystrybuantę rozkładu Kołmogorowa. [ ] Obszar odrzucenia H 0 jest wówczas postaci: n+m n m λ 1 α, 1, gdzie λ 1 α oznacza kwantyl rozkładu Kołmogorowa rzędu 1 α.
Przykład 10.1 Badając ścieralność dwóch różnych tkanin otrzymano wyniki: 27, 11, 16, 10, 17, 10, 30, 9, 29 dla pierwszej próbki a dla drugiej 14, 21, 7, 19, 30, 29, 11. Przetestować hipotezę, ze rozkłady ścieralności obu tkanin są identyczne wobec alternatywy, że się różnią.
Przykład 10.1 Badając ścieralność dwóch różnych tkanin otrzymano wyniki: 27, 11, 16, 10, 17, 10, 30, 9, 29 dla pierwszej próbki a dla drugiej 14, 21, 7, 19, 30, 29, 11. Przetestować hipotezę, ze rozkłady ścieralności obu tkanin są identyczne wobec alternatywy, że się różnią. Oznaczmy przez F i przez G. Testujemy hipotezę: H 0 : F (t) = G(t), H 1 : F (t) G(t), dla wszystkich t R dla co najmniej jednej wartości t R
Przykład 10.1 - c.d. liczności licz sk. t i p 1 p 2 p 1 p 2 F n (t i ) G m (t i ) F n (t i ) G m (t i ) 7 1 1 0 0.14 0.14 9 1 1 1 0.11 0.14 0.03 10 2 3 1 0.33 0.14 0.19 11 1 1 4 2 0.44 0.28 0.16 14 1 4 3 0.44 0.43 0.01 16 1 5 3 0.56 0.43 0.13 17 1 6 3 0.67 0.43 0.24 19 1 6 4 0.67 0.57 0.10 21 1 6 5 0.67 0.71 0.04 27 1 7 5 0.78 0.71 0.07 29 1 1 8 6 0.89 0.85 0.04 30 1 1 9 7 1 1 0
Przykład 10.1 - c.d. Statystyką testową jest maksymalna wartość z F n (t i ) G m (t i ), czyli D n,m = 0.24.
Przykład 10.1 - c.d. Statystyką testową jest maksymalna wartość z F n (t i ) G m (t i ), czyli D n,m = 0.24. Z tablic statystycznych mamy wartość iloczynu n m d α (n, m) = 7 9 d 0.01 (7, 9) = 49,
Przykład 10.1 - c.d. Statystyką testową jest maksymalna wartość z F n (t i ) G m (t i ), czyli D n,m = 0.24. Z tablic statystycznych mamy wartość iloczynu n m d α (n, m) = 7 9 d 0.01 (7, 9) = 49, a stąd zbiór krytyczny jest postaci: [0.78, 1],
Przykład 10.1 - c.d. Statystyką testową jest maksymalna wartość z F n (t i ) G m (t i ), czyli D n,m = 0.24. Z tablic statystycznych mamy wartość iloczynu n m d α (n, m) = 7 9 d 0.01 (7, 9) = 49, a stąd zbiór krytyczny jest postaci: [0.78, 1], stąd nie mamy podstaw do odrzucenia hipotezy zerowej.
Literatura: Bartoszewicz J.,Wykłady ze statystyki matematycznej, PWN, Warszawa 1989. Koronacki J. i Mielniczuk J., Statystyka, dla studentów kierunków technicznych i przyrodniczych, WNT, 2001 Krysicki W., Bartos J., Dyczka W., Krówlikowska K., Wasilewski M., Rachunek Prawdopodobieństwa i Statystyka Matematyczna w Zadaniach, część II, PWN, 2012 Magiera M, Modele i metody statystyki matematycznej, część II, wnioskowanie statystyczne, Wrocław, 2007