Test t-studenta dla jednej średniej Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a 0 (a = a 0 ). Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest różna od określonej wartości a 0 (a a 0 ). Hipoteza alternatywna.: Średnia wartość zmiennej w populacji jest mniejsza od określonej wartości a 0 (a < a 0 ). Hipoteza alternatywna 3.: Średnia wartość zmiennej w populacji jest większa od określonej wartości a 0 (a > a 0 ). Założenia: Zmienna ma rozkład normalny o nieznanej wariancji σ. T n = n x a 0 s ma rozkład t-studenta z n 1 stopniami swobody (dla dużych n (n 30) rozkład ten jest zbliżony do standardowego rozkładu normalnego). Obszar krytyczny 1.: K = (, t n 1 1 α/ ) (tn 1 1 α/, + ) Obszar krytyczny.: K = (, t1 α) n 1 Obszar krytyczny 3.: K = (t n 1 1 α, + ) gdzie t n 1 1 α jest kwantylem rzędu 1 α rozkładu t-studenta z n 1 stopniami swobody. p-wartość 1.: α = (1 F n 1 ( T n )) p-wartość. i 3.: α = 1 F n 1 ( T n ) gdzie F n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. Ponieważ przy n, niezależnie od wyjściowego rozkładu badanej zmiennej, statystyka T n ma standardowy rozkład normalny i jest to rozkład graniczny rozkładu t-studenta, to test t-studenta może być stosowany dla zmiennych o dowolnym rozkładzie (dla którego istnieje wariancja), jeśli tylko próba jest dość liczna (n 30 i rozkład jest w przybliżeniu jednomodalny i symetryczny lub n 40, gdy rozkład jest wyraźnie skośny [3], choć czasami podawany jest warunek n 5 [7]). W próbie nie powinny występować wartości odstające. W przypadku rozkładu dwupunktowego, tj. zmiennej losowej X, która przyjmuje wartości 1 i 0 z prawdopodobieństwami odpowiednio p i 1 p, wartość średnia wynosi EX = 1 p + 0 (1 p) = p, jest więc równa prawdopodobieństwu wystąpienia 1. Oznacza to, że testem t-studenta można testować hipotezę dotyczącą odsetka elementów 1
populacji posiadających pewną własność. Zaleca się stosować ten test, jeśli nˆp 5 i n(1 ˆp) 5 (gdzie ˆp oznacza prawdopodobieństwo obserwowane), czyli liczba elementów, które mają pewną własność i liczba tych, które jej nie mają, wynoszą co najmniej 5. [3] Test t-studenta dla dwóch średnich i prób niezależnych Hipoteza zerowa: Średnie wartości zmiennej są takie same w dwóch różnych populacjach (a 1 = a ). Hipoteza alternatywna 1.: Średnie wartości zmiennej są różne w badanych populacjach (a 1 a ). Hipoteza alternatywna.: Średnia wartość zmiennej w pierwszej populacji jest mniejsza od średniej wartości zmiennej w drugiej populacji (a 1 < a ). Hipoteza alternatywna 3.: Średnia wartość zmiennej w pierwszej populacji jest większa od średniej wartości zmiennej w drugiej populacji (a 1 > a ). Założenia: Zmienna ma w obu populacjach rozkład normalny o nieznanych wariancjach. a) Zmienna ma w obu populacjach rozkład normalny o nieznanych, ale równych wariancjach. T n = x 1 x (n1 1)s 1 + (n 1)s n 1 + n n1 + n n 1 n ma rozkład t-studenta z n 1 + n stopniami swobody. Obszar krytyczny 1.: K = (, t n 1+n 1 α/ Obszar krytyczny.: K = (, t n 1+n 1 α ) Obszar krytyczny 3.: K = (t n 1+n 1 α, + ) ) (t n 1+n, + ) 1 α/ gdzie t n 1+n 1 α oznacza kwantyl rzędu 1 α z rozkładu t-studenta z n 1 + n stopniami swobody. p-wartość 1.: α = (1 F n 1+n ( T n )) p-wartość. i 3.: α = 1 F n 1+n ( T n ) gdzie F n 1+n jest dystrybuantą rozkładu t-studenta z n 1 + n stopniami swobody.
b) Zmienna ma w obu populacjach rozkład normalny o nieznanych i różnych wariancjach. (statystyka Cochrana i Coxa). C n = x 1 x s 1 n 1 + s n Obszar krytyczny 1.: K = (, c n 1,n 1 α/ ) (cn 1,n 1 α/, + ) Obszar krytyczny.: K = (, c n 1,n 1 α ) Obszar krytyczny 3.: K = (c n 1,n 1 α, + ) gdzie c n 1,n 1 α ( ) ( ) s 1 t n 1 1 1 α + s t n 1 s 1 α : 1 + s. n 1 n n 1 n Test t-studenta dla dwóch średnich i prób niezależnych może być również używany w przypadku zmiennej, która nie posiada w badanych populacjach rozkładu normalnego. Wymagana jest wówczas duża liczebność obu prób (co najmniej po 30 obserwacji), symetria i brak obserwacji odstających. W idealnych warunkach obiekty powinny być losowo przypisane do dwóch grup, tak aby każda różnica ich reakcji była wynikiem oddziaływania (lub braku oddziaływania) tylko jednego czynnika. Nie jest tak w przypadku porównywania średniego dochodu mężczyzn i kobiet. Płeć badanych nie jest przypisywana losowo. W takich przypadkach należy zadbać o to, żeby różnice innych czynników nie pomniejszały, ani nie powiększały, znaczącej różnicy średnich. Na różnice średniego dochodu mogą mieć także wpływ takie czynniki jak wykształcenie (a nie tylko płeć). [Pomoc IBM SPSS Statistics] Test t-studenta dla dwóch średnich i prób zależnych Hipoteza zerowa: Dwie zmienne zależne mają jednakowe średnie (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią równą 0). Hipoteza alternatywna 1.: Zmienne zależne mają różne średnie (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią różną od 0). 3
Hipoteza alternatywna.: Pierwsza ze zmiennych ma średnią mniejszą niż druga (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią ujemną). Hipoteza alternatywna 3.: Pierwsza ze zmiennych ma średnią większą niż druga (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią dodatnią). T n = d s d n ma rozkład t-studenta z n 1 stopniami swobody. Obszar krytyczny 1.: K = (, t n 1 1 α/ ) (tn 1 1 α/, + ) Obszar krytyczny.: K = (, t1 α) n 1 Obszar krytyczny 3.: K = (t n 1 1 α, + ) gdzie t n 1 1 α jest kwantylem rzędu 1 α rozkładu t-studenta z n 1 stopniami swobody. p-wartość 1.: α = (1 F n 1 ( T n )) p-wartość. i 3.: α = 1 F n 1 ( T n ) gdzie F n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. Ponieważ test ten jest w praktyce testem t-studenta dla jednej średniej (dla zmiennej D = X Y ), to należy sprawdzić, czy różnica zmiennych spełnia wymagania testu dla jednej średniej, tj. ma rozkład normalny lub ma rozkład odbiegający od normalnego (ale bez wartości odstających), ale liczebność próby jest odpowiednio duża. Test chi-kwadrat zgodności Założenia: Zmienna ma rozkład dyskretny, przyjmuje tylko wartości l 1,..., l k z prawdopodobieństwami odpowiednio p 1,..., p k, które nie są znane. Hipoteza zerowa: Zmienna ma rozkład dyskretny z określonymi prawdopodobieństwami p 0 1,..., p 0 k. Hipoteza alternatywna: Zmienna ma rozkład z innymi prawdopodobieństwami niż zadane. k χ (n i n 0 i ) = i=1 n 0 i k (n i np 0 i ) =, i=1 np 0 i gdzie n i oznaczają liczebności obserwowane, n 0 i oczekiwane, ma w przybliżeniu rozkład chi-kwadrat z k 1 stopniami swobody. Obszar krytyczny: K = (u k 1 1 α, + ), 4
gdzie u k 1 1 α oznacza kwantyl rzędu 1 α rozkładu chi-kwadrat z k 1 stopniami swobody. p-wartość: α = 1 F k 1 χ (χ ), gdzie F k 1 χ jest dystrybuantą rozkładu chi-kwadrat z k 1 stopniami swobody. Jeżeli rozkład teoretyczny zależy od d nieznanych parametrów, to parametry te wyznaczamy metodą największej wiarogodności, a liczbę stopni swobody zmniejszamy o d. Statystyka χ ma tylko w przybliżeniu (asymptotycznie) rozkład chikwadrat. Przybliżenie rozkładem chi-kwadrat uznajemy za dopuszczalne, gdy np 0 i 5, i = 1,..., k, a za dobre, gdy np 0 i 10, i = 1,..., k. Jeśli liczba kategorii jest duża (> 6), to zgadzamy się stosować przybliżenie rozkładem chi-kwadrat także wtedy, gdy dla jednej lub dwóch kategorii 1 np 0 i < 5 [3]. Mało liczne kategorie można również łączyć z kategoriami sąsiednimi, redukując wówczas odpowiednio liczbę stopni swobody. W przypadku zmiennej o rozkładzie z ciągłą dystrybuantą dane grupujemy w k (10k n) klas. Prawdopodobieństwa teoretyczne wyliczamy z dystrybuanty. Klasy staramy się dobrać tak, aby prawdopodobieństwa znalezienia się w klasie były równe 1/k, a liczebności teoretyczne były co najmniej równe 5. Testujemy wówczas hipotezę zerową: Zmienna ma rozkład o podanej dystrybuancie. Łatwo zauważyć, że testowanie zgodności z zadanym rozkładem ciągłym za pomocą testu chi-kwadrat jest przedsięwzięciem kontrowersyjnym, ponieważ punktem wyjścia do konstrukcji testu jest świadoma utrata informacji związana z koniecznością dokonania dyskretyzacji. Dlatego, gdy mamy do czynienia z rozkładem ciągłym, powinniśmy unikać stosowania tego testu [...] Dopiero, gdy próba losowa jest bardzo liczna i histogram sporządzony na jej podstawie przypomina gładki rozkład ciągły, zastosowanie testu chi-kwadrat przestaje być ryzykowne. Inna sprawa, że test ten może być jedynym dającym się zastosować w danej konkretnej sytuacji. Tak jest np. wtedy, gdy dane, którymi dysponujemy, pochodzą wprawdzie z rozkładu ciągłego, ale są już zdyskretyzowane. [3, str. 37] Jeśli założenia testu nie są spełnione, można wykonać tzw. test dokładny, który nie korzysta z rozkładu granicznego statystyki testowej tylko z jej właściwego rozkładu. 5
Test chi-kwadrat niezależności Hipoteza zerowa: Zmienne losowe X i Y są niezależne. Hipoteza alternatywna: X i Y są zależne. Założenia: Cechy X, Y są jakościowe (nominalne lub o wartościach uporządkowanych). gdzie k r χ (n ij n 0 = ij), j=1 i=1 n 0 ij r liczba kategorii zmiennej X (liczba wierszy w tablicy kontyngencji), k liczba kategorii zmiennej Y (liczba kolumn w tablicy kontyngencji), n ij liczba wystąpień w próbie par obserwacji (x i, y j ), k r n ij n ij n 0 j=1 i=1 ij =, n r k n = n ij. i=1 j=1 Dla zmiennych X i Y przyjmujących tylko po wartości stosuje się statystykę k r χ ( n ij n 0 = ij 1/), j=1 i=1 n 0 ij co zawiera tzw. poprawkę Yatesa na ciągłość poprawiającą jakość przybliżenia. [6] Obszar krytyczny: K = (u (r 1)(k 1) 1 α, + ), gdzie u (r 1)(k 1) 1 α jest kwantylem rzędu 1 α rozkładu chi-kwadrat z (r 1)(k 1) stopniami swobody. p-wartość: α = 1 F (r 1)(k 1) χ (χ ), gdzie F (r 1)(k 1) χ jest dystrybuantą rozkładu chi-kwadrat z (r 1)(k 1) stopniami swobody. Podobnie jak w teście chi-kwadrat zgodności, przybliżenie statystyki testowej rozkładem chi-kwadrat stosujemy, gdy liczebności teoretyczne prób w wierszach (kolumnach) są stosunkowo duże (n 0 ij 5). 6
Gdy tablica kontyngencji ma rozmiar i liczebności próby w wierszach (kolumnach) są zbyt małe, można oprzeć się na tzw. dokładnym teście Fishera. W przypadku pary cech o uporządkowanych kategoriach test niezależności może okazać się zwodniczy. Może wówczas zajść potrzeba wprowadzenia odpowiedniej miary zależności między cechami. Miara gamma miara zależności monotonicznej, dodatniej, gdy γ > 0 i ujemnej, gdy γ < 0. Zasadniczo γ [ 1, 1]. p-wartość podawana przy tym współczynniku dotyczy testu hipotezy zerowej o niezależności zmiennych przy hipotezie alternatywnej orzekającej ich dodatnią (lub ujemną) zależność. d Sommersa i τ b Kendalla używane, gdy liczba par związanych jest duża. Test Kołmogorowa Hipoteza zerowa: Zmienna ma rozkład o zadanej dystrybuancie F. Hipoteza alternatywna: Zmienna ma rozkład o innej niż zadana dystrybuancie. D n = max{d n +, Dn } gdzie D n + i = max 1 i n n F (x (i)), D n = max 1 i n F (x (i) ) i 1 n Obszar krytyczny: (d n (1 α), 1] odczytujemy z tablic kwantyli statystyki Kołmogorowa, jest to taka wartość, dla której P (D n d n (1 α)) = α). W przypadku danych zgrupowanych w klasy bierzemy pod uwagę prawy koniec każdej z klas i zamiast podanych statystyk wyznaczamy wartość maksymalną statystyki F n (x i ) F (x i ), gdzie F n jest dystrybuantą empiryczną. Dla dużych prób (n > 100) używa się statystyki nd n, a obszar krytyczny wyznacza, używając kwantyli granicznego rozkładu Kołmogorowa. W przypadku testowania zgodności z rozkładem normalnym zaleca się stosowanie testu Kołmogorowa z poziomem istotności Lillieforsa oraz testu Shapiro-Wilka (najbardziej polecany dla prób o liczebności nieprzekraczającej 000). 7
Test Wilcoxona znakowanych rang Założenia: Dysponujemy ciągiem par obserwacji: (X 1, Y 1 ),..., (X n, Y n ). Pary zmiennych losowych są niezależne, natomiast X i, Y i mogą być zależne. Definiujemy niezależne różnice Z i = Y i X i, i = 1..., n. Każda zmienna Z i, i = 1,..., n pochodzi z tego samego rozkładu ciągłego o dystrybuancie F i, symetrycznego względem wspólnej mediany θ (może być ona interpretowana jako efekt kuracji ). Hipoteza zerowa: θ = 0 (brak efektu kuracji ) Hipoteza alternatywna 1.: θ 0 (jest jakiś efekt kuracji ). Hipoteza alternatywna.: θ > 0 ( efekt kuracji jest dodatni). Hipoteza alternatywna 3.: θ < 0 ( efekt kuracji jest ujemny). Jest to statystyka znakowanych rang Wilcoxona, czyli suma rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim: T + = Z i >0 r( Z i ), gdzie r( Z i ) ranga Z i, i = 1,...(, n, (r(x i ) = j {1,...], n} X i = X j:n ). n(n + 1) Obszar krytyczny 1.: K =, w 1 α/ [ w 1 α/, ), Obszar krytyczny.: K = ([w 1 α, + ) ] n(n + 1) Obszar krytyczny 3.: K =, w 1 α gdzie w a jest kwantylem rozkładu statystyki znakowanych rang Wilcoxona (przy założeniu prawdziwości hipotezy zerowej) rzędu a (w tablicach). Test znakowanych rang Wilcoxona jest nieparametryczną alternatywą dla testu t-studenta w przypadku dwóch próbek dających się połączyć w pary. Różnica między tymi testami jest taka, że test t-studenta testuje równość średnich arytmetycznych, a test Wilcoxona testuje mediany. Test Wilcoxona nie wymaga założeń dotyczących rozkładu próby, może być więc używany, gdy założenia testu t-studenta nie są spełnione. Test dla jednej próby jest odpowiednikiem testu dla dwóch prób, w którym drugą z prób zastąpiono stałą równą wartości testowanej mediany. Jeżeli n jest duże (w praktyce dla n 5), stosuje się tzw. test asymptotyczny, tj. używa się statystyki testowej postaci T = T + n(n+1) 4 n(n + 1)(n + 1)/4, 8
i obszarów krytycznych Obszar krytyczny 1.: K = (, z 1 α/ ] [ z1 α/, ) Obszar krytyczny.: K = [z 1 α, + ) Obszar krytyczny 3.: K = (, z 1 α ] gdzie z 1 α jest kwantylem rzędu 1 α standardowego rozkładu normalnego. W praktyce (w wyniku zaokrąglania) mogą pojawić się tzw. węzły, czyli grupy obserwacji o jednakowej wartości bezwzględnej. Postępowanie w przypadku, gdy 1. n < 5 - odrzucamy wszystkie Z i takie, że Z i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test dokładny ze zmodyfikowanymi rangami;. n 5 - odrzucamy wszystkie Z i takie, że Z i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test asymptotyczny ze modyfikowaną statystyką testową T : T = T = T + n(n+1) 4 n(n + 1)(n + 1)/4 1 48, N (t j 1)t j j=1 gdzie: N liczba grup węzłów (również jednoelementowych), t j liczba węzłów w j-tej grupie, j = 1,..., N. 9
Bibliografia [1] Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K.: Statystyka w zadaniach. Część II: Statystyka matematyczna. Warszawa, Wydawnictwa Naukowo-Techniczne, 001. [] Harnett D. L., Soni A. K.: Statistical Methods for Business and Economics. Addison-Wesley Publishing Company, 1991. [3] Koronacki J., Mielniczuk J.: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa, WNT, 006. [4] Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M.: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część II: Statystyka matematyczna. Warszawa, PWN, wyd. VIII, 006. [5] Plucińska A., Pluciński E.: Probabilistyka. Warszawa, Wydawnictwa Naukowo-Techniczne, 000. [6] Rees D.G.: Essential Statistics. London, Chapman&Hall, 1995. [7] Sheskin D.J.: Handbook of Parametric and Nonparametric Statistical Procedures. Boca Raton, Chapman&Hall/CRC, 000. 10