Test t-studenta dla jednej średniej

Podobne dokumenty
Testy statystyczne teoria

Wykład 10 Testy jednorodności rozkładów

Wykład 11 Testowanie jednorodności

Wykład 9 Testy rangowe w problemie dwóch prób

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

1 Estymacja przedziałowa

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 7 Testowanie zgodności z rozkładem normalnym

Przykład 1. (A. Łomnicki)

Testy post-hoc. Wrocław, 6 czerwca 2016

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

Testy nieparametryczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Testowanie hipotez statystycznych.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Kolokwium ze statystyki matematycznej

Statystyka matematyczna dla leśników

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Rozkłady statystyk z próby

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wykład 8 Dane kategoryczne

Elementarne metody statystyczne 9

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Wydział Matematyki. Testy zgodności. Wykład 03

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

1 Podstawy rachunku prawdopodobieństwa

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Rozkłady statystyk z próby. Statystyka

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Statystyczna analiza danych

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wnioskowanie statystyczne. Statystyka w 5

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Zadania ze statystyki, cz.6

Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

1.1 Wstęp Literatura... 1

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Estymacja parametrów rozkładu cechy

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Wykład 9 Wnioskowanie o średnich

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Estymacja punktowa i przedziałowa

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wykład 3 Hipotezy statystyczne

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Testowanie hipotez statystycznych

Badania eksperymentalne

166 Wstęp do statystyki matematycznej

Statystyka matematyczna i ekonometria

Zadania ze statystyki cz.8. Zadanie 1.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Estymacja parametrów w modelu normalnym

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych cd.

STATYSTYKA

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka w przykładach

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Testowanie hipotez statystycznych

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Transkrypt:

Test t-studenta dla jednej średniej Hipoteza zerowa: Średnia wartość zmiennej w populacji jest równa określonej wartości a 0 (a = a 0 ). Hipoteza alternatywna 1.: Średnia wartość zmiennej w populacji jest różna od określonej wartości a 0 (a a 0 ). Hipoteza alternatywna.: Średnia wartość zmiennej w populacji jest mniejsza od określonej wartości a 0 (a < a 0 ). Hipoteza alternatywna 3.: Średnia wartość zmiennej w populacji jest większa od określonej wartości a 0 (a > a 0 ). Założenia: Zmienna ma rozkład normalny o nieznanej wariancji σ. T n = n x a 0 s ma rozkład t-studenta z n 1 stopniami swobody (dla dużych n (n 30) rozkład ten jest zbliżony do standardowego rozkładu normalnego). Obszar krytyczny 1.: K = (, t n 1 1 α/ ) (tn 1 1 α/, + ) Obszar krytyczny.: K = (, t1 α) n 1 Obszar krytyczny 3.: K = (t n 1 1 α, + ) gdzie t n 1 1 α jest kwantylem rzędu 1 α rozkładu t-studenta z n 1 stopniami swobody. p-wartość 1.: α = (1 F n 1 ( T n )) p-wartość. i 3.: α = 1 F n 1 ( T n ) gdzie F n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. Ponieważ przy n, niezależnie od wyjściowego rozkładu badanej zmiennej, statystyka T n ma standardowy rozkład normalny i jest to rozkład graniczny rozkładu t-studenta, to test t-studenta może być stosowany dla zmiennych o dowolnym rozkładzie (dla którego istnieje wariancja), jeśli tylko próba jest dość liczna (n 30 i rozkład jest w przybliżeniu jednomodalny i symetryczny lub n 40, gdy rozkład jest wyraźnie skośny [3], choć czasami podawany jest warunek n 5 [7]). W próbie nie powinny występować wartości odstające. W przypadku rozkładu dwupunktowego, tj. zmiennej losowej X, która przyjmuje wartości 1 i 0 z prawdopodobieństwami odpowiednio p i 1 p, wartość średnia wynosi EX = 1 p + 0 (1 p) = p, jest więc równa prawdopodobieństwu wystąpienia 1. Oznacza to, że testem t-studenta można testować hipotezę dotyczącą odsetka elementów 1

populacji posiadających pewną własność. Zaleca się stosować ten test, jeśli nˆp 5 i n(1 ˆp) 5 (gdzie ˆp oznacza prawdopodobieństwo obserwowane), czyli liczba elementów, które mają pewną własność i liczba tych, które jej nie mają, wynoszą co najmniej 5. [3] Test t-studenta dla dwóch średnich i prób niezależnych Hipoteza zerowa: Średnie wartości zmiennej są takie same w dwóch różnych populacjach (a 1 = a ). Hipoteza alternatywna 1.: Średnie wartości zmiennej są różne w badanych populacjach (a 1 a ). Hipoteza alternatywna.: Średnia wartość zmiennej w pierwszej populacji jest mniejsza od średniej wartości zmiennej w drugiej populacji (a 1 < a ). Hipoteza alternatywna 3.: Średnia wartość zmiennej w pierwszej populacji jest większa od średniej wartości zmiennej w drugiej populacji (a 1 > a ). Założenia: Zmienna ma w obu populacjach rozkład normalny o nieznanych wariancjach. a) Zmienna ma w obu populacjach rozkład normalny o nieznanych, ale równych wariancjach. T n = x 1 x (n1 1)s 1 + (n 1)s n 1 + n n1 + n n 1 n ma rozkład t-studenta z n 1 + n stopniami swobody. Obszar krytyczny 1.: K = (, t n 1+n 1 α/ Obszar krytyczny.: K = (, t n 1+n 1 α ) Obszar krytyczny 3.: K = (t n 1+n 1 α, + ) ) (t n 1+n, + ) 1 α/ gdzie t n 1+n 1 α oznacza kwantyl rzędu 1 α z rozkładu t-studenta z n 1 + n stopniami swobody. p-wartość 1.: α = (1 F n 1+n ( T n )) p-wartość. i 3.: α = 1 F n 1+n ( T n ) gdzie F n 1+n jest dystrybuantą rozkładu t-studenta z n 1 + n stopniami swobody.

b) Zmienna ma w obu populacjach rozkład normalny o nieznanych i różnych wariancjach. (statystyka Cochrana i Coxa). C n = x 1 x s 1 n 1 + s n Obszar krytyczny 1.: K = (, c n 1,n 1 α/ ) (cn 1,n 1 α/, + ) Obszar krytyczny.: K = (, c n 1,n 1 α ) Obszar krytyczny 3.: K = (c n 1,n 1 α, + ) gdzie c n 1,n 1 α ( ) ( ) s 1 t n 1 1 1 α + s t n 1 s 1 α : 1 + s. n 1 n n 1 n Test t-studenta dla dwóch średnich i prób niezależnych może być również używany w przypadku zmiennej, która nie posiada w badanych populacjach rozkładu normalnego. Wymagana jest wówczas duża liczebność obu prób (co najmniej po 30 obserwacji), symetria i brak obserwacji odstających. W idealnych warunkach obiekty powinny być losowo przypisane do dwóch grup, tak aby każda różnica ich reakcji była wynikiem oddziaływania (lub braku oddziaływania) tylko jednego czynnika. Nie jest tak w przypadku porównywania średniego dochodu mężczyzn i kobiet. Płeć badanych nie jest przypisywana losowo. W takich przypadkach należy zadbać o to, żeby różnice innych czynników nie pomniejszały, ani nie powiększały, znaczącej różnicy średnich. Na różnice średniego dochodu mogą mieć także wpływ takie czynniki jak wykształcenie (a nie tylko płeć). [Pomoc IBM SPSS Statistics] Test t-studenta dla dwóch średnich i prób zależnych Hipoteza zerowa: Dwie zmienne zależne mają jednakowe średnie (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią równą 0). Hipoteza alternatywna 1.: Zmienne zależne mają różne średnie (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią różną od 0). 3

Hipoteza alternatywna.: Pierwsza ze zmiennych ma średnią mniejszą niż druga (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią ujemną). Hipoteza alternatywna 3.: Pierwsza ze zmiennych ma średnią większą niż druga (inaczej: różnica D = X Y odpowiadających sobie wartości zmiennych ma średnią dodatnią). T n = d s d n ma rozkład t-studenta z n 1 stopniami swobody. Obszar krytyczny 1.: K = (, t n 1 1 α/ ) (tn 1 1 α/, + ) Obszar krytyczny.: K = (, t1 α) n 1 Obszar krytyczny 3.: K = (t n 1 1 α, + ) gdzie t n 1 1 α jest kwantylem rzędu 1 α rozkładu t-studenta z n 1 stopniami swobody. p-wartość 1.: α = (1 F n 1 ( T n )) p-wartość. i 3.: α = 1 F n 1 ( T n ) gdzie F n 1 jest dystrybuantą rozkładu t-studenta z n 1 stopniami swobody. Ponieważ test ten jest w praktyce testem t-studenta dla jednej średniej (dla zmiennej D = X Y ), to należy sprawdzić, czy różnica zmiennych spełnia wymagania testu dla jednej średniej, tj. ma rozkład normalny lub ma rozkład odbiegający od normalnego (ale bez wartości odstających), ale liczebność próby jest odpowiednio duża. Test chi-kwadrat zgodności Założenia: Zmienna ma rozkład dyskretny, przyjmuje tylko wartości l 1,..., l k z prawdopodobieństwami odpowiednio p 1,..., p k, które nie są znane. Hipoteza zerowa: Zmienna ma rozkład dyskretny z określonymi prawdopodobieństwami p 0 1,..., p 0 k. Hipoteza alternatywna: Zmienna ma rozkład z innymi prawdopodobieństwami niż zadane. k χ (n i n 0 i ) = i=1 n 0 i k (n i np 0 i ) =, i=1 np 0 i gdzie n i oznaczają liczebności obserwowane, n 0 i oczekiwane, ma w przybliżeniu rozkład chi-kwadrat z k 1 stopniami swobody. Obszar krytyczny: K = (u k 1 1 α, + ), 4

gdzie u k 1 1 α oznacza kwantyl rzędu 1 α rozkładu chi-kwadrat z k 1 stopniami swobody. p-wartość: α = 1 F k 1 χ (χ ), gdzie F k 1 χ jest dystrybuantą rozkładu chi-kwadrat z k 1 stopniami swobody. Jeżeli rozkład teoretyczny zależy od d nieznanych parametrów, to parametry te wyznaczamy metodą największej wiarogodności, a liczbę stopni swobody zmniejszamy o d. Statystyka χ ma tylko w przybliżeniu (asymptotycznie) rozkład chikwadrat. Przybliżenie rozkładem chi-kwadrat uznajemy za dopuszczalne, gdy np 0 i 5, i = 1,..., k, a za dobre, gdy np 0 i 10, i = 1,..., k. Jeśli liczba kategorii jest duża (> 6), to zgadzamy się stosować przybliżenie rozkładem chi-kwadrat także wtedy, gdy dla jednej lub dwóch kategorii 1 np 0 i < 5 [3]. Mało liczne kategorie można również łączyć z kategoriami sąsiednimi, redukując wówczas odpowiednio liczbę stopni swobody. W przypadku zmiennej o rozkładzie z ciągłą dystrybuantą dane grupujemy w k (10k n) klas. Prawdopodobieństwa teoretyczne wyliczamy z dystrybuanty. Klasy staramy się dobrać tak, aby prawdopodobieństwa znalezienia się w klasie były równe 1/k, a liczebności teoretyczne były co najmniej równe 5. Testujemy wówczas hipotezę zerową: Zmienna ma rozkład o podanej dystrybuancie. Łatwo zauważyć, że testowanie zgodności z zadanym rozkładem ciągłym za pomocą testu chi-kwadrat jest przedsięwzięciem kontrowersyjnym, ponieważ punktem wyjścia do konstrukcji testu jest świadoma utrata informacji związana z koniecznością dokonania dyskretyzacji. Dlatego, gdy mamy do czynienia z rozkładem ciągłym, powinniśmy unikać stosowania tego testu [...] Dopiero, gdy próba losowa jest bardzo liczna i histogram sporządzony na jej podstawie przypomina gładki rozkład ciągły, zastosowanie testu chi-kwadrat przestaje być ryzykowne. Inna sprawa, że test ten może być jedynym dającym się zastosować w danej konkretnej sytuacji. Tak jest np. wtedy, gdy dane, którymi dysponujemy, pochodzą wprawdzie z rozkładu ciągłego, ale są już zdyskretyzowane. [3, str. 37] Jeśli założenia testu nie są spełnione, można wykonać tzw. test dokładny, który nie korzysta z rozkładu granicznego statystyki testowej tylko z jej właściwego rozkładu. 5

Test chi-kwadrat niezależności Hipoteza zerowa: Zmienne losowe X i Y są niezależne. Hipoteza alternatywna: X i Y są zależne. Założenia: Cechy X, Y są jakościowe (nominalne lub o wartościach uporządkowanych). gdzie k r χ (n ij n 0 = ij), j=1 i=1 n 0 ij r liczba kategorii zmiennej X (liczba wierszy w tablicy kontyngencji), k liczba kategorii zmiennej Y (liczba kolumn w tablicy kontyngencji), n ij liczba wystąpień w próbie par obserwacji (x i, y j ), k r n ij n ij n 0 j=1 i=1 ij =, n r k n = n ij. i=1 j=1 Dla zmiennych X i Y przyjmujących tylko po wartości stosuje się statystykę k r χ ( n ij n 0 = ij 1/), j=1 i=1 n 0 ij co zawiera tzw. poprawkę Yatesa na ciągłość poprawiającą jakość przybliżenia. [6] Obszar krytyczny: K = (u (r 1)(k 1) 1 α, + ), gdzie u (r 1)(k 1) 1 α jest kwantylem rzędu 1 α rozkładu chi-kwadrat z (r 1)(k 1) stopniami swobody. p-wartość: α = 1 F (r 1)(k 1) χ (χ ), gdzie F (r 1)(k 1) χ jest dystrybuantą rozkładu chi-kwadrat z (r 1)(k 1) stopniami swobody. Podobnie jak w teście chi-kwadrat zgodności, przybliżenie statystyki testowej rozkładem chi-kwadrat stosujemy, gdy liczebności teoretyczne prób w wierszach (kolumnach) są stosunkowo duże (n 0 ij 5). 6

Gdy tablica kontyngencji ma rozmiar i liczebności próby w wierszach (kolumnach) są zbyt małe, można oprzeć się na tzw. dokładnym teście Fishera. W przypadku pary cech o uporządkowanych kategoriach test niezależności może okazać się zwodniczy. Może wówczas zajść potrzeba wprowadzenia odpowiedniej miary zależności między cechami. Miara gamma miara zależności monotonicznej, dodatniej, gdy γ > 0 i ujemnej, gdy γ < 0. Zasadniczo γ [ 1, 1]. p-wartość podawana przy tym współczynniku dotyczy testu hipotezy zerowej o niezależności zmiennych przy hipotezie alternatywnej orzekającej ich dodatnią (lub ujemną) zależność. d Sommersa i τ b Kendalla używane, gdy liczba par związanych jest duża. Test Kołmogorowa Hipoteza zerowa: Zmienna ma rozkład o zadanej dystrybuancie F. Hipoteza alternatywna: Zmienna ma rozkład o innej niż zadana dystrybuancie. D n = max{d n +, Dn } gdzie D n + i = max 1 i n n F (x (i)), D n = max 1 i n F (x (i) ) i 1 n Obszar krytyczny: (d n (1 α), 1] odczytujemy z tablic kwantyli statystyki Kołmogorowa, jest to taka wartość, dla której P (D n d n (1 α)) = α). W przypadku danych zgrupowanych w klasy bierzemy pod uwagę prawy koniec każdej z klas i zamiast podanych statystyk wyznaczamy wartość maksymalną statystyki F n (x i ) F (x i ), gdzie F n jest dystrybuantą empiryczną. Dla dużych prób (n > 100) używa się statystyki nd n, a obszar krytyczny wyznacza, używając kwantyli granicznego rozkładu Kołmogorowa. W przypadku testowania zgodności z rozkładem normalnym zaleca się stosowanie testu Kołmogorowa z poziomem istotności Lillieforsa oraz testu Shapiro-Wilka (najbardziej polecany dla prób o liczebności nieprzekraczającej 000). 7

Test Wilcoxona znakowanych rang Założenia: Dysponujemy ciągiem par obserwacji: (X 1, Y 1 ),..., (X n, Y n ). Pary zmiennych losowych są niezależne, natomiast X i, Y i mogą być zależne. Definiujemy niezależne różnice Z i = Y i X i, i = 1..., n. Każda zmienna Z i, i = 1,..., n pochodzi z tego samego rozkładu ciągłego o dystrybuancie F i, symetrycznego względem wspólnej mediany θ (może być ona interpretowana jako efekt kuracji ). Hipoteza zerowa: θ = 0 (brak efektu kuracji ) Hipoteza alternatywna 1.: θ 0 (jest jakiś efekt kuracji ). Hipoteza alternatywna.: θ > 0 ( efekt kuracji jest dodatni). Hipoteza alternatywna 3.: θ < 0 ( efekt kuracji jest ujemny). Jest to statystyka znakowanych rang Wilcoxona, czyli suma rang wartości bezwzględnych różnic odpowiadających różnicom dodatnim: T + = Z i >0 r( Z i ), gdzie r( Z i ) ranga Z i, i = 1,...(, n, (r(x i ) = j {1,...], n} X i = X j:n ). n(n + 1) Obszar krytyczny 1.: K =, w 1 α/ [ w 1 α/, ), Obszar krytyczny.: K = ([w 1 α, + ) ] n(n + 1) Obszar krytyczny 3.: K =, w 1 α gdzie w a jest kwantylem rozkładu statystyki znakowanych rang Wilcoxona (przy założeniu prawdziwości hipotezy zerowej) rzędu a (w tablicach). Test znakowanych rang Wilcoxona jest nieparametryczną alternatywą dla testu t-studenta w przypadku dwóch próbek dających się połączyć w pary. Różnica między tymi testami jest taka, że test t-studenta testuje równość średnich arytmetycznych, a test Wilcoxona testuje mediany. Test Wilcoxona nie wymaga założeń dotyczących rozkładu próby, może być więc używany, gdy założenia testu t-studenta nie są spełnione. Test dla jednej próby jest odpowiednikiem testu dla dwóch prób, w którym drugą z prób zastąpiono stałą równą wartości testowanej mediany. Jeżeli n jest duże (w praktyce dla n 5), stosuje się tzw. test asymptotyczny, tj. używa się statystyki testowej postaci T = T + n(n+1) 4 n(n + 1)(n + 1)/4, 8

i obszarów krytycznych Obszar krytyczny 1.: K = (, z 1 α/ ] [ z1 α/, ) Obszar krytyczny.: K = [z 1 α, + ) Obszar krytyczny 3.: K = (, z 1 α ] gdzie z 1 α jest kwantylem rzędu 1 α standardowego rozkładu normalnego. W praktyce (w wyniku zaokrąglania) mogą pojawić się tzw. węzły, czyli grupy obserwacji o jednakowej wartości bezwzględnej. Postępowanie w przypadku, gdy 1. n < 5 - odrzucamy wszystkie Z i takie, że Z i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test dokładny ze zmodyfikowanymi rangami;. n 5 - odrzucamy wszystkie Z i takie, że Z i = 0 i odpowiednio zmniejszamy n, - uśredniamy rangi dla pozostałych węzłów (mogą być one niecałkowite), - stosujemy test asymptotyczny ze modyfikowaną statystyką testową T : T = T = T + n(n+1) 4 n(n + 1)(n + 1)/4 1 48, N (t j 1)t j j=1 gdzie: N liczba grup węzłów (również jednoelementowych), t j liczba węzłów w j-tej grupie, j = 1,..., N. 9

Bibliografia [1] Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K.: Statystyka w zadaniach. Część II: Statystyka matematyczna. Warszawa, Wydawnictwa Naukowo-Techniczne, 001. [] Harnett D. L., Soni A. K.: Statistical Methods for Business and Economics. Addison-Wesley Publishing Company, 1991. [3] Koronacki J., Mielniczuk J.: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa, WNT, 006. [4] Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M.: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część II: Statystyka matematyczna. Warszawa, PWN, wyd. VIII, 006. [5] Plucińska A., Pluciński E.: Probabilistyka. Warszawa, Wydawnictwa Naukowo-Techniczne, 000. [6] Rees D.G.: Essential Statistics. London, Chapman&Hall, 1995. [7] Sheskin D.J.: Handbook of Parametric and Nonparametric Statistical Procedures. Boca Raton, Chapman&Hall/CRC, 000. 10