TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi nazywamy hipotezy dotyczące wartości nieznanego parametru θ rozkładu. Na podstawie próbki X 1,..., X n z rozkładu P θ, θ Θ, mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Nieparametrycznymi nazywamy hipotezy, które nie dotyczą parametrów rozkładu (np. hipotezy o typie rozkładu). Sposób postępowania, który prowadzi do podjęcia decyzji, nazywamy testem statystycznym. Przykład. Na kartonie z mlekiem jest napisane zawartość tłuszczu wynosi 3,2%. W celu sprawdzenia, czy tak jest naprawdę, zmierzona została zawartość tłuszczu w 10 losowo wybranych kartonach z mlekiem, dostarczonych przez pewnego producenta. Uzyskano następujące wyniki: 3,26%; 3,12%; 3,24%; 3,16%; 3,08%, 3,14%; 3,23%; 3,11%; 3,09%; 3,24%. Jak wiemy, przy oszacowaniu średniej wartości pewnej cechy dobrym estymatorem jest średnia z próby. Oka- 1
zało się, że dla powyższych danych x = 3,167%. Czy na podstawie tego można przyjąć, że zawartość tłuszczu w mleku przeciętnie wynosi 3,2% (hipoteza H 0 )? Gdyby okazało się, że x = 2,8%, to zapewne nie mielibyśmy wątpliwości, że hipotezę H 0 należy odrzucić. Natomiast w przypadku x = 3,2% na pewno nie należałoby się jej odrzucać. Ale ponieważ zaobserwowaliśmy wartość x = 3,167%, to decyzja o odrzuceniu bądź nie odrzuceniu hipotezy H 0 już nie jest tak oczywista. Rozsądnym wydaje się następujące postępowanie. Przypuśćmy, że hipoteza H 0 jest prawdziwa, tzn. przeciętna zawartość tłuszczu w mleku wynosi 3,2%. Jeśli prawdopodobieństwo zaobserwowania przy tym przypuszczeniu wartości x = 3,167% jest bardzo małe, powiedzmy nie większe niż α = 0,05, to uznamy, że nasze przypuszczenie nie jest zgodne z prawdą, bo zdarzyło się coś, co powinno zdarzać się niezmiernie rzadko (zdarzyło się coś, co jest prawie niemożliwe). Dalej α nazywamy poziomem istotności testu. Decyzja o odrzuceniu rozważanej hipotezy H 0 związana jest z podjęciem decyzji o przyjęciu pewnej hipotezy alternatywnej H 1. W tym przykładzie może nią być hipoteza mówiąca, że przeciętna zawartość tłuszczu w mleku różni się od 3,2%. Ale może też być inna 2
hipoteza alternatywna. Np. organizacja obrony praw konsumentów może być zainteresowana rozważaniem hipotezy alternatywnej postaci przeciętna zawartość tłuszczu w mleku jest mniejsza niż 3,2%, natomiast sam producent mleka, że przeciętna zawartość tłuszczu w mleku jest większa od 3,2%. Postać hipotezy alternatywnej powinna wpływać na naszą decyzję. Otrzymując x = 3,167%, może skłonni bylibyśmy odrzucić hipotezę H 0 i przyjąć hipotezę obrońców praw konsumentów. Trochę mniej pewnie podjęlibyśmy decyzję o przyjęciu hipotezy, że przeciętna zawartość tłuszczu w mleku różni się od 3,2%, a już na pewno nie przyjęlibyśmy hipotezy producenta. Ogólny schemat postępowania. 1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H 0 (zerowa) i H 1 (alternatywna). 2. Określamy poziom istotności testu α (0, 1) (standardowo α = 0,05). 3. Przy założeniu prawdziwości hipotezy H 0, dobieramy pewną statystykę (zwaną statystyką testową), której rozkład nie zależy od nieznanych parametrów. Zgodnie z rozkładem tej statystyki oraz przyjętą wartością α określamy zbiór krytyczny K. Jest to podzbiór R taki, że prawdopodobieństwo wpadnięcia do K war- 3
tości zmiennej losowej o określonym wyżej rozkładzie wynosi właśnie α (czyli jest bardzo małe). 4. Jeśli obliczona na podstawie próbki wartość statystyki testowej wpada do K, to hipotezę H 0 odrzucamy. Jeżeli zaś obliczona wartość statystyki testowej nie wpada do K, to nie mamy podstaw do odrzucenia H 0. Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości oczekiwanej. 1. H 0 : µ = µ 0 H 1 : µ µ 0 lub µ < µ 0 lub µ > µ 0. 2. Określamy α (0, 1). 3. Rozważamy trzy przypadki: 3a. rozkład, z którego pochodzi próbka, jest normalny, wariancja σ 2 jest znana; 3b. rozkład, z którego pochodzi próbka, jest normalny, wariancja σ 2 nie jest znana; 3c. rozkład, z którego pochodzi próbka, jest dowolny, ale n jest duże. 3a. Jeśli H 0 jest prawdziwa, to {X i } - niezależne zmienne losowe o rozkładzie N (µ 0, σ 2 ) = X N (µ 0, σ2 n ) = n X µ 0 σ N (0, 1). Zatem n X µ 0 σ jest statystyką testową. 4
Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H 1. Pod tym względem rozróżniamy: dwustronny obszar krytyczny K = (, z 1 α/2 ) (z 1 α/2, ) (gdy H 1 : µ µ 0 ); lewostronny obszar krytyczny K = (, z 1 α ) (gdy H 1 : µ < µ 0 ); prawostronny obszar krytyczny K = (z 1 α, ) (gdy H 1 : µ > µ 0 ). 4. Wartość statystyki testowej K = odrzucamy H 0 ; wartość statystyki testowej / K = nie mamy podstaw do odrzucenia H 0. 3b. Statystyka testowa ma postać n X µ 0 S i ma rozkład Studenta t n 1. Obszary krytyczne: K = (, t 1 α/2,n 1 ) (t 1 α/2,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 3c. Statystyka testowa ma postać n X µ 0 S w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). i ma 5
Test dot. nieznanej wariancji rozkładu N (µ, σ 2 ). H 0 : σ 2 = σ 2 0, H 1 : σ 2 σ 2 0 lub σ 2 < σ 2 0 lub σ 2 > σ 2 0. Statystyka testowa ma postać (n 1)S2 i ma rozkład χ 2 (n 1). σ0 2 Obszary krytyczne: K = (0, χ 2 α/2,n 1 ) (χ2 1 α/2,n 1, ) lub K = (0, χ 2 α,n 1) lub K = (χ 2 1 α,n 1, ). Niech np. w Przykładzie z producentem mleka testujemy na poziomie istotności, powiedzmy, α = 0,05 hipotezę H 0 : µ = 3,2 (producent jest uczciwy) przeciw H 1 : µ < 3,2 (producent oszukuje). Przy założeniu, że cecha ma rozkład normalny i np. σ 2 = 0,004, mamy do czynienia z sytuacją opisaną w 3a. Otrzymujemy z tablic z 0,95 = 1,6449. Więc K = (, 1,6449). Wartość statystyki testowej wynosi 10 3,167 3,2 0,004 1,650, czyli wpada ona do K. Zatem należy odrzucić hipotezę H 0 i przyznać, że producent mleka oszukuje. Jeśli nie ma wiedzy o σ 2, to mamy do czynienia z sytuacją opisaną w 3b. Otrzymujemy z tablic t 0,95,9 = 1,8331, zatem K = (, 1,8331). Wartość staty- 6
styki testowej wynosi 10 3,167 3,2 0,0048 1,506, czyli nie wpada ona do K. Nie mamy więc podstaw do odrzucenia hipotezy H 0, czyli nie mamy podstaw do orzeczenia, że producent mleka oszukuje. Test dotyczący nieznanego prawdopodobieństwa sukcesu p w rozkładzie zero-jedynkowym. H 0 : p = p 0, H 1 : p p 0 lub p < p 0 lub p > p 0. Statystyka testowa ma postać n X p 0 i ma p0 (1 p 0 ) w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). Testy dot. równości wartości oczekiwanych 2 prób. H 0 : µ 1 = µ 2, H 1 : µ 1 µ 2 lub µ 1 < µ 2 lub µ 1 > µ 2. (a) Mamy niezależne próbki: X (1) 1,..., X(1) X (2) 1,..., X(2) n 2 N (µ 2, σ2); 2 σ 1, σ 2 są znane. Statystyka testowa ma postać X 1 X 2 σ 2 1 n 1 + σ2 2 n 2 7 n 1 N (µ 1, σ 2 1);
i ma rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). (b) Mamy niezależne próbki: X (1) 1,..., X(1) n 1 N (µ 1, σ1); 2 X (2) 1,..., X(2) n 2 N (µ 2, σ2); 2 σ 1, σ 2 są nieznane, σ 1 = σ 2. Statystyka testowa ma postać X 1 X 2 (n1 1)S1 2+(n 2 1)S2 2 n 1 +n 2 2 n1+n 2 n 1 n 2 i ma rozkład Studenta t n1 +n 2 2. Obszary krytyczne: K = (, t 1 α/2,n1 +n 2 2) (t 1 α/2,n1 +n 2 2, ) lub K = (, t 1 α,n1 +n 2 2) lub K = (t 1 α,n1 +n 2 2, ). (c) Mamy niezależne próbki: X (1) 1,..., X(1) n 1 oraz X (2) 1,..., X n (2) 2 o nieznanych wariancjach, ale n 1, n 2 są duże. Statystyka testowa ma postać X 1 X 2 S 2 1 n 1 + S2 2 n 2 i ma w przybliżeniu rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). (d) Mamy zależne próbki: X (1) 1,..., X(1) n oraz X (2) 1,..., 8
X n (2) ; obie pochodzą z rozkładu normalnego. Oznaczmy: D i = X (1) i X (2) i. Statystyka testowa ma postać n D S i ma rozkład Studenta t n 1 (porównaj z 3b). Obszary krytyczne: D K = (, t 1 α/2,n 1 ) (t 1 α/2,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). Przykład 1. Wysunięto hipotezę, że stopień wyprania tkaniny wełnianej płatkami mydlanymi jest wyższy od stopnia wyprania sulfapolem. W celu sprawdzenia tej hipotezy wykonano pomiary stopnia wyprania 10 wycinków tkaniny pranej płatkami, otrzymując wyniki (w %): 74,8; 75,1; 73,0; 72,8; 76,2; 74,6; 76,0; 73,4; 72,9; 71,6 oraz 7 wyników prania sulfapolem, otrzymując: 56,9; 57,8; 54,6; 59,0; 57,1; 58,2; 57,6. Zakładając, że stopień wyprania tkaniny każdym środkiem ma rozkład normalny i wariancje są jednakowe, na poziomie istotności α = 0,05 przetestuj wysuniętą hipotezę. Testujemy hipotezy: H 0 : µ p = µ s, H 1 : µ p > µ s. Mamy sytuację z punktu (b), zbiór krytyczny jest prawostronny. Obliczamy: x p = 74,0, x s = 57,3, s 2 p = 2,31, s 2 s = 1,92. Z tablic otrzymujemy: t 0,95,15 = 1,753, więc zbiór krytyczny jest postaci K = (1,753; + ). 9
Wartość statystyki testowej wynosi: 74,0 57,3 9 2,31+6 1,92 15 17 70 23,07. Ponieważ wpada ona do K, odrzucamy hipotezę H 0. Przykład 2. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z badanych pacjentów. Otrzymano następujące wyniki: pacjent 1 2 3 4 5 6 7 przed 210 180 260 270 190 250 180 po 180 160 220 260 200 230 180 Na poziomie istotności α = 0,05 przetestuj hipotezę, że stosowany lek nie powoduje spadku ciśnienia u pacjentów wobec hipotezy, że średnia wartość ciśnienia przed podaniem leku jest wyższa niż po podaniu, zakładając, że w obu przypadkach ciśnienie tętnicze ma rozkład normalny. Testujemy hipotezy: H 0 : µ 1 = µ 2, H 1 : µ 1 > µ 2. Mamy sytuację z punktu (d), zbiór krytyczny jest prawostronny.wyliczamy, że wartości d i wynoszą: 30, 20, 40, 10, -10, 20, 0, zatem d = 15,7, s d = 12,23. Z tablic otrzymujemy: t 0,95,6 = 1,943, więc zbiór krytyczny jest 10
postaci K = (1,943; + ). Wartość statystyki testowej wynosi: 7 15,7 12,23 3,40. Ponieważ wpada ona do K, odrzucamy hipotezę H 0. Pojęcie p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s 0, to p-wartość określamy jako: P ( S > s 0 ), jeśli obszar krytyczny jest dwustronny; P (S < s 0 ), jeśli obszar krytyczny jest lewostronny; P (S > s 0 ), jeśli obszar krytyczny jest prawostronny. Możemy podejmować decyzję na podstawie porównania p-wartości z poziomem istotności testu α : jeśli p < α, to odrzucamy H 0 ; jeśli p α, to nie mamy podstaw do odrzucenia H 0. 11