TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy się hipotezami parametrycznymi: są to hipotezy dotyczące nieznanego parametru rozkładu θ (rozważmy tylko przypadek, gdy θ jest nieznaną średnią wartością pewnej cechy X). Na podstawie próbki (x 1,..., x n ) mamy zdecydować, czy należy odrzucić daną hipotezę o parametrze θ, czy jej nie odrzucać. Testem statystycznym będziemy nazywać sposób postępowania, który prowadzi do podjęcia decyzji. Przykład 1. Organizacja ochrony konsumentów przypuszcza, że mleko, dostarczane na rynek przez pewnego producenta, ma niższą procentową zawartość tłuszczu niż nominalna 3,2%. Zbadane zostały 10 kartonów z mlekiem i uzyskane następujące wyniki: 3,26; 3,12; 3,24; 3,16; 3,08; 3,14; 3,23; 3,11; 3,09; 3,24. Czy to podejrzenie jest słuszne czy też nie? 1
Zasady ogólne. 1. Formułujemy dwie wzajemnie wykluczające się hipotezy: H 0 (zerowa) i H 1 (alternatywna). 2. Określamy poziom istotności testu α (0, 1) (standardowo α = 0,05). Jest to prawdopodobieństwo popełnienia błędu I rodzaju. Błąd I rodzaju - prawdziwa jest H 0, a my ją odrzucamy. Błąd II rodzaju - prawdziwa jest H 1, a my decydujemy na rzecz H 0. stan rzeczy/decyzja przyjąć H 0 przyjąć H 1 H 0 prawdziwa OK błąd I rodzaju H 1 prawdziwa błąd II rodzaju OK Pożądane jest, by prawdopodobieństwa popełnienia błędów obu rodzajów były jak najmniejsze. Okazuje się, że tego nie da się zrobić jednocześnie. Wobec tego, postępujemy tak, że przede wszystkim kontrolujemy prawdopodobieństwo popełnienia błędu I rodzaju (hipotezy oznaczamy w ten sposób, aby popełnienie błędu I rodzaju miało gorsze skutki). 3. Dobieramy statystykę (nazywamy ją statystyką testową), której rozkład przy założeniu prawdziwości hipotezy H 0 potrafimy określić (nie może on zależeć od nieznanych parametrów). Zgodnie z tym rozkładem 2
oraz przyjętą wartością α określamy tzw. zbiór krytyczny K. Jest to podzbiór R taki, że prawdopodobieństwo wpadnięcia do K wartości zmiennej losowej o określonym wyżej rozkładzie wynosi właśnie α (czyli jest bardzo małe). 4. Jeśli obliczona na podstawie próbki wartość statystyki testowej wpada do K, to hipotezę H 0 odrzucamy (bo jeśli H 0 jest prawdziwa, to zaszło bardzo rzadkie zdarzenie). Jeśli obliczona wartość statystyki testowej nie wpada do K, to nie mamy podstaw do odrzucenia hipotezy H 0. Uwaga. Decyzje brzmią różnie! Testy dotyczące wartości oczekiwanej θ. 1. H 0 : θ = θ 0 H 1 : θ θ 0 lub θ < θ 0 lub θ > θ 0. 2. Określamy α (0, 1). 3. Rozważamy trzy przypadki: 3a. cecha ma rozkład normalny, wariancja σ 2 jest znana; 3b. cecha ma rozkład normalny, wariancja σ 2 nie jest znana; 3c. cecha ma rozkład dowolny, ale n jest duże. 3
3a. Jeśli H 0 jest prawdziwa, to {x i } - niezależne zmienne losowe o rozkładzie N (θ 0, σ 2 ) = x ma rozkład N (θ 0, σ2 n ) = n x θ 0 σ ma rozkład N (0, 1). Zatem możemy wziąć n x θ 0 σ jako statystykę testową. Postać zbioru krytycznego K zależy od postaci hipotezy alternatywnej H 1. Pod tym względem rozróżniamy: dwustronny obszar krytyczny K = (, z 1 α/2 ) (z 1 α/2, ) (gdy H 1 : θ θ 0 ); lewostronny obszar krytyczny K = (, z 1 α ) (gdy H 1 : θ < θ 0 ); prawostronny obszar krytyczny K = (z 1 α, ) (gdy H 1 : θ > θ 0 ). 3b. Statystyka testowa ma postać n x θ 0 s ; przy prawdziwości hipotezy H 0 ma ona rozkład Studenta o (n 1) stopniach swobody. Obszary krytyczne: K = (, t 1 α/2,n 1 ) (t 1 α/2,n 1, ) lub K = (, t 1 α,n 1 ) lub K = (t 1 α,n 1, ). 3c. Statystyka testowa ma postać n x θ 0 s ; przy prawdziwości hipotezy H 0 ma ona (w przybliżeniu) rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). 4
4. Podejmujemy decyzję. Tak, w Przykładzie 1 testujemy na poziomie istotności, powiedzmy, α = 0,05 hipotezę H 0 : θ = 3,2 (producent jest uczciwy) przeciw H 1 : θ < 3,2 (producent oszukuje). Przy założeniu, że cecha ma rozkład normalny i np. σ 2 = 0,004, mamy do czynienia z sytuacją opisaną w 3a. Otrzymujemy z tablic z 0,95 = 1,6449, zatem K = (, 1,6449). Wartość statystyki testowej wynosi 10 3,167 3,2 0,004 = 1,65, czyli wpada ona do K. Zatem należy odrzucić hipotezę H 0 i przyznać, że producent mleka oszukuje. Jeśli nie ma wiedzy o σ 2, to mamy do czynienia z sytuacją opisaną w 3b. Otrzymujemy z tablic t 0,95,9 = 1,8331, zatem K = (, 1,8331). Wartość statystyki testowej wynosi 10 3,167 3,2 0,0048 1,506, czyli nie wpada ona do K. Nie mamy więc podstaw do odrzucenia hipotezy H 0, czyli nie mamy podstaw do orzeczenia, że producent mleka oszukuje. 5
p0 (1 p 0 ) Test dotyczący nieznanej frakcji. H 0 : p = p 0, H 1 : p p 0 lub p < p 0 lub p > p 0. Statystyka testowa ma postać n p p 0 ; przy prawdziwości hipotezy H 0 ma ona (w przybliżeniu) rozkład N (0, 1). Obszary krytyczne: K = (, z 1 α/2 ) (z 1 α/2, ) lub K = (, z 1 α ) lub K = (z 1 α, ). Przykład 2. Badania przeprowadzone wśród uczniów klas pierwszych wykazały, że na 1400 losowo wybranych dzieci 840 ma próchnicę zębów. Na podstawie tych badań, na poziomie istotności α = 0,05 przetestować hipotezę, że 55% pierwszoklasistów ma próchnicę zębów przeciw hipotezie, że odsetek jest większy. Mamy H 0 : p = 0,55 przeciw H 1 : p > 0,55. Otrzymujemy z tablic z 0,95 = 1,6449, zatem K = (1,6449, + ). Wartość statystyki testowej wynosi 1400 0,60 0,55 0,55 0,45 3,76, czyli wpada ona do K. Więc hipotezę H 0 należy odrzucić i uznać, że odsetek pierwszoklasistów mających próchnicę zębów jest większy niż 55%. 6
Pojęcie o p-wartości. Jeśli zaobserwowana wartość statystyki testowej S to s 0, to p-wartość określamy jako: p=p ( S >s 0 ), jeśli obszar krytyczny jest dwustronny; p=p (S < s 0 ), jeśli obszar krytyczny jest lewostronny; p=p (S >s 0 ), jeśli obszar krytyczny jest prawostronny. Teraz podejmujemy decyzję na podstawie porównania p-wartości z poziomem istotności testu α : jeśli p < α, to odrzucamy H 0 ; jeśli p α, to nie mamy podstaw do odrzucenia H 0. 7