WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Było: Estymacja parametrów rozkładu teoretycznego punktowa przedziałowa
Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: cecha X ma w populacji rozkład normalny, X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane; Cel: wyznaczyć ocenę średniej masy jednego owocu tej odmiany µ. o losujemy próbę: x 1, x 2,..., x n, np. 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2
Estymacja punktowa parametru µ: Estymacja przedziałowa parametru µ: o obliczamy średnią arytmetyczną x dla próby: x = 194, 46 g, Oceną punktową parametru µ jest średnia arytmetyczna x dla próby; w przykładzie oceną punktową średniej masy jednego owocu tej odmiany µ jest wartość 194,46 g. o wybieramy poziom ufności 1-α, np. 95%, o odczytujemy z tablic wartość krytyczną rozkładu t-studenta t α, n-1, np. t 0,05, 9 = 2,2622, o obliczamy parametry próby: x = 194, 46 g, s = 5,19 g, o wyznaczamy ze wzoru krańce przedziału ufności. Ocena przedziałowa parametru µ to przedział ufności; w przykładzie 95% przedziałem ufności dla średniej masy jednego owocu tej odmiany µ jest 190, 75;19817,. 194,46 190,75 194,46 198,17
Pytanie: Czy moŝna przyjąć, Ŝe średnia masa jednego owocu tej odmiany µ jest równa 200? Decyzja: tak/nie.
Idea testowania hipotez i podstawowe pojęcia Przykład. Badamy krąŝek o wymiarach zbliŝonych do monety jednozłotowej ze stronami oznaczonymi: A, B. Mamy ustalić, czy krąŝek jest symetryczny? (w wyniku rzutów tym krąŝkiem z jednakową częstością będzie pojawiać się kaŝda ze stron). Formułujemy hipotezę merytoryczną: krąŝek jest symetryczny; stosunek wyników A do B wynosi 1:1; pstwo otrzymania wyniku A wynosi 0,5.
Sprawdzenie hipotezy Testowanie (weryfikacja) hipotezy wykonujemy pewną liczbę rzutów n (n-elementowa próba), np. n = 10; określamy regułę podejmowania decyzji dotyczącej hipotezy na podstawie wyników w próbie: jeśli wypadnie od 4 do 6 wyników A w 10-elementowej próbie, to monetę uznamy za symetryczną, w przeciwnym przypadku uznamy ją za niesymetryczną, próba: A B B B B A B B B B wyznaczamy liczbę wyników A w próbie, k A = 2, podejmujemy decyzję dotyczącą hipotezy: na podstawie próby odrzucamy hipotezę, Ŝe moneta jest symetryczna.
Teoretyczny opis doświadczenia Doświadczenie losowe: rzut symetrycznym krąŝkiem ze stronami A, B (hipoteza o symetryczności jest prawdziwa); X liczba wyników A w 10-elementowej próbie; X~B(n = 10, p = 0,5). Wykres funkcji rozkładu pstwa zmiennej losowej X pstwo 0,3 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 wartości X
wartość X pstwo 0 0,001 1 0,010 2 0,044 3 0,117 4 0,205 5 0,246 6 0,205 7 0,117 8 0,044 9 0,010 10 0,001 P {X=0} = 0,001 Przykładowa reguła podejmowania decyzji: hipotezę odrzucimy jeśli X=0 lub X=10. P {X=0 lub X=10} = P{X=0}+P{X=10}= = 2 0,001 = 0,002 Jeśli liczba wyników A w próbie wyniesie 0 lub 10, to hipotezę odrzucimy. Odrzucając hipotezę popełniamy błąd. Ten błąd popełniamy z pstwem 0,002. Błędną decyzję podejmujemy z pstwem 0,002.
Jeśli liczba wyników A w próbie wyniesie od 1 do 9, to hipotezy nie moŝna odrzucić ( hipotezę przyjmujemy ). Przyjmując hipotezę nie popełniamy błędu. Prawidłową decyzję o przyjęciu hipotezy podejmujemy z pstwem 0,998. Inna reguła podejmowania decyzji: hipotezę odrzucimy jeśli { 0, 1, 2, 3, 7, 8, 9, 10 } X. Przy tej regule pstwo popełnienia błędu (podjęcia błędnej decyzji o odrzuceniu hipotezy wynosi P ( X { 0, 1, 2, 3, 7, 8, 9, 10 }) = 0, 344.
Inne reguły podejmowania decyzji: Odrzucenie hipotezy przy liczbie wyników A Pstwo popełnienia błędu X = 0 lub X = 10 0,002 X 1 lub X 9 0,022 X 2 lub X 8 0,011 X 3 lub X 7 0,344 X 4 lub X 6 0,754 X { 0, 1,..., 10 } 1 Jakie pstwo popełnienia błędu akceptujemy? Graniczne pstwo błędu poziom istotności, ozn. α (np. α = 0,05 albo α = 0,01). Jeśli przyjmiemy α = 0,05, to obszar krytyczny dla hipotezy (odrzucenia hipotezy) to zbiór { 0, 1, 2, 8, 9, 10}, a obszar dopuszczalny { 3, 4, 5, 6, 7}.
Testowanie hipotez (ogólnie): stawiamy hipotezę, wybieramy funkcję testową f (statystykę testową, test statystyczny), przyjmujemy poziom istotności α; tym samym wyznaczamy obszar krytyczny testu (wartość krytyczną funkcji testowej f kryt ), losujemy próbę, wyliczamy wartość funkcji testowej dla próby f emp (wartość empiryczną funkcji testowej), porównujemy f emp z f kryt, hipotezę odrzucamy, gdy f emp f kryt ; w przeciwnym przypadku hipotezy nie odrzucamy.
Terminologia i oznaczenia: Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu pstwa cechy X (jest to formalny zapis przypuszczenia merytorycznego). Testowaną hipotezę nazywamy hipotezą zerową, ozn.: H 0. W przykładzie cecha X~B(n, p); hipoteza zerowa H 0 : p = 0,5. Funkcja testowa np.: t-studenta, F-Fishera, χ 2 chi-kwadrat. W przykładzie funkcja testowa k = liczba wyników A. Wartość empiryczna funkcji testowej (wartość funkcji testowej dla próby), np.: t emp, F emp, χ 2 emp. W przykładzie k emp = 2.
Poziom istotności α. Wartość krytyczna funkcji testowej (wartość krytyczna testu), np.: t kryt, F kryt, χ 2 kryt. t kryt = t α,v taka, Ŝe P{ t v > t α,v } = α, gdzie t v jest zmienną losową o rozkładzie t-studenta z v stopniami swobody. F kryt = F α,u,v taka, Ŝe P{ F u,v > F α,u,v }= α, gdzie F u,v jest zmienną losową o rozkładzie F-Fishera z liczbami stopni swobody u, v. χ 2 kryt= χ 2 α, v taka, Ŝe P{ χ 2 v > χ 2 α, v } = α, gdzie χ 2 v jest zmienną losową o rozkładzie chi-kwadrat z liczbą stopni swobody v. Wartość p p = P{ t v > t emp }
Błędy wnioskowania o prawdziwości hipotezy zerowej Stan rzeczywisty Wniosek odrzucić H 0 nie odrzucać H 0 H 0 prawdziwa błąd I rodzaju, pstwo = α wniosek prawidłowy H 0 nieprawdziwa (fałszywa) wniosek prawidłowy błąd II rodzaju, pstwo = β Błąd I rodzaju - błąd wnioskowania polegający na odrzuceniu hipotezy zerowej, która jest prawdziwa; pstwo wystąpienia tego błędu powinno być małe, np. α = 0,05 lub α = 0,01; α - poziom istotności testu. Błąd II rodzaju - błąd wnioskowania polegający na nieodrzuceniu hipotezy zerowej, która jest fałszywa.
Hipotezy i testy statystyczne ZałoŜenia: 1. cecha X ~ N(µ, σ 2 ), µ, σ 2 - nieznane parametry, 2. próba losowa: x 1, x 2,...x n ; n liczebność próby; H 0 : µ = µ 0 (porównanie z normą), test t-studenta; poziom istotności α. x µ Funkcja testowa: t emp = 0 n s Wnioskowanie 1: jeŝeli t emp > t α, n-1, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Wnioskowanie 2 (równowaŝne z wnioskowaniem 1): jeŝeli wartość p < α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić.
Przykład. Cecha X masa owocu pewnej odmiany. ZałoŜenie: X ~ N(µ, σ 2 ), gdzie µ, σ 2 nieznane. Hipoteza zerowa H 0 : µ = 200, test t-studenta, poziom istotności α = 0,05. Próba: 191,2; 193,0; 195,1; 184,3; 197,6; 200,8; 194,2; 198,7; 189,5; 200,2; n=10; parametry próby: x = 194, 46 g, s = 5,19 g. Wartość empiryczna funkcji testowej x µ 0 194, 46 200 t emp = n = 10 = 3, 3755 s 519,. Wartość krytyczna funkcji testowej t α,n-1 = t 0,05, 9 = 2,2622. Wnioskowanie 1 (wniosek statystyczny): t emp =3,3375> 2,2622 = t 0,05,9, zatem hipotezę zerową H 0 odrzucamy. Wniosek merytoryczny: nie moŝna przyjąć, Ŝe średnia masa owocu tej odmiany wynosi 200 g.
Ozn.: t emp = X S µ n y = f (x) funkcja gęstości rozkładu t-studenta z v=9 stopniami swobody f(x) 0 wartości t
y = f (x) funkcja gęstości rozkładu t-studenta z v = 9 stopniami swobody α 0, 05 Pole = = = 0, 025 2 2 Pole=1-α=0,95 α 0, 05 Pole = = = 0, 025 2 2 - t 0,05, 9 = -2,2622 0 t 0,05,9 =2,2622 wartości t obszar dopuszczenia hipotezy obszar odrzucenia hipotezy (krytyczny)
y = f (x) funkcja gęstości rozkładu t-studenta z v = 9 stopniami swobody Pole = wartość p Pole = α = 0,05 -t emp =-3,34 - t kryt = -2,26 0 t kryt =2,26 t emp =3,34 wartości t
ZałoŜenia: 1. cecha X 1 ~N(µ 1, σ 2 ), cecha X 2 ~N(µ 2, σ 2 ), µ 1, µ 2, σ 2 - nieznane parametry, 2. pobrano n 1 elementową próbę losową z pierwszej populacji oraz n 2 -elementową próbę losową z drugiej populacji. H 0 : µ 1 = µ 2 (porównanie średnich w dwóch populacjach), test t-studenta, poziom istotności α. x1 x2 Funkcja testowa: temp = s gdzie: 2 1 1 s = r se + n1 n błąd stand. róŝnicy średnich, 2 2 ( n 1) + s ( n 1) r 2 2 s1 1 2 2 s e = n1 + n2 2 wspólna wariancja Wnioskowanie 1: jeŝeli t emp >t α,n1+n2-2, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Wnioskowanie 2: jeŝeli p<α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić.
ZałoŜenia: 1. cecha X 1 ~N(µ 1, σ 2 ), cecha X 2 ~N(µ 2, σ 2 ), µ 1, µ 2, σ 2 - nieznane parametry, 2. pobrano n 1 elementową próbę losową z pierwszej populacji oraz n 2 elementową próbę losową z drugiej populacji. 2 2 H 0 : σ 1 = σ 2 (porównanie wariancji w dwóch populacjach), test F-Fishera, poziom istotności α. 2 2 max ( s, s ) 1 2 F Funkcja testowa: emp = 2 2 min ( s, s ) Wnioskowanie 1: jeŝeli F emp > F α/2, v licz, v mian, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. UWAGA: v licz liczba stopni swobody dla licznika, v mian - liczba stopni swobody dla mianownika, v i = n i 1. Wnioskowanie 2: jeŝeli wartość p<α, to hipotezę H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. 1 2
ZałoŜenia: 1. cecha X 1 ma rozkład dwupunktowy z nieznanym parametrem p 1, 2. cecha X 2 ma rozkład dwupunktowy z nieznanym parametrem p 2, 3. pobrano n 1 elementową próbę losową z pierwszej populacji oraz n 2 elementową próbę losową z drugiej populacji, k i liczba elementów k i k1 + k 2 wyróŝnionych w i-tej próbie; p i =, p = n + n. n i 1 2 H 0 : p 1 = p 2 (porównanie frakcji w dwóch populacjach), test przybliŝony u (dla duŝych prób), poziom istotności α. p1 p2 uemp = Funkcja testowa: 1 1 ( ) p 1 p + n1 n 2 Wnioskowanie: jeŝeli u emp u w przeciwnym przypadku H 0 nie moŝna odrzucić. α 1 2, to hipotezę H 0 odrzucamy,
Pojęcia cd.: Hipoteza alternatywna, ozn. H 1 przyjmowana po odrzuceniu hipotezy zerowej. Moc testu - p-stwo nieodrzucenia prawdziwej hipotezy alternatywnej. Od testu wymagamy, aby był najmocniejszy, czyli z duŝym p-stwem odrzucał fałszywą hipotezę zerową.