Statystyka Matematyczna Anna Janicka wykład X, 9.05.206 TESTOWANIE HIPOTEZ STATYSTYCZNYCH II: PORÓWNYWANIE TESTÓW
Plan na dzisiaj 0. Przypomnienie potrzebnych definicji. Porównywanie testów 2. Test jednostajnie najmocniejszy 3. Test ilorazowy dla hipotez prostych: lemat Neymana-Pearsona 4. Przykłady testów dla hipotez prostych (i uogólnienia)
Definicje przypomnienie Testujemy H 0 : θ Θ 0 przeciw H : θ Θ K obszar krytyczny testu, zbiór wyników, przy których odrzucamy H 0, K = {x X : δ (x) = } Test jest na poziomie istotności α, jeśli dla każdego θ Θ 0 mamy P θ (K) α. P θ (K) dla θ Θ moc testu (przy hipotezie alternatywnej) decyzja odrzucićh 0 H 0 prawdziwa błąd I-go rodzaju Stan faktyczny H 0 fałszywa OK nie odrzucać H 0 OK błąd II-go rodzaju
Przypomnienie: interpretacja graficzna rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej θ = θ 0 θ = θ moc testu dla hipotezy alternatywnej c błąd I-go rodzaju błąd II-go rodzaju
Przykład złego testu rozkłady statystyki testowej przy założeniu prawdziwości hipotezy zerowej i alternatywnej θ = θ θ = θ 0 moc testu dla hipotezy alternatywnej c błąd I-go rodzaju błąd II-go rodzaju
Porównywanie testów Jak wybrać najlepszy test? dla ustalonych hipotez zerowej i alternatywnej dla ustalonego poziomu istotności ( konserwatyzmu badacza ) lepszy jest test, który jest mocniejszy
Porównywanie mocy testów X ~ P θ, {P θ : θ Θ} rodzina rozkładów Testujemy H 0 : θ Θ 0 przeciw H : θ Θ t. że Θ 0 Θ = dwoma testami o obszarach krytycznych K i K 2 ; oba na poziomie istotności α. Test o obszarze krytycznym K jest mocniejszy niż test o obszarze krytycznym K 2, jeśli θ Θ oraz : P θ θ Θ ( K : ) P θ ( K 2 ) Pθ ( K) > P ( K θ 2 )
Test jednostajnie najmocniejszy Dla ustalonych H 0 : θ Θ 0 i H : θ Θ : δ* jest testem jednostajnie najmocniejszym (TJNM) na poziomie istotności α, jeśli ) δ* jest testem na poziomie istotności α, 2) dla każdego testu δ na poziomie istotności α, mamy, dla każdego θ Θ : P θ (δ*(x)=) P θ (δ (X)=) tzn. moc testu δ* jest niemniejsza niż moc każdego innego testu tych samych hipotez, dla dowolnego θ Θ jeśli Θ jest jednoelementowy, niepotrzebne jest słowo jednostajnie
Test jednostajnie najmocniejszy sformułowanie z obszarem krytycznym Dla ustalonych H 0 : θ Θ 0 i H : θ Θ : Test o obszarze krytycznym K* jest testem jednostajnie najmocniejszym (TJNM) na poziomie istotności α, jeśli ) Test o obszarze krytycznymk* jest testem na poziomie istotności α, tzn. dla każdego θ Θ 0 :P θ (K*) α, 2) dla każdego testu o obszarze krytycznym K na poziomie istotności α, mamy dla każdego θ Θ : P θ (K*) P θ (K)
Testowanie hipotez prostych Obserwujemy X. Chcemy testować H 0 : θ = θ 0 przeciw H : θ = θ. (dwie hipotezy proste) Możemy zapisać to jako: H 0 : X ~ f 0 przeciw H : X ~ f, gdzie f 0 i f to gęstości rozkładów opisanych przez θ 0 i θ (tj. P 0 i P )
Test ilorazowy dla hipotez prostych. Lemat Neymana-Pearsona Niech f ( x) K* = x X : > c f0( x) t. że P0 ( K*) = α i P( K*) = β Wówczas dla dowolnego zbioru K X : jeśli P 0 (K) α, to P (K) β. (tzn. test o obszarze krytycznym K* jest testem (jednostajnie) najmocniejszym do testowania hipotezy H 0 przeciw H ) Często łatwiej obszar krytyczny zapisać jako K* = {x: lnf (x) lnf 0 (x) > c } Test ilorazowy (ilorazu funkcji wiarogodności): przyrównujemy iloraz szans do pewnej stałej, jeśli zły to odrzucamy H 0
Lemat Neymana-Pearsona Przykład Model normalny: X, X 2,..., X n są próbą IID z rozkładu N(µ, σ 2 ), przy czym σ 2 jest znane Test najmocniejszy dla H 0 : µ = 0 przeciw H : µ =. Rozw: na poziomie istotności α : u K* ( x x xn X >, 2,..., ): = ασ Np. dla obs.,37; 0,2; 0,33; -0,45;,33; 0,85;,78;,2; 0,72 z N(µ, ) mamy, dla α = 0,05 : X 0,82 >,645 0,54 9 n odrzucamy H 0 µ 0 < µ
Lemat Neymana-Pearsona Przykład cd. Moc testu dla hipotezy alternatywnej P = > σ ( K*) P X,645 µ = =... n = Φ,645 µ n σ Gdy zmieniamy α, µ, n moc testu... 0,9
Lemat Neymana-Pearsona: Uogólnienie przykładu Ten sam test jest TJNM dla H : µ > 0 oraz dla H 0 : µ 0 przeciw H : µ > 0 ogólniej: przy pewnych dodatkowych założeniach dot. rodziny rozkładów, analogiczna postać testu jest TJNM dla testów jednostronnych H 0 : µ µ 0 przeciw H : µ > µ 0 Uwaga: zmiana kierunku nierówności w obszarze krytycznym gdy testujemy H 0 : µ µ 0 przeciw H : µ < µ 0
Lemat Neymana-Pearsona Przykład 2 Model wykładniczy: X, X 2,..., X n są próbą IID z rozkładu exp(λ), n = 0. Test najmocniejszy dla H 0 : λ = ½ przeciw H : λ = ¼. Rozw: na poziomie istotności α = 0,05: K {( x, x,..., x ): x 3,4} * = 2 0 i > Np. dla danych: 2; 0,9;,7; 3,5;,9; 2,; 3,7; 2,5; 3,4; 2,8: Σ = 24,5 nie ma podstaw do odrzucenia H 0. 2 exp( λ ) = Γ(, λ) Γ( a, λ) + Γ( b, λ) = Γ( a + b, λ) Γ( n, 2 2) = χ ( n)
Lemat Neymana-Pearsona Przykład 2 Model wykładniczy: X, X 2,..., X n są próbą IID z rozkładu exp(λ), n = 0. Test najmocniejszy dla H 0 : λ = ½ przeciw H : λ = ¾. Rozw: na poziomie istotności α = 0,05: K {( x, x,..., x ): x 0,85} * = 2 0 i < Np. dla danych: 2; 0,9;,7; 3,5;,9; 2,; 3,7; 2,5; 3,4; 2,8: Σ = 24,5 nie ma podstaw do odrzucenia H 0. 2 exp( λ ) = Γ(, λ) Γ( a, λ) + Γ( b, λ) = Γ( a + b, λ) Γ( n, 2 2) = χ ( n)
Przykład 2 cd. Test K {( x, x,..., x ): x 3,4} * = 2 0 i > jest TJNM dla H 0 : λ ½ przeciw H : λ < ½ Test K {( x, x,..., x ): x 0,85} * = 2 0 i < jest TJNM dla H 0 : λ ½ przeciw H : λ > ½
Test ilorazu wiarogodności dla hipotez złożonych X ~ P θ, {P θ : θ Θ} rodzina rozkładów Testujemy H 0 : θ Θ 0 przeciw H : θ Θ t. że Θ 0 Θ =, Θ 0 Θ = Θ Niech H 0 : X ~ f 0 (θ 0, ) dla pewnego θ 0 Θ 0, H : X ~ f (θ, ) dla pewnego θ Θ, gdzie f 0 i f to rodziny gęstości rozkładów (dla θ Θ 0 oraz θ Θ, odpowiednio) Jak w lemacie N-P, ale modele są statystyczne zawierają nieznane parametry. Postępujemy jednak podobnie...
Test ilorazu wiarogodności dla hipotez złożonych cd. Statystyka testowa: lub inaczej θˆ, θ λ = f f 0 sup λ = sup ( ˆ θ, X) ( ˆ θ, X) 0 θ Θ gdzie 0 ˆ są estymatorami NW odpowiednio w modelu opisanym przez hipotezę zerową oraz hipotezę alternatywną Odrzucamy H 0 jeśli λ > c dla pewnej stałej c (wyznaczonej odpowiednio do poz. istotności) 0 θ Θ 0 f f 0 ( θ, X ( θ, X 0 ) )
Test ilorazu wiarogodności dla hipotez złożonych uzasadnienie Podobnie jak w tw. Neymana-Pearsona, porównujemy największą szansę otrzymania obserwacji X, gdy prawdziwa jest hipoteza alternatywna do największej szansy otrzymania obserwacji X, gdy prawdziwa jest hipoteza zerowa ; odrzucamy hipotezę zerową na rzecz alternatywnej, gdy ten stosunek jest bardzo niekorzystny dla hipotezy zerowej.
Test ilorazu wiarogodności dla hipotez złożonych wersja alternatywna Statystyka testowa: lub inaczej θˆ, ˆ θ ~ λ = ~ λ = f( ˆ, θ X) f 0 ( ˆ θ, X) 0 sup sup f( θ, X f ( θ 0 0, X 0 Θ0 gdzie 0 są estymatorami NW odpowiednio w modelu bez ograniczeń oraz w modelu opisanym przez hipotezę zerową Odrzucamy H 0 jeśli dla pewnej stałej. θ θ Θ ~ >c ~ λ c ~ wersja wygodniejsza, jeśli hipoteza zerowa jest prosta albo jeśli mamy do czynienia z modelami zagnieżdżonymi ) )
Test ilorazu wiarogodności dla hipotez złożonych własności Dla niektórych modeli z hipotezami złożnymi TJNM nie istnieje (więc test ilorazu wiarogodności nie będzie na pewno TJNM bo takiego nie ma) np. testowanie H 0 : θ = θ 0 przeciw H : θ θ 0, jeżeli rodzina spełnia warunek monotonicznego ilorazu wiarogodności, tj. f (x)/f 0 (x) jest rosnącą funkcją pewnej statystyki T(x) dla każdych f 0 i f odpowiadających parametrom θ 0 < θ. Żeby mieć TJNM H 0 : θ = θ 0 przeciw H : θ< θ 0 należałoby mieć obszar krytyczny postaci T(x)>c, a żeby test był TJNM dla H 0 : θ = θ 0 przeciw H : θ > θ 0 obszar krytyczny musi być postaci T(x)<c, a zatem nie da się ustalić TJNM dla hipotezy H : θ θ 0,.