Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie pobranej próbki. Przypuszczenia te najczęściej dotyczą postaci rozkładu lub wartości jego parametrów. Hipotezy, które dotyczą wyłącznie wartości parametru (bądź parametrów) określonej klasy rozkładów nazywamy hipotezami parametrycznymi, a pozostałe hipotezami nieparametrycznymi. Jeżeli hipoteza parametryczna precyzuje dokładne wartości wszystkich nieznanych parametrów rozkładu badanej cechy nazywamy ją hipotezą prostą, a w przeciwnym przypadku hipotezą złożoną. Weryfikacja hipotez statystycznych W praktyce przy weryfikacji hipotez postępuje się w ten sposób, że oprócz weryfikowania danej hipotezy wyróżnia się jeszcze inną hipotezę (prostą albo złożoną), zwaną hipotezą alternatywną. Hipoteza, którą chcemy sprawdzić nazywamy hipotezą zerową i oznaczamy symbolem H 0, zaś hipotezę alternatywną oznaczamy przez H 1. Wyróżniona hipoteza H 0 może być prawdziwa lub fałszywa. Postępowanie, w wyniku którego następuje przyjęcie lub odrzucenie hipotezy nazywamy sprawdzaniem lub weryfikowaniem hipotezy statystycznej. Weryfikacja hipotezy statystycznej składa się z dwóch etapów: wyboru odpowiedniego testu i ustalenia tzw. zbioru krytycznego. Weryfikacja hipotez statystycznych Testem hipotezy H 0 przeciw hipotezie alternatywnej H 1 nazywamy każdą statystykę Y, której wartość obliczona na podstawie próby będzie podstawą do zdecydowania, czy hipotezę H 0 odrzucić, czy też przyjąć. Pierwszy etap weryfikacji hipotezy statystycznej polega na wyborze odpowiedniej statystyki i wyznaczeniu jej rozkładu przy założeniu, że weryfikowana hipoteza H 0 jest prawdziwa. Test służący do weryfikacji hipotezy oparty jest na statystyce, której rozkład jest nam znany. Jeżeli próba jest duża, to wykorzystujemy rozkład graniczny, jeżeli próba jest mała, to rozkład dokładny. Weryfikacja hipotez statystycznych Drugi etap weryfikacji hipotez polega na ustaleniu tzw. zbioru krytycznego. Zbiorem krytycznym testu (zbiorem odrzuceń hipotezy) nazywamy taki zbiór W wartości wybranego testu, których wystąpienie powodować będzie odrzucenie weryfikowanej hipotezy H 0. Jest to więc zbiór tych wartości statystyki Y, których występowanie uważamy za zaprzeczenie hipotezie zerowej H 0. Zbiór W będący dopełnieniem zbioru W nazywamy zbiorem przyjęć hipotezy. Błędy przy testowaniu hipotez statystycznych Przy weryfikacji hipotez statystycznych można podjąć poprawną decyzję lub można popełnić jeden z dwóch błędów: błąd I rodzaju polegający na odrzuceniu testowanej hipotezy H 0, gdy jest ona prawdziwa; błąd II rodzaju polegający na przyjęciu hipotezy H 0, gdy jest ona fałszywa (tzn. prawdziwa jest hipoteza alternatywna H 1 ). Błędy przy testowaniu hipotez statystycznych Decyzja H 0 jest prawdziwa H 0 jest faszywa przyj hipotez H 0 decyzja poprawna decyzja bdna (bd II rodzaju) odrzuci hipotez H 0 decyzja bdna decyzja poprawna (bd I rodzaju) 1
Poziom istotności testu Prawdopodobieństwo odrzucenia hipotezy H 0 przy założeniu, że jest ona prawdziwa nazywamy poziomem istotności testu i oznaczamy symbolem α. Fakt ten zapisujemy następująco P (y W H 0 ) = α. Poziom istotności testu jest więc prawdopodobieństwem popełnienia błędu I rodzaju. Wybór tego prawdopodobieństwa jest dowolny, ale zwykle przyjmuje się jedną z wartości α = 0, 01 albo α = 0, 05. Moc testu Prawdopodobieństwo odrzucenia hipotezy H 0 w przypadku, gdy prawdziwa jest hipoteza alternatywna H 1 nazywamy mocą testu. Prawdopodobieństwo popełnienia błędu II rodzaju oznaczamy symbolem β. Fakt ten zapisujemy następująco Moc testu jest więc równa P (y W H 1 ) = 1 β. P (y W H 1 ) = 1 P (y W H 1 ) = β. Test najmocniejszy Test statystyczny powinien oczywiście być taki, aby prawdopodobieństwo popełnienia błędów I i II rodzaju było jak najmniejsze. Idealnym rozwiązaniem byłoby α = 0 oraz β = 0. Nie jest to jednak możliwe. Zmniejszenie wartości α pociąga za sobą zwiększenie β. Wybierając więc poziom istotności α należy minimalizować β, czyli maksymalizować moc testu. Test, który przy ustalonym prawdopodobieństwie błędu I rodzaju minimalizuje prawdopodobieństwo błędu II rodzaju nazywamy testem najmocniejszym dla hipotezy H 0 względem prostej hipotezy alternatywnej H 1. Jeżeli test jest najmocniejszy względem każdej złożonej hipotezy alternatywnej H 1, to nazywamy go testem jednostajnie najmocniejszym względem H 1. Etapy przy weryfikacji hipotez statystycznych Aby skonstruować test statystyczny pozwalający weryfikować hipotezę H 0, należy określić następujące elementy: wybrać statystykę testową stosownie do treści postawionej hipotezy H 0 ; ustalić dopuszczalne prawdopodobieństwo α błędu pierwszego rodzaju, tzn. ustalić poziom istotności testu; określić hipotezę alternatywną; wyznaczyć zbiór krytyczny tak, aby przy danym poziomie istotności α zminimalizować prawdopodobieństwo błędu drugiego rodzaju. Testy istotności Testem istotności nazywamy test, którego celem jest jedynie zweryfikowanie jednej wysuniętej hipotezy pod kątem jej fałszywości z pominięciem innych hipotez. Testy istotności uwzględniają jedynie prawdopodobieństwo popełnienia błędu I rodzaju. Należy pamiętać, że nieodrzucenie weryfikowanej hipotezy H 0 nie oznacza jej przyjęcia. Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o znanym odchyleniu standardowym σ = σ 0. Liczebność próby jest dowolna. H 0 : µ = µ 0 ; H 1 : µ µ 0, gdzie µ 0 jest hipotetyczną wartością średniej. Do weryfikacji hipotezy H 0 wykorzystujemy ( średnią arytmetyczną z próby X. σ Statystyka X ma rozkład normalny N µ, ). n 2
Zmienna U = X µ 0 n σ ma przy założeniu prawdziwości hipotezy H 0 (µ = µ 0 ) rozkład normalny N(0, 1). H 0 : µ = µ 0 ; H 1 : µ < µ 0. P (U u α ) = α albo Φ(u α ) = α. W = {u: u u α } = (, u α. Hipotezy H 0 i H 1 mają postać H 0 : µ = µ 0 ; H 1 : µ > µ 0. Z tablic rozkładu N(0, 1) odczytujemy wartość krytyczną u α w ten sposób, by spełniony był warunek P (U u α ) = α albo Φ(u α ) = 1 α. Zbiór krytyczny W ma postać W = {u: u u α } = u α, + ). I Obserwowana w próbie zmienna X ma rozkład dowolny, ale odchylenie standardowe σ jest nieznane. Liczebność próby jest duża (n 30). H 0 : µ = µ 0 ; H 1 : µ µ 0. Ze względu na fakt, że próba jest duża, można przyjąć, że σ Ŝ. Przy założeniu prawdziwości hipotezy H 0 zmienna ma rozkład normalny N(0, 1). U = X µ 0 Ŝ X µ 0 n = n 1 S 3
I Testy jednostronne budujemy podobnie jak w modelu I. II Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o nieznanym odchyleniu standardowym σ. Liczebność próby jest mała (n < 30). H 0 : µ = µ 0 ; H 1 : µ µ 0. Ze względu na małą liczebność nie można wykorzystać statystyki z modelu II. Zmienna losowa T = X µ 0 X µ 0 n = n 1 Ŝ S ma przy założeniu prawdziwości hipotezy H 0 rozkład t-studenta o n 1 stopniach swobody. II Dla określonego poziomu istotności α wyznaczamy wartość krytyczną t α z tablic rozkładu t-studenta o n 1 stopniach swobody w ten sposób, by spełniony był warunek P ( T t α ) = α. W = {t: t t α } = (, t α t α, + ). Jeżeli wartość statystyki T wyznaczona dla danej próby jest równa t 0 oraz t 0 W, to hipotezę H 0 odrzucamy. Jeżeli natomiast t 0 / W, to nie mamy dostatecznych podstaw do odrzucenia hipotezy H 0. II H 0 : µ = µ 0 ; H 1 : µ < µ 0. Z tablic rozkładu t-studenta o n 1 stopniach swobody odczytujemy wartość krytyczną t α w ten sposób, by spełniony był warunek P ( T t α ) = 2α. W = {t: t t α } = (, t α. II H 0 : µ = µ 0 ; H 1 : µ > µ 0. 4
Z tablic rozkładu t-studenta o n 1 stopniach swobody odczytujemy wartość krytyczną t α w ten sposób, by spełniony był warunek P ( T t α ) = 2α. W = {t: t t α } = t α, + ). Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ. Liczebność próby jest mała (n < 50). H 0 : σ 2 = σ 2 0; H 1 : σ 2 σ 2 0, gdzie σ 2 0 jest hipotetyczną wartością wariancji σ 2. Do weryfikacji hipotezy H 0 wykorzystujemy zmienną losową χ 2 = ns2 σ 2 0 lub χ 2 = (n 1)Ŝ2 σ0 2. Jeżeli słuszna jest hipoteza H 0, to powyższe zmienne losowe mają rozkład χ 2 o n 1 stopniach swobody. Przy ustalonym poziomie istotności α z tablic tego rozkładu odczytujemy wartości χ 2 1 oraz χ 2 2 tak, aby P (χ 2 χ 2 2) = α 2 = 1 P (χ2 χ 2 1). W = (0, χ 2 1 χ 2 2, + ). Jeżeli wartość statystyki χ 2 wyznaczona dla danej próby jest równa χ 2 0 oraz χ 2 0 W, to hipotezę H 0 odrzucamy. Jeżeli natomiast χ 2 0 / W, to nie mamy podstaw do odrzucenia hipotezy H 0. H 0 : σ 2 = σ 2 0; H 1 : σ 2 < σ 2 0. Przy ustalonym poziomie istotności α z tablic rozkładu χ 2 o n 1 stopniach swobody odczytujemy wartość χ 2 α tak, aby P (χ 2 χ 2 α) = 1 α. W = (0, χ 2 α. H 0 : σ 2 = σ 2 0; H 1 : σ 2 > σ 2 0. Przy ustalonym poziomie istotności α z tablic rozkładu χ 2 o n 1 stopniach swobody odczytujemy wartość χ 2 α tak, aby P (χ 2 χ 2 α) = α. W = χ 2 α, + ). I 5
Obserwowana w próbie zmienna X ma rozkład normalny N(µ, σ) o nieznanych parametrach µ i σ. Liczebność próby jest duża (n 50). H 0 : σ 2 = σ 2 0; H 1 : σ 2 σ 2 0, gdzie σ0 2 jest hipotetyczną wartością wariancji σ 2. Do weryfikacji hipotezy H 0 wykorzystujemy statystykę 2nS U = 2 2n 3, która ma w przybliżeniu rozkład normalny N(0, 1). σ 2 0 I I H 0 : σ 2 = σ 2 0; H 1 : σ 2 < σ 2 0. P (U u α ) = α albo Φ(u α ) = α. W = {u: u u α } = (, u α. I H 0 : σ 2 = σ 2 0; H 1 : σ 2 > σ 2 0. P (U u α ) = α albo Φ(u α ) = 1 α. W = {u: u u α } = u α, + ). Niech rozkład badanej cechy będzie dwupunktowy z parametrem p. Liczebność próby jest duża (n 100). H 0 : p = p 0 ; H 1 : p p 0. Hipoteza H 0 mówi, że frakcja wyróżnionych elementów w populacji jest równa p 0. Estymatorem frakcji p jest statystyka K, gdzie K jest liczbą elementów wyróżnionych w n-elementowej próbie. n 6
( ) p(1 p) Ma ona rozkład asymptotycznie normalny N p,. n Statystyka U = K n p 0 p 0(1 p 0) n = K np 0 np0 (1 p 0 ) ma przy założeniu prawdziwości hipotezy H 0 rozkład asymptotycznie normalny N(0, 1). H 0 : p = p 0 ; H 1 : p < p 0. P (U u α ) = α albo Φ(u α ) = α. W = {u: u u α } = (, u α. H 0 : p = p 0 ; H 1 : p > p 0. P (U u α ) = α albo Φ(u α ) = 1 α. W = {u: u u α } = u α, + ). 7