Testowanie hipotez statystycznych Przypuśdmy, że mamy do czynienia z następującą sytuacją: nieznany jest rozkład F rządzący pewnym zjawiskiem losowym. Dysponujemy konkretną próbą losową ( x1, x2,..., xn ) i wysunęliśmy pewną hipotezę H dotyczącą rozkładu F. Co można orzec o prawdziwości tej hipotezy na podstawie x, x,..., x )? ( 1 2 n Hipoteza statystyczna to przypuszczenie odnośnie do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów), którego prawdziwośd jest oceniana na podstawie wyników próby losowej. 2
Po sformułowaniu hipotezy niezbędne jest określenie zasad weryfikacji tej hipotezy, tzn. zasad postępowania umożliwiającego stwierdzenie na podstawie wyników próby, czy hipotezę należy uznad za prawdziwą, czy też nie. Testem statystycznym nazywa się regułę postępowania, która każdej możliwej próbie przyporządkowuje decyzję przyjęcia lub odrzucenia hipotezy. 3
Zwykle mamy pewne informacje o populacji generalnej, ograniczające zbiór możliwych przypuszczeo (np. jeśli wiemy, że cecha jest ciągła, to bezpodstawne jest sprawdzanie hipotezy, że populacja generalna ma rozkład Poissona). Te informacji a priori o populacji generalnej wyznaczają tzw. zbiór hipotez dopuszczalnych. Każda hipoteza jest więc podzbiorem zbioru hipotez dopuszczalnych. Klasyfikacja hipotez: Jeśli hipoteza H dotyczy wartości parametrów rozkładu F, nazywa się ją hipotezą parametryczną; w przeciwnym wypadku hipotezą nieparametryczną. Hipotezę H, która jednoznacznie precyzuje nieznany rozkład F, nazywa się hipotezą prostą; w przeciwnym wypadku hipotezą złożoną. 4
Statystyczne testy istotności są konstruowane następująco: 1. Formułuje się sprawdzaną hipotezę (zwaną zerową), którą tradycyjnie oznacza się przez H 0 oraz tzw. hipotezę alternatywną H 1, która jest zaprzeczeniem hipotezy zerowej i którą jesteśmy skłonni przyjąd w przypadku odrzucenia hipotezy zerowej. 2. Na podstawie próby określa się statystykę sprawdzającą S n, której rozkład określa się przy założeniu, że prawdziwa jest hipoteza H 0. 3. Ustala się poziom istotności (0 < <1) i określa się tzw. obszar krytyczny testu (obszar odrzucenia hipotezy) K, tj. zbiór o tej własności, że P(Sn K H0). 4. Jeśli wartośd statystyki wyznaczona na podstawie próby s n K to H 0 odrzuca się na korzyśd hipotezy alternatywnej H 1, w przeciwnym wypadku stwierdza się brak podstaw do odrzucenia H 0. 5
Błąd I rodzaju wyniki próby są takie, że odrzucimy hipotezę H 0, która jest prawdziwa. Błąd II rodzaju wyniki próby są takie, że przyjmiemy hipotezę H 0, która jest fałszywa. Uwaga: nie można minimalizowad obu tych błędów równocześnie ( gdy jeden z nich maleje, to drugi rośnie). Test istotności dla wartości średniej populacji generalnej A. Założenie: populacja generalna ma N(m,σ), m - nieznane, σ-znane : m H0 m 0 H1 : m m0 Statystyka sprawdzająca U X m 0 ma rozkład N(0,1) 6
Przy przyjętym poziomie istotności α z tablic rozkładu normalnego odczytuje się taką wartośd u α, aby zachodziło P( U u ). Jeśli wartośd statystyki z próby u spełnia nierównośd u u, to H 0 odrzuca się; w przeciwnym wypadku stwierdza się brak podstaw do odrzucenia H 0. B. Założenie: populacja generalna ma N(m,σ), m, σ nieznane : m H : m H0 m 0 1 m0 Statystyka X m S t 0 n 1 ma rozkład t-studenta z n-1 stopniami swobody Przy przyjętym poziomie istotności α z tablic rozkładu t-studenta odczytuje się taką wartośd t α,n-1, aby zachodziło ( t t ). P,n 1 7
Jeśli wartośd statystyki z próby t spełnia nierównośd t t,n 1, to H 0 odrzuca się; w przeciwnym wypadku stwierdza się brak podstaw do odrzucenia H 0. C. Założenie: populacja generalna ma dowolny rozkład z nieznanymi parametrami : m H : m Statystyka X m S U 0 n H0 m 0 1 m0 ma asymptotyczny N(0,1) Dla dużej próby przy przyjętym poziomie istotności α z tablic rozkładu normalnego odczytuje się taką wartośd u α, aby zachodziło P( u u ). Jeśli wartośd statystyki z próby u spełnia nierównośd u u, to H 0 odrzuca się; w przeciwnym wypadku stwierdza się brak podstaw do odrzucenia H 0. 8