Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę mówiącą, że jego prawdziwa wartość nie różni się istotnie od zadanej wartości, co zapisujemy: θ = θ 0, gdzie θ 0 jest ustalone. Poza samą hipotezą (nazywać ją będziemy hipotezą zerową) musimy jeszcze podać hipotezę alternatywną, czyli ustalić jaka jest nasza decyzja w przypadku odrzucenia hipotezy zerowej. Przykładowo, dla hipotezy zerowej H 0 : θ = θ 0, możliwe są następujące alternatywy: H 1 : θ = θ 0, H 1 : θ > θ 0 lub H 1 : θ < θ 0.
Przykładowe układy hipotez 1 Hipoteza zerowa: wartość oczekiwana (średnia) badanej cechy nie różni się istotnie od 2. Hipoteza alternatywna: wartość oczekiwana (średnia) badanej cechy jest istotnie większa od 2. 2 Hipoteza zerowa: wartości oczekiwane (średnie) badanej cechy w dwóch grupach nie różnią się istotnie. Hipoteza alternatywna: wartości oczekiwane (średnie) badanej cechy w dwóch grupach różnią się istotnie. 3 Hipoteza zerowa: nie ma istotnej zależności pomiędzy dwoma badanymi cechami. Hipoteza alternatywna: istnieje istotna zależność pomiędzy dwoma badanymi cechami.
Konstruując procedurę testową wyznaczamy tzw. obszar krytyczny (obszar odrzuceń hipotezy zerowej). Najbardziej typowym jest prawostronny obszar krytyczny postaci: R = {x : T (x) k}, gdzie T jest statystyką testową, a k oznacza wartość krytyczną. Stąd jeśli wartość statystyki testowej jest duża (przekracza wartość krytyczną), to odrzucamy hipotezę zerową. Inne postaci obszarów krytycznych: Lewostronny obszar krytyczny: Dwustronny obszar krytyczny: R = {x : T (x) k}. R = {x : T (x) k 1 lub T (x) k 2 }.
Błędy przy testowaniu hipotez Przyjmując lub odrzucając hipotezę zerową podejmujemy decyzję, która może być poprawna lub błędna. Podczas testowania hipotezy zerowej możemy popełnić jeden z dwóch błędów: 1 Odrzucamy hipotezę zerową, gdy jest ona prawdziwa błąd I rodzaju. 2 Przyjmujemy hipotezę zerową, gdy jest ona fałszywa błąd II rodzaju.
Błędy przy testowaniu hipotez
Wynik testowania hipotez Ponieważ decyzja przyjęcia hipotezy zerowej może pociągnąć za sobą popełnienie błędu II rodzaju (prawdopodobieństwo tego błędu nie jest kontrolowane i nawet w najlepszych testach może być bardzo duże), to wynikiem testowania hipotez statystycznych jest jedna z dwóch decyzji: 1 Odrzucamy hipotezę zerową, tzn. stwierdzamy występowanie istotnych statystycznie różnic (zależności), na poziomie istotności α, 2 Nie ma podstaw do odrzucenia hipotezy zerowej, tzn. stwierdzamy brak istotnych statystycznie różnic (zależności), na poziomie istotności α.
Definicja p wartość jest najmniejszym poziomem istotności testu, przy którym odrzucamy hipotezę zerową. 1 Jeżeli jest mniejsze bądź równa α, to odrzucamy H 0. 2 Jeżeli jest większa od α, to nie ma podstaw do odrzucenia H 0.
Sposób obliczania p wartości: 1 Prawostronny obszar krytyczny: P 0 (T T (x)). 2 Lewostronny obszar krytyczny: P 0 (T T (x)). 3 Dwustronny obszar krytyczny: 2 min{p 0 (T T (x), P 0 (T T (x))}.
Testy ilorazu wiarogodności Załóżmy, że dysponujemy n-elementową próbą, a θ oznacza parametr modelu statystycznego. Rozważamy zagadnienie testowania układu hipotez: H 0 : θ Θ 0, H 1 : θ Θ 1, gdzie Θ 0 Θ 1 = Θ oraz Θ 0 Θ 1 =. Ponadto załóżmy, że populacja, z której pochodzi nasza próba ma rozkład absolutnie ciągły. Testem ilorazu wiarogodności nazywamy test z obszarem krytycznym postaci: R = {x : sup θ Θ L(θ; x) sup θ Θ0 L(θ; x) k α}, gdzie wartość k α wyznaczamy tak, aby prawdopodobieństwo błędu pierwszego rodzaju było równe α.
Przykład Załóżmy, że dysponujemy n-elementową próbą prostą X = (X 1, X 2,..., X n ), n > 1 z populacji o rozkładzie normalnym z nieznanymi parametrami µ i σ 2. Obszar krytyczny testu ilorazu wiarogodności dla układu hipotez: ma następującą postać: H 0 : µ = µ 0 H 1 : µ < µ 0 R = {x : x µ 0 n t(α, n 1)}. s
Przykład W modelu jednej próby prostej z populacji o rozkładzie normalnym funkcja wiarogodności ma postać: L(µ, σ 2 ; x) = (2π) n/2 (σ 2 ) n/2 exp 1 n 2σ 2 (x i x) 2. Ponadto, estymatorami największej wiarogodności parametrów µ i σ 2 są odpowiednio statystyki: ˆµ = X, ˆσ 2 = S 2 = 1 n n (X i X ) 2. i=1 i=1
Przykład 1 Test t dla jednej próby. 2 Test t da dwóch prób niezależnych. 3 Test t dla dwóch prób zależnych. 4 Test istotności dla współczynnika korelacji. 5 Wersje permutacyjne powyższych testów.