Testowanie hipotez statystycznych Wyk lad 9 Natalia Nehrebecka Stanis law Cichocki 28 listopada 2018
Plan zaj eć 1 Rozk lad estymatora b 2 3 dla parametrów 4 Hipotezy l aczne - test F 5
Dodatkowe za lożenie Rozk lad estymatora b Oprócz za lożeń o: braku autokorelacji i homoskedastyczności: Var(ε) = σ 2 I zerowej wartości oczekiwanej: E(ε) = 0 Dochodzi za lożenie o: normalności rozk ladu b l edów losowych. Reasumujac: ε N(0, σ 2 I)
Rozk lad estymatora b Wiemy już że: Stad: b = β + (X X) 1 X ε E(b) = β oraz Var(b) = σ 2 (X X) 1 b N(β, σ 2 (X X) 1 )
Hipoteza teoretyczna powinna być zgodna z danymi, aby móc ja uwzgledniać w procesie estymacji Niskie prawdopodobieństwo uzyskania obserwowanego odchylenia oszacowań od narzuconych przez teorie ograniczeń odrzucamy hipoteze teoretyczna Aby określić to prawdopodobieństwo, niezbedna jest znajomość rozk ladu estymatorów i statystyk testujacych
Testowanie hipotez przy użyciu statystyki t Testowanie hipotez statystycznych polega na badaniu prawdopodobieństwa uzyskania otrzymanej wartości statystyki testowej przy za lożonej hipotezie zerowej H 0. Hipotezy proste dotycza pojedynczego parametru modelu lub kombinacji liniowej parametrów
Rozk lad statystyki t t = b k β k se(b ˆ k ) t t N K
Przyk lad (1/2) Za lóżmy, że teoria mówi, że pewien parametr modelu, β k, jest równy określonej wartości, β k, β k = β k Jeżeli: spe lnione sa za lożenia KMRL b l ad losowy ma rozk lad normalny teoria jest s luszna / hipoteza zerowa H 0 jest prawdziwa
Przyk lad (2/2) Wtedy: statystyka testowa: t = b k βk se(b ˆ k ) t N K statystyka krytyczna (odczytujemy z tablic rozk ladu t-studenta ): t = t N K }{{} Stopni swobody, 1 α }{{ 2 } Rzad kwantyla gdzie: α- poziom istotności Jeśli t t - odrzucamy H 0 Jeśli t < t - nie ma podstaw do odrzucenia H 0
Hipotezy dwustronne { H0 : β k = 0 H 1 : β k 0 Jeśli H 0 jest prawdziwa, wówczas model ma postać: y = β 0 + + β }{{} k x k + + β K x K + ε 0 zmienna x k nie ma znaczenia dla wyjaśnienia zmienności y
Statystyka testowa statystyka testowa: t = b k se(b ˆ k ) czyli jest to stosunek wielkości estymatora parametru przez estymator jego odchylenia standardowego statystyka krytyczna (odczytujemy z tablic rozk ladu t-studenta ): ( t = t N K, 1 α ) 2 Jeśli t t - odrzucamy H 0 Jeśli t < t - nie ma podstaw do odrzucenia H 0
Wnioskowanie statystyczne hipotezy dwustronne P( t > t ) = 2[1 F tn K (t )] = α Obecnie, zamiast stosować wartości krytyczne, oblicza si e p-value (policzony poziom istotności): 2[1 F tn K (t)] = p value Jeśli p value poniżej określonego poziomu istotności (np. 0, 05) - odrzucamy H 0 W przeciwnym przypadku - nie ma podstaw do odrzucenia H 0
Przyk lad
dla parametrów Jaki jest przedzia l, w którym z określonym prawdopodobieństwem znajdzie si e nieznana wartość parametru β k. Odpowiedź na to pytanie uzyskamy wyznaczajac tak zwany przedzia l ufności. Przedzia l ufności dla nieznanego parametru β k na poziomie ufności 1= α można skonstruować nastepuj aco: ( ) P( t < t b k β ) = P k se(b ˆ k ) < t = = P (b k se(b ˆ k )t < β k < b k + se(b ˆ k )t ) = 1 α gdzie: t = t ( N K, 1 α ) 2
Przyk lad dla parametrów Policzyć 95%-procentowy przedzia l ufności dla β plec.
Hipotezy l aczne - test F Hipotezy l aczne sa ważne z punktu widzenia: rozważań teoretycznych Uwaga: doboru zmiennych do modelu Hipotezy l aczne nie sa równoważne iloczynowi hipotez prostych!
Typowa hipoteza l aczna Hipotezy l aczne - test F dana jest uk ladem równań: H 0 : Hβ = h gdzie: H - macierz o pe lnym rzedzie wierszowym = g. Liczba równań w tym uk ladzie nazywana jest liczba ograniczeń Uk lad równań: zawiera równania liniowo niezależne nie jest sprzeczny
Zadanie Hipotezy l aczne - test F W modelu: y i = β 0 + β 1 x 1i + β 2 x 2i + β 3 x 3i + ε i testowana jest hipoteza H0 postaci: β 0 = 0 H 0 : β 1 = β 2 β 2 + β 3 = 1 Znaleźć macierze H i h za pomoca których hipoteze H0 można zapisać jako Hβ = h.
1 Wyprowadzić rozk lad ma lopróbkowy estymatora MNK. Jakie za lożenie, poza standardowymi KMRL, należy w tym przypadku przyjać? 2 Jaka postać ma statystyka s lużaca do testowania hipotezy o tym, że β k = βk? 3 Majac oszacowanie b k oraz oszacowanie odchylenia standardowego tego oszacowania se(b ˆ k ) wyjaśnić w jaki sposób należy zbudować przedzia l ufności dla β k. Ilość obserwacji wynosi N, ilość szacowanych parametrów K, a poziom ufności 1 α.