Trzecie laboratoria komputerowe ze Staty Testy

Podobne dokumenty
Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Natalia Nehrebecka. Zajęcia 4

65120/ / / /200

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Ćwiczenia 7 Drugie zajęcia w pracowni komputerowej.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Weryfikacja hipotez dla wielu populacji

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Egzamin z ekonometrii wersja IiE, MSEMAT

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka. Wykład 2

Stanisław Cichocki. Natalia Nehrebecka

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Natalia Nehrebecka. Zajęcia 3

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Dobór zmiennych objaśniających

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Ekonometria Ćwiczenia 19/01/05

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Diagnostyka w Pakiecie Stata

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Diagnostyka w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Natalia Neherbecka. 11 czerwca 2010

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Testowanie hipotez statystycznych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Prawdopodobieństwo i statystyka r.

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Weryfikacja hipotez statystycznych

1.8 Diagnostyka modelu

Ekonometria egzamin 07/03/2018

Ekonometria. Zajęcia

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Mikroekonometria 7. Mikołaj Czajkowski Wiktor Budziński

Egzamin z ekonometrii wersja ogolna

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Testowanie hipotez statystycznych.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Markowa. ZałoŜenia schematu Gaussa-

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

Kolokwium ze statystyki matematycznej

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Egzamin z ekonometrii wersja IiE, MSEMAT

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

Natalia Nehrebecka. 18 maja 2010

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Wprowadzenie do analizy korelacji i regresji

Wykład 9 Wnioskowanie o średnich

Sprawozdanie powinno zawierać:

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Testowanie hipotez statystycznych

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

IID = 2. i i i i. x nx nx nx

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Transkrypt:

Trzece laboratora komputerowe ze Staty Testy Korzystać będzemy z danych dane_3.dta. Chcemy (jak zwykle ) oszacować model zarobków. Tym razem nteresująca nas postać modelu to: p0 = β + β pd0 + β pl08 + β pe07 + β wek + β wek + ε 0 1 3 4 5 Zmenna wek jest odpowedzalna za nelnowy wpływ weku na dochody jest często umeszczana w modelu dochodów. Zasadność tego można sprawdzć rysując wykres rozrzutu zarobków względem weku: scatter p0 age Aby ją stworzyć, wykorzystamy polecene: gen wek=wek^ Pamętając, że nektóre ze zmennych są zmennym dyskretnym, możemy oszacować ten model w Stace przy użycu polecena: x: reg p0.pd0.pl08.pe07 wek wek Jak wek wpływa na zarobk? Test RESET Testem, który ma dla nas relatywne najwększą wagę jest test poprawnośc formy funkcyjnej modelu (test RESET). Pozytywne przejśce modelu przez ten test, pozwala nam przyjąć, że lnowa forma funkcyjna, którą zakładamy przy szacowanu modelu, jest poprawna. Tym samym spełnone jest jedno z założeń KMRL. Test RESET wykonujemy w Stace przy użycu polecena ovtest : ovtest

Oto wynk: Ponważ p-value wynku tego testu jest mnejsze od pozomu stotnośc ( p value < α ), to odrzucamy hpotezę zerową przyjmujemy alternatywną, mówącą o nepoprawnej specyfkacj modelu. epoprawna specyfkacja modelu jest dość częstym zjawskem przecwdzałane jej zwykle wymaga dużo pracy badacza. Dodatkowo test RESET odpowada na pytane o poprawność formy funkcyjnej, jednak w raze zdagnozowana uchybeń w jej poprawnośc, wynk testu ne podaje żadnych wskazówek jakby można tę formę ulepszyć. Jest jednak klka standardowych sposobów, które często są warte spróbowana. Jednym z nch jest sensowne przekształcene zmennych modelu. Sensowne, gdyż transformacje zmennych mogą być na tyle skomplkowane, że pommo poprawana formy funkcyjnej modelu, mogą powodować utratę nterpretacj jego parametrów. Spójrzmy na hstogram zarobków: hst p0 W naszym przypadku, jedną z możlwych transformacj jest zlogarytmowane zmennej objaśnanej: gen lnp0=ln(p0) hst lnp0 Otrzymamy wtedy model: ln( p0 ) = β + β pd 0 + β pl08 + β pe07 + β wek + β wek + ε A w Stace: 0 1 3 4 5 x: reg lnp0.pd0.pl08.pe07 wek wek Wynk testu RESET to: Tym razem, przyjmując standardowy 5%-owy pozom stotnośc, ne mamy podstaw do odrzucena hpotezy zerowej, możemy węc przyjąć, że nasz model ma poprawną (lnową) formę funkcyjną. W przypadku tego modelu, ważnym posunęcem było równeż uwzględnene nelnowego wpływu weku na zarobk. Okazuje sę, że samo logarytmowane zmennej zależnej ne rozwązałoby problemu.

Test Jarque-Berra Test ten testuje normalność rozkładu składnka losowego. Pamętamy, że założene o tym, że składnk losowy ma rozkład normalny, pozwolło nam wyprowadzć rozkłady statystyk t F (równeż w małych próbach) poprawne testować hpotezy. Test Jarque-Berra wykonujemy w Stace w następujący sposób: 1. Do testu wykorzystywane są reszty modelu. Musmy węc je znaleźć: predct reszty, res. Teraz, porównując skośność kurtozę rozkładu reszt z skośnoścą kurtozą rozkładu normalnego, przeprowadzamy test normalnośc składnka losowego: sktest reszty W wynku testu, musmy odrzucć hpotezę zerową, że składnk losowy ma rozkład normalny. O le dysponujemy dużą loścą obserwacj (a tutaj dysponujemy), to wynk ten ne jest specjalne groźny, gdyż w dużych próbach, rozkłady statystyk testowych są wystarczająco blske zakładanym rozkładom teoretycznym, węc testowane hpotez statystycznych zgodne z poznanym przez nas zasadam, jest wcąż prawdłowe. Sytuacja może sę komplkować dla małych prób. Ręczne przeprowadzene testu Jarque-Berra: H0 : ε ( 0; σ I) H1 : ε ne ma rozkladu ( 0; σ I) Wyznaczamy skośność kurtozę dla reszt: 3 e 1 = θ 1 = 3 σ, gdze σ = e 4 1 = e 1 = θ = 4 σ porównujemy je ze skośnoścą kurtozą rozkładu normalnego z wartoścą oczekwaną zero. θ1 = 0 Czyl formalne testujemy H0 :. θ = 3 ( ) θ θ 3 1 D Statystyka testowa testu J-B ma postać: LM = + χ 6 4, co pozwala podjąć decyzję o wynku wnoskowana.

Testy na homoskedastyczność/hetroskedastyczność Test Breuscha-Pagana Test ten służy do testowana czy jakaś zmenna objaśnająca (lub ch zestaw) ne powoduje w modelu heteroskedastycznośc. Przetestujmy najperw, czy zmenna wek ne jest odpowedzalna za heteroskedastyczność. (Argumentem przemawającym za przetestowanem, czy ewentualna heteroskedastyczność ne jest zwązana właśne z tą zmenna jest fakt, że warancja zarobków może być różna w różnych grupach wekowych. W teśce Breuscha-Pagana zmennych podejrzewanych o powodowane heteroskedastycznośc ne pownno sę wyberać w sposób losowy wybór ten pownen być logczne uzasadnony) W Stace można to zrobć w następujący sposób: hettest wek co daje w wynku: Poneważ ne ma podstaw do odrzucena hpotezy zerowej, to przyjmujemy, że heteroskedastyczność (jeśl nawet w modelu występuje) ne jest zwązana ze zmenną wek. Równe sensowne wydaje sę testowane, czy jest ona zwązana ze zmenną pd0 (płeć): hettest _Ipd0_ Wynk testu wskazuje na heteroskedastyczność błędu losowego zwązaną ze zmenną pd0. Istneje możlwość przeprowadzena testu Breuscha-Pagana dla całego zestawu zmennych objaśnających. Zrobć to można w następujący sposób: hettest, rhs Mamy:

Wynk wskazuje na koneczność przyjęca hpotezy alternatywnej, mówącej o występowanu heteroskedastycznośc składnka losowego. Jednakże, powyższa postać testu ne pozwala na stwerdzene z którą zmenną objaśnającą heteroskedastyczność jest zwązana. Heteroskedastyczność można przezwycężać stosując tzw. odporne estymatory (np.estymator Whte a). W sporej częśc przypadków okaże sę, że użyce odpornych estymatorów, w neznacznym stopnu wpłyne na wynk. Test Whte a Jest to nny rodzaj testu na heteroskedastyczność. Stosujemy go wtedy, gdy ne mamy pomysłu odnośne tego, która zmenna może być odpowedzalna za powodowane heteroskedastycznośc, chcemy natomast zdagnozować jej ewentualne występowane. Test ten polega na przeprowadzenu dodatkowej regresj: e = α 0 + α z + u σ gdze e są resztam z modelu, dla którego heteroskeastyczność badamy, zaś z zawerają wszystke zmenne objaśnające tegoż modelu (z pomnęcem stałej), kwadraty tych zmennych oraz wszystke loczyny par tych zmennych. Statystyką testową jest statystyka R χ p, gdze R to współczynnk determnacj regresj pomocnczej, zaś p to lość zmennych z z. W Stace możemy posłużyć sę polecenem: mtest, whte którego wynk: potwerdza wynk uzyskany przez odpowadającą mu postać testu Breuscha-Pagana. Test Chowa test stablnośc parametrów W przypadku próby przekrojowej, test ten pozwala stwerdzć, czy parametry modelu zależą od podpróbk (czy, na przykład, płace mężczyzn kobet determnowane są przez nne mechanzmy, albo czy różne mechanzmy determnują płace w próbkach wydzelonych ze względu na pozomy wykształcena). Jeśl można przyjąć hpotezę zerową, że parametry przy

odpowadających sobe zmennych są w podpróbkach sobe równe, to parametry modelu uznajemy za stablne. Zgodne z teorą (wyłożoną m.n. w skrypce dr Mycelskego), test Chowa można sprowadzć do przeprowadzena regresj we wszystkch badanych podgrupach oraz dodatkowej regresj dla całej próby. Każdorazowo nteresować nas będze suma kwadratów reszt regresj, a ch znajomość pozwol na oblczene statystyk testowej, zgodne ze wzorem: ( S ) /[ ( 1)] ( ) /( ( 1)) R S K m SR S K m F = = ~ F[ K( m 1),( mk)] S /( mk) S /( mk) gdze S R jest sumą kwadratów reszt modelu z ogranczenam wynkającym z hpotezy zerowej (równość parametrów mędzy grupam), a węc modelu na całej próbe, zaś S to suma kwadratów reszt dla -tej podpróbk. m stanow lość grup, w których stablność parametrów badamy. My zajmemy sę przypadkem stablnośc parametrów w poszczególnych grupach wykształcena (są trzy możlwe pozomy wykształcena, a węc badać będzemy stablność parametrów w trzech grupach). Regresje będą wyglądały następująco: ln( p0 ) = β + β pd 0 + β pl08 + β wek + β wek + ε dla pe07 = 1 1 10 11 1 1 1 14 1 15 1 1 ln( p0 ) = β + β pd 0 + β pl08 + β wek + β wek + ε dla pe07 = 0 1 4 5 ln( p0 3 ) = β30 + β31 pd03 + β3 pl083 + β34wek3 + β35wek3 + ε 3 dla pe07 = 3 w końcu: ln( p0 ) = β + β pd 0 + β pl08 + β wek + β wek + ε (dla całej próby) 0 1 4 5 Z regresj tych wyznaczone będą odpowedno S 1, S, S 3 S R. W Stace mamy: x: reg lnp0.pd0.pl08 wek wek f pe07==1 x: reg lnp0.pd0.pl08 wek wek f pe07== x: reg lnp0.pd0.pl08 wek wek f pe07==3 oraz x: reg lnp0.pd0.pl08 wek wek Z tego mamy: S 1 = 14,56 S = 314,891 S 3 = 139,397 S = 649, 468 R Statystykę F możemy polczyć w samej Stace: ds ((649.468-14.56-314.891-139.397) / (5*)) / ((14.56+314.891+139.397) / (1595-3*5)) F = 19, 87. Wemy równeż, że statystyka ta ma rozkład F-Snedecora o parametrach K( m 1) oraz mk, a węc rozkład F (10 ;1580). Wartość krytyczną dla 5%-ego pozomu stotnośc możemy wyznaczyć w Stace przy pomocy polecena:

ds nvf(10,1580,0.95) Poneważ statystyka testowa jest znaczne wększa nż wartość krytyczna, to odrzucamy hpotezę zerową o równośc parametrów w podpróbkach przyjmujemy alternatywną, że ne są one równe. Alternatywą jest wyznaczene p-value dla znanej wartośc statystyk testowej oraz znanego jej rozkładu przy założenu prawdzwośc hpotezy zerowej. Może być to zrealzowane za pomocą komendy: ds 1-F(10, 1580, 19.866) WSPÓŁLIIOWOŚĆ Aby wyznaczyć statystyk VIF dla zmennych objaśnających, należy po regresj wpsać komendę: vf W wynku dostajemy: Wynk wskazuje na zbyt slną korelację zmennych wek wek (VIF>10). e jest to jednak wynk zaskakujący, obydwe te zmenne są w modelu stotne, zaś wprowadzenu do modelu zmennej wek było uzasadnone merytoryczne zmenne pownny w modelu pozostać. ZADAIA: 1. Przeprowadź ręczne test Whte a dla modelu: ln( p0 ) = β0 + β1 pd 0 + βwek + ε Potwerdź uzyskany wynk wynkem podawanym przez odpowedne polecene Staty.. Dla modelu ln( p0 ) = β0 + β1 pd 0 + β pl08 + β3 pe07 _ + β4 pe07 _ 3 + β5wek + β6wek + ε przeprowadź test Chowa na stablność parametrów w grupe kobet mężczyzn. TESTOWAIE HIPOTEZ Oszacujmy model: ln( p0 ) = β + β pd0 + β pl08 + β pe07 _ + β pe07 _ 3 + β wek + β wek + ε 0 1 3 4 5 6

Do modelu dochodów często oprócz weku dodaje sę jego kwadrat. Pozwala to uwzględnć fakt, że do pewnego weku dochody zwykle rosną, ale od pewnego weku zaczynają maleć. Kwadrat weku zwykle pozwala lepej dopasować model do danych. x: reg lnp0.pd0.pl08.pe07 wek wek Aby przetestować hpotezę prostą: H0 : β = 1 (co to znaczy?) używamy polecena: test _Ipl08_=-1 Testowane hpotez łącznych odbywa sę z użycem tej samej komendy, każdorazowo (począwszy od drugego ogranczena narzucanego na model) zakończonej przecnkem komendą accum. Przykładowo, gdy chcemy przetestować hpotezę: H β β = 1 1 0 : β3 = β4 posłużymy sę polecenam: test _Ipl08_=1-_Ipd0_/ test _Ipe07_=_Ipe07_3, accum Ćwczene: Dla modelu ln( p0 ) = β0 + β1 pd 0 + β pl08 + β3 pe07 _ + β4 pe07 _ 3 + β5wek + β6wek + ε przetestuj hpotezy: H : β = 1 a. 0 5 β1 = 0,5 ( co to znaczy?) b. H 0 : β = 0,8 ( co to znaczy?) β4 = β3 ( co to znaczy?) c. ręczne przetestuj hpotezę: β1 = 0,3 H 0 : β4 = β3 Ręczne, czyl najperw wprowadź ogranczena do modelu, oszacuj model z ogranczenam, wyznacz statystykę testową oraz podejmj decyzję.