Ekonometria dla IiE i MSEMat Z12 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 09-01-2017
Test RESET Ramsey a W pierwszym etapie estymujemy współczynniki regresji w modelu: y i = x i β + ε i (1) i uzyskujemy wartości dopasowane ŷ i = x i ˆβ. Następnie regresję pomocniczą: y i = x i β + α 1 ŷ 2 i + α 2 ŷ 3 i +... + α p ŷ p+1 i + u i (2) Za pomocą testu F testujemy hipotezę Co oznacza odrzucenie H 0? H 0 : α 1 = α 2 =... = α p (3) H 1 : i : α i 0 (4)
Test RESET Ramsey a (wersja alternatywna) W pierwszym etapie estymujemy współczynniki regresji w modelu: y i = x i β + ε i (5) i uzyskujemy wartości dopasowane ŷ i = x i ˆβ. Następnie regresję pomocniczą: e i = x i β + α 1 ŷ 2 i + α 2 ŷ 3 i +... + α p ŷ p+1 i + η i (6) Za pomocą testu statystyki NR 2 χ 2 p weryfikujemy hipotezę Co oznacza odrzucenie H 0? H 0 : α 1 = α 2 =... = α p (7) H 1 : i : α i 0 (8)
Zbiór danych br.dta z Principles of Econometrics Source SS df MS Number of obs = 1,080 -------------+---------------------------------- F(2, 1077) = 773.61 Model 9.61096538 2 4.80548269 Prob > F = 0.0000 Residual 6.69009 1,077.006211783 R-squared = 0.5896 -------------+---------------------------------- Adj R-squared = 0.5888 Total 16.3010554 1,079.015107558 Root MSE =.07881 price Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- sqft.000091 2.40e-06 37.86 0.000.0000863.0000957 age -.000755.0001409-5.36 0.000 -.0010315 -.0004786 _cons -.0419477.0069896-6.00 0.000 -.0556625 -.0282328
Model P RICE = β 0 + β 1 SQF T + β 2 AGE + ε Source SS df MS Number of obs = 1,080 -------------+---------------------------------- F(3, 1076) = 1043.96 Model 12.1326976 3 4.04423253 Prob > F = 0.0000 Residual 4.16835779 1,076.003873938 R-squared = 0.7443 -------------+---------------------------------- Adj R-squared = 0.7436 Total 16.3010554 1,079.015107558 Root MSE =.06224 price Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- yhat.6482606.1162139 5.58 0.000.4202289.8762922 yhat2-1.321675.5125729-2.58 0.010-2.327431 -.315919 yhat3 4.767403.6062385 7.86 0.000 3.57786 5.956947 _cons.0547255.0073846 7.41 0.000.0402355.0692154. test yhat2 yhat3 ( 1) yhat2 = 0 ( 2) yhat3 = 0 F( 2, 1076) = 325.47 Prob > F = 0.0000
Model P RICE = β 0 + β 1 SQF T + β 2 AGE + ε Source SS df MS Number of obs = 1,080 -------------+---------------------------------- F(7, 1072) = 489.81 Model 12.4183436 7 1.77404909 Prob > F = 0.0000 Residual 3.88271176 1,072.003621933 R-squared = 0.7618 -------------+---------------------------------- Adj R-squared = 0.7603 Total 16.3010554 1,079.015107558 Root MSE =.06018 price Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- sqft.0000874.0000183 4.79 0.000.0000516.0001233 age.0002363.0007052 0.34 0.738 -.0011475.00162 sqft2-1.57e-08 5.51e-09-2.84 0.005-2.65e-08-4.85e-09 sqft3 3.41e-12 4.89e-13 6.96 0.000 2.45e-12 4.37e-12 age2 7.76e-06.0000242 0.32 0.748 -.0000396.0000552 age3 1.56e-07 2.36e-07 0.66 0.509-3.07e-07 6.19e-07 sqftage -9.57e-07 1.10e-07-8.68 0.000-1.17e-06-7.41e-07 _cons.0063255.0197419 0.32 0.749 -.0324117.0450627. test sqft2 sqft3 age2 age3 sqftage ( 1) sqft2 = 0 ( 2) sqft3 = 0 ( 3) age2 = 0 ( 4) age3 = 0 ( 5) sqftage = 0 F( 4, 1072) = 28.99 Prob > F = 0.0000
Linktest (Zaawansowana Ekonometria I) W pierwszym etapie estymujemy współczynniki regresji w modelu: y i = x i β + ε i (9) i uzyskujemy wartości dopasowane ŷ i = x i ˆβ. Następnie regresję pomocniczą: y i = α 1 ŷ i + α 2 ŷ 2 i + u i (10) Testujemy istotność parametrów α 1, α 2 Który powinien być istotny, a który nie?
Linktest dla dwóch modeli Logistic regression Number of obs = 100 LR chi2(2) = 54.33 Prob > chi2 = 0.0000 Log likelihood = -22.874468 Pseudo R2 = 0.5429 winner Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- _hat 1.03227.288556 3.58 0.000.4667105 1.597829 _hatsq.0159818.0873744 0.18 0.855 -.155269.1872326 _cons -.0340588.4486726-0.08 0.939 -.9134409.8453233 ****************************************************************************** Probit regression Number of obs = 100 LR chi2(2) = 38.67 Prob > chi2 = 0.0000 Log likelihood = -30.703025 Pseudo R2 = 0.3864 winner Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- _hat.53903.3468488 1.55 0.120 -.1407811 1.218841 _hatsq -.4288426.2972041-1.44 0.149-1.011352.1536667 _cons.1837663.2474221 0.74 0.458 -.3011722.6687047
Heteroskedastyczność Testujemy założenie KMRL o homoskedastyczności reszt H 0 : V ar(ε i ) = σ 2 (11) Test Goldfelda-Quandta H 1 : V ar(ε i ) > V ar(ε j ) dla z i > z j (12) Test Breuscha-Pagana H 0 : V ar(ε i ) = σi 2 = σ 2 f(α 0 + z i α) (13)
Heteroskedastyczność Co gdy w modelu występuje heteroskedastyczność? Konsekwencje Ważona Metoda Najmniejszych Kwadratów WMNK (Weighted Ordinary Least Squares) Estymacja funkcji wariancji V ar(ε i ) = σ 2 i = σ2 f(α 0 + z i α) Stosowalna Uogólniona Metoda Najmniejszych Kwadratów SUMNK Estymator odporny macierzy wariancji-kowariancji White a
Heteroskedastyczność y = β 0 + β 1 x + β 2 z + β 3 d + ε (14) Załóżmy, że wiemy skąd się bierze heteroskedastyczność Załóżmy, że V ar(e i ) = σ 2 i = σ2 z i Transformujemy model do modelu bez heteroskedastyczności y 1 x z d = β 0 z + β 1 z + β 2 z + β 3 z + ε (15) z z V ar( ε z ) = 1 z V ar(ε) = 1 z σ2 z = σ 2 (16) Stała
Heteroskedastyczność Wykrywanie przyczyn heteroskedastyczności Próbka danych o 200 gosp. dom. z Chicago MILES = β 1 + β 2 INCOME + β 3 AGE + β 4 KIDS + ε (17) Wykres reszty i poszczególnych zmiennych Zadanie 8.4 z Principles of Econometrics, Third Edition.
Residuals vs. Age
Residuals vs. Income
Heteroskedastyczność W AGE = β 1 + β 2 EDUC + β 3 EXP ER + β 4 MET RO + ε (18) σ 2 M = 31.824 σ 2 R = 15.243 Jak przekształcić taki model do modelu bez heteroskedastyczności? Jak to zrobić w Stacie? Jaki test?
Heteroskedastyczność Test Breuscha-Pagana y = β 0 + β 1 x + β 2 z + β 3 d + ε (19) Uzyskujemy reszty (e) i wariancję reszt (σ 2 ) Regresja pomocnicza e 2 i σ 2 = α 0 + α 1 x + α 2 z + α 3 d + η (20) Testujemy H 0 : α 1 = α 2 = α 3 = 0
Zmienne pominięte i nieistotne Wydatki gosp. dom. na odzież i obuwie obuwie = β 0 + β 1 dochod + β 2 losob + ε (21)