Dr Łukasz Goczek Uniwersytet Warszawski
UWAGA OGÓLNA Stata rozróżnia duże i małe litery w poleceniach. Jeśli polecenie skopiowane z mojej prezentacji nie działa w Stacie, proszę zwrócić uwagę, czy Powerpoint nie zmienił pierwszej litery na dużą!
Przypomnienie Nickell (1981) w FE nadal występuje korelacja pomiędzy opóźnioną zmienną zależną i przekształconym wyrażeniem błędu, która sprawia, że estymatory te mają pożądane właściwości wyłącznie asymptotycznie, tzn. gdy liczba obserwacji w czasie zmierza do nieskończoności. Nie jest to przypadek typowego modelu wzrostu gdzie z reguły występuje znacznie mniej niż 5 obserwacji w czasie (ze względu na uśrednianie z reguły jest to 5-1 obserwacji).
Z samej definicji metoda ta ogranicza analizę do szukania średniej wewnątrz krajów, pomijając być może istotne różnice między krajami. Metoda ta w żadnym stopniu nie pomaga rozwiązać problemu przyczynowości, błędu pomiaru oraz pominiętych zmiennych, zmiennych w czasie. Nie pozwala również na szacowanie wpływu na wzrost gospodarczy zmiennych o charakterze stałym w czasie, jak np. wpływu geografii czy historii.
Rozwiązanie metody zmiennych instrumentalnych (i GMM) Estymatory: Andersona-Hsiao, Arellano-Bonda, Blundella Bonda, PMG, Kivietsa.
Rozważmy model w pierwszych różnicach: y β it y i t ', 1 x it Pozbycie się efektu stałego i niewiele więcej. y it Transformacja i, t 1 powoduje endogeniczność, ponieważ y y y jest skorelowane z i, t1 y i, t1 w i, t1 i, t1 i, t2 it it i, t1 w Jeżeli nie ma autokorelacji opóźnione zmienne mogą być egzogeniczne, mogą stanowić instrumenty.
Po zróżnicowaniu efektów stałych, dostępny jest naturalny estymator Metody Zmiennych Instrumentalnych. Możemy skonstruować instrumenty z opóźnionej zmiennej zależnej, opóźnionej dwa razy, trzy razy itd.
Rozwiązaniem problemu błędu pomiarowego i przeciwnej przyczynowości jest estymator Metody Zmiennych Instrumentalnych Andersona i Hsiao (1981) Zakłada szacowanie modelu na pierwszych różnicach i użycie przeszłego poziomu PKB w drugim opóźnieniu jako instrumentu dla opóźnionych pierwszych różnic PKB.
Przy założeniu braku AR() w, it naturalnymi instrumentami dla y i, t 1 są y i, t 2 oraz y i, t2 Wyrażenia bliskie y i, t 1 yi, t 2wydaje się rozsądniejsze: już od t = 3 Niemniej jednak tracimy mnóstwo obserwacji, gdy T jest małe. Podobnie w przypadku pozostałych zmiennych
Konieczność instalacji pakietu xtivreg2 net install xtivreg2 xi: xtivreg2 dpkb pop lki i.num5 (lpkb = l.lpkb), fd Parametr fd wybiera estymator Andersona i Hsiao 1981, lecz dostępne inne metody. help xtivreg2
IV (2SLS) estimation -------------------- Estimates efficient for homoskedasticity only Statistics consistent for homoskedasticity only [del] ------------------------------------------------------------------------------ D.dpkb Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- lpkb D1. -1.59232.1577865-1.8. -1.899488-1.28976 [del] Underidentification test (Anderson canon. corr. LM statistic): 225.987 Chi-sq(1) P-val =. ------------------------------------------------------------------------------ Weak identification test (Cragg-Donald Wald F statistic): 266.985 Stock-Yogo weak ID test critical values: 1% maximal IV size 16.38 15% maximal IV size 8.96 2% maximal IV size 6.66 25% maximal IV size 5.53 Source: Stock-Yogo (25). Reproduced by permission. ------------------------------------------------------------------------------ Sargan statistic (overidentification test of all instruments):. (equation exactly identified) ------------------------------------------------------------------------------
Egzogenicznośd instrumentów Craig Donald F Poprawnośd instrumentów Sargan (o teście na koocu). Werdykt: Instrumenty egzogeniczne, ale restrykcje przeidentyfikujące niepoprawne.
Pozwala to na wyizolowanie tej części wariacji zmiennej objaśnianej, która nie jest związana z przeciwną przyczynowością, pominiętymi zmiennymi i błędem pomiarowym. Metoda ta prowadzi do oszacowań zgodnych, lecz mogą być one nieefektywne przy niesferyczności składnika losowego z powodu braku wykorzystania wszystkich warunków dotyczących momentów (Hansen, 1982).
Konieczność dalszych opóźnień niepożądana. o Zmniejszenie T. o Problem dla krótkich paneli Po zróżnicowaniu, błędy nie i.i.d. o it i i, t 1 skorelowane o 2SLS nieefektywna
Zasadność wprowadzenia instrumentu w postaci opóźnienia zmiennej objaśnianej zapisać można w postaci założenia identyfikującego momenty: E u u y it i, t1 i, t2 Aby podnieść efektywność estymatora, Arellano i Bond (1991) wykorzystują wszystkie możliwe instrumenty w postaci opóźnień i różnic. Zasadność wprowadzenia tych instrumentów należy zapisać w postaci warunków dotyczących momentów, założeń identyfikujących, które służą do zbudowania estymatora Uogólnionej Metody Momentów.
Użycie dużej ilości opóźnień. W przypadku braku w macierzy zero. Utworzono instrumenty dla każdego opóźnienia i okresu. Instrumenty IV: 2, 1.. T i i y y UMM:. 1 2 3 1 2 1 i i i i i i y y y y y y Wynik: Arellano-Bond (1991) estymator różnicowy UMM
Warunki momentów utworzono przy założeniu, że opóźnione poziomy zmiennej zależnej są ortogonalne do zróżnicowanego zaburzenia są znane jako warunki momentów UMM. Warunki momentów tworzone przy użyciu ściśle egzogenicznych zmiennych są po prostu standardowymi warunkami metody zmiennych instrumentalnych( IV), nazywane są też standardowymi warunkami momentów.
Skund one się wzieły, te instrumenty czy jak? Każdy regresor traktujemy jako ściśle egzogeniczny. Każdy regresor daje jeden instrument. Pozostałe instrumenty pochodzą z p-2 instrumentów dostępnych w okresach p = 3, 4,, T W okresie 3, y i1 jest poprawnym instrumentem dla y i3 W okresie 4, y i1 i y i2 są poprawnym instrumentami dla y i4 W okresie 5, y i1, yi 2 i y i3 są poprawnym instrumentami dla y i5 W okresie 6, y i1, y i2, y i3 i y i4 są poprawnym instrumentami dla y i6 i tak dalej
Liczba instrumentów: p = T 2 (jeden okres na różnice, jeden na opóźnienie) k + p (p + 1)/2 Gdzie k to liczba egzogenicznych zmiennych.
xtabond dpkb l.lpkb pop ki, lags(1) vce(robust) artests(2) Arellano-Bond dynamic panel-data estimation Number of obs = 1214 Group variable: cty Number of groups = 188 Time variable: num5 Obs per group: min = 1 avg = 6.457447 max = 9 Number of instruments = 49 Wald chi2(4) = 233.9 Prob > chi2 =. One-step results (Std. Err. adjusted for clustering on cty) ------------------------------------------------------------------------------ Robust dpkb Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- dpkb L1. -.1297861.47782-3.18.1 -.2971 -.498623 lpkb L1. -.2716851.271594-1.. -.3249166 -.2184536 pop -2.914595 1.661945-1.75.79-6.171947.3427576 ki.5789.13495 4.23..3639.8354 _cons 2.534362.2645364 9.58. 2.1588 3.52844 ------------------------------------------------------------------------------ Instruments for differenced equation GMM-type: L(2/.).dpkb Standard: LD.lpkb D.pop D.ki Instruments for level equation
Liczba instrumentów: p = 12 3 4 + 9 (9 + 1)/2 =49
Porównanie estymatorów jedno i dwustopniowych: xi: xtabond dpkb l.lpkb pop ki i.num5, lags(2) eststo AB_ONESTEP xi: xtabond dpkb l.lpkb pop ki i.num5, lags(2) two eststo AB_TWOSTEP esttab
-------------------------------------------- (1) (2) stopniowa stopniowa -------------------------------------------- L.dpkb -.784** -.118*** (-3.16) (-4.5) L2.dpkb -.176*** -.112*** (-7.27) (-6.41) L.lpkb -.443*** -.444*** (-25.45) (-19.57) pop -.358-1.13 (-.63) (-1.84) ki.468***.538*** (5.77) (6.5) cons 3.734*** 3.789*** (23.94) (19.93) -------------------------------------------- N 126 126 --------------------------------------------
Natura problemu wydaje się byd związana z nadmiernym dopasowaniem. Efektywne UMM daje mniejszą wagę momentom z wysoką wariancją (wysoka waga drugich momentów) Możliwe, że UMM w małych próbkach może nie brad pod uwagę obserwacji mniej typowych (wysoka waga pierwszych momentów) Wskazywana jest przypadkowa precyzja.
Oszacowanie jednostopniowe: Y ˆβ 1 f (warunkowo względem X, Z) Oszacowanie jednostopniowe błędów do Ωˆ : βˆ 1 ' 1 ˆ ' ' ' 1 ˆ ' Z X X Z Z ΩZ Z Y g( Y, Ωˆ ) g( Y, f ( )) ' 2 X Z Z ΩZ Y Standardowe oszacowanie ˆ 2 Var β uznaje Ωˆ za stałą, obserwowaną i dokładną pomimo zależności od losowego Y.
Roszerzenie Taylora g wokół prawdziwego β : βˆ 2 g βˆ Y, Ωˆ gy, Ωˆ gy, Ωˆ βˆ β ˆ 1 ˆ βˆ β Korekta bierze się z drugiego wyrazu: E β ˆ 1 β zatem ˆ E β 2 brak obciążeń współczynników Wpływ na wariancję - jedynie na błędy. 1
Porównanie estymatorów jedno i dwustopniowych: xi: xtabond dpkb l.lpkb pop ki i.num5, lags(2) eststo AB_ONESTEP xi: xtabond dpkb l.lpkb pop ki i.num5, lags(2) two eststo AB_TWOSTEP xi: xtabond dpkb l.lpkb pop ki i.num5, lags(2) two vce(robust) eststo AB_TWOSTEP_WIND esttab
-------------------------------------------------------------- (1) (2) (3) ONESTEP TWOSTEP TWOSTEP_WIND -------------------------------------------------------------- L.dpkb -.784** -.118*** -.118* (-3.16) (-4.5) (-2.18) L2.dpkb -.176*** -.112*** -.112*** (-7.27) (-6.41) (-3.41) L.lpkb -.443*** -.444*** -.444*** (-25.45) (-19.57) (-1.65) pop -.358-1.13-1.13 (-.63) (-1.84) (-.7) ki.468***.538***.538*** (5.77) (6.5) (3.66) _cons 3.734*** 3.789*** 3.789*** (23.94) (19.93) (11.23) -------------------------------------------------------------- N 126 126 126 -------------------------------------------------------------- t statistics in parentheses * p<.5, ** p<.1, *** p<.1.
Hipoteza zerowa: H : wprowadzenie restrykcji było uzasadnione. Sar ' ZW Z' u ~ Statystyka testu określona jest jako: 1 N 1 gdzie: W N jest optymalną macierzą wag, ~ u 1 jest wektorem reszt z I stopnia estymacji dla odpowiedniego estymatora. 1 N u ~ u 1 dla UMM w modelu na pierwszych różnicach u 1 ˆ 1 u dla systemowego UMM, Z jest macierzą instrumentów odpowiadającą danemu estymatorowi.
Hipoteza zerowa: H : wprowadzenie restrykcji było uzasadnione. Sar ' ZW Z' u ~ Statystyka testu określona jest jako: 1 N 1 1 N u ~ Statystyka ma asymptotycznie rozkład 2 pk, gdzie p oznacza liczbę wszystkich wykorzystywanych warunków, natomiast k jest liczbą szacowanych parametrów.
xtabond dpkb l.lpkb pop ki, lags(2) artests(2) estat sargan Sargan test of overidentifying restrictions H: overidentifying restrictions are valid chi2(42) = 298.8597 Prob > chi2 =.
xtabond dpkb l.lpkb pop ki, lags(5) artests(2) estat sargan Sargan test of overidentifying restrictions H: overidentifying restrictions are valid chi2(3) = 96.94337 Prob > chi2 =.
xtabond dpkb l.lpkb pop ki, lags(7) artests(2) estat sargan Sargan test of overidentifying restrictions H: overidentifying restrictions are valid chi2(9) = 12.36628 Prob > chi2 =.1934
Niby sukces, ale test osłabł od dużej ilości instrumentów!
Spodziewamy się AR() w it i it Aby sprawdzić AR(1) w it, testujemy AR(2) w e it porównujemy e it e i, t 1 i e i, t 2 e i, t 3 żeby stwierdzić e e i, t1 ~ i, t2 Statistyka testu AR(l): i, t e it e i, t l Normalny rozkład przy H o braku AR(l) Arellano i Bond obliczają odchylenie test z dla AR()
xtabond dpkb l.lpkb pop ki, lags(1) artests(2) estat abond artests not computed for one-step system estimator with vce(gmm) Arellano-Bond test for zero autocorrelation in firstdifferenced errors +-----------------------+ Order z Prob > z ------+---------------- 1-3.851.1 2-2.8764.4 +-----------------------+ H: no autocorrelation
Obecność autokorelacji pierwszego rzędu przyrostów zakłóceń wynika z konstrukcji modelu. Oznacza to, że obecność autokorelacji pierwszego rzędu nie świadczy o niezgodności estymatorów UMM. H odrzucona również na drugim poziomie. Tu problem, autokorelacja drugiego rzędu. Oszacowania niezgodne. Zwiększamy liczbę opóźnień.
xtabond dpkb l.lpkb pop ki, lags(2) artests(2) estat abond artests not computed for one-step system estimator with vce(gmm) Arellano-Bond test for zero autocorrelation in firstdifferenced errors +-----------------------+ Order z Prob > z ------+---------------- 1-3.7764.2 2 1.325.1867 +-----------------------+ H: no autocorrelation
ALGORYTM 1. FE>MNK, chociaż w przypadku niektórych obciążeń MNK bardziej efektywna. 2. FE versus RE, BE - test Hausmanna. 3. Jeżeli FE test Woolridge a, czy poprawka na zaburzenie AR(1) 4. Pozostaje zbadać, czy model FE jednokierunkowy, czy dwukierunkowy test F zmiennych zerojedynkowych. 5. Anderson-Hsiao, sprawdzić testem Sargana, czy instrumenty: Poprawne, testem Craig-Donalda czy egzogeniczne. 6. Arellano-Bond jedno czy dwustopniowy, czy z korektą na skończoną próbę test Sargana i Arellano Bonda. 7. Jak źle wychodzą testy, zwiększamy liczbę instrumentów, z metody jednostopniowej przechodzimy na dwustopniową, zwiększamy liczbę instrumentów, ale bez przesady! Bo to jeszcze nie koniec
Nie można uzyskad szacunków zmiennych o charakterze stałym. W tych zebranych danych nie ma takiej zmiennej, niemniej jednak pozostaje do wyboru Hausman-Taylor IV estymator, który w Stacie można uzyskad przy pomocy: help xthtaylor Który umożliwia takie oszacowanie przy pomocy instrumentów polegających na zmiennych objaśniających z okresów innych niż aktualnie szacowany.
Jeżeli y ma charakter bliski błądzeniu losowemu, y i, t 1 jest słabym instrumentem dla yit. Pytanie: które procesy w ekonomii NIE mają takiego charakteru?
Dziękuję za uwagę.