Dr Łukasz Goczek Uniwersytet Warszawski
Jeżeli y ma charakter bliski błądzeniu losowemu, y i, t 1 jest słabym instrumentem dla yit. Pytanie: które procesy w ekonomii NIE mają takiego charakteru?
. sort cty num5. correlate lpkb L.lpkb L2.lpkb L3.lpkb L4.lpkb L5.lpkb L6.lpkb L. L2. L3. L4. L5. L6. lpkb lpkb lpkb lpkb lpkb lpkb lpkb -------------+------------------------------------------------------------ lpkb --. 1.0000 L1. 0.9926 1.0000 L2. 0.9770 0.9920 1.0000 L3. 0.9559 0.9730 0.9894 1.0000 L4. 0.9311 0.9500 0.9686 0.9878 1.0000 L5. 0.8989 0.9201 0.9409 0.9650 0.9881 1.0000 L6. 0.8680 0.8897 0.9123 0.9391 0.9668 0.9881 1.0000
xtunitroot fisher lpkb, dfuller lags(0) Fisher-type unit-root test for lpkb Based on augmented Dickey-Fuller tests -------------------------------------- Ho: All panels contain unit roots Number of panels = 190 Ha: At least one panel is stationary Avg. number of periods = 9.37 AR parameter: Panel-specific Asymptotics: T -> Infinity Panel means: Included Time trend: Not included Drift term: Not included ADF regressions: 0 lags ------------------------------------------------------------------------------ Statistic p-value ------------------------------------------------------------------------------ Inverse chi-squared(376) P 680.9705 0.0000 Inverse normal Z 2.6933 0.9965 Inverse logit t(924) L* -0.8559 0.1962 Modified inv. chi-squared Pm 11.1211 0.0000 ------------------------------------------------------------------------------ P statistic requires number of panels to be finite. Other statistics are suitable for finite or infinite number of panels. ------------------------------------------------------------------------------
Blundell i Bond (1998) zaproponowali zastosowanie, oprócz regresji na różnicach, dodatkowej regresji na poziomach z opóźnionymi zmiennymi jako instrumentami. Wymaga to spełnienia dodatkowych warunków dotyczących momentów, które opierają się na warunkach stacjonarności względem początkowej obserwacji: E y '( v ) 0 i, t s i it E x '( v ) 0 i, t s i it
Warunki te są spełnione, gdy proces generowania danych jest stacjonarny co do średniej: ni y przy E( ) E( ) 0 i,1 i i i i (1 ) ni x przy E( ) E( ) 0 i,1 i i i i (1 )
Blundell i Bond (2000) pokazują, że warunek ten nie jest w rzeczywistości warunkiem koniecznym. Rozważając równanie w pierwszych można pokazad, że jeśli: E ( ' x ) 0 i i, t
oraz zakładając, że ten sam proces generowania danych powodował danymi PKB per capita w danej serii danych w próbie przez dostatecznie długi okres przed wybraną próbą, że wpływ warunków początkowych (w tym przypadku początkowy poziom kapitału) można uznad za nieistotny, to: E ( ' y ) 0 i i, t
Można zauważyd, że jeśli pierwsze różnice tych zmiennych były skorelowane z efektami stałymi dla danego kraju, miałoby to nieprawdopodobne implikacje długoterminowe. Nie oznacza, że dla danego kraju efekty stałe nie odgrywają żadnej roli w ustalaniu wzrostu. Ich wpływ jest jednym z wyznaczników stanu ustalonego poziomu produkcji na jednostkę wydajności pracy, uzależnionego od innych uwarunkowao w stanie stacjonarnym. Istotą tych założeo jest, że nie ma korelacji między wzrostem produkcji i efektem stałym, przy braku kontrolowania na obecnośd innych zmiennych.
Jak zostało to przedstawionej w symulacjach Monte Carlo (np. (Blundell i Bond, 1998, Blundell, et al. 2000), gdy te warunki są spełnione, otrzymany estymator UMM na różnicach i poziomach (dalej BB, ang. System GMM), ma lepsze właściwości w skooczonych próbach w zakresie obciążeo i RMSE niż estymator różnicowy Arelllano i Bonda.
Przy obecności heteroskedastyczności i autokorelacji w modelu, możliwe jest zastosowanie dwustopniowego estymatora UMM, korzystającego z pierwszego kroku (Davidson i MacKinnon, 2004) do oszacowania macierzy wag reszt oszacowania. Chcemy by była ona wprost proporcjonalna do odwrotności macierzy wariancji i kowariancji instrumentów, czyli macierzy: V Z ' E Z ' ' Z i i i i i i
Przy obecności heteroskedastyczności i autokorelacji w modelu, możliwe jest zastosowanie dwustopniowego estymatora UMM, korzystającego z pierwszego kroku (Davidson i MacKinnon, 2004) do oszacowania macierzy wag reszt oszacowania. Chcemy by była ona wprost proporcjonalna do odwrotności macierzy wariancji i kowariancji instrumentów, czyli macierzy: V Z ' E Z ' ' Z i i i i i i 1 plim W E Z ' ' Z N N i i i i
Przy użyciu średniej: Wˆ opt N N 1 Z ˆ ˆ i'δεiδεi ' Zi N i 1 1 Brak jednak oszacowao wartości reszt. Rozwiązanie: metoda dwustopniowa.
Szacuje się model metodą zmiennych instrumentalnych podstawiając w miejsce macierzy W N macierz jednostkową, uzyskując oszacowania reszt Uzyskany estymator jest nieobciążony i zgodny, jednak nie jest efektywny, ponieważ wybrana macierz nie jest optymalna Wykorzystujemy uzyskane oceny składnika losowego z pierwszego stopnia by następnie oszacowad optymalną macierz W N, którą w drugim stopniu wykorzystujemy do oszacowania ostatecznych parametrów.
Szacuje się model metodą zmiennych instrumentalnych podstawiając w miejsce macierzy W N macierz jednostkową, uzyskując oszacowania reszt Uzyskany estymator jest nieobciążony i zgodny, jednak nie jest efektywny, ponieważ wybrana macierz nie jest optymalna Wykorzystujemy uzyskane oceny składnika losowego z pierwszego stopnia by następnie oszacowad optymalną macierz W N, którą w drugim stopniu wykorzystujemy do oszacowania ostatecznych parametrów.
Chod asymptotycznie bardziej efektywny, dwustopniowy estymator UMM w skooczonych próbach przedstawia szacunki standardowych błędów, które są mocno obciążone w dół. Możliwe jest, aby rozwiązad ten problem za pomocą korekty do dwuetapowej kowariancji w skooczonej próbie zaproponowanej przez Windmeijera (2005). Korekta ta powoduje, że odporny dwustopniowy estymator UMM na różnicach i poziomach jest bardziej efektywny niż odporne estymatory jednostopniowe, nawet gdy panel jest stosunkowo krótki (korekta już omówiona przy okazji estymatora AB)
Dodatkowo estymator ten rozwiązuje problem błędu pomiaru i przeciwnej przyczynowości. Bond et al. (2001) wskazują, że dzięki użyciu zmiennych zerojedynkowych odpowiadających kolejnym okresom czasu zmienny w czasie błąd pomiaru w danym obserwowanym szeregu w próbie nie będzie miał konsekwencji dla oszacowania modelu i nie ma to wpływu na ważnośd użytych instrumentów UMM. Z kolei opóźnienia w poziomach pozwalają zmniejszyd problem przeciwnej przyczynowości. Oszacowany w ten sposób współczynnik uwzględnia przyczynowośd w sensie Grangera.
W dotychczas prezentowanych metodach instrumentami są instrumenty endogeniczne. Np. w przypadku UMM poziomów i różnic w modelach empirycznych najczęściej w przypadku równania pierwszych różnic wzrostu stosuje się różnice zmiennych objaśniających oraz drugie opóźnienia poziomu zmiennej objaśnianej, a w przypadku równania poziomów są to opóźnione pierwsze różnice zmiennej objaśnianej. Możliwe jest uwzględnienie w modelu zmiennych instrumentalnych o charakterze egzogenicznym, co pozwala na uwzględnienie zmiennych mających byd może przeciwną przyczynowośd, bądź działad jako
xtdpdsys dpkb l.lpkb pop ki, lags(1) vce(robust) artests(2) System dynamic panel-data estimation Number of obs = 1402 Group variable: cty Number of groups = 188 Time variable: num5 Obs per group: min = 2 avg = 7.457447 max = 10 Number of instruments = 58 Wald chi2(4) = 119.68 Prob > chi2 = 0.0000 One-step results ------------------------------------------------------------------------------ Robust dpkb Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- dpkb L1..0397641.0395016 1.01 0.314 -.0376575.1171858 lpkb L1. -.2473419.0269692-9.17 0.000 -.3002005 -.1944833 pop -3.494342 2.070097-1.69 0.091-7.551657.5629743 ki.0047215.0012743 3.71 0.000.0022239.0072191 _cons 2.386552.3516864 6.79 0.000 1.697259 3.075844 ------------------------------------------------------------------------------ Instruments for differenced equation GMM-type: L(2/.).dpkb Standard: LD.lpkb D.pop D.ki
estat abond artests not computed for one-step system estimator with vce(gmm) Arellano-Bond test for zero autocorrelation in firstdifferenced errors +-----------------------+ Order z Prob > z ------+---------------- 1-4.7181 0.0000 2-2.1149 0.0344 +-----------------------+ H0: no autocorrelation (brak podstaw do odrzucenia) Działania identyczne jak xtabond zwiększamy parametr lags, przechodzimy na metodę dwustopniową.
estat sargan Też problemy. Aby rozwiązad działania identyczne jak xtabond zwiększamy parametr lags, przechodzimy na metodę dwustopniową. Dwiczenia własne dojśd do właściwej postaci modelu Blundella-Bonda analogicznie do Arellano-Bonda. Podpowiem tylko, że łatwiej będzie ze zmiennymi zero-jedynkowymi. Czyli: xi: polecenie i.num5, parametry
Dodatkowe warunki dla estymatora BB można przetestowad różnicowym testem Sargana, znanym jako test C lub test J Hansena. Najprościej ściągnąd moduł xtabond2: net install xtabond2 I powtórzyd oszacowania przy użyciu tego modułu. Syntax dostępny na: Roodman (2006) How to do xtabond2 (wygooglad)
Często ma to miejsce w przypadku badao o charakterze regionalnym. Estymator zaproponowany przez Kivietsa (1995), który rozważa korektę modelu pierwszych różnic w zbilansowanym panelu, gdzie liczba N jest niewielka.
W ten sposób tworzy się poprawiony estymator efektów stałych, który jest bardziej efektywny niż estymatory Andersona i Hsiao (1981), Arellano i Bonda (1995) i Blundella i Bonda (1998) przy małym T i N. Bruno (2005) przedstawia zmodyfikowaną wersję tego estymatora dla paneli niezbilansowanych, co jest ważne w przypadku modeli wzrostu, gdy dla różnych krajów długośd szeregów czasowych jest różna.
Wadą tej metodologii jest założenie ścisłej egzogeniczności zmiennych objaśniających i niemożnośd uwzględnienia przeciwnej przyczynowości i błędu pomiaru, co podważa zastosowanie tego estymatora w dynamicznych modelach wzrostu w innych zastosowaniach niż niewielkie (regionalne) próby krajów.
Instalacja estymatora Kivietsa w wersji Bruno (2005): net install xtlsdvc Koniecznośd instalacji dodatkowego pakietu do System GMM: net install xtabond2 Samo polecenie: xtlsdvc lpkb pop ki, initial (bb) Gdzie w nawiasie znajduje się estymator efektywny: Bb Blundell bond AB Arellano Bond FD Anderson Hsiao
xtlsdvc lpkb pop ki, initial (bb) LSDVC dynamic regression (SE not computed) ---------------------------------------------------------------- lpkb Coef. Std. Err. z P> z [95% Conf. Interval] -------------+-------------------------------------------------- lpkb L1..9631341..... pop.6083637..... ki.0051197..... ----------------------------------------------------------------
Kolejnym problemem, poruszanym w literaturze ekonometrycznej dotyczącej szacowania wzrostu, jest heterogenicznośd krajów. Dotąd zakładano, że dla wszystkich krajów oszacowane współczynniki są jednakowe a zatem dla każdego j oraz i: ij j Czy tak jest? Czy wszystkie obiekty są z tego samego rozkładu? Czy jak zwiększymy okres edukacji o rok, to skutek będzie taki sam w Japonii, Polsce i Burkina Faso?
Problem tego typu nie da się rozwiązad w przypadku prób krajów. Jest ich za mało. Niemniej jednak można kierowad się w stronę metod z heterogenicznymi współczynnikami. Warunek: N>500. Da się jednak rozwiązad heterogenicznośd pomiędzy współczynnikami krótkookresowymi, zakładając, że przypadku długookresowym są one jednakowe.
Estymator Pooled Mean Group (PMG) w zastosowaniu do szacowania wzrostu gospodarczego można opisad następującym równaniem: p 1 q k y y x y x i, t i i, t z i i, t z i i, t 1 i j i, j, t 1 i, t z 1 z 0 j 1. Równanie to pozwala osobno oszacowad krótkookresową dynamikę zmiennej objaśnianej oraz dynamikę długookresową, dzięki zawarciu w próbie przekrojowo czasowej mechanizmu korekty błędem, różnej dla różnych krajów.
net install xtpmg xtpmg dpkb d.lpop d.lki, lr(l.lpkb lki lpop) pmg Pooled Mean Group Regression: Estimated Error Correction Form (Estimate results saved as PMG) ------------------------------------------------------------------------------ ------------------------------------------------------------------------------ Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- ec ki.0505416.0078991 6.40 0.000.0350597.0660235 pop -8.557502 5.377549-1.59 0.112-19.0973 1.9823 -------------+---------------------------------------------------------------- SR ec -.1009378.0101466-9.95 0.000 -.1208248 -.0810508 pop D1. 1.161559.4925535 2.36 0.018.1961723 2.126947 ki D1..0007548.0007747 0.97 0.330 -.0007636.0022732 _cons.9078603.1079748 8.41 0.000.6962335 1.119487 ------------------------------------------------------------------------------
Ok. wszystkie stosowane najczęściej metody zostały omówione. Pozostaje jeszcze omówid, to co jest rzadziej stosowane w makroekonomii ze względu na krótki panel. xtrc pozwala na szacowanie przy założeniu zmiennych współczynników. Odpowiada to innemu współczynnikowi dla każdego kraju, dla każdej zmiennej. xtmixed modele hierarchiczne. Do tej pory modele liniowe. Są również rozszerzenia modeli nieliniowych do paneli.
Model Przekształcenie danych Zmienne objaśniające Zgodność FE Wewnątrzobiektowe y, x nie FEDW Wewnątrzobiektowe y i, t 1 i, t, x i, t 1 i, t AH yi, t 1, xi, t tak AB yi, t 1, xi, t tak BB yi, t 1, xi, t, yi, t 1, xi, t tak Kiviets yi, t 1, xi, t, yi, t 1, xi, t tak PMG yi, t 1, xi, t, yi, t 1, xi, t, ECM tak tak
1. FE>MNK, chociaż w przypadku niektórych obciążeń MNK bardziej efektywna. 2. FE versus RE, BE - test Hausmanna. 3. Jeżeli FE test Woolridge a, zbadać czy konieczna jest korekta na zaburzenie AR(1) 4. Pozostaje zbadać, czy model FE jednokierunkowy, czy dwukierunkowy test F zmiennych zerojedynkowych.
5. Anderson-Hsiao, sprawdzić testem Sargana, czy instrumenty: Poprawne, testem Craig-Donalda czy egzogeniczne. 6. Arellano-Bond jedno czy dwustopniowy, czy z korektą na skończoną próbę test Sargana i Arellano Bonda. 7. Jak źle wychodzą testy, zwiększamy liczbę instrumentów, z metody jednostopniowej przechodzimy na dwustopniową, zwiększamy liczbę instrumentów, ale bez przesady!
8. Blundell Bond procedura taka jak przy Arellano Bondzie. Testem J-Hansena zbadać, czy dodatkowe warunki BB są istotne. 9. Jeżeli mało danych rozważyć Kivietsa (sprawdzić, czy wynik wypada pomiędzy MNK a FE z korektą) 10. Jeżeli podejrzewa się heterogeniczność, PMG. Nawet jeżeli wybiera się metody Kivietsa i PMG warto podać wyniki innych! Metody te można ocenić testem Hausmana względem FE!
Największym problemem badao empirycznych w makroekonomii pozostaje niepewnośd parametrów modelu, zmiennych objaśniających. Trywializując - co jest z prawej strony?
Co robid z outlierami i brakującymi danymi? Dużo różnych testów, np. net install grubbs Ale najlepiej narysowad wykresy jak na pierwszych zajęciach i zobaczyd czy jakieś obserwacje wyjątkowo odstają. Brakujące dane w Stacie: ipolate - interpolacja epolate - ekstrapolacja
Dziękuję za uwagę.