Rozdział 8 Modele Wielorównaniowe Modele wielorównaniowe o równaniach współzależnych (Simultaneus Equations Model) stosuje się do opisu zależności między zmiennymi, które wzajemnie i równocześnie wpływają na siebie. Przypadek wzajemnego równoczesnego wpływu jest standardem w przypadku modeli makroekonomicznych. Modele wielorównaniowe można z reguły zapisać na kilka sposobów, przy czym różne formy zapisu modelu mają różną interpretację i zastosowania. Niewątpliwie najważniejszą formą modelu wielorównaniowego jest forma strukturalna. 8.1 Forma strukturalna Forma strukturalna modelu o G równaniach ma następującą postać: AY t = BX t + u t, (8.1) gdzie Y t = [y 1t,..., y Gt ], X t = [x 1t,..., x Kt ], u t = [u 1t,..., u Gt ] i E (u t ) = 0, Var (u t ) = Σ 1 a E (u t u s ) = 0 dla t s. O macierzy A G G zakładamy, że ma pełen rząd wierszowy G. Wektor Y t jest wektorem zmiennych endogenicznych a wektor X t jest wektorem zmiennych nieskorelowanych z odchyleniem losowym u t. Zmiennymi takimi mogą być zmienne egzogeniczne oraz opóźnione zmienne endogeniczne. Łącznie nazywa się te zmienne zmiennymi z góry ustalonymi. Liczba zmiennych endogenicznych w modelu wielorównaniowym jest równa liczbie równań w tym modelu. Zazwyczaj model strukturalny zapisywany jest w taki sposób by w każdym równaniu po prawej stronie stała inna zmienna endogeniczna. Nie jest to jednak uniwersalną regułą (patrz przykład 8.1.1). Niekiedy okazuje się bowiem, że łatwiej jest zinterpretować współczynniki w równaniach jeśli model zostanie zapisany inny sposób. Forma strukturalna modelu powinna być sformułowana tak, by jej poszczególnym równaniom można było nadać interpretację ekonomiczną. Z kolei parametry występujące w poszczególnych równaniach po- 1 Macierz Σ nie musi być diagonalna, ponieważ zaburzenia losowe dla różnych równań mogą być ze sobą skorelowane. Copyright c 2007 by Jerzy Mycielski 163
164 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE winny opisywać określone cechy podmiotów ekonomicznych. Nazwa formy strukturalnej bierze się stąd, że powinna ona opisywać strukturę zależności wewnątrz pewnego fragmentu gospodarki, w tym kanały transmisji, poprzez które podmioty ekonomiczne wzajemnie na siebie wpływają. Postać poszczególnych równań formy strukturalnej oraz podział na zmienne endogeniczne i egzogeniczne powinny wynikać z teorii ekonomii. Przykład 8.1.1 Model podaż i popytu, forma strukturalna. Szacowany jest na logarytmach. q D = α 0 + α 1 p + α 2 y + u 1 q S = β 1 p + β 2 p M + u 2 q D = q S krzywa popytu krzywa podaży warunek równowagi rynku q D -logarytm popytu, q S -logarytm podaży, p-logarytm ceny, y logarytm dochodów konsumentów, p M - logarytm indeksu cen surowców. Poszczególnym równaniom tak sformułowanej formy strukturalnej można nadać następujac a interpretację: pierwsze równanie jest równaniem popytu, drugie równanie jest równaniem podaży, zaś trzecie równanie podaje warunek równowagi rynku. Także parametry w tym modelu maja oczywista interpretację ekonomiczna: α 1 jest cenowa elastycznościa popytu, α 2 dochodowa elastycznościa popytu, β 1 - cenowa elastycznościa podaży, β 2 - elastycznościa podaży względem cen surowców. Znaki współczynników w pierwszym równaniu można wywnioskować z teorii konsumenta: jeśli dobro jest dobrem normalnym to α 1 < 0, α 2 > 0. Z teorii producenta wynika, że dla doskonałej konkurencji β 1 > 0 a β 2 < 0. Pominięcie stałej w równaniu podaży implikuje, że podaż przy zerowej cenie jest równa 1. Fakt, że dochody konsumentów pojawiaja się jedynie w równaniu a nie pojawia się w równaniu podaży wynika z teorii ekonomii. Z teorii konsumenta wiemy, że wybierajac optymalny poziom konsumpcji danego dobra bierze on pod uwagę jedynie ceny oraz swoje ograniczenie budżetowe. Z kolei z teorii producenta wiemy, że przy optymalizowaniu wielkości produkcji producent bierze pod uwagę jedynie cenę dobra finalnego i czynników produkcji. Podobnie dla wyborów konsumenta nie maja bezpośredniego znaczenia ceny surowców, z których wytwarzane jest dobro finalne, jednak dla producenta ceny te maja zasadnicze znaczenie. Trzecie równanie formy strukturalnej ma nieco inna postać niż pozostałe równania. Nie występuje w nim bład losowy i nie zawiera ono parametrów do wyestymowania. Równania tego typu nazywamy identycznościami. Identyczności można wyeliminować z modelu dokonujac w pozostałych równaniach odpowiednich podstawień. Nie robi się jednak tego, ponieważ identyczności traktuje się jako część struktury ekonomicznej, opisywanej przez strukturalny model wielorównaniowy. Które zmienne sa endogeniczne, a które egzogeniczne w modelu podaży i popytu? Nie wynika do bezpośrednio z formy modelu. Wiemy jednak, że w modelu z trzema równaniami, wić trzy zmienne w modelu musza być zmiennymi endogenicznymi. Zgodnie z teoria, mechanizm rynkowy zapewnia, że cena ustali się na poziomie, przy którym podaż będzie równa popytowi. Wynika z tego, że zmiennymi endogenicznymi
8.2. FORMA ZREDUKOWANA 165 w modelu podaży i popytu sa q D, q S, p. Przenoszac na prawa stronę zmienne endogeniczne uzyskujemy: q D α 1 p = α 0 + α 2 y + u 1 q S β 1 p = β 2 p M + u 2 q D q S = 0 Dla wektora zmiennych endogenicznych Y t = [q D, q S, p], zmiennych egzogenicznych X t = [1, y, p M ], oraz wektora błędów losowych u t = [u 1t, u 2t, 0], macierze parametrów A i B formy strukturalnej maja następujac a postać: A = 1 0 α 1 0 1 β 2 1 1 0 B = α 0 α 2 0 0 0 β 2 0 0 0 Zauważmy, że macierze A i B zawieraja stosunkowo niewielka liczbę swobodnych parametrów. Fakt, że większość elementów tych macierzy jest równa 0, 1 lub 1 wynika z ograniczeń narzuconych na formę strukturalna, które wywnioskowaliśmy z teorii ekonomii. 8.2 Forma zredukowana Forma zredukowana modelu (8.1) powstaje przez lewostronne pomnożenie (8.1) przez A 1 : Y t = A 1 BX t + A 1 u t (8.2) Jeśli zdefiniujemy macierz Π = A 1 B i zaburzenie losowe ε t = A 1 u t, to otrzymaną formę zredukowaną można zapisać jako Y t = ΠX t + ε t (8.3) Macierz Π nazywać będziemy macierzą parametrów formy zredukowanej. Charakterystyczną cechą formy zredukowanej jest to, że w poszczególnych równaniach po prawej stoi jedna, różna dla każdego z równań, zmienna endogeniczna, a po prawej stronie każdego z równań znajdują się jedynie zmienne z góry ustalone. Najważniejsza różnica między formą strukturalną i zredukowaną polega na innej interpretacji równań wchodzących w skład tych dwóch form modelu wielorównaniowego. W przypadku formy strukturalnej poszczególne równania opisują zachowania podmiotów ekonomicznych. Równania formy zredukowanej opisują zależności ilościowe między zmiennymi endogenicznymi i z góry ustalonymi nie wyjaśniając jednak sposobu w jaki zależności te powstają. Parametrom formy zredukowanej można nadać interpretację mnożnikową ale nie da się ich jednak bezpośrednio powiązać z zachowaniami podmiotów ekonomicznych. Między parametrami formy strukturalnej i parametrami formy zredukowanej istnieją oczywiście zależności wynikające z tego, że Π = A 1 B.
166 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE Przykład 8.2.1 (c. d. 8.1.1) Forma zredukowana modelu podaży i popytu. W formie zredukowanej po lewej stronie kolejnych równań stoja zmienne endogeniczne a po prawej stronie pojawiaja się wszystkie zmienne z góry ustalone. W przypadku modelu (8.1.1) forma zredukowana będzie więc miała następujac a postać: q D = q S = π 11 + π 12 y + π 13 p M + ε 1 (8.4) p = π 21 + π 22 y + π 23 p M + ε 2 Rozwiazuj ac formę strukturalna dla zmiennych p i q D otrzymujemy q D = q S = β 1α 0 + β 1α 2 y β 2α 1 p M + β 1 u 1 α 1 u 2 (8.5) β 1 α 1 β 1 α 1 β 1 α 1 β 1 α 1 β 1 α 1 p = α 0 + α 2 D β 2 1 p M + u 1 α 1 u 2 β 1 α 1 β 1 α 1 β 1 α 1 β 1 α 1 β 1 α 1 Wynika z tego, że zależności między parametrami formy strukturalnej i zredukowanej sa więc następujace π 11 = β 1α 0 β 1 α 1, π 12 = β 1α 2 β 1 α 1, π 13 = β 2α 1 β 1 α 1 π 21 = α 0 β 1 α 1, π 22 = α 2 β 1 α 1, π 23 = β 2 β 1 α 1 Wielkościom parametrów π nie da się nadać interpretacji behawioralnej. Przykładowo wielkość parametru π 12 mierzy o ile procent wzrośnie popyt/podaż na dane dobro jeśli dochody konsumentów wzrosna o 1%. Parametr ten opisuje więc reakcję rynku na zmianę dochodów konsumentów. Rynek nie jest jednak podmiotem ekonomicznym a jedynie pewnym mechanizmem zapewniajacym równowagę popytu i podaży. Bez znajomości równań formy strukturalnej nie da się powiedzieć na ile zaobserwowane zmiany popytu/podaży sa zwiazane z reakcjami konsumentów a na ile z reakcjami producentów. Na podstawie równań (8.5) widać wyraźnie, że p jest skorelowane z u 1 i u 2 a tym samym w równaniach dla q S i dla q D formy strukturalnej wystapi problem równoczesności. Problemów takich nie sprawia forma zredukowana (8.5), ponieważ w jej przypadku po prawej stronie równania znajduja się jedynie zmienne egzogeniczne. 8.3 Identyfikacja Jednym z ważniejszych problemów związanych z estymacją modeli wielorównaniowych jest problem identyfikacji. Parametry modelu nie są zidentyfikowane jeśli możliwe jest takie przekształcenie modelu, które zmieniając wielkości parametrów nie zmienia wielkości funkcji wiarygodności. Pokażemy teraz, że model strukturalny może nie być zidentyfikowany. Zacznijmy od przemnożenia model (8.1) lewostronnie przez nieosobliwą macierz F G G. W efekcie otrzymamy model F AY t = F BX t + F u t, (8.6)
8.3. IDENTYFIKACJA 167 który można także zapisać jako A Y t = B X t + u t (8.7) gdzie A = F A, B = F B, u t = F u t a zatem Σ = F ΣF. W ogólnym przypadku A A, B B, Σ Σ a więc parametry analizowanych modeli różnią się od siebie. Jednak model (8.6) uzyskaliśmy modelu (8.1) poprzez wzajemnie jednoznaczne przekształcenie. Wynika z tego, że modele te są sobie matematycznie równoważne i na podstawie danych nie da się stwierdzić, który z nich jest lepiej dopasowany do danych. Nie jest też trudno pokazać (patrz dodatek matematyczny 8.5), że funkcje wiarogodności dla modeli (8.6) i (8.7) nie różnią się od siebie. Przykład 8.3.1 Identyfikowalność standardowego modelu podaży i popytu. Rozważmy następujacy model popytu i podaży: q D = α 0 + α 1 p + u 1 q S = β 0 + β 1 p + u 2 q D = q S Jeśli rozważane dobro jest dobrem normalnym to α 1 > 0 a z teorii producenta wnioskujemy, że β 1 > 0. Zastanówmy się jak przebiegać będzie proces estymacji równań tego modelu. Ponieważ q D = q S więc obserwacje dla zmiennej zależnej dla obu równań sa identyczne. Po prawej stronie obu mamy identyczna zmienna objaśniajac a. Wynika z tego, że niezależnie od zastosowanej metody estymacji uzyskane oszacowania dla α 0, α 1 musza być równe oszacowaniom dla β 0 i β 1. Jak to jednak możliwe skoro α 1 < 0 a β 1 > 0? Powodem problemów jest nieidentyfikowalność równań podaży i popytu. W analizowanym modelu nie da się uzyskać poprawnych oszacowań parametrówα k, β k. Załóżmy, że obserwowane różne wartości q D, q S i p sa wynikiem przesunięć krzywej podaży i krzywej podaży wynikajacych z występowania błędów losowych u 1, u 2. Prosta regresji dopasowana policzona dla tych danych nie będzie odpowiadać ani krzywej podaży ani krzywej popytu. Ilustruje to krzywa regresji R na rysunku (8.1). Oszacowanie parametrów równań popytu i podaży będzie możliwe tylko wtedy, gdy uda nam się rozróżnić przesunięcia krzywej popytu od przesunięć krzywej podaży. Będzie to możliwe jeśli w równaniu dla podaży pojawia się zmienne, które nie pojawiaja się w równaniu popytu a w równaniu popytu pojawia się zmienne, które nie pojawiaja się w równaniu podaży (patrz model w przykładzie 8.1.1). Dla takiego modelu w przypadku zmiany zmiennej, która wpływa jedynie na popyt wiemy, że przesunięciu ulegnie jedynie krzywa popytu. Podobnie będzie w przypadku krzywej podaży. Prosty przypadek, w którym zmianie ulegaja jedynie zmienne wpływajace na popyt zilustrowany jest na rysunku (8.2). W tym przypadku, prosta regresji odpowiada krzywej podaży. Wynika z tego, że do identyfikacji krzywej podaży, konieczna jest znajomość zmiennych, które wpływaja wyłacznie na krzywa popytu. Forma strukturalna jest zidentyfikowana jeśli ograniczenia nałożone na macierze parametrów A i B, są tego rodzaju, że A i B spełniają je jedynie dla F = I. Równanie w modelu wielorównaniowym
168 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE P R S 1 S2 D2 D3 S3 D1 Q Rysunek 8.1: Regresja w niezidentyfikowanym modelu popytu i podaży P R S D 2 D3 D1 Q Rysunek 8.2: Regresja dla równania podaży w zidenytfikowanym modelu podaży i popytu będziemy nazywać zidentyfikowanym jeśli z ograniczeń nałożonych na formę strukturalną wynika, że parametry tego równania znajdujące się w macierzach A, A i B, B są sobie równe. Definicję te można bezpośrednio zastosować by sprawdzić, czy równania modelu są zidentyfikowane. W praktyce częściej sprawdza się jedynie warunek konieczny dla kolejnych równań. Przykład 8.3.2 (c.d. 8.1.1) Badanie identyfikowlności równań w modelu popytu i podaży. Przemnóżmy macierz A i B przez macierz postaci: F = f 11 f 12 f 13 f 21 f 22 f 23 f 31 f 32 f 33 Zgodnie z tym co powiedziano powyżej, macierze parametrów przekształconej formy strukturalnej po-
8.3. IDENTYFIKACJA 169 winny spełniać te same ograniczenia co oryginalnej formy strukturalne a zatem: 1 0 α1 α0 α2 0 A = 0 1 β2 B = 0 0 β 2 1 1 0 0 0 0 Układy równań A = F A ma postać: f 11 + f 13 = 1 f 12 f 13 = 0 f 11 α 1 f 12 β 2 = α 1 f 21 + f 23 = 0 f 22 f 23 = 1 f 21 α 1 f 22 β 2 = β2 f 31 + f 33 = 1 f 32 f 33 = 1 f 31 α 1 f 32 β 2 = 0 a układ B = F B: f 11 α 0 = α 0 f 11 α 2 = α 2 f 12 β 2 = 0 f 21 α0 = 0 f 21 α 2 = 0 f 22 β 2 = β2 f 31 α0 = 0 f 31 α 2 = 0 f 32 β 2 = 0 Przy założeniu, że parametry α i 0 i β i 0 drugiego układu równań implikuje, że f 12 = 0, f 21 = 0, f 31 = 0, f 32 = 0. Używajac tej informacji wnioskujemy na podstawie pierwszego układu równań, że f 13 = 0, f 23 = 0 oraz, że f 11 = 1, f 22 = 1, f 33 = 1. Doszliśmy więc do wniosku, że jedyna macierz F, dla której zarówno model oryginalny jak i przekształcony spełniaja ograniczenia wynikajace z formy strukturalnej jest macierz F = I. Parametry modelu sa zatem zidentyfikowane. W praktyce najczęściej do weryfikacji identyfikowalności równań modelu stosuje się tak zwane warunki rzędu (rank conditions) i wymiaru (order conditions). Warunki te stosuje się do sprawdzania identyfikowalności równań w modelach, w których ograniczenia mają charakter ograniczeń zerowych narzuconych na elementy macierzy parametrów A i B. Przypadek ten jest jednak najczęściej spotykany w praktyce. 8.3.1 Warunki rzędu i wymiaru (*) Zapiszmy j-te równanie formy strukturalnej w następujący sposób: A j Y t = B j X t + u t, gdzie A j i B j są j-tymi wierszami odpowiednio macierzy A i B. W równaniu j-tym nie występuje zwykle część zmiennych endo i egzogenicznych a więc część elementów wektorów A j i B j jest równa zeru. Uporządkujmy Y t i X t tak, że A j = [1, a j, 0], B j = [ β j, 0 ]. Oznaczmy jako K j liczbę zmiennych ezogenicznych w j-tym równaniu a jako G j liczbę zmiennych endogenicznych w tym równaniu, przy czym do G j wliczać będziemy także zmienną endogeniczną stojącą po lewej stronie równania. Wymiar wektora β j jest więc równy K j a wektora a j jest równy G j 1. Zdefiniujmy [ ] 1 aj 0 β U = [A, B] = j 0 A 1 A a A 0 B β B 0
170 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE Równanie j-te przekształconej formy strukturalnej spełniała te same ograniczenia co odpowiednie równanie oryginalnej formy strukturalnej, zatem powinniśmy otrzymać zera dla tych samych elementów wektora U 1 dla których U 1 było równe zeru. Wiemy też, że równie j będzie zidentyfikowane, jeśli U 1 = f 1 U implikuje, że f 1 = [f 10, f 11 ] = [1, 0,..., 0]. W związku z tym musi być prawdą, że f 11 [A 0, B 0 ] = 0. (8.8) Jeśli macierz [A 0, B 0 ] ma pełen rząd równy G 1 to równość (8.8) może być spełniona jedynie dla f 11 = 0. Tym samym warunkiem dostatecznym identyfikowalności parametrów j-tego równania jest pełen rząd macierzy [A 0, B 0 ] złożona z tych kolumn macierzy A i B, które w j-tym wierszu mają 0. Przykład 8.3.3 (c.d. 8.1.1) Sprawdzanie warunku dostatecznego indentyfikowalności równań modelu popytu i podaży. W przypadku modelu podaży i popytu omówionego w przykładzie 8.1.1, macierz [A, B] ma postać: 1 0 α 1 α 0 α 2 0 0 1 β 2 0 0 β 2 1 1 0 0 0 0 Dla pierwszego równania strzałki pokazuja te zmienne, dla których współczynniki formy strukturalnej sa równe zeru. Macierz [A 0, B 0 ] jest więc równa postaci: [ 1 β2 1 0 i przy założeniu, że β 2 0 jest macierza nieosobliwa. Implikuje to, że pierwsze równanie modelu jest zidentyfikowane. Podobnego analizę można przeprowadzić także dla drugiego równania. Liczba kolumn macierzy [A 0, B 0 ] jest równa liczbie zmiennych endogenicznych i zmiennych góry ustalonych, które nie występują w danym równaniu. Liczba kolumn tej macierzy jest więc równa G G j + K K j. Warunkiem koniecznym by rząd macierzy [A 0, B 0 ] był równy G 1 jest, by liczba jej kolumn była większa lub równa G 1. W efekcie otrzymujemy następujący warunek konieczny dla identyfikacji j-tego równania: ] G G j + K K j G 1. (8.9) Warunek ten można jeszcze nieco uprościć. Taką uproszczoną wersję warunku koniecznego indentyfikowalności równań w modelu sformułujemy w następnym podrozdziale. 8.3.2 Warunek konieczny identyfikowalności równań Upraszczając warunek (8.9) uzyskujemy jego następującą wygodną w zastosowaniach formę: K G j + K j 1
8.4. METODY ESTYMACJI 171 przypomnijmy, że K jest całkowitą liczbą zmiennych egzogenicznych w modelu (wliczając w to stałą), G j jest liczbą zmiennych endogenicznych w j-tym równaniu (wliczając w to zmienną stojącą po prawej stronie równania) a K j jest liczbą zmiennych z góry ustalonych w j-tym równaniu (wliczając w to stałą). Warunek ten jest bardzo prosty w zastosowaniu i najczęściej jest jedynym warunkiem, który się weryfikuje przed przystąpieniem do estymacji modelu wielorównaniowego. O j-tym równaniu modelu mówi się, że jest dokładnie zidentyfikowane jeśli K = G j + K j 1. O równaniu tym będziemy mówić, że jest przeidentyfikowane, jeśli K > G j + K j 1. Z kolei jeśli K < G j + K j 1 będziemy mówić, że równanie j-te nie jest zidentyfikowane. Przykład 8.3.4 (c.d. 8.3.3) Weryfikacja warunku dostatecznego identyfikowalności równań w modelu popytu i podaży. Dla modelu z przykładu (8.1.1) wiemy, że liczba zmiennych egzogenicznych K = 3. W pierwszym równaniu liczba zmiennych endogenicznych wynosi G 1 = 2 a egzogenicznych K 1 = 2. Warunek konieczny dla identyfikacji pierwszego równania jest spełniony, ponieważ 3 = 2 + 2 1. Ponieważ warunek ten spełniony jest z równościa więc pierwsze równanie jest dokładnie zidentyfikowane. W przypadku drugiego równania mamy 3 > 2 + 1 1. W tym przypadku warunek spełniony jest z nierównościa, co oznacza, że drugie jest przeidentyfikowane. Pytania: 1. Czym różni się forma strukturalna od formy zredukowanej? Na czym polega różnica w interpretacji parametrów i równań formy strukturalnej i zredukowanej? 2. Wyjaśnić skąd bierze się problem identyfikacji w modelach wielorównaniowych. Podać warunek konieczny identyfikowalności równania modelu. 8.4 Metody estymacji Zazwyczaj interesują nas głównie parametry formy strukturalnej a nie formy zredukowanej. Dzieje się tak dlatego, że forma strukturalna tworzona jest na podstawie teorii ekonomii i poszczególne jej parametry mają interpretację ekonomiczną. Forma zredukowana dostarcza jedynie informacji na temat korelacji między zmiennymi ale uzyskane w ten sposób współczynniki są zazwyczaj trudno interpretowalne i nie wnoszą wiele do zrozumienia zależności ekonomicznych. 8.4.1 Pośrednia M N K Poszczególnych równania formy strukturalnej nie da się poprawnie oszacować za pomocą M N K z powodu występowania równoczesności. Powodem równoczesności są sprzężenia zwrotne występujące między zmiennymi endogenicznymi (patrz przykład??). Poszczególne zmienne endogeniczne zależą pośrednio od błędów losowych ze wszystkich równań formy strukturalnej. Łatwo się o tym przekonać
172 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE się o tym analizując związek między Y t a elementami u t w równaniu (8.2). Jeśli przekształcimy formę strukturalną tak, by po prawej stronie znajdowała się jedna ze zmiennych endogenicznych a po prawej pozostałe zmienne endogeniczne oraz zmienne z góry ustalone, to zmienne endogeniczne znajdujące się po prawej stronie będą skorelowane z błędem losowym w tym równaniu a tym samym próba jego szacowania za pomocą MNK nie da zgodnych oszacowań parametrów. Inaczej wygląda sytuacja z szacowaniem równań formy zredukowanej (8.3). W poszczególnych równaniach tego układu równań po prawej stronie stoją kolejne zmienne endogeniczne a po prawej jedynie zmienne z góry ustalone. Zmienne z góry ustalone z definicji nie są skorelowane z błędem losowym. Wynika z tego, że stosując M N K do poszczególnych równań formy zredukowanej otrzymamy zgodny estymator macierzy Π. Pojawia się w związku z tym pytanie, czy na postawie oszacowania macierzy Π można znaleźć oszacowania macierzy A i B. Jest to możliwe jeśli tylko model jest zidentyfikowany. W tym przypadku zgodne oszacowania macierzy  i B można uzyskać jako rozwiązanie układu równań Π =  1 B. Jeśli model ten jest dokładnie zidentyfikowany, to układ ten daje jednoznaczne rozwiązania dla  i B. Dla modelu przeidentyfikowanego, układ równań będzie sprzeczny i otrzymamy kilka rozwiązań dla  i B. W przypadku modelu niezidentyfkowanego rozwiązań tych będzie nieskończenie wiele. Przykład 8.4.1 (c.d. 8.2.1) Parametry π ij formy strukturalnej można oszacować za pomoca MNK zastosowanego do każdego z równań formy zredukowanej postaci. Za pomoca uzyskanych π jk można policzyć estymatory α i i β i wykorzystujac równania implikowane przez układ równań (8.4): π 11 = β 1 α 0, π 12 = β 1 α 2, π 13 = β 2 α 1 β 1 α 1 β 1 α 1 β 1 α 1 β 2 π 21 = α 0 β 1 α 1, π 22 = α 2 β 1 α 1, π 23 = β 1 α 1 Powyższy układ równań jest sprzeczny, ponieważ mamy 5 niewiadomych i 6 niezależnych równań. Przekształcajac te równania dochodzimy do wniosku, że β 1 = π 11 π 21, β1 = π 12 π 22, α 1 = π 13 π 23, β 2 = π 23 ( β1 α 1 ), α 2 = π 22 ( β1 α 1 ), α 0 = π 21 ( β1 α 1 ) β 2 = π 23 ( β1 α 1 ), α 2 = π 22 ( β1 α 1 ), α 0 = π 21 ( β1 α 1 ) Jeśli model jest prawidłowo sformułowany, to wszystkie te estymatory sa estymatorami zgodnymi. Na przykład: plim β 1 = plim plim β1 = plim ( π11 π 21 ( π12 π 22 ) ) = plim π 11 plim π 21 = π 11 π 21 = β 1 = plim π 12 plim π 22 = π 12 π 22 = β 1.
8.4. METODY ESTYMACJI 173 Jednak w małych próbach π11 π 21 π 12 π 22, co oznacza że oszacowania uzyskane przy użyciu β 1 i β1 moga się od siebie różnić. Estymator pośredniej M N K jest rzadko stosowany w praktyce, ponieważ modele przeidentyfikowane są w badaniach ekonometrycznych regułą a niewygodne jest posługiwanie się kilkoma oszacowaniami uzyskanymi dla tych samych parametrów. Co więcej pokazano, że estymator ten jest w przypadku modeli przeidentyfikowanych estymatorem nieefektywnym. 8.4.2 2MNK Jak już kilkakrotnie wspomniano poszczególnych równań modelu strukturalnego nie powinno się szacować M N K z racji na występowanie w nich problemu równoczesności. W przypadku, kiedy taki problem występuje, można jednak uzyskać estymator zgodny stosując estymator M ZI. Estymator M ZI można zastosować do j-tego równania formy strukturalnej, jeśli tylko będziemy w stanie wskazać zmienne instrumentalne, które dla danego równania spełniają założenia 7.2.1, 7.2.2 i 7.2.3. Zauważmy, że zmienne z góry ustalone w formie strukturalnej spełniają warunek 7.2.1 i 7.2.3, a warunek 7.2.2 jest spełniony jeśli liczba zmiennych po prawej stronie równania j jest mniejsza niż całkowita ilość zmiennych z góry ustalonych modelu. Warunek ten jest równoważny warunkowi koniecznemu dla identyfikacji j-tego równania (K G j + K j 1). Parametry zidentyfikowanych równań formy strukturalnej można więc oszacować stosując M ZI do każdego z tych równań z osobna przy zastosowaniu zmiennych instrumentalnych, którymi są wszystkie zmienne z góry ustalone w modelu. Nazwa 2MNK wzięła się stąd, że estymacja przy użyciu tej metody składa się z dwóch kroków: 1. obliczenia wartości teoretycznych zmiennych endogenicznych z regresji na zmiennych egzogenicznych. Są to wartości dopasowane z modelu w formie zredukowanej (8.3). 2. wyliczenia estymatory M ZI dla poszczególnych równań formy strukturalnej. Zmienne endogeniczne zastępujemy wyliczonymi w pierwszym kroku ich wartościami teoretycznymi. W kontekście metod estymacji stosowanych do szacowania parametrów modeli wielorównaniowych 2M N K zaliczamy do metod estymacji z ograniczoną informacją, ponieważ do oszacowania równania j- tego w modelu musimy znać jedynie ograniczenia narzucone na to równanie oraz wiedzieć, które zmienne w modelu są endogeniczne, a które są z góry ustalone. Nie używamy natomiast w procesie estymacji ograniczeń narzuconych na pozostałe równania. Estymatory wykorzystujące ograniczoną informację są często wygodne, ponieważ można za ich pomocą wyestymować jedno z równań modelu nie specyfikując w pełni pozostałych równań. Z drugiej strony estymatory takie są estymatorami nieefektywnymi, ponieważ w trakcie estymacji i-tego równania nie wykorzystują informacji wynikających z ograniczeń nałożonych na j-te równanie. Przykład 8.4.2 Jednym z pierwszych wyestymowanych modeli wielorównaniowych był model gospodarki Stanów Zjednoczonych w latach 1921 1941 stworzony przez Kleina. Składa się on z następujacych
174 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE równań C t = α 1 + α 2 P t + α 3 P t 1 + α 4 (W t + W t) + u 1t W t = γ 1 + γ 2 X t + γ 3 X t 1 + γ 4 t + u 3t I t = β 1 + β 2 P t + β 3 P t 1 + β 4 K t 1 + u 2t K t = I t + K t 1 X t = C t + I t + G t P t = X t W t T t konsumpcja płace w sektorze prywatnym inwestycje wielkość kapitału równanie dochodu narodowego zyski w sektorze prywatnym Zmiennymi endogenicznymi w tym modelu jest konsumpcja C t, płace w sektorze prywatnym W t, inwestycje I t, wielkość kapitału w gospodarce K t, produkt narodowy X t oraz zyski w sektorze prywatnym P t. Zmiennymi egzogenicznymi w tym modelu sa stała, trend liniowy t, wydatki rzadowe G t, płace w sektorze państwowym W t, podatki T t oraz zmienne opóźnione P t 1, K t 1, X t 1. W pierwszym równaniu zagregowana konsumpcja wyjaśniona jest przez zyski, zyski opóźnione i łaczne płace w sektorze prywatnym i państwowym. Osobne potraktowanie zysków w tym równaniu wynika z tego, że krańcowa skłonność do konsumpcji z tego rodzaju dochodu jest niższa niż z dochodu z pracy - jest to prawdopodobnie wynikiem faktu, że znaczace dochody z kapitału osiagaj a ludzie zamożniejsi. Płace w sektorze prywatnym zależa od wartości produktu w tym sektorze oraz podlegaja trendowi liniowemu. Kapitał równy jest kapitałowi z zeszłego okresu plus inwestycje w danym okresie. Wartości dochodu narodowego równa jest wydatkom na kosumpcję, inwestycje i pozapłacowe wydatki rzadowe. Z kolei zyski w sektorze prywatnym równe sa wartości produktu minus wydatki na płace i podatki. Zauważmy, że model ten różni się od modelu IS/LM, ponieważ nie ma w nim zmiennych zwiazanych z sektorem pieniężnym takich jak ilość pieniadza, czy stopy procentowe. Oszacowania uzyskane za pomoca MNK i MZI dla równania konsumpcji w modelu Kleina znajduja się w tabeli 8.1. MNK MZI b t p b t p P 0.193 2.115 0.049 0.017 0.132 0.897 P 1 0.090 0.992 0.335 0.216 1.814 0.087 Wp+Wg 0.796 19.933 0.000 0.810 18.111 0.000 stała 16.237 12.464 0.000 16.555 11.277 0.000 Tablica 8.1: Oszacowania równania konsumpcji w modelu MNK i MZI Analizujac wyniki regresji dochodzimy do wniosku, że oszacowania uzyskane MNK i MZI znacznie się różnia. Statystyka dla testu Hausmana-Wu wynosi χ 2 3 = 8.980 [0.030]. Statystyka ta ma 3 stopnie swobody, ponieważ porównujemy oszacowania przy trzech parametrach. Wielkość statystyki wskazuje, że rzeczywiście oszacowania uzyskane MNK i MZI różnia się istotnie a tym samym należy odrzucić H 0 o tym, że wszystkie zmienne w modelu sa egzogeniczne.
8.4. METODY ESTYMACJI 175 Dla testu Sargana wielkość statystyki wynosi χ 2 4 = 8.772 [0.067]. Liczba stopni swobody rozkładu χ 2 wynika z tego, że w modelu mamy 4 zmienne objaśniajace a liczba instrumentów wynosi 8. Wielkość statystyki implikuje, że na poziomie istotności 5% nie można odrzucić H 0 o tym, że instrumenty sa prawidłowe. Zbadajmy teraz, czy w równaniu konsumpcji instrumenty sa skorelowane ze zmiennymi objaśniaja- cymi. Oszacowanie odpowiedniego równania formy zredukowanej znajduje się po lewej stronie w tabeli (8.2). Na pierwszy rzut oka mogłoby się wydawać, że wszystkie zmienne w tej regresji sa nieistotne. Niskie statystyki t dla poszczególnych zmiennych wynikaja jednak w tym przypadku z wysokiej współliniowości. Wielkość wartości p dla statystyki F wskazuje, że wszystkie zmienne łacznie sa nieistotne. Statystyka F dla hipoteza łacznej, że G, W g, T oraz X 1 sa nieistotne jest równa 0.56 [0.696].Po wyeliminowaniu tych zmiennych dochodzimy do wniosku, że cztery zmienne w formie zredukowanej sa istotne. Wnioskujemy z tego, że liczba istotnie skorelowanych ze zmiennymi objaśniajacymi instrumentów jest wystarczajaca, by oszacować równanie konsumpcji. Forma zredukowana Forma zredukowana zmienne istotne b t p b t p t.701 0.930 0.369 0.857 10.356 0.000 G.205 0.541 0.598 Wg.193 0.079 0.938 T -.366-0.871 0.400 P 1.748 1.489 0.160 1.19 10.477 0.000 K 1 -.147-1.270 0.226-0.115-2.196 0.042 X 1.23 0.842 0.415 Stała -1295-0.908 0.380-1597 -10.295 0.000 F 28.2 0.000 72.7 0.000 Tablica 8.2: Forma zredukowana, równanie konsumpcji Pytania: 1. Opisać estymację modelu wielorównaniowego za pomocą pośredniej M N K. Wyjaśnić dlaczego metoda ta daje zgodne estymatory oraz co jest powodem jej małej popularności. 2. Opisać dwa kroki estymacji modelu wielorównaniowego dokonywanej za pomocą 2MNK. 8.4.3 3MNK (*) Metoda 3M N K jest jedną z prostszych metod estymacji wykorzystujących pełną informację. Zapiszmy formę strukturalną (8.1) w następujący sposób:
176 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE y j = Z j β j + u j (8.10) E (u j ) = 0, Var (u j ) = σ 2 jji, Cov (u j, u k ) = σ jk gdzie j, k = 1,..., G, Z j jest macierzą tych zmiennych endogenicznych i z góry ustalonych, które występują w j-tym równaniu formy strukturalnej a β j jest wektorem parametrów przy tych zmiennych. Zmienne z góry ustalone w formie strukturalnej zgromadziliśmy w macierzy X. Możemy teraz model (??) sformułować w sposób następujący: y 1 y 2.. y G = Z 1 0 0. Z 2 0... 0 0 Z G β 1 β 2.. β G + u 1 u 2. u G lub y = Z β + u, (8.11) gdzie y = y 1 y 2.. y G Z 1 0 0. Z 2 0, Z =..., β = 0 0 Z G Zauważmy teraz, że model (8.11) jest zwykłym jednorównaniowym modelem liniowym. Jednak w β 1 β 2.. β G, u = modelu tym pojawi się problem równoczesności a co więcej, wystąpi w nim heteroskedastyczność i autokorelacja, ponieważ Cov ( ) u k, u j = σij I a zatem: σ 11 I σ 1G I Var (u) = Σ =.... = Σ I σ G1 I σ GG I Do estymacji modelu strukturalnego w formie (8.11) stosujemy metodę, która jest kombinacją MZI i stosowalnej UMNK. Pierwsze dwa kroki estymacji tą metodą są takie same jak w przypadku 2MNK. W pierwszym kroku liczymy wartości teoretyczne za pomocą wzoru (7.4) zastosowanego do każdego z równań (8.10) Ẑ j = X Π j = X ( X X ) 1 X Z j = P X Z j. (8.12) Oznaczmy jako Ẑ odpowiednio skonstruowaną macierz wartości dopasowane zmiennych Ẑj Ẑ 1 0 0 Z. Ẑ 2 0 =... 0 0 Ẑ G u 1 u 2. u G
8.4. METODY ESTYMACJI 177 W drugim kroku, liczymy dla kolejnych równań estymatory b 2MNK, które zapisane łącznie jednym wzorem można zapisać następującym za pomocą następującego wzoru: b 2MNK = (Ẑ Ẑ) 1 Ẑ y Następnie dla każdego z policzonych równań liczymy reszty. Reszty te wykorzystujemy wykorzystujemy do policzenia estymatora macierzy wariancji i kowariancji Σ, szacując kowariancję między błędami losowymi na podstawie kowariancji empirycznej między resztami: Σ ij = σ ij = T t=1 e i,te k,t T = ẽ iẽj T (8.13) W trzecim kroku liczymy estymator 3MNK za pomocą stosowalnego UMNK zastosowanego do wartości dopasowanych Ẑ i przy zastosowaniu macierzy Σ uzyskanej na podstawie estymatora Σ wyliczonego ze wzoru 8.13. Uzyskany w ten sposób estymator ma następującą postać: b 3MNK = (Ẑ Σ 1Ẑ) 1 Ẑ Σ 1 y Estymator 3M N K zaliczamy do metod pełnej informacji, licząc estymator ze wzoru (8.13) wykorzystują reszty ze wszystkich równań formy strukturalnej. Przykład 8.4.3 Oszacowanie modelu Kleina za pomoca 3MNK. Oszacowania uzyskane za pomoca MNK, 2MNK, 3MNK znajduja się w tabeli 8.3. W przypadku niektórych parametrów, różnice między oszacowaniami uzyskanymi z 2MNK i 3MNK wydaja się dosyć znaczace. Charakterystyczne jest to, że oszacowania uzyskane z 3MNK maja generalnie mniejsze odchylenia standardowe niż oszacowania z 2MNK.
178 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE Równanie Zmienna MNK 2MNK 3MNK C P 0.193 0.017 0.125 (0.091) (0.131) (0.108) P 1 0.090 0.216 0.163 (0.091) (0.119) (0.100) Wp+Wg 0.796 0.810 0.790 (0.040) (0.045) (0.038) stała 16.237 16.555 16.441 (1.303) (1.468) (1.305) Wp X 0.439 0.439 0.400 (0.032) (0.040) (0.032) X 1 0.146 0.147 0.181 (0.037) (0.043) (0.034) t 0.130 0.130 0.150 (0.032) (0.032) (0.028) stała -250.006-250.294-287.223 (61.046) (61.957) (53.449) I P 0.480 0.150-0.013 (0.097) (0.193) (0.162) P 1 0.333 0.616 0.756 (0.101) (0.181) (0.153) K 1-0.112-0.158-0.195 (0.027) (0.040) (0.033) Stała 10.126 20.278 28.178 (5.466) (8.383) (6.794) W nawiasach oszacowania błędów standardowych Tablica 8.3: Oszacowania parametrów modelu Kleina 8.4.4 LIV E i F IV E (*) We wzorze na estymator 3M N K wykorzystujemy oszacowania macierzy Σ i macierz wartości dopasowanych Ẑ. Jak wynika ze wzoru (8.12) do policzenia Ẑ potrzebne nam jest oszacowanie Π. Pojawia się pytanie, czy po otrzymaniu z 3MNK oszacowań A i B nie można poprawić jakości oszacowań szacując powtórnie macierz Π na podstawie wzoru Π = Â 1 B i dokładniejsze oszacowanie wartości dopasowanych Ẑ. Dodatkowo, skoro oszacowania parametrów uzyskane z 3MNK są dokładniejsze z oszacowania uzyskane z 2MNK, to także estymator Σ policzony na podstawie reszt z 3MNK powinien być dokładniejszy niż estymator tej macierzy uzyskany na podstawie reszt z 2MNK.
8.4. METODY ESTYMACJI 179 Za każdym razem, zmodyfikowane macierze Ẑ i Σ można użyć do oszacowania wektora parametrów przy użyciu wzoru analogicznego do wzoru dla dla 3MNK: b = (Ẑ Σ 1Ẑ) 1 Ẑ Σ 1 y (8.14) Nazwijmy estymator macierzy Π wykorzystywany w danej metodzie do generowania Ẑ, a przez wejściowe Π. Podobnie estymator macierzy Σ macierz służący do tworzenia macierzy Σ występującej we wzorze (8.14) nazwijmy wejściowym Σ. Z kolei wyjściowym Π nazwijmy macierz Π =  1 B policzoną na podstawie estymatorów  i B uzyskanych z danej metody. Wyjściowym Σ nazwijmy oszacowanie macierzy wariancji i kowariancji uzyskane na podstawie reszt uzyskanych w danej metodzie. Stosując różne warianty macierzy wejściowych uzyskujemy następujące warianty estymatorów parametrów w modelu wielorównaniowym: Metoda Wejściowa Σ Wejściowa Π Wyjściowa Σ Wyjściowa Π MNK ΣMNK ΠMNK 2MNK I ΠMNK Σ2MNK Π2MNK 3MNK Σ2MNK ΠMNK Σ3MNK Π3MNK LIV E I Π2MNK ΣLIV E ΠLIV E F IV E po 2MNK Σ 2MNK Π2MNK ΣF IV E1 ΠF IV E1 F IV E po 3MNK Σ 3MNK Π3MNK ΣF IV E2 ΠF IV E2 F IV E po LIV E ΣLIV E ΠLIV E ΣF IV E3 ΠF IV E3 Estymatory te można dalej ulepszać tworząc np. estymator F IV E po F IV E. Pokazano, że iterowany w ten sposób estymator F IV E zbiega do estymatora metody największej wiarogodności (F IML). Przykład 8.4.4 Estymator SUR (Seemingly Unrelated Regressions). W modelu 8.11 nie pojawi się problem równoczesności, gdy w każdym z równań (8.10) po prawej stronie występować będa jedynie zmienne egzogeniczne. Do szacowania takiego modelu można zastosować estymator UMNK postaci b G = ( Z Σ 1 Z ) 1 Z Σ 1 y Nieznana macierz Σ można oszacować estymujac MNK poszczególne równania (8.11) i szacujac macierz Σ na podstawie wzoru gdzie a e j oznacza wektor reszt z j-tego równania. Σ jk = σ jk = e j e k T (8.15)
180 ROZDZIAŁ 8. MODELE WIELORÓWNANIOWE 8.4.5 F IML i LIML Nowsze pakiety statystyczne umożliwiają estymację formy strukturalnej za pomocą Metody Największej Wiarygodności przy pełnej informacji F IM L (Full Information Maximum Likelihood). Do tego celu zakładamy, że błędy losowe w modelu mają rozkład normalny u N (0, Σ), formułujemy funkcję wiarygodności i maksymalizujemy ją za pomocą metod numerycznych. Postać funkcji wiarogodności dla modelu wielorównaniowego opisana jest w dodatku matematycznym 8.5. Uzyskane w ten sposób estymatory będą miały typowe własności estymatorów M N W, to są zgodne i asymptotycznie efektywne. Ponieważ do sformułowania estymatora F IML wykorzystujemy całą formę strukturalną metodę tę zaliczamy do metod pełnej informacji. Wariantem estymatora F IM L jest estymator LIM L (Limited Information Maximum Likelihood). Estymator LIM L stosujemy, gdy wiemy, które zmienne w modelu są egzogeniczne oraz znamy formę strukturalną części równań. Pozostałe równania formy strukturalnej zastępujemy wtedy odpowiednimi równaniami pochodzącymi z formy zredukowanej i do otrzymanego modelu stosujemy estymator F IM L. Metodę tą zaliczamy do metod niepełnej informacji, ponieważ do estymacji parametrów równania j nie jest konieczne wyspecyfikowanie pełnej postaci formy strukturalnej. Pytania: 1. (*) Opisać procedurę estymacji za pomocą 3M N K. W jaki sposób można polepszyć uzyskane w ten sposób oszacowania? 2. Wyjaśnić różnice między estymatorami niepełnej i pełnej informacji stosowanych do estymacji modeli wielorównaniowych. Jaki są zalety i wady estymatorów obu typów? Podać przykłady takich estymatorów. 8.5 Dodatek Matematyczny Funkcja gęstości dla wielowymiarowego rozkładu normalnego dla G-wymiarowego wektora losowego u t o wartości oczekiwanej 0 i macierzy wariancji Σ ma następującą postać: 1 f (u t ) = (2π) G 2 Σ 1 2 exp ( 12 ) u tσ 1 u t W przypadku modelu wielorównaniowego, u t = AY t BX t a więc funkcja gęstości dla poszczególnych obserwacji jest równa: 1 f (u t ) = (2π) G 2 Σ 1 2 Logarytm funkcji wiarygodności ma następującą postać: l (A, B, Σ) = [ exp 1 ] 2 (AY t BX t ) Σ 1 (AY t BX t ) T ln f (u t ) = T G 2 ln (2π) T 2 ln Σ 1 2 t=1 T (AY t BX t ) Σ 1 (AY t BX t ) i=1
8.5. DODATEK MATEMATYCZNY 181 Przeprowadźmy analizę identyfikowalności parametrów modelu wielorównaniowego, na podstawie tak zdefiniowanego logarytmu funkcji wiarygodności. Wiemy z rozważań z rozdziału (8.3), że parametry modelu przekształconego są równe A = F A, B = F B, Σ = F ΣF. Podstawiając te wartości do funkcji wiarygodności uzyskujemy l (A, B, Σ ) = T G 2 ln (2π) T 2 ln F ΣF 1 2 = T ln F T G 2 ln (2π) 1 2 T = ln f (u t ) = l (A, B, Σ) t=1 T (F AY t F BX t ) ( F ΣF ) 1 (F AY t F BX t ) i=1 T (AY t BX t ) Σ 1 (AY t BX t ) i=1 Przy czym skorzystaliśmy z tego, że dla funkcji gęstości f (u t ), oraz nieosobliwej macierzy F, funkcja gęstości dla u t = F u t jest równa f (u t ) = f (u t ) F 1