Metody Ekonometryczne Niesferyczność macierzy wariancji kowariancji składnika losowego Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 1 / 40
Outline 1 2 Niesferyczność macierzy wariancji-kowariancji składnika losowego 3 Test Durbina-Watsona Testy portmanteau Test Breuscha-Godfreya 4 Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Test Goldfelda i Quandta Test Breuscha i Pagana Test White a Odporne estymatory wariancji-kowariancji Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 2 / 40
Dla jednorównaniowego modelu liniowego: y = Xβ + ε, (1) estymator MNK (OLS) przyjmuję postać: ˆβ OLS = ( X T X ) 1 X T y. (2) Estymator wariancji-kowariancji można zapisać jako: Var( ˆβ OLS ) = S 2 ε(x T X) 1, (3) gdzie wariancja składnika losowego można oszacować jako S 2 ε: S 2 ɛ = e T e n (k + 1) = SSE( ˆβ OLS ) df (4) gdzie SSE( ˆβ OLS ) to suma kwadratów reszt, a df to liczba stopni swobody. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 3 / 40
Twierdzenie Gaussa -Markowa Założenia: 1 rz(x) = k + 1 n 2 E(Xε) = 0 3 E(ε) = 0 4 Var(ε) = E(εε T ) = I σ 2 5 εi N (0, σ 2 ) Twierdzenie Gaussa - Markowa Estymator ˆβ uzyskany Klasyczną Metodą Najmniejszych Kwadratów jest estymatorem BLUE [best linear unbiased estimator], tj. zgodnym, nieobciążonym i najefektywniejszy w klasie liniowych estymatorów wektora β. nieobciążoność, czyli: E( ˆβ OLS ) = β najefektywniejszy, czyli posiadający najmniejszą wariancję w swojej klasie zgodny, czyli: plim n ˆβOLS n = β. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 4 / 40
Outline 1 2 Niesferyczność macierzy wariancji-kowariancji składnika losowego 3 Test Durbina-Watsona Testy portmanteau Test Breuscha-Godfreya 4 Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Test Goldfelda i Quandta Test Breuscha i Pagana Test White a Odporne estymatory wariancji-kowariancji Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 5 / 40
Konsekwencje braku sferyczności macierzy kowariancji składnika losowego Przypomnijmy estymator macierzy wariancji-kowariancji oszacowań ( ˆβ OLS ): Var( ˆβ OLS ) = E [ ( ˆβOLS β ) ( ˆβOLS β ) T ] (5) Korzystając z zapisu macierzowego: [ (X Var( ˆβ ) ( OLS ) = E T 1 (X ) ) ] T X X T ε T 1 X X T ε [ (X ) ( ) ] = E T 1 X X T εε T X X T 1 X = ( X T X ) 1 X T E [ εε T] X ( X T X ) 1 Następnie korzystając z założenie o sferyczności macierzy wariancji-kowariancji składnika losowego, tj. D 2 (ε) = E(εε T ) = σ 2 I, można uprościć wzór na estymator wariancji kowariancji oszacowań do: Var( ˆβ OLS ) = σ 2 ( X T X ) 1. (6) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 6 / 40
Konsekwencje niesferyczności macierzy wariancji-kowariancji składnika losowego Brak sferyczności macierzy wariancji-kowariancji składnika losowego prowadzi do obciążenia macierzy wariancji-kowariancji parametrów strukturalnych Var( ˆβ OLS ). Naturalną konsekwencją jest brak wiarygodności błędów standardowych. Obciążene są również wyniki testów statystycznych bazujących na macierzy wariancji-kowariancji wektora parametrów strukturalnych. W szczególności test t-studenta czy test liniowych restrykcji (test Walda). Brak sferyczności macierzy wariancji-kowariancji składnika losowego może świadczyć o poważniejszych problemach jak np. problemie pominiętych zmiennych (omitted variable bias). Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 7 / 40
Szczególne przypadki niesferyczności macierzy wariancji-kowariancji składnika losowego Heteroskedastyczność Efekt ARCH (Autoregressive Conditional Heteroscedasticity). Zależność przestrzenna Zależność pomiędzy jednostkami panelu (cross-sectional dependence) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 8 / 40
Szczególne przypadki niesferyczności macierzy wariancji-kowariancji składnika losowego Heteroskedastyczność Efekt ARCH (Autoregressive Conditional Heteroscedasticity). Zależność przestrzenna Zależność pomiędzy jednostkami panelu (cross-sectional dependence) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 8 / 40
Niesferyczność macierzy wariancji-kowariancji składnika losowego co dalej? Zmiana specyfikacji modelu. Odporne estymatory wariancji-kowariancji (robust covariance estimators). Konsekwencją niesferyczności składnika losowego jest obciążoność macierzy wariancji-kowariancji. Dlatego rozwiązaniem estymatora wariancji-kowariancji uwzględniającego (odpornego) tę własność skłanika losowego. Inne metody estymacji parametrów strukturalnych: Uogólniona MNK (GLS - Generalized Least Squares) Ważona MNK w przypadku heteroskedastyczności. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 9 / 40
Outline 1 2 Niesferyczność macierzy wariancji-kowariancji składnika losowego 3 Test Durbina-Watsona Testy portmanteau Test Breuscha-Godfreya 4 Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Test Goldfelda i Quandta Test Breuscha i Pagana Test White a Odporne estymatory wariancji-kowariancji Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 10 / 40
jest problemem najczęściej występującym w przypadku szeregów czasowych i polega na zależności (skorelowaniu) bieżących wartości składnika losowego od wartości przeszłych. Autokorelację składnika losowego można wiązać z inercją/persystencją zmiennych/procesów ekonomicznych. Jest to własność polegająca na rozłożonej w czasie absorbcji czynników zewnętrznych. Indeks t będzie oznaczać czas obserwacji. Zgodnie z założenia MNK: σ 2 0...... 0. 0........... Var(ε t ) =..... σ 2............... 0 0...... 0 σ 2 co jest równoznaczne: t s cov(ε t, ε s) = 0 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 11 / 40
pierwszego rzędu I Autokorelacja skłanika losowego pierwszego rzędu AR(1): ε t = ρε t 1 + η t (7) gdzie η t N (0, ση 2), E(η) = 0 oraz Var(η)2 = I ση 2. Zakładamy również, że ρ < 1 Wariancja składnika losowego: Korzystając z definicji (7) można podmienić ε t 1 : Iterując powyższą czynność uzsykujemy: η t są niezależne w czasie a więc Var(ε t ) = Var(ρε t 1 + η t ). (8) Var(ε t ) = Var(ρ 2 ε t 2 + ρη t 1 + η t ). (9) Var(ε t ) = Var(η t + ρη t 1 + ρ 2 η t 2 +...). (10) a więc wariancja składnika losowego jest równa Var(ε t ) = σ 2 η + ρσ2 η + ρ2 σ 2 η +..., (11) Var(ε t ) = σ2 η 1 ρ. (12) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 12 / 40
pierwszego rzędu II W przypadku kowariancji warto iść krok po kroku: cov(ε t, ε t 1 ) = cov(ε t 1 + η t, ε t 1 ) = ρcov(ε t 1, ε t 1 ) = ρvar(ε t 1 ) = ρ σ2 η 1 ρ. Łatwo pokazać ogólną zależność: (13) cov(ε t, ε t k ) = ρ k ση 2 1 ρ. (14) Zatem, w przypadku autokorelacji składnika losowego macierz wariancji-kowariancji składnika losowego nie jest diagonalna: 1 ρ ρ 2... ρ n 1 ρ 1 ρ... ρ n 2 Var(ε t ) = σ2 η ρ 2 ρ 1... ρ n 3 1 ρ.......... ρ n 1 ρ n 2 ρ n 3... 1 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 13 / 40
Przykłady Przykład idiosynkratycznego zaburzenia losowego (L) oraz AR(1) (P) 2 1 0 1 2 4 2 0 2 4 6 0 50 100 150 200 0 50 100 150 200 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 14 / 40
Przyczyny autokorelacji składnika losowego: Wysoka inercja (persystencja) zjawisk gospodarczych. Psychologia podejmowanych zjawisk. Problem pominięcia ważnej zmiennej. Niepoprawna postać funkcyjna; wadliwa struktura dynamiczna, brak uwzględnienie czynników cyklicznych/sezonowych. Przekształcenia statystyczne. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 15 / 40
Analiza reszt (e t): wykresy reszt w czasie, scatterploty, tj. wykres reszt e t względem opóźnionych reszt, np.e t 1. test Durbina-Watsona, testy portmanteau, test Breuscha-Godfreya. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 16 / 40
Test Durbina-Watsona umożliwia sprawdzenie jedynie autokorelacji pierwszego rzędu. Statystyka testu DW opiera się na oszacowaniu współczynnika korelacji pomiędzy e t a e t 1: n (e t e t 1 ) 2 d = t=2 n (15) t=1 Łatwo zauważyć, że d 2(1 ˆρ). Hipotezą zerową jest brak autokorelacji, tj.: H 0 : ρ = 0 (16) Natomiast hipoteza alternatywna testu DW zależy od wartości statystyki testowej:, tj. H 1 : ρ > 0 gdy d (0, 2) (17) Wartości krytyczne d U i d L są stablicowane. e 2 t 1 H 1 : ρ < 0 gdy d (2, 4) (18) H 1 : ρ > 0 H 1 : ρ < 0 Statystyka d Decyzja Statystyka d Decyzja (0, d L ) są podstawy do odrzucenia H 0 na rzecz H 1 o dodatniej autokorelacji (4 d L, 4) są podstawy do odrzucenia H 0 na rzecz H 1 o ujemnej autokorelacji do odrzucenia (d L, d U ) brak decyzji (4 d L, 4 d U ) brak decyzji (d U, 2) nie ma podstaw do odrzucenia (4 d U, 2) nie ma podstaw H 0 H 0 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 17 / 40
Ograniczenia podstawowego testu Durbina-Watsona Test DW posiada obszary niekonkluzywności. Test Durbina-Watsona umożliwia weryfikację autokorelacji jedynie pierwszego rzędu. W specyfikacji modelu ekonometrycznego nie może zostać uwzględniona część autoregresyjna zmiennej objaśniane (późnione wartości zmiennej objaśnianej), ponieważ wtedy statystyka DW jest obciążona. Test Durbina-Watsona można stostować w przypadku modeli z wyrazem wolnym. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 18 / 40
Uogólniony test Durbina-Watsona Statystyka uogólnionego testu Durbina-Watsona nie wykazuje obciążenia w przypadku modeli autoregresyjnych. Hipoteza zerowa odnosi się do braku autokorelacji. Statystyka testowa: d G = ( 1 d ) T 2 1 TVar( ˆβ y) (19) gdzie Var( ˆβ y) to wariancja szacunku parametru autoregresji, a d to statystyka podstawowego testu Durnina-Watsona. Statystyka d G posiada standardowy rozkład normalny, tj. d G N (0, 1). Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 19 / 40
Testy portmanteau Generalna konstrukcja testów portmanteau polega na weryfikacji statystycznej zależności w czasie (tj. autokorelacji) do rzędu P włącznie. Hipotezy zerowa postuluje brak autokorelacji do rzędu P włącznie. Niech ˆρ k będzię korelacją pomiedzy resztami e t a resztami opóźnionymi o k okresów, tj. e t k. Statystyka Boxa-Pierca: Q BP = T P ˆρ 2 T (20) ma rozkład χ 2 z P stopniami swobody a T oznacza wielkość próby. Statystyka Ljunga-Boxa: i=1 Q LB = T(T + 2) P i=1 ˆρ 2 k T i (21) ma rozkład χ 2 z P stopniami swobody. Statytyka Q LB ma lepsze własności od Q PB bez względu na wielkość próby. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 20 / 40
Test mnożnika Lagrange a (LM) zaproponowany przez Breuscha i Godfreya pozwala na testowanie autokorelacji zarówno pierwszego jak i wyższych rzędów. W pierwszym kroku szacowane są parametry modelu: y t = β 0 + β 1 x 1,t +... + β k x k,t + ε t (22) W drugim kroku szacowane są parametry modelu, w którym wyjąśniany jest składnik resztowy z modelu (22). Dodatkowo, uwzględniane są opóźnienia do rzędu P włącznie: e t = β 0 + β 1 x 1,t + β 2 x 2,t +... + β k x k,t + β k+1 e t 1 +... + β k+p,t e t P +η t (23) }{{}}{{} zmienne objaśniające z modelu (22) opóżnione reszty z modelu (22) Hipoteza zerowa testu LM jest równoznaczna braku autokorelacji do rzędu P włącznie: Statystyka testowa: H 0 : β k+1 =... = β k+p = 0 (24) H 1 : l (1,..,P) β k+l 0 (25) LM = nr 2 (26) posiada rozkład χ 2 z P stopniami swobody (rząd weryfikowanej autokorelacji składnika losowego). Są podstawy do odrzucenia H 0, jeżeli LM jest większa od wartości krytycznej χ 2. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 21 / 40
Estymator wariancji-kowariancji wektora β: Var( ˆβ OLS ) = ( X T X ) 1 X T E [ εε T] X ( X T X ) 1. (27) Niech Ω będzie niesferyczną macierzą wariancji kowariancji składnika losowego, tj. Var( ˆβ OLS ) = ( X T X ) 1 X T ΩX ( X T X ) 1. (28) Newey i West (1987) proponują następujący estymator wariancji-kowariancji: L T [ ] X T ˆΩX = X T ˆΩ0 X + w j e t e t j xt xt j T + x t jxt T, (29) j=1 t=j+1 gdzie L to maksymalna liczba opóźniej, x t to wektor obserwacji zmiennych objaśniających w momencie t, w j to wagi dla j-tego opóźnienia, a ˆΩ 0 jest wyznaczana następująco: X T ˆΩ0 X = T T k T et 2 xt t x t. (30) t=1 Newey i West (1987) proponują następujące wagi w j = 1 j/l. (31) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 22 / 40
- uwagi ogólne Wybór maksymalnej liczby opóźniej L jest kluczowy. Im mniejsze L tym mniejsza wariancja ale większe obciążenie. metoda Andrewsa (1991) czy Neweya i Westa (1994), metoda prób i błędów, Wybór wag w j. Możliwe wykorzystanie estymatora jądra gęstości spektralnej ( kernel spectral density), np. Barletta czy Parzena. Częstą praktyką mającą na celu ograniczenie obciążenia (wynikającego z persystencji obserwacji empirycznych) jest tzw. prewhitening przy pomocy modelu VAR (wektorowej autoregeresji). Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 23 / 40
Przykład [Hill, Griffiths i Lim]: krzywa Phillipsa dla Australii. Dane: szeregi czasowe od 1987Q1 do 2009Q3. inf t - inflacja w okresie t. u t - zmiana stopy bezrobocia w okresie t. Model: inf t = inf E t γ u t + ε t (32) Zakładając, że oczekiwania inflacyjne są stałe w czasie: gdzie β 1 = γ. inf t = β 0 + β 1 u t + ε t (33) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 24 / 40
Przykład c.d. Rozważany model: inf t = β 0 + β 1 u t + ε t (34) Oszacowanie Błąd stand. t-studenta wartość p β 0 0.777621 0.0658249 11.8135 0.0000 β 1 0.527864 0.229405 2.3010 0.0238 Czy oszacowanie parametru β 1 jest statystycznie istotne? Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 25 / 40
Przykład wykres reszt modelu względem czasu -2-1 0 1 2 1985q1 1990q1 1995q1 2000q1 2005q1 2010q1 time Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 26 / 40
Przykład zależność między resztami a ich pierwszym opóźnieniem e_{t} -2-1 0 1 2-2 -1 0 1 2 e_{t-1} Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 27 / 40
Przykład zależność między resztami a ich pierwszym opóźnieniem e_{t} -2-1 0 1 2-2 -1 0 1 2 e_{t-1} Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 28 / 40
Przykład testowanie autokorelacji składnika losowego Test Durbina-Watsona: Statystyka testowa: 0.887 Wartości krytyczne (N = 90 i k = 1) przy 5% poziomie istotności: d L : 1.6345 d U : 1.6794 Statystyka testu LM: p Wartość statystyki p-value 1 27.592 0.000 4 36.672 0.000 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 29 / 40
Przykład testowanie autokorelacji składnika losowego Test Durbina-Watsona: Statystyka testowa: 0.887 Wartości krytyczne (N = 90 i k = 1) przy 5% poziomie istotności: d L : 1.6345 d U : 1.6794 Statystyka testu LM: p Wartość statystyki p-value 1 27.592 0.000 4 36.672 0.000 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 29 / 40
Przykład estymator macierzy wariancji-kowariancji odporny na autokorelację Rozważany model: inf t = β 0 + β 1 u t + ε t (35) Podstawowe oszacowania oszacowania Oszacowanie Błąd stand. t-studenta wartość p β 0 0.777621 0.0658249 11.8135 0.0000 β 1 0.527864 0.229405 2.3010 0.0238 Odporne błędy standardowe Oszacowanie Błąd stand. t-studenta wartość p β 0 0.777621 0.101848 7.6351 0.0000 β 1 0.527864 0.309225 1.7071 0.0913 Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 30 / 40
Outline Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji 1 2 Niesferyczność macierzy wariancji-kowariancji składnika losowego 3 Test Durbina-Watsona Testy portmanteau Test Breuscha-Godfreya 4 Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Test Goldfelda i Quandta Test Breuscha i Pagana Test White a Odporne estymatory wariancji-kowariancji Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 31 / 40
Istota heteroskedastyczności składnika losowego Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji jest drugą formą niespełnienia założenia o sferyczności macierzy wariancji-kowariancji składnika losowego. Zjawisko heteroskedastyczności składnika losowego charakteryzuje przede wszystkim modele oparte o dane przekrojowe. Ogólny zapis hetereoskedastyczności składnika losowego: σ1 2 0... 0...... gdzie Var(ε) = 0 σ2 2.........., 0... 0 σn 2 σ 2 1 σ 2 2... σ 2 k. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 32 / 40
Istota heteroskedastyczności składnika losowego Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji można wiązać ze zmiennością roli nieobserowalnej heterogeniczności (różnorodności): σ 2 1 σ 2 2... σ 2 k. Zasadniczo σi 2 może w tym przypadku zależeć od zmiennych objaśniającyh, tj. X i: σi 2 = f (x 1i, x 2i,..., x ki ), (36) gdzie f ( ) jest pewną funkcją. Kluczowe jest zdiagnozowanie tej zależności oraz próba wytłumaczenia. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 33 / 40
Testowanie heteroskedatyczności składnika losowego Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji Analiza reszt (e t): wykresy kwadratów reszt względem zmiennych objaśniających, Testowanie heteroskedatyczności składnika losowego test Godfleda i Quandta, Test Breuscha i Pagana, test White a. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 34 / 40
Test Goldfelda i Quandta Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji Test Goldfelda Quandta polega na porównaniu wariancji w dwóch grupach. Kluczowa jest tutaj identyfikacja grup. zmienne binarne, porządkowanie (sortowanie) próby względem pewnej (ciągłej) zmiennej objaśniającej. W pierwszym kroku szacowane są parametry strukturalne modeli dla obu grup osobno, a następnie wyznaczane są reszty. W drugim kroku porównywana jest wariancja składnika losowego przy pomocy statystyki F: SSE1/(N1 K) F = SSE 2/(N 2 K), (37) gdzie SSE i i N i to suma kwadratów reszt i liczebność i-tej podpróby. Wariancja reszt pierwszej podpróby jest większa. Hipoteza zerowa postuluje brak różnic w wariancji pomiędzy grupami. Statystyka F ma rozkład F-Snedecora z N 1 K oraz N 2 K stopniami swobody. Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 35 / 40
Test Breuscha i Pagana Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji W teście Breuscha i Pagana zakłada się specyficzną zależność: σ 2 i = σ 2 f (α 0 + αx). (38) Pierwszy krok: szacujemy parametry strukturalne i wyznaczamy reszty. Drugi krok: obliczamy kwadrat reszt w relacji do ich wariancji w całej próbie, tj. ê 2 i /ˆσ 2. Trzeci krok: regresja pomocnicza, w której zmienną objaśnianą są ê 2 /ˆσ 2 : ê 2 i /ˆσ 2 = α 0 + α 1x 1i +... + α k x ki + η i, (39) gdzie η i N (0, σ 2 η). Hipoteza zerowa postuluje brak heteroskedastyczności (w rozważanej formie): Statystyka testowa: H : α 1 =... = α k tj. σ 2 i = σ 2. (40) posiada rozkład χ 2 z k stopniami swobody. LM = nr 2 (41) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 36 / 40
Test White a I Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji Test White a jest najogólniejszym testem pozwalającym zbadać heteroskedastyczność składnika losowego. W pierwszym kroku szacowane są parametry modelu: y i = β 0 + β 1x 1,i +... + β k x k,i + ε i (42) W drugim kroku, zmienną objaśnianą są kwadraty reszt z oszacowanego modelu (42). Ponadto uwzględniane są kwadraty oraz interacje zmiennych objaśniających z modelu (42), tj.: ê 2 i = α 0 + β 1x 1,i +... + α k x k,i + β k+1 x 2 1,i +... + α k+k x 2 k,i + +α k+k+1 x 1,ix 2,i +... + α k+k+s x k 1,i x k,i + η i Hipotezą zerową jest homoskedastyczność składnika losowego: H 0 : σ 2 i = σ 2 H 1 : σ 2 i σ 2 (43) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 37 / 40
Test White a II Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji Statystyka testowa: LM = nr 2 (44) posiada rozkład χ 2 z M stopniami swobody (liczba wszystkich wszystkich zmiennych objaśniających w regresji testowej, tj. M = 2k + s). Są podstawy do odrzucenia H 0, jeżeli LM jest większa od wartości krytycznej χ 2. Test White a jest ogólny ponieważ szczegółowa postać heteroskedastyczności jest nieznana. Tym samym, wynik tego testu może świadczyć np. o braku poprawnej specyfikacji (np. brak uwzględnienia nieliniowości). Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 38 / 40
Macierz projekcji Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji Macierz projekcji (projection/hat matrix) P określa zależność pomiędzy obserwacjami empirycznymi a wartościami teoretycznym: Macierz projekcji w przypadku estymatora MNK: Wybrane własność macierzy projekcji: Symetryczność, tj. P = P T. Idempotentność, tj. PP = P. ^y = Py. (45) P = X ( X T X ) 1 X T. (46) Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 39 / 40
Odporne estymatory wariancji-kowariancji Istota heteroskedastyczności składnika losowego Testowanie heteroskedatyczności składnika losowego Odporne estymatory wariancji-kowariancji Najczęstsze estymatory macierzy wariancji-kowariancji (Ω) uwzględniające heteroskedastyczność HC (heteroskedasticity-consistent): homoskedatyczność: ω i = ˆσ 2 ε(const), HC 0 (White) ω i = ê 2 i, HC 1 ω i = HC 2 ω i = HC 3 ω i = HC 4 ω i = N N k ê2 i, ê 2 i 1 p i, ê 2 i (1 p i ) 2, ê 2 i (1 p i ) δ i. gdzie p i to diagonalny element macierzy projekcji P, a δ i = min (4, p i/ p). Jakub Mućk Metody Ekonometyczne Wykład 3 Niesferyczność macierzy wariancji kowariancji składnika losowego 40 / 40