2.2 Autokorelacja Wprowadzenie

Podobne dokumenty
Czasowy wymiar danych

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Natalia Neherbecka. 11 czerwca 2010

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria Ćwiczenia 19/01/05

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Autokorelacja i heteroskedastyczność

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Diagnostyka w Pakiecie Stata

Ekonometria egzamin 07/03/2018

Testowanie hipotez statystycznych

Egzamin z ekonometrii wersja IiE, MSEMAT

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Problem równoczesności w MNK

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Przyczynowość Kointegracja. Kointegracja. Kointegracja

1 Modele ADL - interpretacja współczynników

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Diagnostyka w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria dla IiE i MSEMat Z12

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

1.8 Diagnostyka modelu

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Metody Ekonometryczne

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Testowanie hipotez statystycznych

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

1.1 Klasyczny Model Regresji Liniowej

Egzamin z ekonometrii wersja IiE, MSEMAT

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cihcocki. Natalia Nehrebecka

1.9 Czasowy wymiar danych

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Stacjonarność Integracja. Integracja. Integracja

Testowanie hipotez statystycznych

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Egzamin z ekonometrii wersja IiE, MSEMAT

1.3 Własności statystyczne estymatorów MNK

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Egzamin z ekonometrii wersja ogolna

Metoda najmniejszych kwadratów

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Przykład 2. Stopa bezrobocia

Ekonometria egzamin wersja ogólna 29/01/08

1.7 Ograniczenia nakładane na równanie regresji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Modele warunkowej heteroscedastyczności

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe

Metoda największej wiarogodności

Stanisław Cichocki. Natalia Nehrebecka

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Modele wielorównaniowe (forma strukturalna)

Budowa modelu i testowanie hipotez

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Stanisław Cichocki. Natalia Nehrebecka

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

0.1 Modele Dynamiczne

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

1.5 Problemy ze zbiorem danych

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Heteroskedastyczość w szeregach czasowyh

Weryfikacja hipotez statystycznych

Analiza regresji - weryfikacja założeń

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin wersja ogólna 17/06/08

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Uogólniona Metoda Momentów

Stosowana Analiza Regresji

Statystyka matematyczna dla leśników

Stanisław Cichocki Natalia Neherbecka

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Transkrypt:

2.2 Autokorelacja 2.2.1 Wprowadzenie Przy wyprowadzaniu estymatorów Klasycznego Modelu Regresji Liniowej (KMRL) zakładaliśmy, że są spełnione założenia Gaussa-Markowa, tzn. składniki losowe są homoscedastyczne i nieskorelowane. Jednak te założenia dla dużej liczby modeli nie są spełnione. W wielu zastosowaniach reszty modelu są skorelowane. Szczególnie dotyczy to modeli szacowanych na podstawie danych o wymiarze czasowym (dane pochodzące z szeregów czasowych). W ekonometrii skorelowanie zmiennej z tą samą zmienną z innego okresu (obiektu) nazywamy autokorelacją. Gdy wartość każda z wartości zmiennej jest skorelowana z poprzedzającą wartością mówimy o występowaniu autokorelacji pierwszego rzędu. Gdy autokorelacji podlegają obserwacje oddalone o s okresów mówimy o występowaniu autokorelacji rzędu s. W przypadku występowania zjawiska autokorelacji składnika losowego macierz wariancji-kowariancji nie jest macierzą diagonalną. Dzieje się tak, ponieważ składniki losowe dla obserwacji pochodzących z różnych okresów nie są niezależne, one są skorelowane. Podobnie jak w przypadku autokorelacji analizę zaczynamy od Klasycznego Modelu Regresji Liniowej. Postać funkcyjną modelu możemy zapisać jako: y = Xβ + ε (1) Ale uchylamy założenie o nieskorelowaniu składnika losowego, czyli przyjmujemy, że E(ε t, ε s ) 0 dla t s. Macierz wariancji-kowariancji dla modelu z autokorelacją ma taką samą diagonalę jak macierz wariancji-kowariancji w KMRL. Różnica polega na tym, że poza diagonalą są elementy różne od zera, należące do przedziału [ 1, 1] obrazujące wartość współczynnika korelacji między składnikami losowymi pochodzącymi od różnych obserwacji. Autokorelacja, czyli skorelowanie składników losowych, jest naruszeniem założeń modelu które odnosi się wyłącznie do danych o charakterze szeregów czasowych. Macierz wariancji-kowariancji, podobnie jak dla modelu z heteroscedastycznością oznaczamy przez: var(ε) = σ 2 Ω (2) gdzie Ω jest macierzą której elementy znajdujące się na diagonali są równe 1. Ale poza diagonalą znajdują się elementy różne od zera, będące współczynnikami korelacji składników losowych z odpowiednich okresów. Traktując model regresji liniowej bardzo ogólnie można powiedzieć, że składnik losowy ε t zawiera wpływ zmiennych nieuwzględnionych w równaniu regresji na zmienną objaśnianą. Wobec tego brak uwzględnienia zmiennej 88

istotnej lub błędna specyfikacja formy funkcyjnej modelu jest częstą przyczyną występowania dodatniej autokorelacji w modelu. Jeżeli wartości takiej zmiennej są obserwowane i mogą zostać włączone do modelu, możemy interpretować występowanie autokorelacji jako wskazanie błędnej specyfikacji modelu. Biały szum Jeżeli spełnione są założenia KMRL, w szczególności założenie o normalności rozkładu reszt, reszty z modelu powinny być niezależne od siebie i pochodzić z rozkładu o średniej 0 i stałej wariancji równej σ 2. ε iid (0, σ 2 ) Jeżeli reszt są niezależne od siebie, to zachowują się w sposób czysto losowy. Znają wartość reszty z okresu t nie jesteśmy w stanie nic powiedzieć o wartości reszty w okresie t + 1. Co więcej, nawet nie można określić czy będzie dodatnia, czy też ujemna. W całkowicie odmienny sposób zachowują się resz- Rysunek 1: Biały szum y 2 1 0 1 2 0 20 40 60 80 100 x ty, które są skorelowane. Dodatnia korelacja składnika losowego sprawia, że jeżeli błąd w okresie t jest dodatni to będzie większe prawdopodobieństwo, że w okresie t + 1 będzie dodatni, niż ujemny. Natomiast jeżeli w okresie t błąd był ujemny, to będzie wyższe prawdopodobieństwo otrzymania w okresie t + 1 błędu ujemnego niż błędu dodatniego. Jeżeli porównamy rysunki białego szumu i reszt z dodatnią autokorelacją to zauważymy, że na rysunku z dodatnią autokorelacją wykres reszt przecina oś zerową znacznie rzadziej niż wykres białego szumu. 89

Rysunek 2: Dodatnia autokorelacja y1 2 1 0 1 2 0 20 40 60 80 100 x Dodatnia autokorelacja jest znacznie częściej występującą formą autokorelacji, niż autokorelacja ujemna. Jest ona powszechnym zjawiskiem w przypadku modeli szacowanych na szeregach czasowych. Występuje w przypadku, gdy zjawisko losowe zaburzające przeciętny poziom zmiennych ma wpływ na ich wartości w więcej niż jednym okresie. Ujemna autokorelacja składnika losowego powoduje, że większe jest prawdopodobieństwo zmiany znaku przez składnik losowy. Jeżeli w okresie t jest on dodatni, to w okresie t + 1 ze znacznie większym prawdopodobieństwem będzie on ujemny niż dodatni. Natomiast jeżeli w okresie t składnik losowy jest ujemny, to ze znacznie większym prawdopodobieństwem będzie on w okresie t + 1 dodatni. Jeżeli porównamy wykres reszt z ujemną autokorelacją z wykresem białego szumu, to zauważymy, że znacznie częściej przecina on poziom 0. Proces AR Istnieje wiele form autokorelacji. Każda z nich prowadzi do innej postaci macierzy wariancji-kowariancji składnika losowego σ 2 Ω. Najbardziej rozpowszechnioną formą autokorelacji jest proces autoregresyjny pierwszego rzędu. W takim przypadku przyjmuje on postać: ε t = ρε t 1 + φ t (3) gdzie φ iid (0, σ 2 ) jest wektorem zmiennych losowych o niezależnym rozkładzie ze średnią zero i stałą wariancją wynoszącą σ 2. Zakładamy, że wartość składnika losowego jest równa ρ razy wartość składnika z poprzedniego okresu plus innowacja φ t. Nowy komponent φ t ma średnią zero, stałą wariancję 90

Rysunek 3: Ujemna autokorelacja y2 2 1 0 1 2 3 0 20 40 60 80 100 x i jest niezależny w wymiarze czasu. Dla porcesu AR(1) macierz wariancjikowariancji ma następująca postać 1 ρ 0... 0 ρ 1 ρ 0 0 0 ρ 1 ρ 0.... ρ. ρ 0 0 0 ρ 1 Wzór na proces autoregresyjny można uogólnić. Proces autoregresyjny rzędu p ma następującą postać analityczną. ε t = ρ 1 ε t 1 + ρ 2 ε t 2 +... + ρ t p ε t p + φ t (4) Proces MA Inną często spotykaną formą autokorelacji jest proces średniej ruchomej Moving Average. Wartość w okresie t jest średnią wartości pochodzących z pewnej ilości okresów. Ilość okresów determinuje rząd procesu. y t = µ + ε t θε t 1 (5) Podobnie jak w przypadku procesu AR możemy wzór uogólnić. Proces średniej ruchomej rzędu q dany jest przez y t = µ + ε t θ 1 ε t 1 θ 2 ε t 2... θ q ε t q (6) 91

2.2.2 Własności estymatorów MNK Estymator MNK dla modelu regresji jest dany przez: Jest on nadal nieobciążony, ponieważ b = (X X) 1 X y (7) E(b) = E[(X X) 1 X y] = E[(X X) 1 X (Xβ + ε)] = E[(X X) 1 X X β] = β }{{} I czyli wartość oczekiwana estymatora MNK nie zależy od postaci składnika losowego, ani jego wariancji. Tak się dzieje w przypadku braku skorelowania zmiennych objaśniających z błędem losowym. Jeżeli macierz X nie zawiera regresorów skorelowanych z błędem losowym ε, to wariancję estymatora b możemy zapisać jako: var(b) = E[b E(b)][b E(b)] = E[(X X) 1 X εε X(X X) 1 ] var(b) = E[(X X) 1 X σ 2 ΩX(X X) 1 ] = σ 2 (X X) 1 X ΩX(X X) 1 (8) Jak widać, wariancja estymatora w przypadku gdy składnik losowy podlega autokorelacji jest różna od σ 2 (X X) 1. Wobec tego statystyka S 2 będzie obciążonym estymatorem wariancji składnika losowego. Jeżeli w modelu występuje autokorelacja to zazwyczaj estymator MNK niedoszacowuje prawdziwą wielkość wariancji. Ponadto testy statystyczne oparte na statystykach t, F oraz χ 2 bardzo często będą dawać mylne wyniki. Statystyki t częściej niż powinny, będą wskazywać na istotność statystyczną regresorów. 2.2.3 Estymator Praisa-Winstena Podobnie jak w przypadku heteroscedastyczności efektywnym estymatorem dla modelu z autokorelacją jest estymator otrzymany z wykorzystaniem Uogólnionej Metody Najmniejszych Kwadratów b = (X Ω 1 X) 1 X Ωy Jednak w ogólnym przypadku nie znamy postaci macierzy wariancji-kowariancji Ω. Jeżeli błąd losowy zawiera proces autoregresyjny pierwszego rzędu, to model regresji możemy przedstawić jako: y t = X t β + ε t (9) w którym składnik losowy zależy od wartości składnika losowego w poprzednim okresie ε t = ρε t 1 + φ t (10) 92

o składniku losowym φ t iid (0, σ 2 ) zakładamy, że jest nieskorelowany i ma taki sam rozkład niezależny od czasu. Jeżeli równanie (9) poddamy transformacjom ε t ρε t 1, y t ρy t 1, oraz x t ρx t 1 otrzymamy model, którego składnik losowy będzie homoscedastyczny i nieskorelowany.ta procedura uzyskiwania estymatora w przypadku autokorelacji została nazwana od nazwisk autorów estymacją Cochrana-Orcutta. y t ρy t 1 = (x t ρx t 1 ) β + φ t (11) Model (11) spełnia założenia twierdzenia Gaussa-Markowa, wobec tego estymator metody najmniejszych kwadratów obliczony dla niego będzie równoważny estymatorowi UMNK, o ile znany jest współczynnik korelacji ρ. Jednakże w wyniku transformacji danych tracimy pierwszą obserwację. Wobec tego uzyskany estymator będzie jedynie przybliżeniem estymatora wartości UMNK. Uzyskane przybliżenie będzie tym lepsze, im więcej obserwacji zawiera próba. Oczywiście estymator Cochrana-Orcuta jest asymptotycznie równoważny estymatorowi UMNK. Prais i Winten zmodyfikowali procedurę i zaproponowali obliczenie wartości estymatora na podstawie całej próby. Dzięki temu estymator Praisa- Winstena jest nieobciażony. Problematyczne jest, że jako estymator SUMNK jest on tylko asymptotycznie efektywny, wobec tego w małych próbach może być obciążony. Ponadto, poza podstawowymi przypadkami nie sa znane właściwości statystyk testowych. W zastosowaniach praktycznych wartość współczynnika korelacji ρ nie jest znana. Uzyskiwana jest dzięki przeprowadzaniu regresji reszt na reszty opóźnione o jeden okres (10). Otrzymanym estymatorem współczynnika korelacji jest: ( T ) 1 ( T ) ˆρ = e t e t 1 (12) t=1 e 2 t 1 Jednak ten estymator jest obciążony. ( T t=2 E(ρ ˆρ) = E e ) T te t 1 t=1 e te t 1 = T t=1 e2 t 1 t=2 T t=1 e2 t 1 e 2 1 T t=1 e2 t 1 (13) Pomimo tego, że ten estymator jest obciążony, jest on zgodny, gdyż dla dużej wartości t obciążenie dąży do zera, wobec tego plim(ˆρ) = ρ. Oznacza to że w dużych próbach jego obciążenie dąży do zera. W praktyce zamiast prawdziwej wartości ρ stosowany jest estymator ˆρ. W rezultacie uzyskany estymator Stosowalnej UMNK nie będzie najlepszym liniowym nieobciążonym estymatorem. Ale będzie on asymptotycznie równoważny estymatorowi UMNK, wobec tego w dużych próbach obciążenie będzie pomijalnie małe. 93

Pakiety statystyczne do estymacji używają iterowanej metody Praisa- Winstena. Polega ona na tym, że najpierw estymuje się parametr ρ, a następnie wektor β za pomocą stosowalnej UMNK. Po uzyskaniu estymatora, generuje się wektor reszt i ponownie oblicza estymator współczynnika korelacji, i ponownie estymuje się wektor β. Procedurę powtarza się do osiągnięcia zbieżności, czyli do osiągnięcia takich wartości estymatorów dla których zastosowana kolejna iteracja już ich nie zmienia. W dużych próbach nie ma dużego znaczenia ile wykonamy iteracji, bowiem estymatory są asymptotycznie równoważne. W małych próbach procedura iterowana daje lepsze rezultaty. 2.2.4 Estymator Newey a-westa Innym problemem jest uzyskanie zgodnego oszacowania macierzy wariancjikowariancji. Macierz wariancji-kowariancji składnika losowego otrzymywana metodą MNK jest obciążonym estymatorem prawdziwej macierzy wariancjikowariancji. Macierz wariancji-kowariancji estymatora możemy zapisać jako: var(β MNK ) = X σ 2 ΩX W modelach o wymiarze czasowym zakłada się, że wielkość korelacji pomiędzy obserwacjami jest stała w czasie, a formalnie wynika to z założenia o stacjonarności szeregu. Dzięki temu zmniejsza się liczba parametrów macierzy wariancji-kowariancji wymagających oszacowania, a parametry szacuje się na podstawie reszt z modelu. Możemy obliczyć jej zgodny estymator wykorzystując wyrażenie Ŝ = 1 T T e 2 t x t x t + 1 T t=1 L T w l e t e t l (x t x t l + x t l x t) l=1 t=l+1 gdzie w l = 1 l jest wagą kolejnej obserwacji, a L liczbą opóźnień. Dla L+1 procesu średniej ruchomej liczba opóźnień jest z reguły mała. Z kolei dla procesu autoregresyjnego autokorelacja nigdy nie jest równa zero. W praktyce przyjęło się u używać L = T 1 4. Ten estymator jest obciążony. Estymator Newey a-westa dany jest wzorem var(β) = (X X) 1 Ŝ(X X) 1 (14) Jest to estymator zgodny zarówno w przypadku występowania heteroscedastyczności, jak i w przy autokorelacji składnika losowego. Co więcej do jego obliczenia nie jest wymagana znajomość formy macierzy Ω. Rozkłady statystyk testowych t, F oraz χ 2 są tylko asymptotycznie poprawne, ponieważ estymator jest zgodny ale obciążony. 94

2.2.5 Testowanie występowania autokorelacji Jeżeli w modelu ekonometrycznym występuje autokorelacja, a tworząc model problem ten pominiemy, to doprowadzi to do sytuacji w której będziemy wyciągać wnioski na podstawie błędnego modelu. Wobec tego sprawdzenie czy składniki losowe są skorelowane jest bardzo ważnym elementem poprzedzającym wnioskowanie statystyczne. Testy na występowanie autokorelacji bazują na fakcie, że jeżeli prawdziwe zaburzenia losowe zawierają autokorelację, to reszty z metody najmniejszych kwadratów też będą skorelowane. Test Durbina-Watsona Test Durbina-Watsona jest najpopularniejszym testem wykrywającym autokorelację. Testuje ona hipotezę: przeciwko alternatywie: H 0 : brak autokorelacji H 1 : występuje autokorelacja pierwszego rzędu Podstawową zaletą testu jest to, że rozkład statystyki testowej DW jest znany zarówno dla małych jak i dla dużych prób. Statystyka dana jest wzorem: DW = T i=2 (e i e i 1 ) 2 T i=1 e2 i = 2(1 ρ) e2 1 + e 2 T n i=1 e2 i (15) gdzie ρ jest współczynnikiem korelacji pierwszego rzędu. Jeżeli dysponujemy dużą próbą to czynnik po prawej stronie równania (15) jest pomijalnie mały. Formalnie można wykazać, że DW p 2(1 ρ εtε t 1 ) Sposób testowania zależy od tego czy sprawdzamy obecność dodatniej czy ujemnej autokorelacji. Tablice rozkładu zawierają wartości krytyczne w zależności od liczby zmiennych w modelu k i ilości obserwacji T. Dla każdej pary k, T dane są dwie wartości krytyczne d L, d U. Wnioskowanie przebiega według następującego schematu: 1. jeżeli zakładamy występowanie dodatniej autokorelacji, wtedy DW < 2, oraz a) DW < d L, odrzucamy hipotezę zerową o braku autokorelacji i przyjmujemy, że w modelu jest dodatnia autokorelacja, 95

b) d L < DW < d U brak konkluzji, c) DW > d U nie ma podstaw do odrzucenia H 0 o braku autokorelacji. 2. jeżeli zakładamy występowanie ujemnej autokorelacji, wtedy DW > 2, oraz a) DW > 4 d L, odrzucamy hipotezę zerową o braku autokorelacji i przyjmujemy, że w modelu jest ujemna autokorelacja, b) 4 d U < DW < 4 d L brak konkluzji, c) DW < 4 d U nie ma podstaw do odrzucenia H 0 o braku autokorelacji 3. jeżeli DW = 2 to brak jest autokorelacji. Test DW ma trzy wady. Po pierwsze, wykrywa jedynie występowanie autokorelacji pierwszego rzędu. Po drugie, rozkład statystyki testowej jest nietypowy i zazwyczaj jego wartość krytyczna musi być odczytana z tablic. Po trzecie istnieje obszar braku konkluzji, ponieważ rozkład statystyki DW zależy od postaci nielosowej macierzy obserwacji X. Wartości krytyczne sa obliczone dla takich postaci macierzy X, dla których rozkład statystyki testowej dla prawdziwej hipotezy zerowej jest przesunięty najbardziej w lewą (prawą) stronę. Z tego powodu, pomiędzy wartościami krytycznymi istnieje obszar w którym odpowiedź jest niejednoznaczna. Część ekonometryków praktyków uważa, że w przypadku znalezienia się w obszarze niekonkluzywnym powinniśmy przyjąć, że składniki losowe nie są skorelowane. Test Breuscha-Godfrey a Test Breuscha-Godfrey a jest testem wykorzystującym metodę mnożników Lagrange a. Ma on przewagę nad testem Durbina-Watsona, ponieważ jest w stanie wykrywać obecność autokorelacji wyższych rzędów. Weryfikujemy hipotezę przeciwko alternatywie: H 0 : brak autokorelacji H 1 : ε i = AR(p) ε i = MA(p) W obu przypadkach używamy takiej samej statystyki testowej: Możemy ją uzyskać dwoma metodami: LM = T R 2 0 (16) 96

1. bierzemy wektor reszt i przeprowadzamy regresję e t = γ 0 + γ 1 e t 1 + γ 2 e t 2 +... + γ p e t p następnie obliczamy współczynnik R 2 0. Statystyka testowa LM = T R 2 0 ma rozkład χ 2 (p) 2. do oryginalnego równania regresji dodajemy p kolumn, zawierających opóźnione reszty y t = x t γ 0 + γ 1 e t 1 + γ 2 e t 2 +... + γ p e t p a następnie sprawdzamy łączną istotność statystyczną opóźnionych reszt za pomocą statystyki LM = T R 2 0. Ma ona rozkład χ 2 (p) W obu przypadkach, jeżeli wartość statystyki jest większa od wartości z rozkładu to należy do obszaru krytycznego testu i odrzucamy hipotezę zerową o braku autokorelacji. Przykład 1. Badając występowanie procesu AR(1) w pewnym modelu, znaleziono następujące wartości krytyczne testu Durbina-Watsona: d L = 1, 00 oraz d U = 1, 31. Dla jakich wartości statystyki DW z próby możemy uznać, że: a) 1. jest autokorelacja dodatnia, 2. jest autokorelacja ujemna, 3. nie ma autokorelacji, 4. nie da się roztrzygnąć czy jest autokorelacja. b) Czy i jak wpływa na wartość statystyki DW z próby fakt, że szacując model uporządkujemy obserwacje, a więc i reszty, nie od 1 do n, a od n do 1. A jaki wpływ będzie miało uporządkowanie reszt od najmniejszej do największej? Odpowiedź. a) 1. autokorelacja dodatnia jest dla DW (0; 1), 2. autokorelacja ujemna jest dla DW (3; 4), 3. nie ma autokorelacji dla DW (1, 31; 2, 69), 4. nie da się roztrzygnąć czy jest autokorelacja DW ((1; 1, 31) (2, 69; 3)). 97

b) Statystyka DW dana jest wzorem: DW = n i=2 (e i e i 1 ) 2 n i=1 e2 i = 2(1 r) e2 1 + e 2 T n i=1 e2 i wobec tego odwrotne uporządkowanie obserwacji nie wpłynie na kwadrat sumy w liczniku statystyki, wobec tego wartość statystyki się nie zmieni. Natomiast uporządkowanie próby według wielkości reszt zmniejszy sumę kwadratów w liczniku statystyki DW, a więc zwiększy prawdopodobieństwo, że stwierdzimy brak autokorelacji w modelu. Przykład 2. Szacując metodą MNK model liniowy o postaci y i = β 0 + β 1 x 1t + β 2 x 2t + ε t otrzymano następujący wektor reszt: e = [1, 2, 1, 2, 3, 1, 3, 0, 4, 3] Zweryfikuj hipotezę dotyczącą występowania autokorelacji składnika losowego w tym modelu na poziomie istotności α = 0, 05. Korzystając ze wzoru na statystykę Durbina-Watsona oblicza- Odpowiedź. my: DW = (2 1)2 + ( 1 2) 2 + ( 2 + 1) 2 + (3 + 2) 2 + ( 1 3) 2 + ( 3 + 1) 2 + (2 1) 2 + (0 + 3) 2 + (4 0) 2 + ( 3 4) 2 1 2 + 2 2 + ( 1) 2 + ( 2) 2 + 3 2 + ( 1) 2 + ( 3) 2 + 0 2 + 4 2 + ( 3) 2 DW = 135 54 = 2, 5 Z tablicy rozkładu Durbina-Watsona odczytujemy wartości krytyczne dla dwóch zmiennych i dziesięciu obserwacji. Ponieważ dla dwóch zmiennych i 15 obserwacji wynoszą one odpowiednio d L = 0, 7, oraz d U = 1, 64, to dla dziesięciu obserwacji d L będzie niższe, a d U wyższe. Ponieważ, wartość statystyki DW jest większa od 2, to modyfikujemy wartości krytyczne przyjmując 4 d U = 2, 36 oraz 4 d L = 3, 3. Ponieważ 4 d U < DW < 4 d L wynik testu jest niekonkluzywny. Przykład 3. Popyt na lody w USA Dane do przykładu pochodzą z artykułu Hildretha i Lu (1960). Są to szeregi czasowe zawierające po 30 comiesięcznych obserwacji od marca 1951 do lipca 1953. Obejmują one następujące zmienne: cons wielkość konsumpcji lodów na głowę w pintach. (1 pinta ok 0,54 litra), income przeciętny tygodniowy dochód rodziny, 98

price cena lodów, temp przeciętna temperatura w skali Fahrenheita Jeżeli spojrzymy na wykresy danych to zauważymy, że temperatura jest istotnym czynnikiem wyjaśniającym poziom konsumpcji lodów. Przeprowadzona Rysunek 4: Konsumpcja lodów, cena, oraz temperatura/100.2.3.4.5.6.7 0 10 20 30 time cons temp100 price regresja metodą MNK dała następujące wyniki:. reg cons price income temp Source SS df MS Number of obs = 30 ---------+------------------------------ F( 3, 26) = 22.17 Model.090250523 3.030083508 Prob > F = 0.0000 Residual.035272835 26.001356647 R-squared = 0.7190 ---------+------------------------------ Adj R-squared = 0.6866 Total.125523358 29.004328392 Root MSE =.03683 cons Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------- price -1.044413.834357-1.25 0.222-2.759458.6706322 income.0033078.0011714 2.82 0.009.0008999.0057156 temp.0034584.0004455 7.76 0.000.0025426.0043743 _cons.1973149.2702161 0.73 0.472 -.3581223.752752 By obliczyć wartość statystyki Durbina-Watsona w pakiecie Stata, należy najpierw zdefiniować zmienną opisującą czas. Ta zmienna może przyjmować dowolne wartości. Czas powinien rosnąć z wartością zmiennej i wartość 99

zmiennej nie może się powtarzać, jeżeli nie zdefiniujemy zmiennej panelowej (zmiennej która będzie przyjmowała taką samą wartość dla każdej jednostki w panelu na przestrzeni czasu, ale różna dla różnych jednostek).. tsset time time variable: time, 1 to 30 Jeśli mamy zdefiniowaną zmienną opisującą czas, obliczenie statystyki Durbina- Watsona jest proste. estat dwstat Durbin-Watson d-statistic( 4, 30) = 1.021169 wartości krytyczne wynoszą odpowiednio d L = 1, 21 i d U = 1, 65. Wobec tego odrzucamy hipotezę zerową o braku autokorelacji pierwszego rzędu. Wyniki testu możemy potwierdzić patrząc na wykres dopasowanych wartości konsumpcji i reszt. Na rysunku wyraźnie widać, że po dodatniej reszcie Rysunek 5: Konsumpcja lodów i dopasowana konsumpcja lodów.2.3.4.5.6 0 10 20 30 time Fitted values cons następuje dużo częściej reszta dodatnia niż ujemna, co potwierdza występowanie zjawiska dodatniej korelacji. Występowanie autokorelacji powoduje, że błędy standardowe estymatorów nie są poprawnie oszacowane. Możemy poprawić ich oszacowanie używając stosowalnej UMNK.. reg cons price income temp, robust Regression with robust standard errors Number of obs = 30 100

F( 3, 26) = 20.26 Prob > F = 0.0000 R-squared = 0.7190 Root MSE =.03683 Robust cons Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------- price -1.044413.8808608-1.19 0.246-2.855048.7662221 income.0033078.0011511 2.87 0.008.0009417.0056738 temp.0034584.0004492 7.70 0.000.0025352.0043817 _cons.1973149.2875763 0.69 0.499 -.3938068.7884365 lub estymatora Newey a-westa z jednym opóźnieniem, ponieważ jesteśmy pewni że składnik losowy zawiera proces AR(1).. newey cons price income temp, lag(1) Regression with Newey-West standard errors Number of obs = 30 maximum lag: 1 F( 3, 26) = 18.76 Prob > F = 0.0000 Newey-West cons Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------- price -1.044413.8874727-1.18 0.250-2.868639.7798132 income.0033078.0012065 2.74 0.011.0008278.0057877 temp.0034584.0004647 7.44 0.000.0025033.0044136 _cons.1973149.2964394 0.67 0.512 -.4120249.8066547 lub z sugerowaną przez teorię ekonometryczną liczbą opóźnień. 30 1 4 = 2, 34. Wobec tego używamy 3 opóźnień.. newey cons price income temp, lag(3) Regression with Newey-West standard errors Number of obs = 30 maximum lag: 3 F( 3, 26) = 27.63 Prob > F = 0.0000 Newey-West cons Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------- price -1.044413.9772494-1.07 0.295-3.053178.9643518 income.0033078.0013278 2.49 0.019.0005783.0060372 temp.0034584.0004002 8.64 0.000.0026357.0042811 101

_cons.1973149.3378109 0.58 0.564 -.4970654.8916952 Jak widać estymatory parametrów wektora β są zawsze takie same, co wynika ze zgodności estymatora MNK, natomiast uzyskujemy różne wartości odchyleń standardowych estymatorów. Literatura [1] William H. Greene (2003) Econometric Analysis, 5th edition. [2] Jerzy Mycielski (2000), WNE. [3] Marno Verbbek (2000) A Guide to Modern Econometrics, John Wiley & Sons. 102