Badanie stacjonarności szeregów czasowych w programie GRETL Program proponuje następujące rodzaje testów stacjonarności zmiennych:. Funcję autoorelacji i autoorelacji cząstowej 2. Test Diceya-Fullera na pierwiasti jednostowe 3. Periodogram i spetrum procesów Poniżej omawiamy pierwsze dwie grupy testów.. Funcja autoorelacji (autocorrelations function ACF) Funcja autoorelacyjna dana jest wzorem: (.) r = ˆ ρ = T t= + ( x t x)( x t x) / T t= ( x t x) 2 = T t= + ( x t x)( x Ts 2 t x) W przypadu, gdy badany proces jest stacjonarny olejne wartości r powinny być blisie zeru. Statystyą badająca istotność olejnych współczynniów orelacji w programie GRETL jest statystya Ljunga-Boxa postaci: (.2) Q( ) = T ( T + 2) ( T i) i= 2 r i Statystya (.2) ma rozład χ 2 z stopniami swobody. Wartości sprawdzianu więsze od wartości rytycznych pozwalają na odrzucenie hipotezy zerowej mówiącej o nieistotności autoorelacji rzędu. W przeciwnym wypadu nie ma podstaw do odrzucenia hipotezy zerowej. Funcja autoorelacji cząstowej (partial autocorrelations function PACF) Pozwala ocenić rząd opóźnienia badanego procesu dla modelu autoregresji AR() na podstawie statystyi Quenouilla postaci:.96 (.3) Q = n Jeżeli współczynni autoorelacji cząstowej jest mniejszy od statystyi Q to nie ma podstaw do odrzucenia hipotezy o brau związu pomiędzy procesami o odstępie równym. W przypadu, gdy wszystie wartości funcji autoorelacji cząstowej są mniejsze od Q należy wniosować, że badany proces jest stacjonarny, co więcej, losowy. ACF i PACF w programie GRETL W celu oszacowania ACF i PACF oraz statysty Q() i Q w programie GRETL należy wybrać z menu głównego Zmienna Korelogram (lub Korelogram menu ontestowego)
2. Testy Diceya- Fullera na pierwiasti jednostowe Test Diceya- Fullera (test DF) zaproponowany w 979 r. zwany jest również testem pierwiastów jednostowych. Sprawdza on istnienie pierwiasta jednostowego, tzn. hipotezę, że ρ= w równaniu : (2.a) y t =ρ y t- + t Komentarz: gdzie t jest procesem białego szumu, tóry z założenia ma średnią równą zero, stałą wariancję i zerową owariancję pomiędzy różnymi obserwacjami, jest więc stacjonarny. Idea użycia równania (2.a) do badania stacjonarności wywodzi się z fatu, że jeśli ρ <, to szereg y t jest stacjonarny (ma zerową średnią i stałą wariancję). W przeciwnym wypadu, średnia procesu jest również stała, lecz wariancja rośnie wraz ze wzrostem t, czyli y t jest niestacjonarny. W pratyce, w celu uninięcia sutów niestacjonarności regresanta, testowanie parametru przy opóźnionej zmiennej odbywa się w oparciu o równanie: (2.b) y t =δy t- + t ; Odrzucenie hipotezy zerowej załadającej istnienie pierwiasta jednosowego: H 0 : δ=0, na rzecz alternatywnej załadającej stacjonarność procesu y t : H : δ<0, pozwala na stwierdzenie, że zmienna y t jest integrowana rzędu 0 - y t I(0) - czyli jest stacjonarna. Statystya służąca do weryfiacji hipotezy o istnieniu pierwiasta jednostowego ma postać: ^ δ DF = S( ^ δ ) Statystya DF przypomina sprawdzian testu t-studenta, lecz nie charateryzuje się podobnym rozładem, lecz jego wartości rytyczne są znacznie wyższe w porównaniu do rozładu t- Studenta 2. Jeśli obliczona statystya DF jest mniejsza od wartości rytycznej dla odpowiedniej liczby obserwacji (n), to odrzucamy hipotezę zerową (o pierwiastu jednostowym) na orzyść Oreślenie pierwiaste jednostowy odnosi się do jednostowego parametru ρ przy y t-. Stwierdzenie, że proces y t ma pierwiaste jednostowy, lub jest zintegrowany rzędu pierwszego jest równoważne. 2 Tablice wartości rytycznych znajdują się np. w pracy W. Charemza, D. Deadman [992], lub W. Enders [995]. Użycie ich nie zawsze jest onieczne, bowiem nowoczesne paiety do analizy szeregów czasowych (również GRETL) automatycznie podają wartości rytyczne, lub prawdopodobieństwa odrzucenia hipotezy zerowej. 2
hipotezy alternatywnej mówiącej o stacjonarności y 3 t. Jeśli obliczona statystya jest więsza od wartości rytycznej, nie ma podstaw do odrzucenia hipotezy zerowej. Następnym etapem analizy powinno być wtedy testowanie integracji pierwszego rzędu, tzn. jeśli y t I(), to y t I(0). Powtarzamy zatem test, używając y t zamiast y t, gdzie y t oznacza pierwsze różnice zmiennej y t. Test Diceya - Fullera częściej stosuje się do badania stopnia integracji dla zmiennej generowanej przez proces stochastyczny z dryfem (ang. drift), tzn. dla równania: (2.) y t =µ+δy t- + t gdzie µ jest stałą (wyrazem wolnym) reprezentującą dryf. Technia testowania jest analogiczna do wyżej zaprezentowanej Słabością powyższych testów jest fat, że nie biorą one pod uwagę możliwości występowania autoorelacji sładnia losowego. Jeśli autoorelacja taa występuje (czyli sładni losowy nie jest procesem białego szumu) to wtedy estymatory KMNK nie są efetywne. Prostym rozwiązaniem polecanym przez Diceya i Fullera jest użycie opóźnionej zmiennej objaśnianej jao dodatowej zmiennej objaśniającej w celu usunięcia autoorelacji. Test ten, zwany jest rozszerzonym testem Diceya-Fullera ADF (ang. Augmented Dicey- Fuller test) i bazuje na oszacowaniach równania: (2.2) y t =µ+δy t- + i= δ i y t-i + t, lub (2.2a) y t =δy t- + i= δ i y t-i + t Za pomocą testu Diceya - Fullera można również testować hipotezę o pierwiastu jednostowym przeciwo hipotezie o występowaniu trendu deterministycznego. Badanie taie przeprowadza się w oparciu o ogólny model postaci: (2.3) y t =α 0 +δα t+δy t-i + i= δ i y t- + t gdzie zespół hipotez ma postać: H 0 : δ= 0 (pierwiaste jednostowy); H : δ<0 (trend deterministyczny); 3 Wartości rytyczne rozładu DF są ujemne. Oznacza to, że jeśli weźmiemy pod uwagę wartości bezwzględne (rytyczne i sprawdzianu testu), hipotezę zerową odrzucamy dla wartości więszych od wartości rytycznych. 3
Przyłady zastosowania testów na stacjonarność zmiennych w programie GRETL Przyłady dotyczą sztucznie generowanych zmiennych w oparciu o następujące procesy: y t =y t- +e t y 2t =y 2t- +e 2t y 3t =y 3t- +e 3t y 4t =+y 4t- +e 4t y 5t =-+y 5t- +e 5t y 6t =y 6t- +t+e 6t y 7t =+y 7t- +t+e 7t y 8t =0.y 8t- +e 8t y 9t =0.5y 9t- +e 9t y 0t =0.9y 0t- +e 0t y t =0.y I- +t+e t y 2t =0.5y 2t- +t+e 2t y 3t =0.9y 3t- +t+e 3t Sposób generowania procesów y y 3 polegał na tym, że najpierw wygenerowano w Excelu 3 zmiennych losowych o długości 00 obserwacji ze standaryzowanego rozładu normalnego (Narzędzia Analiza Danych Generowanie Liczb Pseudolosowych). Następnie, przyjmując w ażdym z powyższych przypadów y 0 =0, obliczano olejne wartości y t dla =,...3, t=,...,00. W ten sposób wygenerowano zmienne, o tórych z góry wiadomo, że: e,...,e 3 to białoszumowe procesy losowe, zintegrowane rzędu 0, tzn. stacjonarne w średniej (trend deterministyczny) i wariancji (trend stochastyczny, integracja) y, y 2, y 3 to procesy random wal, tzn. integrowane rzędu, czyli z trendem stochastycznym y 4, y 5 to procesy random wal with drift, tzn.integrowane rzędu, czyli z trendem stochastycznym y 6, y 7 to procesy random wal with trend (ew. drift), czyli zintegrowane rzędu z dodatowym trendem liniowym, tzn. trend stochastyczny i deterministyczny y 8, y 9, y 0 procesy stacjonarne: bez trendu stochastycznego i deterministycznego y, y 2, y 3 procesy stacjonarne w wariancji (zintegrowane rzędu 0, czyli bez trendu stochastycznego), lecz niestacjonarne w średniej (z trendem deterministycznym). 4
Przyład badania stacjonarności za pomocą funcji autoorelacyjnej w programie GRETL Po wybraniu z menu ontestowego opcji Korelogram (lub Zmienna Korelogram) dla zmiennej e otrzymujemy następujące wynii: Tablica : Wynii działania funcji Korelogram zastosowanej do zmiennej e Ljung-Box Q' = 20.997 Stopnie swobody = 4, p-value = 0.037 ) 0.066 2) -0.2202 3) -0.62 4) 0.0097 5) -0.0096 6) -0.568 7) 0.05 8) 0.075 9) 0.0258 0) 0.0085 ) 0.56 2) -0.602 3) -0.45 4) -0.029 Funcja autoorelacji cząstowej (PACF): ) 0.066 2) -0.2256 3) -0.369 4) -0.0220 5) -0.0799 6) -0.930 7) 0.0477 8) -0.0266 9) -0.052 0) 0.0326 ) 0.772 2) -0.26 3) -0.0279 4) -0.250 Źródło: Obliczenia własne w programie GRETL Z tabeli wynia, że poszczególne wartości współczynniów autoorelacji są niewielie, pozwalające przypuszczać, że można je uznać za równe zero. Niestety statystya Q() por. wzór.2, tóra to weryfiuje, jest liczona w programie GRETL jedynie dla ostatniej orelacji rzędu =4 (a zatem możemy zweryfiować istotność tylo tej ostatniej autoorealcji). W tym wypadu statystya Q(4)=20,997 jest mniejsza od 5% wartości rytycznej rozładu χ2 z 4 stopniami swobody wynoszącej χ 2 0.05=23,6848 4. Nie ma zatem podstaw do odrzucenie hipotezy zerowej o brau autoorelacji rzędu 4 (o czym świadczy również wartość p-value). Ponieważ w podanym przyładzie nie występują przesłani do badania autoorelacji oreślonego rzędu (w przeciwieństwie do danych wartalnych lub miesięcznych, gdzie bada się autoorelację 4 lub 2 rzędu) obliczymy funcję autoorelacyjną rzędu. W tym celu po wybraniu opcji Korelogram należy wpisać wartość w onie Masymalne opóźnienie. Po wyonaniu tych czynności dostajemy wynii z tabeli 2. Tablica 2:Wynii działania funcji Korelogram zastosowanej do zmiennej e z opóźnieniem Ljung-Box Q' = 0.4408 Stopnie swobody =, p-value = 0.5067 ) 0.066 Funcja autoorelacji cząstowej (PACF): ) 0.066 Źródło: Obliczenia własne w programie GRETL Oczywiście wartości autoorelacji są identyczne, lecz w tym wypadu otrzymujemy statystyę Q() pozwalającą przetestować autoorelację rzędu. Ponieważ Q()=0,4408 jest mniejsza od 5% wartości rytycznej rozładu χ2 z stopniem swobody wynoszącej χ 2 0.05=3,84 zatem stwierdzamy, że autoorelację rzędu można uznać za równą zeru. Jest to zgodne z przewidywaniami, ponieważ wiadomo, że e jest procesem losowym. 4 Wartości rytyczne rozładu możemy uzysać w programie GRETL w menu Narzędzia Tablice Statystyczne 5
Przyład badania stacjonarności za pomocą testów Diceya-Fullera w programie GRETL- dla stacjonarnego procesu e bez trendu liniowego Testy Diceya Fullera weryfiują następujący zespół hipotez: H 0 : y t jest integrowane rzędu, tzn. w procesie występuje pierwiaste jednostowy (trend stochastyczny) H : y t jest integrowane rzędu 0, tzn. stacjonarne, bez trendu stochastycznego (lecz w dalszym ciągu z możliwością występowania trendu deterministycznego) W programie GRETL możliwe jest testowanie następujących specyfiacji modelu: (2.), (2.a), (2.2) oraz modyfiacji tych postaci z dołączonymi zmiennymi opóźnionymi w celu wyeliminowanie autororelacji załóceń, tzn. (2.2), (2.2a), (2.3). Aby zastosować test DF w programie GRETL należy z menu głównego wybrać: Zmienna Test ADF (lub z menu ontesowego Test Diceya-Fullera) a następnie zaznaczyć trzy pierwsze specyfiacje modelu, tzn.: - test bez wyrazu wolnego (2.2a) - test z wyrazem wolnym (2.2) - test z trendem liniowym (2.3) Rys. : Pole wyboru testu ADF Źródło: Program GRETL 6
Domyślnie GRETL wyświetla wartości statysty dla równań (2.2) (2.2a) i (2.3) przy =, lecz można to zmienić, co jest polecane w przypadu danych o oreślonej częstotliwości. Ponieważ w naszym przypadu nie zachodzi niebezpieczeństwo autoorelacji wybieramy =0, co powoduje oszacowanie prostszych wersji powyższych równań a mianowicie postaci (2.a), (2.) i (2.2). Zastosowanie postaci z trendem liniowym (2.2) lub (2.3) jest wsazane wówczas, gdy wiadomo, że badana zmienna wyazuje trend deterministyczny. Natomiast wybór postaci z wyrazem wolnym i bez nie wpływa zasadniczo na wynii testów. Wynii działania funcji ADF poazuje tabela 3: Tabela 3: Test DF dla zmiennej e dla równań (2.a), (2.), (2.2) - =0 Test Diceya-Fullera dla e liczebność próby 99 Hipoteza zerowa: występuje pierwiaste jednostowy a = ; proces I() test bez wyrazu wolnego (const) model: ( - L)y = (a-)*y(-) + e estymowana wartość (a-) wynosi: -0.93223 statystya testu: t = -9.9279 p-value 2.4e-034 test z wyrazem wolnym (const) model: ( - L)y = b0 + (a-)*y(-) + e estymowana wartość (a-) wynosi: -0.9338 statystya testu: t = -9.5754 p-value 5.48e-009 z wyrazem wolnym i trendem liniowym model: ( - L)y = b0 + b*t + (a-)*y(-) + e estymowana wartość (a-) wynosi: -0.9446 statystya testu: t = -9.2342 p-value.969e-0 Źródło: Obliczenia własne w programie GRETL Program GRETL nie podaje wartości rytycznych (tóre nie można również wygenerować w programie, lecz można znaleźć w podręczniach) lecz wartość p, tóra mówi o poziomie istotności dla tórego można odrzucić hipotezę zerową. Jeżeli zdecydujemy się wniosować na 5% poziomie istotności, to wartości p-value poniżej 0,05 będą świadczyć o stacjonarności zmiennej. W naszym przypadu, zgodnie z oczeiwaniami wartości p z wszystich trzech regresji (por. tablica 3) są znacznie niższe od 0,05, zatem stwierdzamy, że badany proces e jest stacjonarny 7
Przyład badania stacjonarności za pomocą testów Diceya-Fullera w programie GRETL- dla stacjonarnego procesu y z trendem liniowym W przypadu, gdy badana zmienna wyazuje liniowy trend deterministyczny, użycie testów (2.a), (2.) lub (2.2a) (2.2) wsaże na występowanie pierwiasta jednostowego, czyli integracji pierwszego stopnia. Podejmiemy zatem decyzję o niestacjonarności zmiennej, lecz błędnie rozpoznamy przyczynę tej niestacjonarności w postaci trendu stochastycznego, podczas gdy niestacjonarność jest wywołana przez trend deterministyczny. W tablicy 4 poazana jest właśnie taa sytuacja, gdy dla zmiennej y, o tórej wiadomo, że charateryzuje się jedynie trendem deterministycznym, z dwóch pierwszych regresji otrzymujemy bardzo wysoą wartość p, wsazującą na występowanie pierwiasta jednostowego. Tablica 4: Test DF dla zmiennej y bez pierwiasta jednostowego z trendem liniowym Test Diceya-Fullera dla y liczebność próby 99 Hipoteza zerowa: występuje pierwiaste jednostowy a = ; proces I() test bez wyrazu wolnego (const) model: ( - L)y = (a-)*y(-) + e estymowana wartość (a-) wynosi: 0.0555 statystya testu: t = 6.28497 p-value test z wyrazem wolnym (const) model: ( - L)y = b0 + (a-)*y(-) + e estymowana wartość (a-) wynosi: -0.00389 statystya testu: t = -0.254894 p-value 0.9265 z wyrazem wolnym i trendem liniowym model: ( - L)y = b0 + b*t + (a-)*y(-) + e estymowana wartość (a-) wynosi: -0.83894 statystya testu: t = -8.35324 p-value 6.06e-00 Źródło: Obliczenia własne w programie GRETL Jeśli natomiast użyjemy do badania regresji trzeciej, uwzględniającej liniowy trend deterministyczny, to podejmiemy właściwą decyzję o brau integracji (pierwiasta jednostowego). Wartość p dla tej regresji wynosi p-value=0,000000000606 i jest znacznie niższa od poziomu istotności rzędu 0,05, co pozwala odrzucić hipotezę o pierwiastu jednostowym. 8
NOTATNIK Uwagi ogólne do programu GRETL:. Zarówno zmienne, ja i foldery nie powinny zawierać polsich znaów oraz nazw dłuższych niż 8 znaów 2. Aby były dostępne funcje do analizy szeregów czasowych należy oreślić właściwą struturę danych: Próba Strutura danych Szeregi czasowe 9