Ekonometria Wykład 5. Procesy stochastyczne, stacjonarność, integracja Dr Michał Gradzewicz Katedra Ekonomii I KAE
Ekonometria szeregów czasowych Procesy stochastyczne Stacjonarność i biały szum Niestacjonarność: Plan wykładu Trendostacjonarność Przyrostostacjonarność (błądzenie losowe) Integracja i jej stopień Testowanie stopnia integracji (testy pierwiastka jednostkowego) Przykłady procesów stacjonarnych procesy autoregresyjne AR Funkcja ACF Impulse-Response Function (IRF) Persystencja i Half-life
Procesy stochastyczne i stacjonarność Ekonometria szeregów czasowych Definicja: Proces stochastyczny Y t to zbiór zmiennych losowych Y t uporządkowany zgodnie z indeksem czasowym t = 1,2,, T Szereg czasowy y t to realizacja procesu stochastycznego Y t w konkretnej próbie Stacjonarność jest jedną z własności procesu stochastycznego (nie jest to własność wszystkich procesów stochastycznych) Definicja: proces (słabo) stacjonarny spełnia następujące warunki: 1. E Y t = const (niezależna od t) 2. D 2 Y t = σ 2 < (niezależna od t) 3. Cov Y t, Y t+k = λ k (zależna wyłącznie od odległości w czasie k, a nie od momentu pomiaru t) Dodatkowo Jeśli proces stochastyczny spełnia warunki słabej stacjonarności, oraz dodatkowo λ k = 0 dla k 0 (czyli Cov Y t, Y t+k = 0), to nazywamy go białym szumem (white noise), przykładem jest dobrze zachowujący się składnik losowy w modelu ekonometrycznym
Przykład stacjonarnego i niestacjonarnego szeregu czasowego Szereg czasowy stacjonarny Szereg czasowy niestacjonarny
Procesy niestacjonarne - trendostacjonarność Istnieją różne formy niestacjonarności Większość makroekonomicznych szeregów czasowych jest niestacjonarnych (mają różnego rodzaju trendy) Ważne klasy procesów niestacjonarnych błądzenie losowe (o którym za chwilę) proces trendostacjonarny Szereg trendostacjonarny to losowe wahania wokół trendu deterministycznego Y t = α + βt + ε t Jak doprowadzić ten proces stochastyczny do stacjonarności? Odjąć trend deterministyczny Y t α βt = ε t
Procesy niestacjonarne błądzenie losowe Błądzenie losowe (random walk, por. wykres z wcześniejszego slajdu) jest to proces niestacjonarny, który opisywany jest równaniem: Y t = Y t 1 + ε t Gdzie ε t jest białym szumem o średniej E ε t = 0 oraz wariancji D 2 ε t = σ 2 Y t = Y t 1 + ε t = Y t 2 + ε t 1 + ε t = Y t 3 + ε t 2 + ε t 1 + ε t = ε τ + Y 0 Jest to zatem szereg o doskonałej pamięci (dzisiejszy Y t nie zapomina żadnej realizacji ε t i ) Własności (załóżmy, że Y 0 = σ0 τ= ε τ = 0): E Y t = E σt τ=1 ε τ = σt τ=1 E(ε τ ) = σt τ=1 0 = 0 D 2 Y t = E Y t E Y t 2 = E Y t 2 = E σ τ=1 t ε 2 τ = σt τ=1 t τ=1 E ε 2 τ = σt τ=1 σ 2 = tσ 2 Zatem błądzenie losowe ma zerową wartość oczekiwaną, ale wariancję, która rośnie w czasie jest procesem niestacjonarnym Na rysunku przedstawiono kroczące wariancje: procesu białego szumu (WN) procesu błądzenia losowego (RW)
Stacjonarny proces stochastyczny
Proces niestacjonarny zmienna w czasie (rosnąca) wartość oczekiwana
Proces niestacjonarny zmienna w czasie (rosnąca) wariancja
Integracja i przyrostostacjonarność Jeśli proces generujący nasze dane jest typu błądzenia losowego, to również łatwo możemy przekształcić go do procesu stacjonarnego Y t = Y t 1 + ε t ΔY t = Y t Y t 1 = ε t Taki szereg Y t nazywamy szeregiem zintegrowanym stopnia 1, czyli Y t I(1) Inn nazwa szereg I 1 jest przyrostostacjonarny (jego przyrosty są stacjonarne) Trend, któremu podlegają tego typu szeregi nazywamy trendem stochastycznym (w odróżnieniu od trendu deterministycznego, o którym była mowa wcześniej) W tym zapisie, szereg stacjonarny oznaczamy jako zintegrowany w stopniu 0, czyli Y t I(0) Większość makroekonomicznych szeregów czasowych jest typu I(1), przykładowo: poziom realny PKB, konsumpcji, inwestycji, poziom cen, podaży pieniądza Niektóre szeregi czasowe są raczej typu I(0), np. inflacja, bezrobocie, stopa procentowa. Testy statystyczne (o których za chwilę) dla tych zmiennych czasami to wskazują (ale czasami nie!) Niektóre szeregi czasowe uzyskują stacjonarność dopiero po dwukrotnym zróżnicowaniu (policzeniu przyrostów drugiego stopnia) nazywamy je I(2) Δ 2 y t = Δ Δy t = Δy t Δy t 1 = y t y t 1 y t 1 y t 2 = y t 2y t 1 + y t 2 Ogólnie: szereg zintegrowany stopnia d: y t I d oznacza, że Δ d y t I(0) Zintegrowanie w stopniu 2 zdarza się w danych, choć raczej rzadko (jako analogon z fizyki procesy tego typu mają w miarę stałe przyspieszenie, co nie jest częste w ekonomii). Czasami nominalny pieniądz czy poziom cen w warunkach hiperinflacji ma charakter procesu ze stałym przyspieszeniem (zintegrowanym stopnia 2)
Funkcja autokorelacji ACF Funkcja autokorelacji ACF (Autocorrelation function): ρ k = cov y t,y t+k σ2 y wariancją procesu y t., gdzie σ y 2 jest Estymatorem ρ k jest: ρ k = σ t=1 T k (y t തy)(y t+k തy) σt, mający w przybliżeniu rozkład normalny o t=1 y t തy 2 odchyleniu standardowym 1 T Dla białego szumu powinna być ona nierozróżnialna od 0 (w sensie statystycznym) Dla błądzenia losowego powinna być ona równa zawsze 1 lub wygasać bardzo, bardzo powoli Dla stabilnego procesu autoregresyjnego powinna ona wygasać wraz z rosnącym k (ρ k = φ k )
Testowanie stacjonarności Test Dickeya-Fullera (DF) Test DF jest jednym z grupy testów stopnia integracji, nazywanych też testami pierwiastka jednostkowego (unit root test) Opiera się on na testowaniu współczynnika α w procesie AR(1): y t = αy t 1 + ε t Jeśli α < 1 to proces y t jest stacjonarny, jeśli α = 1 to proces y t jest niestacjonarny Ale jeśli H 0 jest prawdziwa, to estymator α jest obciążony, a statystyka t dla testu istotności nie ma rozkładu t-studenta Przekształcając równanie autoregresyjne: y t y t 1 = αy t 1 y t 1 + ε t Δy t = α 1 y t 1 + ε t Otrzymujemy poprawną reprezentację testową: Zestaw hipotez testu DF: Δy t = δy t 1 + ε t, gdzie δ = α 1 H 0 : δ = 0, czyli α = 1, a zatem y t I(1) jest niestacjonarny H 1 : δ < 0, czyli α < 1, a zatem y t I 0 jest stacjonarny Ponieważ przy założeniu prawdziwości H 0 zmienna objaśniająca jest niestacjonarna, zatem statystyka t nie ma rozkładu t-studenta, ale DF = መ δ S δ DF(T) Czyli ma rozkład Dickeya-Fullera, którego wartości krytyczne zostały wyznaczone metodami symulacyjnymi Jeśli DF < DF (T) to odrzucamy H 0 i konkludujemy, że badany proces jest stacjonarny y t I(0)
Test Dickeya-Fullera kolejne etapy Jeśli odrzuciliśmy H 0 kończymy procedurę testową, przyjmując, że szereg czasowy y t generowany jest przez proces stacjonarny Jeśli nie ma podstaw do odrzucenia H 0 kontynuujemy procedurę testową, wyznaczając stopień integracji szeregu czasowego (wiedząc, że na pewno jest on niestacjonarny): 2 etap: Budujemy analogiczne równanie regresji dla 2-gich przyrostów: Δ 2 y t = δδy t 1 + ε t H 0 : δ = 0 y t I 2 lub Δy t I 1 vs. H 1 : δ < 0 [y t I 1 lub Δy t I 0 ] Wyznaczamy ponownie statystykę DF = δ S δ i przyrównujemy do wartości krytycznej Jeśli odrzucamy H 0 to kończymy procedurę testową, przyjmując, że y t I(1) Jeśli nie ma podstaw do odrzucenia H 0, to przechodzimy do ostatecznej fazy testu 3 etap Budujemy analogiczne równanie regresji dla 3-cich przyrostów: Δ 3 y t = δδ 2 y t 1 + ε t Wyznaczamy ponownie statystykę DF = δ S δ i przyrównujemy do wartości krytycznej Jeśli odrzucamy H 0 to kończymy procedurę testową, przyjmując, że y t I(2) Jeśli nie ma podstaw do odrzucenia H 0, to najprawdopodobniej test DF ma za słabą moc by choć raz odrzucić H 0 i należy zastosować alternatywne testy pierwiastka jednostkowego Większość szeregów czasowych spotykanych w danych ekonomicznych jest albo I(0) albo I 1, procesy zintegrowane w stopniu wyższym są bardzo rzadko spotykane
ADF Augmented Dickey-Fuller test Rozszerzenia testu DF Wartości krytyczne testu DF symulowane są przy założeniu sferycznego składnika losowego (szczególnie przy braku autokorelacji) Aby wyczyścić składnik losowy równania testowewgo z autokorelacji często dodaje się opóźnienia zmiennej objasnianej (np. opóźnienia Δy t w pierwszej fazie testu) Równanie testowe ma postać: Δy t = δy t 1 + γ 1 Δy t 1 + γ 2 Δy t 2 + + γ k Δy t k + ε t A sam test nosi nazwę rozszerzonego testu Dickeya-Fullera (ADF) statystyka testowa jest identyczna jak w DF, podobnie jak wartości krytyczne testu Trendostacjonarność vs. przyrostostacjonarność Jeśli uzupełnimy równanie testowe dodatkowo o trend, to w zasadzie testujemy charkter trendu stochastyczny czy deterministyczny Δy t = α + βt + δy t 1 + γ k Δy t k + ε t Jeśli odrzucimy H 0 w tym teście, a parametr przy trendzie jest istotny, to w przypadku tej specyfikcji oznacza to, że szereg jest trendostacjonarny Jeśli przyjmujemy H 0, to oznacza to przyrostostacjonarność k
Testowanie ADF w praktyce I etap II etap
Przykład procesu stacjonarnego proces autoregresyjny AR(1) Proces AR(1) y t = c + φy t 1 + ε t Dla φ < 1 jest to proces stacjonarny Można go przedstawić jako: y t = c + φ c + φy t 2 + ε t 1 + ε t = c + φc + φ 2 c + φy t 3 + ε t 2 + φε t 1 + ε t Czyli: y t = φ i c + φ i ε t i = c 1 φ + φ i ε t i i=0 i=0 i=0 Wtedy: y t = φ i ε t i Możemy zdefiniować funkcję odpowiedzi na impuls (Impulse-Response Function) IRF i = y t ε t i, czasami jej elementy nazywane są mnożnikami modelu Dla stacjonarnego procesu AR(1), dla którego φ (0; 1) funkcja IRF maleje wykładniczo (dla φ ( 1; 0) maleje ona oscylacyjnie) Takie procesy czasami określane są procesami o którkiej (malejącej) pamięci wpływ przeszłych zaburzeń na bieżące wartości y t maleje wraz z rosnącą odległością w czasie
Procesy AR(p) wyższego rzędu Proces AR(p) ma postać: y t = c + φ 1 y t 1 + φ 2 y t 2 + + φ p y t p + ε t Procesy takie są stacjonarne, jeśli σ i φ i < 1 Mają one bardziej skomplikowaną strukturę powiązań czasowych, przykładowo proces: y t = c + 1.4y t 1 0.6y t 2 + ε t generuje funkcję IRF, która ma garba (hump-shaped IRF) tak często wyglądają wyniki symulacji odpowiedzi na impuls w przypadku danych makroekonomicznych
Funkcje ACF i PACF dla modeli autoregresyjnych Funkcje autokorelacji dla stabilnych modeli autoregresyjnych ma charakter malejący, a funkcja PACF (Partial Autocorrelation Function) przyjmuje niezerowe wartości wtedy, kiedy dane opóźnienie jest istotne statystycznie, czyli wyznacza rząd p dla procesu AR(p) Poniżej empiryczne ACF i PACF dla szeregów czasowych procesów y t = 0.75y t 1 + ε t (lewa część) oraz dla y t = 1.4y t 1 0.6y t 2 + ε t
Half-life Często stosowaną w praktyce miarą trwałości (persistence) jest tzw. half-life, czasami nazywany czasem połówkowym, czyli czasem potrzebnym na to, aby jednostkowy szok wytracił połowę swojego impetu Jak wyznaczyć go dla procesu AR(1)? Załóżmy, że y t = αy t 1 + ε t, i zaczynamy y 1 = 0. Rozważmy co się dzieje z y w kolejnych okresach, jeśli wystąpi jednostkowy szok w t = 0, czyli ε 0 = 1, a w kolejnych okresach nie ma dalszych zaburzeń, czyli ε t = 0 dla t 1. Zatem: y 0 = α 0 + 1 = 1, y 1 = α 1 + 0 = α, y 2 = α α + 0 = α 2,, y t = α t Zatem half-life HL jest rozwiązaniem α t = 1 2 ln α t = ln 1 2 t ln α = ln 0.5 ln 0.5 t = ln α Przykładowo, dla α = 0.8, HL = 3,1 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 IRF (alpha=0.8) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
A jak wygląda funkcja IRF dla procesu typu Random Walk? W przypadku procesu z długa pamięcią niestacjonarnych typu Random Walk, funkcja odpowiedzi na impuls wygląda zupełnie inaczej po wystąpieniu losowego zaburzenia proces stochastyczny typu RW nie wraca do poziomu początkowego (jak proces stacjonarny), ale przechodzi do nowego położenia W przypadku RW nie występuje naturalna tendencja powrotu do średniej, co w zasadzie jest przyczyną niestacjonarności To, że proces RW ma średnią 0 jest jedynie konsekwencją założenia, że E ε t = 0, czyli średnio zaburzenia dodatnie i ujemne znoszą się, ale ich wpływ jest trwały 1,2 1 0,8 0,6 0,4 0,2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 IRF - RW