Ekonometria Wykład 5. Procesy stochastyczne, stacjonarność, integracja. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Podobne dokumenty
Stacjonarność Integracja. Integracja. Integracja

Ekonometria. Modelowanie szeregów czasowych. Stacjonarność. Testy pierwiastka jednostkowego. Modele ARDL. Kointegracja. Jakub Mućk

Ekonometria. Modelowanie szeregów czasowych. Stacjonarność. Testy pierwiastka jednostkowego. Modele ARDL. Kointegracja. Jakub Mućk

3. Analiza własności szeregu czasowego i wybór typu modelu

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

1 Modele ADL - interpretacja współczynników

Przyczynowość Kointegracja. Kointegracja. Kointegracja

0.1 Modele Dynamiczne

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

0.1 Modele Dynamiczne

Przykład 2. Stopa bezrobocia

Ekonometria. Zajęcia

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Stanisław Cihcocki. Natalia Nehrebecka

4. Średnia i autoregresja zmiennej prognozowanej

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Prognozowanie i Symulacje. Wykład VI. Niestacjonarne szeregi czasowe

WYKŁAD: Szeregi czasowe I. Zaawansowane Metody Uczenia Maszynowego

2.6 Zmienne stacjonarne i niestacjonarne 2.6. ZMIENNE STACJONARNE I NIESTACJONARNE 33. RYSUNEK 2.6: PKB w wyrażeniu realnym

Niestacjonarne zmienne czasowe własności i testowanie

5. Model sezonowości i autoregresji zmiennej prognozowanej

Ekonometria Wykład 6 - Kointegracja, rozkłady opóźnień. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Kolokwium ze statystyki matematycznej

Testy pierwiastka jednostkowego

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Modele warunkowej heteroscedastyczności

Zadanie 1 1. Czy wykresy zmiennych sugerują, że zmienne są stacjonarne. Czy występuje sezonowość?

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka Matematyczna Anna Janicka

Stanisław Cichocki Natalia Neherbecka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4.

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Analiza szeregów czasowych bezrobocia i inflacji w Danii

Statystyka matematyczna dla leśników

Badanie stacjonarności szeregów czasowych w programie GRETL

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

MODELE AUTOREGRESYJNE W PROGNOZOWANIU CEN ZBÓŻ W POLSCE

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Testowanie hipotez statystycznych.

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Rachunek Prawdopodobieństwa Anna Janicka

ZASTOSOWANIE DYNAMICZNEGO MODELU ZGODNEGO W ANALIZIE GOSPODARKI GÓRNEGO ŚLĄSKA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Ekonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Testowanie hipotez statystycznych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Ekonometria Ćwiczenia 19/01/05

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Własności statystyczne regresji liniowej. Wykład 4

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej

Plan wykładu: 1) Pojęcie stacjonarności i niestacjonarności zmiennych 2) Testowanie integracji 3) Pojęcie kointegracji metoda Engle a-grangera.

Hipotezy statystyczne

Egzamin z ekonometrii wersja IiE, MSEMAT

Sprawy organizacyjne

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Weryfikacja hipotez statystycznych

Analiza autokorelacji

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Stanisław Cichocki. Natalia Nehrebecka

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna i ekonometria

Statystyka Matematyczna Anna Janicka

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza szeregów czasowych: 6. Liniowe modele niestacjonarne

Estymacja parametrów w modelu normalnym

166 Wstęp do statystyki matematycznej

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Hipotezy statystyczne

Testowanie hipotez statystycznych

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Transkrypt:

Ekonometria Wykład 5. Procesy stochastyczne, stacjonarność, integracja Dr Michał Gradzewicz Katedra Ekonomii I KAE

Ekonometria szeregów czasowych Procesy stochastyczne Stacjonarność i biały szum Niestacjonarność: Plan wykładu Trendostacjonarność Przyrostostacjonarność (błądzenie losowe) Integracja i jej stopień Testowanie stopnia integracji (testy pierwiastka jednostkowego) Przykłady procesów stacjonarnych procesy autoregresyjne AR Funkcja ACF Impulse-Response Function (IRF) Persystencja i Half-life

Procesy stochastyczne i stacjonarność Ekonometria szeregów czasowych Definicja: Proces stochastyczny Y t to zbiór zmiennych losowych Y t uporządkowany zgodnie z indeksem czasowym t = 1,2,, T Szereg czasowy y t to realizacja procesu stochastycznego Y t w konkretnej próbie Stacjonarność jest jedną z własności procesu stochastycznego (nie jest to własność wszystkich procesów stochastycznych) Definicja: proces (słabo) stacjonarny spełnia następujące warunki: 1. E Y t = const (niezależna od t) 2. D 2 Y t = σ 2 < (niezależna od t) 3. Cov Y t, Y t+k = λ k (zależna wyłącznie od odległości w czasie k, a nie od momentu pomiaru t) Dodatkowo Jeśli proces stochastyczny spełnia warunki słabej stacjonarności, oraz dodatkowo λ k = 0 dla k 0 (czyli Cov Y t, Y t+k = 0), to nazywamy go białym szumem (white noise), przykładem jest dobrze zachowujący się składnik losowy w modelu ekonometrycznym

Przykład stacjonarnego i niestacjonarnego szeregu czasowego Szereg czasowy stacjonarny Szereg czasowy niestacjonarny

Procesy niestacjonarne - trendostacjonarność Istnieją różne formy niestacjonarności Większość makroekonomicznych szeregów czasowych jest niestacjonarnych (mają różnego rodzaju trendy) Ważne klasy procesów niestacjonarnych błądzenie losowe (o którym za chwilę) proces trendostacjonarny Szereg trendostacjonarny to losowe wahania wokół trendu deterministycznego Y t = α + βt + ε t Jak doprowadzić ten proces stochastyczny do stacjonarności? Odjąć trend deterministyczny Y t α βt = ε t

Procesy niestacjonarne błądzenie losowe Błądzenie losowe (random walk, por. wykres z wcześniejszego slajdu) jest to proces niestacjonarny, który opisywany jest równaniem: Y t = Y t 1 + ε t Gdzie ε t jest białym szumem o średniej E ε t = 0 oraz wariancji D 2 ε t = σ 2 Y t = Y t 1 + ε t = Y t 2 + ε t 1 + ε t = Y t 3 + ε t 2 + ε t 1 + ε t = ε τ + Y 0 Jest to zatem szereg o doskonałej pamięci (dzisiejszy Y t nie zapomina żadnej realizacji ε t i ) Własności (załóżmy, że Y 0 = σ0 τ= ε τ = 0): E Y t = E σt τ=1 ε τ = σt τ=1 E(ε τ ) = σt τ=1 0 = 0 D 2 Y t = E Y t E Y t 2 = E Y t 2 = E σ τ=1 t ε 2 τ = σt τ=1 t τ=1 E ε 2 τ = σt τ=1 σ 2 = tσ 2 Zatem błądzenie losowe ma zerową wartość oczekiwaną, ale wariancję, która rośnie w czasie jest procesem niestacjonarnym Na rysunku przedstawiono kroczące wariancje: procesu białego szumu (WN) procesu błądzenia losowego (RW)

Stacjonarny proces stochastyczny

Proces niestacjonarny zmienna w czasie (rosnąca) wartość oczekiwana

Proces niestacjonarny zmienna w czasie (rosnąca) wariancja

Integracja i przyrostostacjonarność Jeśli proces generujący nasze dane jest typu błądzenia losowego, to również łatwo możemy przekształcić go do procesu stacjonarnego Y t = Y t 1 + ε t ΔY t = Y t Y t 1 = ε t Taki szereg Y t nazywamy szeregiem zintegrowanym stopnia 1, czyli Y t I(1) Inn nazwa szereg I 1 jest przyrostostacjonarny (jego przyrosty są stacjonarne) Trend, któremu podlegają tego typu szeregi nazywamy trendem stochastycznym (w odróżnieniu od trendu deterministycznego, o którym była mowa wcześniej) W tym zapisie, szereg stacjonarny oznaczamy jako zintegrowany w stopniu 0, czyli Y t I(0) Większość makroekonomicznych szeregów czasowych jest typu I(1), przykładowo: poziom realny PKB, konsumpcji, inwestycji, poziom cen, podaży pieniądza Niektóre szeregi czasowe są raczej typu I(0), np. inflacja, bezrobocie, stopa procentowa. Testy statystyczne (o których za chwilę) dla tych zmiennych czasami to wskazują (ale czasami nie!) Niektóre szeregi czasowe uzyskują stacjonarność dopiero po dwukrotnym zróżnicowaniu (policzeniu przyrostów drugiego stopnia) nazywamy je I(2) Δ 2 y t = Δ Δy t = Δy t Δy t 1 = y t y t 1 y t 1 y t 2 = y t 2y t 1 + y t 2 Ogólnie: szereg zintegrowany stopnia d: y t I d oznacza, że Δ d y t I(0) Zintegrowanie w stopniu 2 zdarza się w danych, choć raczej rzadko (jako analogon z fizyki procesy tego typu mają w miarę stałe przyspieszenie, co nie jest częste w ekonomii). Czasami nominalny pieniądz czy poziom cen w warunkach hiperinflacji ma charakter procesu ze stałym przyspieszeniem (zintegrowanym stopnia 2)

Funkcja autokorelacji ACF Funkcja autokorelacji ACF (Autocorrelation function): ρ k = cov y t,y t+k σ2 y wariancją procesu y t., gdzie σ y 2 jest Estymatorem ρ k jest: ρ k = σ t=1 T k (y t തy)(y t+k തy) σt, mający w przybliżeniu rozkład normalny o t=1 y t തy 2 odchyleniu standardowym 1 T Dla białego szumu powinna być ona nierozróżnialna od 0 (w sensie statystycznym) Dla błądzenia losowego powinna być ona równa zawsze 1 lub wygasać bardzo, bardzo powoli Dla stabilnego procesu autoregresyjnego powinna ona wygasać wraz z rosnącym k (ρ k = φ k )

Testowanie stacjonarności Test Dickeya-Fullera (DF) Test DF jest jednym z grupy testów stopnia integracji, nazywanych też testami pierwiastka jednostkowego (unit root test) Opiera się on na testowaniu współczynnika α w procesie AR(1): y t = αy t 1 + ε t Jeśli α < 1 to proces y t jest stacjonarny, jeśli α = 1 to proces y t jest niestacjonarny Ale jeśli H 0 jest prawdziwa, to estymator α jest obciążony, a statystyka t dla testu istotności nie ma rozkładu t-studenta Przekształcając równanie autoregresyjne: y t y t 1 = αy t 1 y t 1 + ε t Δy t = α 1 y t 1 + ε t Otrzymujemy poprawną reprezentację testową: Zestaw hipotez testu DF: Δy t = δy t 1 + ε t, gdzie δ = α 1 H 0 : δ = 0, czyli α = 1, a zatem y t I(1) jest niestacjonarny H 1 : δ < 0, czyli α < 1, a zatem y t I 0 jest stacjonarny Ponieważ przy założeniu prawdziwości H 0 zmienna objaśniająca jest niestacjonarna, zatem statystyka t nie ma rozkładu t-studenta, ale DF = መ δ S δ DF(T) Czyli ma rozkład Dickeya-Fullera, którego wartości krytyczne zostały wyznaczone metodami symulacyjnymi Jeśli DF < DF (T) to odrzucamy H 0 i konkludujemy, że badany proces jest stacjonarny y t I(0)

Test Dickeya-Fullera kolejne etapy Jeśli odrzuciliśmy H 0 kończymy procedurę testową, przyjmując, że szereg czasowy y t generowany jest przez proces stacjonarny Jeśli nie ma podstaw do odrzucenia H 0 kontynuujemy procedurę testową, wyznaczając stopień integracji szeregu czasowego (wiedząc, że na pewno jest on niestacjonarny): 2 etap: Budujemy analogiczne równanie regresji dla 2-gich przyrostów: Δ 2 y t = δδy t 1 + ε t H 0 : δ = 0 y t I 2 lub Δy t I 1 vs. H 1 : δ < 0 [y t I 1 lub Δy t I 0 ] Wyznaczamy ponownie statystykę DF = δ S δ i przyrównujemy do wartości krytycznej Jeśli odrzucamy H 0 to kończymy procedurę testową, przyjmując, że y t I(1) Jeśli nie ma podstaw do odrzucenia H 0, to przechodzimy do ostatecznej fazy testu 3 etap Budujemy analogiczne równanie regresji dla 3-cich przyrostów: Δ 3 y t = δδ 2 y t 1 + ε t Wyznaczamy ponownie statystykę DF = δ S δ i przyrównujemy do wartości krytycznej Jeśli odrzucamy H 0 to kończymy procedurę testową, przyjmując, że y t I(2) Jeśli nie ma podstaw do odrzucenia H 0, to najprawdopodobniej test DF ma za słabą moc by choć raz odrzucić H 0 i należy zastosować alternatywne testy pierwiastka jednostkowego Większość szeregów czasowych spotykanych w danych ekonomicznych jest albo I(0) albo I 1, procesy zintegrowane w stopniu wyższym są bardzo rzadko spotykane

ADF Augmented Dickey-Fuller test Rozszerzenia testu DF Wartości krytyczne testu DF symulowane są przy założeniu sferycznego składnika losowego (szczególnie przy braku autokorelacji) Aby wyczyścić składnik losowy równania testowewgo z autokorelacji często dodaje się opóźnienia zmiennej objasnianej (np. opóźnienia Δy t w pierwszej fazie testu) Równanie testowe ma postać: Δy t = δy t 1 + γ 1 Δy t 1 + γ 2 Δy t 2 + + γ k Δy t k + ε t A sam test nosi nazwę rozszerzonego testu Dickeya-Fullera (ADF) statystyka testowa jest identyczna jak w DF, podobnie jak wartości krytyczne testu Trendostacjonarność vs. przyrostostacjonarność Jeśli uzupełnimy równanie testowe dodatkowo o trend, to w zasadzie testujemy charkter trendu stochastyczny czy deterministyczny Δy t = α + βt + δy t 1 + γ k Δy t k + ε t Jeśli odrzucimy H 0 w tym teście, a parametr przy trendzie jest istotny, to w przypadku tej specyfikcji oznacza to, że szereg jest trendostacjonarny Jeśli przyjmujemy H 0, to oznacza to przyrostostacjonarność k

Testowanie ADF w praktyce I etap II etap

Przykład procesu stacjonarnego proces autoregresyjny AR(1) Proces AR(1) y t = c + φy t 1 + ε t Dla φ < 1 jest to proces stacjonarny Można go przedstawić jako: y t = c + φ c + φy t 2 + ε t 1 + ε t = c + φc + φ 2 c + φy t 3 + ε t 2 + φε t 1 + ε t Czyli: y t = φ i c + φ i ε t i = c 1 φ + φ i ε t i i=0 i=0 i=0 Wtedy: y t = φ i ε t i Możemy zdefiniować funkcję odpowiedzi na impuls (Impulse-Response Function) IRF i = y t ε t i, czasami jej elementy nazywane są mnożnikami modelu Dla stacjonarnego procesu AR(1), dla którego φ (0; 1) funkcja IRF maleje wykładniczo (dla φ ( 1; 0) maleje ona oscylacyjnie) Takie procesy czasami określane są procesami o którkiej (malejącej) pamięci wpływ przeszłych zaburzeń na bieżące wartości y t maleje wraz z rosnącą odległością w czasie

Procesy AR(p) wyższego rzędu Proces AR(p) ma postać: y t = c + φ 1 y t 1 + φ 2 y t 2 + + φ p y t p + ε t Procesy takie są stacjonarne, jeśli σ i φ i < 1 Mają one bardziej skomplikowaną strukturę powiązań czasowych, przykładowo proces: y t = c + 1.4y t 1 0.6y t 2 + ε t generuje funkcję IRF, która ma garba (hump-shaped IRF) tak często wyglądają wyniki symulacji odpowiedzi na impuls w przypadku danych makroekonomicznych

Funkcje ACF i PACF dla modeli autoregresyjnych Funkcje autokorelacji dla stabilnych modeli autoregresyjnych ma charakter malejący, a funkcja PACF (Partial Autocorrelation Function) przyjmuje niezerowe wartości wtedy, kiedy dane opóźnienie jest istotne statystycznie, czyli wyznacza rząd p dla procesu AR(p) Poniżej empiryczne ACF i PACF dla szeregów czasowych procesów y t = 0.75y t 1 + ε t (lewa część) oraz dla y t = 1.4y t 1 0.6y t 2 + ε t

Half-life Często stosowaną w praktyce miarą trwałości (persistence) jest tzw. half-life, czasami nazywany czasem połówkowym, czyli czasem potrzebnym na to, aby jednostkowy szok wytracił połowę swojego impetu Jak wyznaczyć go dla procesu AR(1)? Załóżmy, że y t = αy t 1 + ε t, i zaczynamy y 1 = 0. Rozważmy co się dzieje z y w kolejnych okresach, jeśli wystąpi jednostkowy szok w t = 0, czyli ε 0 = 1, a w kolejnych okresach nie ma dalszych zaburzeń, czyli ε t = 0 dla t 1. Zatem: y 0 = α 0 + 1 = 1, y 1 = α 1 + 0 = α, y 2 = α α + 0 = α 2,, y t = α t Zatem half-life HL jest rozwiązaniem α t = 1 2 ln α t = ln 1 2 t ln α = ln 0.5 ln 0.5 t = ln α Przykładowo, dla α = 0.8, HL = 3,1 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 IRF (alpha=0.8) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

A jak wygląda funkcja IRF dla procesu typu Random Walk? W przypadku procesu z długa pamięcią niestacjonarnych typu Random Walk, funkcja odpowiedzi na impuls wygląda zupełnie inaczej po wystąpieniu losowego zaburzenia proces stochastyczny typu RW nie wraca do poziomu początkowego (jak proces stacjonarny), ale przechodzi do nowego położenia W przypadku RW nie występuje naturalna tendencja powrotu do średniej, co w zasadzie jest przyczyną niestacjonarności To, że proces RW ma średnią 0 jest jedynie konsekwencją założenia, że E ε t = 0, czyli średnio zaburzenia dodatnie i ujemne znoszą się, ale ich wpływ jest trwały 1,2 1 0,8 0,6 0,4 0,2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 IRF - RW