Modele dynamiczne. Rozdział 2

Podobne dokumenty
Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki Natalia Neherbecka

Stanisław Cihcocki. Natalia Nehrebecka

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

1 Modele ADL - interpretacja współczynników

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Natalia Neherbecka. 11 czerwca 2010

Ćwiczenia IV

166 Wstęp do statystyki matematycznej

Ekonometria Ćwiczenia 19/01/05

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

2.6 Zmienne stacjonarne i niestacjonarne 2.6. ZMIENNE STACJONARNE I NIESTACJONARNE 33. RYSUNEK 2.6: PKB w wyrażeniu realnym

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Wprowadzenie do analizy korelacji i regresji

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Ekonometria Wykład 5. Procesy stochastyczne, stacjonarność, integracja. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

7.4 Automatyczne stawianie prognoz

Ekonometria. Zajęcia

3. Modele tendencji czasowej w prognozowaniu

Stacjonarność Integracja. Integracja. Integracja

3. Analiza własności szeregu czasowego i wybór typu modelu

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Etapy modelowania ekonometrycznego

Zadanie 1 1. Czy wykresy zmiennych sugerują, że zmienne są stacjonarne. Czy występuje sezonowość?

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Testowanie hipotez statystycznych

4. Średnia i autoregresja zmiennej prognozowanej

Przykład 2. Stopa bezrobocia

Stosowana Analiza Regresji

5. Model sezonowości i autoregresji zmiennej prognozowanej

Egzamin z ekonometrii wersja IiE, MSEMAT

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Testowanie hipotez statystycznych

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Zawansowane modele wyborów dyskretnych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Uogólniona Metoda Momentów

Prawdopodobieństwo i statystyka r.

WYKŁAD: Szeregi czasowe I. Zaawansowane Metody Uczenia Maszynowego

Weryfikacja hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Modelowanie szeregów czasowych. Stacjonarność. Testy pierwiastka jednostkowego. Modele ARDL. Kointegracja. Jakub Mućk

Własności statystyczne regresji liniowej. Wykład 4

Metodologia budowy modelu

Testowanie hipotez statystycznych

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Kalibracja. W obu przypadkach jeśli mamy dane, to możemy znaleźć równowagę: Konwesatorium z Ekonometrii, IV rok, WNE UW 1

Ekonometria. Modelowanie szeregów czasowych. Stacjonarność. Testy pierwiastka jednostkowego. Modele ARDL. Kointegracja. Jakub Mućk

0.1 Modele Dynamiczne

Testowanie hipotez statystycznych.

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Model 1: Estymacja KMNK z wykorzystaniem 32 obserwacji Zmienna zależna: st_g

Metoda największej wiarogodności

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Stanisław Cichocki. Natalia Nehrebecka

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka

Kolokwium ze statystyki matematycznej

Modele wielorownaniowe

PDF created with FinePrint pdffactory Pro trial version

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Modele zapisane w przestrzeni stanów

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Rozdział 8. Regresja. Definiowanie modelu

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka Matematyczna Anna Janicka

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Proces modelowania zjawiska handlu zagranicznego towarami

Czasowy wymiar danych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Problem równoczesności w MNK

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

0.1 Modele Dynamiczne

Uogolnione modele liniowe

Statystyka matematyczna dla leśników

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Transkrypt:

Rozdział 2 Modele dynamiczne Modele dynamiczne są to modele, których celem jest opisanie procesu dostosowań do stanu równowagi. Modele takie szacowane są na szeregach czasowych. Własności dynamiczne systemu ekonomicznego, które stanowią obiekt zainteresowania ekonomistów, to przede wszystkim istnienie długookresowej, szybkość dochodzenia do tej równowagi oraz wynikające z tego opóźnienia reakcji na egzogeniczne szoki. Własności równowagi długookresowej są ważne dla ekonomistów, ponieważ związane są bezpośrednio z przewidywaniami wynikającymi z teorii ekonomicznych. Szybkość dochodzenia do tej równowagi i związana z nią szybkość reakcji na egzogeniczne szoki takie jak zmiany polityki gospodarczej są ważne, ponieważ pozwalają sformułować ilościowe przewidywania na temat skuteczności poszczególnych instrumentów polityki gospodarczej (policy analysis). Większa część teorii ekonomii dotyczy stanów równowagi. Dynamika dochodzenia do stanu równowagi jest znacznie gorzej opisana, choć proces stanowi istotną część rzeczywistości ekonomicznej. Dzięki estymacji modeli dynamicznych możemy uzyskać wiedzę na temat takiego dynamiki dostosowań do stanu równowagi. Dodatkową przyczyną, dla których tworzy się modele dynamiczne jest możliwość użycia ich w procesie prognozowania. Jeśli możemy na podstawie danych oszacować w jakim stopniu zmiany wielkości zmiennych ekonomicznych wpływają na zmiany tych samych lub innych zmiennych w przyszłości, to wiedzę tę można będzie użyć w procesie prognozowania. Co więcej, na podstawie zależności w czasie między zmiennymi można niekiedy zidentyfikować związki przyczynowo-skutkowe między zmiennymi ekonomicznymi. Zaczniemy od zdefiniowania pojęcia szeregu czasowego. Szereg czasowy jest to ciąg realizacji zmiennej losowej. Oznaczmy tą zmienną przez y. Ciąg realizacji tej zmiennej zapiszemy jako: {y 1, y 2,..., y T }, przy czym indeks czasu oznacza moment w którym dana realizacja została zaobser- Copyright c 2008 by Jerzy Mycielski 15

16 ROZDZIAŁ 2. MODELE DYNAMICZNE wowana. Opis modeli dynamicznych zaczniemy od modeli o rozłożonych opóźnieniach. 2.1 Model o rozłożonych opóźnieniach (DL) W modelu o rozłożonych opóźnieniach DL (Distributed Lags), rozłożony w czasie wpływ wektora zmiennych niezależnych x t na zmienną zależną y t, modelowany jest za pomocą dodanych do modelu opóźnionych wartości tego wektora, to jest x t 1,..., x t p. Taki model może spełniać założenia KMRL dla x t jest nielosowego. Jeśli wektor x t zawiera tylko jedną zmienną, to model DL ma następującą postać: y t = µ + β 0 x t +... + β p x t p + ε t. Współczynniki przy zmiennych objaśniających w tym modelu opisują reakcję zmiennej zależnej z okresu t na zmiany zmiennych niezależnych z okresu t, t 1,..., t p. Przykładowo β p opisuje zmianę y t jaka nastąpi, jeśli zmieni się x sprzed p okresów a dla wszystkich pozostałych okresów x pozostanie takie same. PRZYKŁAD 2.1 Dynamiczna wersja równania konsumpcji - dane dla Polski 1996.1-2005.2. Zmienna zależna: konsumpcja indywidualna, niezależna: dochód narodowy P KB. Model szacowany na logarytmach zmiennych. Sądzimy, że zmiany dochodu wpływają z pewnym opóźnieniem na wielkość konsumpcji. Istotnie: kons t =.374 (0.039) pkb t 1 + 0.348 (0.038) pkb t 2 + 0.243 (0.041) pkb t 3 Jak widać w modelu istotne są wielkości dochodu narodowego z poprzednich okresów. W modelu nie umieszczono stałej, ponieważ okazała się statystycznie nieistotna. Nieistotna okazała się też nieopóźniona wielkość dochodu narodowego. Liczbę opóźnień dobrano zgodnie z metodą od ogólnego do szczegółowego. Współczynniki przy poszczególnych opóźnieniach opisują, ile procent zmieni się konsumpcja jeśli dochód w danym okresie zmieni się o jeden procent. Przykładowo współczynnik przy pkb t 3 opisuje oczekiwaną zmianę konsumpcji będącej skutkiem 1% zmiany P KB sprzed 3 okresów. Jak jednak zmierzyć wpływ x na y w przypadku, gdy x zmienił się nie w jednym lecz kilku okresach? Pytanie takie jest ważne w kontekście analizy skutków zmian polityki gospodarczej. Analizując skutki takich zmian, najczęściej rozpatrujemy scenariusze, w ramach których trwałym zmianom ulegają parametry polityki gospodarczej i badamy jaka jest reakcja systemu gospodarczego na taką zmianę. Interesują nas przy tym wielkości reakcji y na zmianę x w kolejnych okresach następujących po zmianie parametrów polityki gospodarczej. Najważniejsze są przy tym z reguły dwie wielkości: wielkość natychmiastowej reakcji y t na zmianę x t oraz wielkość reakcji długookresowej. Wielkość oczekiwanej natychmiastowej reakcji y t na zmianę jednostkową zmianę x t nazywamy mnożnikiem bezpośrednim (impact multiplier). W przypadku modelu DL można łatwo zauważyć, że wielkość mnożnika bezpośredniego jest równa β 0. Rzeczywiście, jeśli x t zmieni się o x t, ro oczekiwaną zmianę y t można policzyć w

2.1. MODEL O ROZŁOŻONYCH OPÓŹNIENIACH (DL) 17 sposób następujący: E (y t + y) = µ + β 0 (x t + x) +... + β p x t p = µ + β 0 x t +... + β p x t p + β 0 x t }{{} E(y t) = E (y t ) + β 0 x a więc mnożnik bezpośredni jest równy: E ( y) x = β 0 Rozpatruje się także wielkość oczekiwanej reakcji y t w przypadku, gdy x ulegnie zmianie o x dla kolejnych τ okresów. Mnożnik, który otrzymujemy dla takiego scenariusza nazywamy mnożnikiem skumulowanym. Opisuje on reakcję y t na trwałą zmiany x, która miała miejsce przed τ okresami. Wielkość współczynnika skumulowanego można policzyć w analogiczny sposób jak wielkość mnożnika bezpośredniego E (y t + y) = µ + β 0 (x t + x) +... + β τ (x t τ + x) + β τ+1 x t τ+1 +... + β τ x t p ( τ ) = E (y t ) + β i x i=0 Mnożnik skumulowany jest więc równy: β τ = E ( y) x = τ s=0 β s Ważnym typem mnożnika definiowanego dla modeli dynamicznych jest jeszcze tak zwany mnożnik długookresowy (long-run multiplier). Mnożnik długookresowy opisuje wielkość oczekiwanej zmiany zmiennej zależnej, będącej skutkiem zmiany wszystkich przeszłych wartości x o x. Mnożnik długookresowy opisuje więc długookresowy wpływ trwałej zmiany zmiennej niezależnej na wartość oczekiwaną zmiennej zależnej. Mnożnik długookresowy w modelu DL można policzyć jako mnożnik skumulowany dla τ. E ( y) x = β = s=0 β s Definiuje się jeszcze tak zwane średnie opóźnienie reakcji y t na zmiany x t. Średnie opóźnienie jest liczone jako średnia ważona z opóźnień zmiennej niezależnej przy

18 ROZDZIAŁ 2. MODELE DYNAMICZNE użyciu wag równych stosunkowi współczynnika przy danej zmiennej do mnożnika długookresowego: w = s=1 gdzie β i jest współczynnikiem przy x t s. Średnie opóźnienie można interpretować jako czas jaki upłynie do momentu, w którym zrealizuje się połowa efektu trwałej zmiany x t. Dla modelu, w którym pojawia się więcej niż jedna zmienna objaśniająca, wielkości mnożników i średnich opóźnień liczymy osobno dla każdej z tych zmiennych. PRZYKŁAD 2.2 c.d. 1.5 Mnożnik bezpośredni i długookresowy w równaniu konsumpcji. Wielkość mnożnika bezpośredniego wpływu pkb na konsumpcję wynosi 0. Mnożnik skumulowany wynosi odpowiednio β τ=1 = 0.374, β τ=2 = 0.723, β τ=3 = 0.966. Mnożnik długookresowy jest równy β = 0.966. Oznacza to, że w długim okresie elastyczność dochodowa konsumpcji jest równa 0.966. Średnie opóźnienie reakcji konsumpcji na zmianę pkb wynosi w = 1 (0.374 + 2 0.349 + 3 0.243) = 1. 864 4 0.966 Z przeprowadzonych rozważań wynika, że w krótkim okresie (jednego kwartału) zmiany pkb nie wpływają na wielkość konsumpcję. Długookresowo jednoprocentowy wzrost poziomu pkb powoduje jednak wzrost poziomu konsumpcji o 0.966%. Średnie opóźnienie reakcji konsumpcji na zmianę dochodu narodowego wynosi 1. 864 4 kwartała. Uzyskany model nie jest w pełni satysfakcjonujący, ponieważ H 0 o braku autokorelacji w teście Breuscha-Godfreya jest odrzucana przy policzonym poziomie istotności α = 0.0233. Podobny wynik daje zastosowanie statystyka Durbina-Watsona, ponieważ dla α = 0 wartość statystyki 1.167 < d L = 1.20. W przypadku modeli dynamicznych występowanie autokorelacji często interpretuje się jako błąd specyfikacji modelu. Skorelowanie błędów losowych wskazuje bowiem na to, że w modelu nie udało się w pełni opisać dynamicznych własności y t. Problem ten zazwyczaj rozwiązuje się dodając do modelu opóźnione zmienne zależne. Własności modeli z opóźnionymi zmiennymi zależnymi omówimy w następnym podrozdziale. 2.2 Modele autoregresyjne o rozłożonych opóźnieniach (ADL) Wprowadzając do modelu opóźnione wartości zmiennej zależnej, uzyskujemy często znaczną poprawę własności modelu przy stosunkowo niewielkiej liczbie dodatkowych parametrów. Opóźnionej zmienne zależne umożliwiają uchwycenie znacznej inercji wielu zjawisk ekonomicznych. PRZYKŁAD 2.3 Modelowanie wpływu dynamiki pkb na poziom bezrobocia. Często wskazuje się, że bezrobocie spada wraz ze wzrostem dynamiki pkb. Niemniej wpływ zmian dynamiki pkb na bezrobocie jest rozłożony w czasie, ponieważ nawet w przypadku polepszenia koniunktury gospodarczej konieczny jest pewien czas, nim bezrobotni znajdą nowe miejsca pracy. s β s β

2.2. MODELE AUTOREGRESYJNE O ROZŁOŻONYCH OPÓŹNIENIACH (ADL)19 Model, w którym występują opóźnione zmienne zależne, nazywamy modelem autoregresyjnym. Ogólną klasą takich modeli są modele ADL (Autoregressive Distributed Lags) postaci y t = α 1 y t 1 +... + α p y t p }{{} AR + µ + x t β 0 + x t 1 β 1 +... + x t s β }{{} s +ε t DL W przypadku modeli ADL trudniej, niż w przypadku modeli DL znaleźć mnożnik długookresowy. PRZYKŁAD 2.4 c.d. 1.5 Dynamiczna wersja funkcji konsumpcji. Wprowadzano do modelu opóźnioną konsumpcję. Na podstawie metody od ogólnego do szczegółowego ustalono liczbę opóźnień dla konsumpcji na 2. Uzyskany model ma następująco postać: kons t = 0.526 (0.151) kons t 1 0.235 (0.098) kons t 2 + 0.385 (0.037) pkb t 1 + 0.154 (0.066) pkb t 2 + 0.146 (0.060) pkb t 3 W model ADL nie obserwujemy autokorelacji błędów losowych. Policzony poziom istotności dla testu Breuscha-Godfreya wynosi α = 0.3498. 2.2.1 Równowagi długookresowa Stan równowagi długookresowej (rozwiązanie długookresowe - steady state) jest to stan, w którym wartość oczekiwana zmiennej zależnej pozostaje stała w czasie, o ile tylko nie zmieniają się zmienne niezależne. Rozwiązanie długookresowe jest bardzo ważne z punktu widzenia teorii ekonomii, ponieważ większość teorii ekonomicznych dotyczy relacji między zmiennymi w stanie równowagi. Stan równowagi długookresowej znajdujemy w modelach ADL z definicji tego stanu. Zakładamy więc, że wartość oczekiwana zmiennej zależnej i wartości zmiennych niezależnych są stałe w czasie: y = E (y t ) = E (y t 1 ) =... = E (y t p ), x = x t = x t 1 =... = x t s. Wstawiając te równania definicji modelu ADL i przenosząc y na lewą stronę otrzymujemy: (1 α 1... α p ) y = µ + x β 0 +x β 1 +... + x β s. Równowaga długookresowe zachodzi więc, gdy: gdzie µ = µ 1 α 1... α p a β = β 0 +β 1 +...+β s 1 α 1... α p. y = µ +x β, (2.1)

20 ROZDZIAŁ 2. MODELE DYNAMICZNE W modelu ADL, w którym nie występuje część DL, rozwiązanie długookresowa jest postaci: y = µ. Oznacza to, że y znajdzie się w stanie równowagi długookresowej dla stałej równej µ. PRZYKŁAD 2.5 c.d. 2.4 Długookresowa równowaga w przypadku funkcji konsumpcji. W przypadku funkcji konsumpcji długookresowa równowaga będzie dana równaniem: kons = 0.967pkb. Stała w rozwiązaniu długookresowym nie występuje, ponieważ nie występowała w modelu dynamicznym. Omawiając wzór na równowagę długookresową nie rozpatrywaliśmy warunków koniecznych, by równowaga taka istniała. Intuicyjnie warunki istnienia równowagi długookresowej gwarantują, że zmienna zależna ma tendencję to zbiegania do takiego stanu równowagi w przypadku, gdy zostanie z niego wytrącona. Warunki te powinny też gwarantować, że wpływ zaburzeń losowych ε t zanika z upływem czasu, ponieważ w dłuższym okresie y zbiega do stanu równowagi. Sformułowanie takich warunków wymagałoby wprowadzenia pojęć z zakresu stochastycznych równań różnicowych, co wykraczaja poza zakres tego podręcznika. W następnym podrozdziale wyprowadzimy mnożnik długookresowy dla modelu ADL. Okaże się, że jest on równy β ze wzoru na równowagę długookresową. 2.2.2 Mnożnik bezpośredni i długookresowy w ADL Wielkości mnożników liczymy w sposób analogiczny do tego, w jaki liczyliśmy wielkości mnożników dla modeli DL. Mnożnik bezpośredni mierzy wpływ zmiany x t o x na oczekiwany poziom y t. Oznaczmy zmianę y t jako y t. Oczekiwana zmiana wielkości y t na skutek zmiany x t o x wynosi w modelu ADL: E (y t + y) = E (y t ) + xβ 0 Wzór na mnożnik bezpośredni jest więc identyczny jak w modelu DL: E ( y) x = β 0 Inaczej sprawa wygląda z wielkością mnożnika długookresowego. W przypadku badania wpływu długookresowego rozpatrujemy scenariusz, w którym x t, x t 1,... zmieniają się x. W długim okresie model znajdzie się w stanie równowagi. Dla pierwotnych wartości zmiennych równowaga ta będzie dana wzorem y = µ + x β

2.2. MODELE AUTOREGRESYJNE O ROZŁOŻONYCH OPÓŹNIENIACH (ADL)21 zaś dla zmienionych o x wartości x otrzymamy: y + E ( y) = µ + (x + x) β Odejmując stronami te równia uzyskujemy wzór na mnożnik długookresowy w modelu ADL: E ( y) x = β = β 0 + β 1 +... + β s 1 α 1... α p Mnożnik długookresowy opisuje wpływ zmian trwałej x na wartość y w nowym położeniu rownowagi. Nie powinien być więc zaskoczeniem fakt, że mnożnik długookresowy jest równy wielkości β, która pojawia się we wzorze (2.1) na rozwiązanie długookresowe. PRZYKŁAD 2.6 c.d.2.4 Mnożnik bezpośredni dochodu narodowego dla konsumpcji jest równy zero. Jednak w długim okresie elastyczność dochodowa konsumpcji jest równa: 0.385 + 0.154 + 0.146 β = = 0.967 1 0.526 + 0.235 Uzyskana wielkość mnożnika długookresowego jest prawie identyczna do wyniku uzyskanego w modelu DL. Policzenie mnożników skumulowanych oraz średniego opóźnienia w przypadku modelu ADL jest trudniejsze, niż w modelu DL i wymaga stosowania wzorów rekurencyjnych. PYTANIA: 1. Podać ogólną postać modeli DL i ADL 2. Podać wzory na mnożnik bezpośredni i długookresowy w modelach DL i ADL i podać ich interpretację. 3. Podać wzór na średnie opóźnienie w modelu DL i podać jego interpretację. 4. Pokazać, jak można policzyć stan równowagi długookresowej w modelu ADL. Odpowiedź uzasadnić. 2.2.3 Zgodność MNK dla modeli ADL W przypadku występowania w modelu opóźnionych zmiennych objaśniających, nie da się utrzymać założenia, że zmienne objaśniające są nielosowe, ponieważ dla y t losowego, także opóźnione y t są losowe. Jak wiemy, w przypadku losowych zmiennych niezależnych dowiedzenie zgodności estymatora M N K jest możliwe tylko wtedy, gdy zmienne niezależne nie są skorelowane ze zaburzeniem losowym Cov (x t, ε t ). Kiedy to założenie to może okazać się nieprawdziwe w przypadku modelu ADL? Dla takiego modelu, autokorelacja czynnika losowego może doprowadzić do niezerowej kowariancji między wektorem zmiennych objaśniających i równoczesnym zaburzeniem losowym.

22 ROZDZIAŁ 2. MODELE DYNAMICZNE PRZYKŁAD 2.7 Rozpatrzmy model ADL postaci: y t = αy t 1 + ε t i załóżmy, że w modelu tym występuje autokorelacja pierwszego rzędu, to jest Cov (ε t, ε t 1 ) = γ 0, Cov (ε t, ε t s ) = 0 dla s > 1. Wzór dla y t 1 jest następujący: y t 1 = αy t 2 + ε t 1. Kowariancja między zmienną objaśniającą y t 1 i ε t jest niezerowa i wynosi: Cov (y t, ε t ) = Cov (αy t 2 + ε t 1, ε t ) = αcov (y t 2, ε t ) }{{} 0 + Cov (ε t, ε t 1 ) = γ 0 }{{} γ przy czym korelacja między y t 2 i ε t jest równa zeru, ponieważ y t 2 zależy jedynie od ε t 2, ε t 3,..., o których założyliśmy, że są nieskorelowane z ε t. Zmienna objaśniająca y t 1 w tym modelu jest skorelowana z błędem losowym ε t. Występuje więc w nim problem równoczesności i uzyskany za pomocą MNK estymator parametru α nie będzie zgodny. W przypadku modeli ADL szacowanych M N K powinniśmy dążyć do eliminacji autokorelacji. Zazwyczaj autokorelacje można wyeliminować dodając opóźnione zmienne zależne do modelu. Jeśli metoda ta okaże się nieskuteczna, można próbować modelować sposób w jaki skorelowane są błędy losowe. Problemem tym zajmiemy się w następnym podrozdziale. Przy wykrywaniu autokorelacji w modelu ADL nie należy posługiwać się standardową statystyką DW, ponieważ jej rozkład został wyprowadzony przy założeniu nielosowości zmiennych objaśniających. Można natomiast używać do tego celu testu Breuscha-Godfreya. PYTANIA: 1. Jakie założenie musi spełniać błąd losowy w modelu ADL, aby estymator MNK w tym modelu był zgodny? Za pomocą jakiego testu można zweryfikować to założenie? 2.3 Modele autoregresyjne ze średnia ruchoma ARMA Pewną klasą modeli dynamicznych stanowią modele autoregresyjne ze średnią ruchomą (AutoRegressive Moving Avarege) ARM A (p, q). Pierwszymi ekonometrykami, którzy zajmowali się estymacją tego typu modeli byli Gwilym M. Jenkins i George E.P. Box. Stąd mówi się w tym kontekście o metodzie Boxa-Jenkinsa. W przypadku modeli ARMA (p, q) do wytłumaczenia zmienności zmiennej y t używamy wyłącznie danych dotyczących zachowania danej zmiennej w przeszłości. Modele te nie mogą służyć do opisu zależności między zmiennymi, ale często dostarczają interesujących informacji na temat zachowania samego y t. Modelując szereg czasowy za pomocą modelu ARMA (p, q) nie korzystamy z wiedzy ekonomicznej a jedynie analizujemy własności statystyczne tego szeregu. Uzyskane w ten sposób modele są w wielu przypadkach cennymi narzędziami prognostycznymi. Z drugiej strony modele te są bezużyteczne w badaniach ekonomicznych, ponieważ w takich badaniach z natury rzeczy koncentrujemy się na analizie związków między zmiennymi ekonomicznymi.

2.3. MODELE AUTOREGRESYJNE ZE ŚREDNIA RUCHOMA ARMA 23 Model ARM A (p, q) składa się z części autoregresyjnej AR rzędu p (AutoRegressive) i części związanej ze średnią ruchomą MA rzędu q (Moving Avarege): y t = µ + α 1 y t 1 + α p y t p }{{} AR + ε t + θ 1 ε t 1 +... + θ q ε t q }{{} MA przy czym zakładamy, że zaburzenia losowe ε t dla i = 1,..., T mają wartość oczekiwaną E (0) = 0, stałą wariancję Var (ε t ) = σ 2 i są nieskorelowane w czasie E (ε t, ε s ) = 0 dla i s. O ε t mających takie własności mówi się niekiedy jako o innowacjach (innovations), czyli nieprzewidywalnych zaburzeniach losowych. Model, w którym występuje wyłącznie część autoregresyjna, zapisuje się jako model AR (p) a model, w którym występuje wyłącznie część związana ze średnią ruchomą, określamy jako model MA (q). W modelu ARMA (p, q) równowaga długookresowa jest dana wzorem µ = µ 1 α 1... α p. Można to pokazać w sposób analogiczny do tego w jaki pokazaliśmy to dla modeli ADL. Podobnie, jak w przypadku modeli ADL, równowaga długookresowa istnieje, jeśli wpływ ε t maleje wraz z upływem czasu. Zakłada się, że zaburzenia losowe ε t są bezpośrednio nieobserwowalne. Część M A może więc być traktowana jako część niewyjaśniona modelu, lub też jako błąd losowy postaci u t = ε t + θ 1 ε t 1 +... + θ q ε t q. Zauważmy, że błąd losowy ε t wykazywać będzie autokorelację rzędu q. Model ARM A (p, q) można zapisać tak, jak zwykły model liniowy: y t = µ + α 1 y t 1 + α p y t p + u t Czy model ten można wyestymować zwykłym MNK? Niestety nie. Model o tej postaci jest modelem autoregresyjnym ze skorelowanym błędem losowym. Wiemy, że w tym przypadku występowanie autokorelacji implikuje równoczesność i w efekcie brak zgodności estymatora M N K. Najpopularniejszą metodą estymacji modeli ARM A (p, q) jest Metodą Największej Wiarogodności M N W (Maximum Likelihood M L) lub Nielinową Metodą Najmniejszych Kwadratów N M N K (Nonlinear Least Squares N LS). Metody te szerzej będziemy omawiać nieco później. W przypadku modeli ARMA (p, q) zarówno estymator MNW jak i NMNK liczone są numerycznie, co jest czasochłonne i nie zawsze prowadzi do uzyskania prawidłowego wyniku. Dla p > 3 i p > 3 oszacowanie modelu ARMA (p, q) staje się bardzo uciążliwe z powodu trudności numerycznych, szczególnie w przypadku krótkich szeregów czasowych. Jednym z największych wyzwań przy estymacji modelu ARM A (p, q) jest ustalenie rzędu części autoregresyjnej p i rzędu części związanej ze średnią ruchomą q. Do doboru właściwych q i p wykorzystuje się obecnie najczęściej metodę od ogólnego do szczegółowego. Do testowania poszczególnych hipotez złożonych można użyć w tym przypadku testu ilorazu wiarogodności LR. Można także posłużyć się do tego kryteriami informacyjnymi.

24 ROZDZIAŁ 2. MODELE DYNAMICZNE Model z ARMA (p, q) z właściwie dobranymi wielkościami p i q powinien się charakteryzować oszacowaniami ε t (resztami e t ), które są nieskorelowane w czasie. Testem diagnostycznym, który bada hipotezę o nieskorelowaniu ε t używanym w kontekście estymacji modeli ARMA (p, q), jest test Ljunga-Boxa postaci: Q = n (n + 2) m k=1 ρ 2 k n k D χ 2 m p q gdzie ρ k = (T k) T t=k+1 (yt y)(y t k y) T 1 T t=1 (yt y)2 jest empirycznym współczynnikiem korelacji rzędu k a m jest liczbą współczynników korelacji uwzględnionych w trakcie liczenia statystyki. Hipoteza zerowa dla tego testu mówi, że model ARMA (p, q) jest prawidłowym modelem w tym sensie ε t są nieskorelowane i mają stałą w czasie wariancję. Intuicja tego testu opiera się na obserwacji, że w przypadku, gdy wszystkie współczynniki korelacji ρ k dla ε t są równe zeru, to statystyka Q dąży do zera. 1 PRZYKŁAD 2.8 Wybór wielkości p i q dla modelu ARMA (p, q) wyjaśnijącego dynamikę produkcji przemysłowej ogółem. Dane miesięczne dla Polski w latach 1995.1-2004.12. Szukając właściwej 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 Dyamika produkcji przemysłowej % 90 100 110 120 130 data RYSUNEK 2.1: Produkcja przemysłowa ogółem wielkości p i q oszacowano modele dla p, q 3 i otrzymano następującą tabelę: 1 Test Q nazywany jest także testem portmanteau. Ma on poza formą zaproponowaną przez Ljunga- Box a jeszcze kilka wariantów (np. statystyka Q Box a-pierce a) różniących się własnościami małopróbkowymi.

2.3. MODELE AUTOREGRESYJNE ZE ŚREDNIA RUCHOMA ARMA 25 TABELA 2.1: Wybór p i q w modelu ARMA(p,q) ( dla produkcji przemysłowej Model AIC BIC l µ, α, θ ) LR Pr (X > LR ) ARM A (3, 3) 660.61 682.71-322.30 ARM A (3, 2) 671.87 691.20-328.93 13.26 0.0003 ARM A (2, 3) 673.51 690.08-330.75 16.90 0.0002 Na podstawie wielkości kryteriów informacyjnych w tej tabeli wnioskujemy, że najlepszym modelem jest model ARM A (3, 3). Statystykę LR stosowaliśmy ( do testowania hipotezy o zerowości najwyższych współczynników. Wielkość l µ, α, θ ) jest wielkością funkcji wiarogodności w w maksimum. Uzyskana wielkość testu LR dla modelu ARMA (3, 2) wskazuje, że należy odrzucić H 0 : θ 3 = 0. Z kolei uzyskana wielkość dla ARMA (2, 3) skłania nas do odrzucenia H 0 : α 3 = 0. W rezultacie dochodzimy do wniosku, że właściwym modelem jest model ARMA (3, 3) Dla modelu ARMA (3, 3) wartość p dla statystyki Ljunga-Boxa wynosi α = 0.60. Wynika z tego, że nie ma podstaw do odrzucenia hipotezy zerowej o braku autokorelacji składnika losowego. Tradycyjnym sposobem doboru wielkości p i q była analiza wykresów funkcji autokorelacji i funkcji autokorelacji cząstkowej. Sposób ten został zaproponowany już przez Boxa i Jenkinsa w latach 70-tych. Obecnie bardziej popularne jest stosowanie metody od ogólnego do szczegółowego i traktowanie wykresów wspomnianych wyżej funkcji jako dodatkowych narzędzi diagnostycznych. Poniżej omówimy definicje tych funkcji oraz związek ich przebiegu z wielkościami p i q. 2.3.1 Funkcje ACF i PACF 2.3.1.1 Funkcja autokorelacji Wartość funkcja autokorelacji ACF (Autocorrelation Function) jest zdefiniowana dla liczby naturalnej k jako współczynnik korelacji między dwoma realizacjami y t odległymi w czasie o k okresów: ρ k = Cov (y t, y t k ) Var (y t ) Kształt funkcja autokorelacji pozwala stwierdzić, jak zmienia się korelacja między realizacjami zmiennej y t wraz ze wzrostem odległości w czasie między tymi realizacjami. Można pokazać, że dla modelu AR (p) funkcja autokorelacji będzie wykładniczo maleć. Z kolei dla modelu M A (q) wielkość funkcji autokorelacji będzie niezerowa dla k q a i równa zeru dla k > q. W obu przypadkach zakładamy, że w modelu istnieje położenie równowagi. 2.3.1.2 Funkcja autokorelacji czastkowej Funkcja autokorelacji cząstkowej P ACF (Partial Autocorrelation Function) dla liczby naturalnej k, oznaczana jako α kk, jest równa wyestymowanemu współczynni-

26 ROZDZIAŁ 2. MODELE DYNAMICZNE kowi α k w modelu autoregresyjnym k tego rzędu: y t = µ + α 1 y t 1 +... + α k y t k + ε t. Funkcja autokorelacji cząstkowej pozwala zbadać istotność odległych opóźnień. W przypadku modelu AR (p) istotne będą α kk dla k p a dla k > p wartości funkcji autokorelacji cząstkowej będą równe zeru. Z kolei dla modelu M A (q) funkcja autokorelacji cząstkowej będzie maleć wykładniczo. 2.3.2 Wybór p i q na podstawie funkcji ACF i P ACF Zaproponowana przez Boxa i Jenkinsa procedura wyboru p i q na podstawie wykresów ACF i P ACF opiera się na analizie przebiegów tych funkcji. Przykładowo analizując wykres 2.2 wnioskujemy na podstawie własności funkcji ACF i P ACF, że właściwym modelem jest model AR (1). Wniosek ten wyciągamy z tego, że funkcja autokorelacji istotnie maleje wykładniczo a funkcja autokorelacji cząstkowej posiada jedną istotną wartość dla k = 1. Funkcja autokorelacji -0.200.00 0.20 0.40 0.60 0.80 0 10 20 30 40 Opóźnienie 95% przedział ufności Funkcja autokorelacji cząstkowej 0.00 0.20 0.40 0.60 0.80 0 10 20 30 40 Opóźnienie 95% przedział ufności RYSUNEK 2.2: Wykresy funkcji ACF i P ACF dla modelu AR (1) Podobnie w przypadku wykresu 2.3 wyciągamy wniosek, że właściwy modelem jest model MA (1). Niestety w przypadkach bardziej złożonych, wykresy funkcji ACF i P ACF są często trudne do zintepretowania i nie dają jednoznacznych wskazań co do wielkości parametrów p i q. W przypadku, gdy p i q są różne od zera powinniśmy zaobserwować na wykresie ACF i P ACF kilka kolejnych dużych co do wartości bezwględnej

2.3. MODELE AUTOREGRESYJNE ZE ŚREDNIA RUCHOMA ARMA 27 Funkcja autokorelacji -0.20 0.00 0.20 0.40 0.60 0 10 20 30 40 Opóźnienie 95% przedział ufności Funkcja autokorelacji cząstkowej -0.20 0.00 0.20 0.40 0.60 0 10 20 30 40 Opóźnienie 95% przedział ufności RYSUNEK 2.3: Wykresy funkcji ACF i P ACF dla modelu MA (1) wartości a następnie wykładnicze zbieganie do zera. Na podstawie liczby tych dużych wartości w na wykresie P ACF ustalamy wielkość p a na podstawie ich liczby na wykresie ACF wyznaczamy q. W praktyce problemem jest ustalenie, w którym dokładnie miejscu kończą się duże wartości tych funkcji związane z p i q a zaczynają wartości związane z wykładniczym zbieganiem do zera. Inny problem stanowi to, że wielkości funkcji P ACF są estymowane MNK. Uzyskane w ten sposób oszacowania a kk, nie będą zgodne nawet dla k = p, z racji na związaną z autokorelacją błędu losowego równoczesność. Dodatkowo dla k < p na własności oszacowań α kk wpływaja dodatkowo negatywnie problem zmiennych pominiętych. Obecnie zaleca się więc stosowanie funkcji ACF i P ACF jedynie jako nieformalnych narzędzi diagnostycznych. PRZYKŁAD 2.9 c.d. 2.8 Wybóru p i q na podstawie wykresów funkcji ACF i P ACF. Analizowany jest model ARM A dla produkcji przemysłowej. Na wykresie ACF, duże wielkośc występują dla 3 pierwszych wartości funkcji. Podobnie jest w przypadku wykresu P ACF. Na podstawie wykresu tych funkcji wybieramy p = 3 i q = 3. 2.3.3 Prognozowanie za pomoca ARMA (p, q) (prognozy dynamiczne) Modele ARM A (p, q) znajdują najszersze zastosowanie jako wyjątkowo proste narzędzia prognostyczne. Prostota ta wynika z samego sposobu zdefiniowania tych modeli. Ponieważ jedynymi zmiennymi objaśniającymi w takich modelach są opóźnione zmienne zależne, więc także do prognozowania nie potrzebujemy żadnych do-

28 ROZDZIAŁ 2. MODELE DYNAMICZNE Funkcja autokorelacji -0.40-0.200.000.200.400.60 0 10 20 30 40 Opóźnienie 95% przedział ufności Funkcja autokorelacji cząstkowej -0.20 0.00 0.20 0.40 0.60 0 10 20 30 40 Opóźnienie 95% przedział ufności RYSUNEK 2.4: Funkcja ACF i P ACF dla modelu ARMA (p, q) datkowych informacji poza informacjami na temat y t. Rozpatrzmy wzór na y T +1 : y T +1 = µ + α 1 y T + α p y T p+1 + ε T +1 + θ 1 ε T +... + θ q ε T q+1, gdzie T jest ostatnim okresem, dla którego mamy obserwację w próbce. Załóżmy, że za pomocą odpowiedniej metody estymacji udało się nam oszacować wielkości parametrów µ, α 1,..., α p oraz reszty e 0,..., e T, będące odpowiednikami zaburzeń losowych ε t. Tworząc prognozę, zastępujemy parametry ich oszacowaniami a błędy losowe resztami. W przypadku błędu losowego ε T +1 nie dysponujemy resztą. Co więcej, elementu tego nie da się oszacować, ponieważ o błędach losowych założyliśmy, że są niekorelowane w czasie. Pominięcie tego elementu nie spowoduje jednak systematycznych błędów przy prognozowaniu, ponieważ założyliśmy, że E (ε t ) = 0. Prognozę y T +1 można więc wyznaczyć następująco: ŷ T +1 = µ + α 1 y T + α 2 y T 1 +... + α p y T p+1 + θ 1 e T + θ 2 e T 2 +... + θ q e T q+1. Pojawia się jednak pytanie jak sftworzyć prognozę dla y T +2. Po to, by sformułować prognozę y t na okres T + 2 możemy posłużyć się prognozą dla ŷ T +1. Prognoza dla

2.3. MODELE AUTOREGRESYJNE ZE ŚREDNIA RUCHOMA ARMA 29 y T +2 jest więc dana wzorem: ŷ T +2 = µ + α 1 ŷ T +1 + α 2 y T +... + α p y T p+2 + θ 2 e T +... + θ q e T q+2 Rekurencyjnie postępując w ten sam sposób można uzyskać prognozę ŷ T +s na podstawie prognoz ŷ T +1,..., ŷ T p+s. W literaturze podkreśla się, że prognozy uzyskane przy użyciu modeli ARM A (p, q) są użyteczne jedynie dla stosunkowo krótkich horyzontów prognozy. Przy dłuższych horyzontach wpływ y T, y T 1,... i ε T, ε T 1,... na y T +s maleje do zera a prognozy zbiegają do równowagi długookresowej y = µ = µ 1 α 1... α k. PRZYKŁAD 2.10 Prognozowanie produkcji przemysłowej. Wykres został sporządzony dla modelu oszacowanego dla danych z lat 1995.1-2004.12. Poziomą linią oznaczono rozwiązanie długookresowe. Jakość prognoz można zweryfikować na podstawie dostępnych danych z roku 2005. Na wykresie widać, że prognoza z modelu ARMA (3, 3) dla stycznia 2005 była zupełnie dobra: model prognozował dynamikę produkcji na poziomie 5.9%, zaobserwowana dynamika wyniosła 4.6%. Niestety widać także, że w kolejnych okresach model wyraźnie niedoszacował skalę spadku dynamiki produkcji. Widać też, że w dłuższym okresie prognozy zbiegają do 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Dynamika produkcji przemysłowej % 90 100 110 120 130 data produkcja prognozy RYSUNEK 2.5: Prognozy produkcji przemysłowej z ARMA (4, 4) rozwiązania długookresowego.

30 ROZDZIAŁ 2. MODELE DYNAMICZNE 2.3.4 Modele z błędem losowym postaci ARMA (p, q) Ważnym zastosowaniem modeli ARM A jest modelowanie autokorelacji czynnika losowego. Taka autokorelacja pojawia się często w modelach szacowanych na szeregach czasowych. Najłatwiej wyeliminować autokorelację czynnika losowego wstawiając do modelu opóźnione zmiennych zależnych. Niekiedy jednak prostszy model uzyskuje się akceptując fakt występowania autokorelacji błędów losowych i zakładając, że pochodzą one z modelu ARMA (p, q). Model taki ma postać: gdzie y t = x t β+ u t, u t = α 1 u t 1 +... + α p y t p + ε t + θ 1 ε t 1 +... + θ q ε t q. W modelu o tej postaci wśród zmiennych zawartych w x t mogą pojawiać się także opóźnione y t. Podobnie jak w przypadku standardowego modelu ARMA (p, q), model z zaburzeniami losowymi w formie ARMA (p, q) szacuję się zazwyczaj za pomocą MNW. PYTANIA: 1. Podać ogólną postać modelu ARMA (p, q) 2. Jaką hipotezę badamy za pomocą testu Ljunga-Boxa? 3. Wyjaśnić w jaki sposób tworzone są prognozy za pomocą modelu ARMA (p, q) 4. Wyjaśnić w jaki sposób używa się funkcji ACF i P ACF do ustalania parametrów p i q modelu ARMA (p, q) 2.4 Analiza przyczynowości Jednym z ciekawszych zastosowań modeli szacowanych na szeregach czasowych jest testowanie przyczynowości. Wiele z centralnych pytań ekonomii ma charakter pytań o istnienie związków przyczynowo skutkowych. Na przykład, dyskusję na temat neutralności pieniądza w gospodarce można rozumieć jako dyskusję o tym, czy zmiany podaży pieniądza są przyczyną zmian zmiennych realnych w gospodarce. Aby zrozumieć sposób, w jaki testuje się przyczynowość, zaczniemy od analizy własności związku przyczynowo skutkowego. Związek przyczynowo skutkowy charakteryzuje się tym, że przyczyna zawsze poprzedza skutek. Wiedząc, że wystąpiła przyczyna możemy przewidzieć skutek. Analizując statystycznie związek przyczynowo skutkowy traktujemy go probabilistycznie. Występowanie związku przyczynowo skutkowego oznacza w tym kontekście, że wystąpienie przyczyny zwiększa prawdopodobieństwo późniejszego zaobserwowania skutku. Wiedza o zaistnieniu przyczyny zwiększa także prawdopodobieństwo prawidłowej prognozy wystąpienia skutku. Wymienione własności związku przyczynowo skutkowego stanowią podstawę definicji przyczynowości w sensie Grangera.

2.4. ANALIZA PRZYCZYNOWOŚCI 31 DEFINICJA 2.11 Zmienna x jest przyczyna w sensie Grangera zmiennej y, jeśli bieżace wartości zmiennej y można dokładniej prognozować przy użyciu przeszłych wartości x, niż bez ich wykorzystania. Przyczynowość w sensie Grangera nie jest tym samym, co przyczynowość w głębszym sensie filozoficznym. Zdarza się, że możliwe jest prognozowanie jednej zmiennej na podstawie drugiej nawet wtedy, gdy nie ma między nimi bezpośredniego związku przyczynowo skutkowego. Przy rozważaniu związków przyczynowo skutkowych, poza wykazaniem istnienia korelacji między wcześniejszym wystąpieniem przyczyny a późniejszym zaistnieniem skutku, powinniśmy wyjaśnić, skąd bierze się związek między przyczyną a skutkiem. PRZYKŁAD 2.12 Mądrość ludowa mówi, że nisko latające jaskółki pozwalają przewidzieć, że wkrótce spadnie deszcz. Czy nisko latające jaskółki są przyczyną w sensie Grangera deszczu? ROZWIAZANIE W tym przypadku trudno jest mówić o występowaniu rzeczywistego związku przyczynowo skutkowego. Przyczyną niskiego lotu jaskółek jest wysoka wilgotność powietrza, która powoduje, że nisko latają owady stanowiące pożywienie jaskółek. Prawdopodobnie, gdybyśmy poza obserwowaniem ptaków mierzyli także wilgotność powietrza, to uwzględnienie niskiego lot jaskółek nie polepszałoby prognoz sformułowanych na podstawie pomiarów wilgotności powietrza. Sposób w jaki przeprowadzamy test Grangera jest ściśle związany ze sposobem, w jaki definiujemy przyczynowość w sensie Grangera. W modelu ADL zmienna x t poprawia jakość prognoz y t, jeśli współczynniki przy opóźnieniach są niezerowe. Zdefiniujmy model ADL postaci y t = a (t) + k α i y t i + i=1 k β i x t i + ε t gdzie a (t) jest częścią deterministyczną modelu (np. a (t) = γ 0 + γ 1 t). Jeśli w tym modelu tym β 1 = β 2 =... = β k = 0, to x nie jest przyczyną w sensie Grangera y. Test przyczynowości Grangera polega na testowaniu hipotezy łącznej, że wszystkie β i przy opóźnionych x, są równe zero. Hipotezą zerową w teście przyczynowości Grangera jest hipoteza, że x nie jest przyczyna y. PRZYKŁAD 2.13 c.d. 2.4 W dynamicznym modelu dla konsumpcji przetestujmy hipotezę, że dochód jest przyczyną w sensie Grangera konsumpcji. W analizowanym przypadku testowanie przyczynowości sprowadza się do testowania łącznej hipotezy o nieistotności opóźnianych wielkości PKB. Wielkość statystyki testowej jest równa F (3, 34) = 44.4, wartość p jest w praktyce równa zeru. Wynik ten skłania nas do odrzucenia H 0, że dochód nie jest przyczyna w sensie Grangera konsumpcji. PYTANIA: 1. Wyjaśnić jak należy rozumieć przyczynowość w sensie Grangera i jak ją testujemy. i=1

32 ROZDZIAŁ 2. MODELE DYNAMICZNE 2.5 Sezonowość O sezonowości mówimy wtedy, gdy zmienna zmienia się w pewnym cyklu, zwykle związanym z cyklem rocznym. Na przykład, zmienne kwartalne charakteryzują się zwykle sezonowością kwartalną a zmienne miesięczne sezonowością miesięczną. Sezonowość w danych może pojawiać się w danych z różnych powodów. Często spowodowana jest czynnikami klimatycznymi, np. wartość dodana w budownictwie maleje w okresie zimowym. W innych przypadkach sezonowość związana jest z czynnikami kulturowymi np. w taki sposób można tłumaczyć wzrost wartości sprzedaży w okresie świąt. Niekiedy sezonowość może się też wiązać z uwarunkowaniami prawno księgowymi, które powodują na przykład wzrost dochodów ludności w ostatnim miesiącu roku, związany z wypłatami z zysku i trzynastek. Sezonowość należy uwzględnić w modelu, jeśli ma wpływa ona na związek między zmienną objaśniającą i objaśnianą. Jeśli w modelu nie uwzględniona zostanie sezonowość, to pojawi się ona resztach, które tym samym nie będą spełniać założeń KM RL. Z drugiej strony, jeśli nasz model ma służyć celom prognostycznym, to pominięcie sezonowości znacząco pogorszy jakość otrzymanych przewidywań. Problem sezonowość można w procesie estymacji uwzględnić na kilka sposobów. Pierwszy sposób polega na posłużeniu się danymi wyrównanymi sezonowo. Dane takie są obecnie publikowane przez wiele urzędów statystycznych. Można też samodzielnie usunąć sezonowość z danych za pomocą jednej ze standardowych procedur np. używając średniej ruchomej, metody X11, czy też programu TRAMO-SEATS. Obecnie wśród ekonometryków panuje jednak pogląd, że używanie danych wyrównanych sezonowo jest niepożądane, ponieważ trudno jest przewidzieć, jaki wpływ na oszacowania ma zastosowana procedura usuwania sezonowości. Istnieją przy tym przesłanki, by przypuszczać, że usuwanie sezonowości z danych może poważnie zakłócić wyniki estymacji. Do pewnego stopnia wybór między danymi wyrównanymi sezonowo i niewyrównanymi sezonowo jest wyborem związanym z celem badania. Jeśli na przykład celem budowanego modelu jest prognozowanie zmiennych wyrównanych sezonowo, wtedy prawdopodobnie lepiej posłużyć się w modelu danymi wyrównanymi sezonowo. Prostym sposobem uwzględnienia sezonowości w modelu jest dodanie do niego zmiennych zerojedynkowych, związanych z poszczególnymi miesiącami/kwartałami. Zmienne takie nazywa się zmiennymi sezonowymi. Wielkości parametrów przy tych zmiennych interpretujemy jako różnice między danym miesiącem/kwartałem a miesiącem/kwartałem bazowym. Innym sposobem uwzględnienia sezonowości jest zastosowanie tak zwanego różnicowania sezonowego. Polega ono na zastosowaniu zamiast pierwotnych zmiennych, różnic między tymi zmiennymi, a wartościami tych samych zmiennych sprzed roku. Zaletą tej procedury jest jej prostota, dzięki której łatwiej jest określić własności estymatorów oszacowanych dla tak przekształconych zmiennych. Różnice sezonowe zmiennej y t oznaczamy jako s y t = y t y t s, gdzie s = 4 dla zmiennych kwar-

2.6. ZMIENNE STACJONARNE I NIESTACJONARNE 33 talnych, s = 12 dla zmiennych miesięcznych itd. PRZYKŁAD 2.14 Poziom P KB w Polsce w latach 1995-2004, dane kwartalne. Zmiany sezonowe P KB mają głównie związek z cyklem inwestycyjnym - największe nakłady inwestycyjne księgowane są w czwartym kwartale. Rysunek 2.6 ilustruje sezonowość w logarytmie PKB w wyrażeniu realnym. Realny PKB został uzyskany poprzez zdeflowanie nominalnego PKB przez indeks cen konsumpcyjnych CP I. Zauważmy, że dla surowych na dominującą tendencję nakładają się zmiany sezonowe. Na rysunku znajduje się także wyrównany sezonowo PKB, przy czym wyrównania sezonowego dokonano metodą średniej ruchomej y t = 1 4 (y t + y t 1 + y t 2 + y t 3 ). Na podstawie wykresu zmiennych wyrównanych sezonowo wyraźnie łatwiej jest odczytać tendencję zarysowującą się w danych. 1995q1 1996q1 1997q1 1998q1 1999q1 2000q1 2001q1 2002q1 2003q1 2004q1 2005q1 ln(pkb) 11.211.311.411.511.6 niewyrównany sezonowo wyrównany sezonowo 1995q1 1996q1 1997q1 1998q1 1999q1 2000q1 2001q1 2002q1 2003q1 2004q1 2005q1 0.05.1 Pierwsze różnice ln(pkb) RYSUNEK 2.6: PKB w wyrażeniu realnym Na rysunku przedstawiono także sezonowe różnice nominalnego PKB. Na wykresie tym nie jest widoczna sezonowość, za to można wyraźnie widać zmiany stopu wzrostu nominalnego PKB. PYTANIA: 1. Wyjaśnić co to znaczy, że w danych występuje sezonowość i omówić sposoby uwzględniania sezonowości w procesie modelowania. 2.6 Zmienne stacjonarne i niestacjonarne Jednym z podstawowych pojęć stosowanych w analizie szeregów czasowych jest pojęcie stacjonarności zmiennej 2. Intuicyjnie zmienna stacjonarna to zmienna, której 2 W bardziej formalnym matematycznym kontekście mówimy o procesach stochastycznych zamiast o szeregach czasowych