Metody analizy i prognozowania szeregów czasowych



Podobne dokumenty
Wykład 6. Badanie dynamiki zjawisk

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Wykład 6. Badanie dynamiki zjawisk

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

WNIOSKOWANIE STATYSTYCZNE

DYNAMICZNE MODELE EKONOMETRYCZNE

1. Szereg niesezonowy 1.1. Opis szeregu

Kombinowanie prognoz. - dlaczego należy kombinować prognozy? - obejmowanie prognoz. - podstawowe metody kombinowania prognoz

Analiza rynku projekt

PROGNOZOWANIE. Ćwiczenia 2. mgr Dawid Doliński

PROGNOZOWANIE I SYMULACJE EXCEL 2 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 2 AUTOR: MARTYNA MALAK

Parytet stóp procentowych a premia za ryzyko na przykładzie kursu EURUSD

Niestacjonarne zmienne czasowe własności i testowanie

PROGNOZOWANIE I SYMULACJE. mgr Żaneta Pruska. Ćwiczenia 2 Zadanie 1

PROGNOZOWANIE I SYMULACJE EXCEL 2 PROGNOZOWANIE I SYMULACJE EXCEL AUTOR: ŻANETA PRUSKA

DYNAMICZNE MODELE EKONOMETRYCZNE

Statystyka od podstaw z systemem SAS Dr hab. E. Frątczak, ZAHZiAW, ISiD, KAE. Część VII. Analiza szeregu czasowego

Stanisław Cichocki Natalia Nehrebecka. Wykład 4

EKONOMETRIA wykład 2. Prof. dr hab. Eugeniusz Gatnar.

E k o n o m e t r i a S t r o n a 1. Nieliniowy model ekonometryczny

Ocena efektywności procedury Congruent Specyfication dla małych prób

ANALIZA, PROGNOZOWANIE I SYMULACJA / Ćwiczenia 1

Pobieranie próby. Rozkład χ 2

KURS EKONOMETRIA. Lekcja 1 Wprowadzenie do modelowania ekonometrycznego ZADANIE DOMOWE. Strona 1

WYKORZYSTANIE STATISTICA DATA MINER DO PROGNOZOWANIA W KRAJOWYM DEPOZYCIE PAPIERÓW WARTOŚCIOWYCH

Politechnika Częstochowska Wydział Inżynierii Mechanicznej i Informatyki. Sprawozdanie #2 z przedmiotu: Prognozowanie w systemach multimedialnych

Całka nieoznaczona Andrzej Musielak Str 1. Całka nieoznaczona

Prognozowanie średniego miesięcznego kursu kupna USD

3. Modele tendencji czasowej w prognozowaniu

Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN Nr

FINANSOWE SZEREGI CZASOWE WYKŁAD 3

DYNAMICZNE MODELE EKONOMETRYCZNE

Stanisław Cichocki Natalia Nehrebecka. Wykład 5

Prognozowanie i symulacje

PREDYKCJA KURSU EURO/DOLAR Z WYKORZYSTANIEM PROGNOZ INDEKSU GIEŁDOWEGO: WYBRANE MODELE EKONOMETRYCZNE I PERCEPTRON WIELOWARSTWOWY

licencjat Pytania teoretyczne:

ESTYMACJA KRZYWEJ DOCHODOWOŚCI STÓP PROCENTOWYCH DLA POLSKI

5. Model sezonowości i autoregresji zmiennej prognozowanej

Metody prognozowania: Szeregi czasowe. Dr inż. Sebastian Skoczypiec. ver Co to jest szereg czasowy?

DYNAMIKA KONSTRUKCJI

PROGNOZOWANIE W ZARZĄDZANIU PRZEDSIĘBIORSTWEM

METODY STATYSTYCZNE W FINANSACH

4. Średnia i autoregresja zmiennej prognozowanej

Analiza składowych głównych. Wprowadzenie

specyfikacji i estymacji modelu regresji progowej (ang. threshold regression).

MODELOWANIE EFEKTU DŹWIGNI W FINANSOWYCH SZEREGACH CZASOWYCH

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

3. Analiza własności szeregu czasowego i wybór typu modelu

Klasyfikacja modeli. Metoda najmniejszych kwadratów

POWIĄZANIA POMIĘDZY KRÓTKOOKRESOWYMI I DŁUGOOKRESOWYMI STOPAMI PROCENTOWYMI W POLSCE

ψ przedstawia zależność

Ocena płynności wybranymi metodami szacowania osadu 1

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Copyright by Politechnika Białostocka, Białystok 2017

DYNAMICZNE MODELE EKONOMETRYCZNE

7.4 Automatyczne stawianie prognoz

Matematyka ubezpieczeń majątkowych r. ma złożony rozkład Poissona. W tabeli poniżej podano rozkład prawdopodobieństwa ( )

Jacek Kwiatkowski Magdalena Osińska. Procesy zawierające stochastyczne pierwiastki jednostkowe identyfikacja i zastosowanie.

Wygładzanie metodą średnich ruchomych w procesach stałych

Kobiety w przedsiębiorstwach usługowych prognozy nieliniowe

SYMULACYJNA ANALIZA PRODUKCJI ENERGII ELEKTRYCZNEJ I CIEPŁA Z ODNAWIALNYCH NOŚNIKÓW W POLSCE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Silniki cieplne i rekurencje

EFEKT DŹWIGNI NA GPW W WARSZAWIE WPROWADZENIE

Efekty agregacji czasowej szeregów finansowych a modele klasy Sign RCA

Wprowadzenie do analizy korelacji i regresji

Modelowanie i analiza szeregów czasowych

Dopasowywanie modelu do danych

Elżbieta Szulc Uniwersytet Mikołaja Kopernika w Toruniu. Modelowanie zależności między przestrzennoczasowymi procesami ekonomicznymi

POMIAR PARAMETRÓW SYGNAŁOW NAPIĘCIOWYCH METODĄ PRÓKOWANIA I CYFROWEGO PRZETWARZANIA SYGNAŁU

ĆWICZENIE 7 WYZNACZANIE LOGARYTMICZNEGO DEKREMENTU TŁUMIENIA ORAZ WSPÓŁCZYNNIKA OPORU OŚRODKA. Wprowadzenie

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania. Podstawy Automatyki

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

C d u. Po podstawieniu prądu z pierwszego równania do równania drugiego i uporządkowaniu składników lewej strony uzyskuje się:

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Analiza danych DRZEWA DECYZYJNE. Drzewa decyzyjne. Entropia. test 1 dopełnienie testu 1

Ewa Dziawgo Uniwersytet Mikołaja Kopernika w Toruniu. Analiza wrażliwości modelu wyceny opcji złożonych

Zajęcia 2. Estymacja i weryfikacja modelu ekonometrycznego

2.1 Zagadnienie Cauchy ego dla równania jednorodnego. = f(x, t) dla x R, t > 0, (2.1)

PROGNOZOWANIE BRAKUJĄCYCH DANYCH DLA SZEREGÓW O WYSOKIEJ CZĘSTOTLIWOŚCI OCZYSZCZONYCH Z SEZONOWOŚCI

Estymacja stopy NAIRU dla Polski *

Alicja Ganczarek Akademia Ekonomiczna w Katowicach. Analiza niezależności przekroczeń VaR na wybranym segmencie rynku energii

PROGNOZOWANIE ZUŻYCIA CIEPŁEJ I ZIMNEJ WODY W SPÓŁDZIELCZYCH ZASOBACH MIESZKANIOWYCH

Porównanie jakości nieliniowych modeli ekonometrycznych na podstawie testów trafności prognoz

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

MODELE AUTOREGRESYJNE JAKO INSTRUMENT ZARZĄDZANIA ZAPASAMI NA PRZYKŁADZIE ELEKTROWNI CIEPLNEJ

Integracja zmiennych Zmienna y

OeconomiA copernicana. Małgorzata Madrak-Grochowska, Mirosława Żurek Uniwersytet Mikołaja Kopernika w Toruniu

EFEKT DNIA TYGODNIA NA GIEŁDZIE PAPIERÓW WARTOŚCIOWYCH W WARSZAWIE WSTĘP

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

ZASTOSOWANIE TESTU PERRONA DO BADANIA PUNKTÓW ZWROTNYCH INDEKSÓW GIEŁDOWYCH: WIG, WIG20, MIDWIG I TECHWIG

MODELOWANIE FINANSOWYCH SZEREGÓW CZASOWYCH Z WARUNKOWĄ WARIANCJĄ. 1. Wstęp

Ruch płaski. Bryła w ruchu płaskim. (płaszczyzna kierująca) Punkty bryły o jednakowych prędkościach i przyspieszeniach. Prof.

Zarządzanie ryzykiem. Lista 3

Stanisław Cihcocki. Natalia Nehrebecka

MAKROEKONOMIA 2. Wykład 3. Dynamiczny model DAD/DAS, część 2. Dagmara Mycielska Joanna Siwińska - Gorzelak

Stały czy płynny? Model PVEC realnego kursu walutowego dla krajów Europy Środkowo-Wschodniej implikacje dla Polski

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

Stacjonarność Integracja. Integracja. Integracja

Transkrypt:

Meody analizy i prognozowania szeregów czasowych Wsęp 1. Modele szeregów czasowych 2. Modele ARMA i procedura Boxa-Jenkinsa 3. Modele rendów deerminisycznych i sochasycznych 4. Meody dekompozycji szeregów czasowych 5. Wybór meody dekompozycji szeregu czasowego dla eksporu Bibliografia

Wsęp W module ym zajmiemy się wywodzącą się ze saysyki jednowymiarową analizą dynamiki szeregów czasowych. W ego ypu analizach proces generujący dane saramy się odworzyć jedynie na podsawie przeszłych warości pojedynczego szeregu czasowego. Odgadnięcie w en sposób wzorca dynamiki nie jes prose, ale nie jes niemożliwe. Szczególnie, jeżeli proces sochasyczny jes ak zwanym procesem sacjonarnym, o do jego opisu wysarczy kilka podsawowych modeli szeregów czasowych. Najpierw pokażemy, jak uzyskać własność sacjonarności dla dowolnego szeregu czasowego. Nasępnie opiszemy, jak formalnie dokonać wyboru najlepszego modelu saysycznego dla szeregów sacjonarnych według meodologii Boxa i Jenkinsa. Zasosowanie ej popularnej meody dla modeli ARMA zaprezenujemy w pakiecie ekonomerycznym Grel. W kolejnym emacie omówimy dwie klasy modeli niesacjonarnych (ze względu na warość oczekiwaną i wariancję), zwanych modelami rendów deerminisycznych i sochasycznych. Nasępnie rozszerzymy analizę na meody dekompozycji szeregów czasowych, więcej miejsca poświęcając kolejnej ważnej składowej szeregów czasowych, jaką jes sezonowość. Na końcu zwrócimy uwagę, w jaki sposób użyć odpowiednio sformułowanych modeli w prognozowaniu na wiele okresów w przód i jak ocenić jakość akich prognoz.

1. Modele szeregów czasowych Uporządkowany względem czasu zbiór zmiennych losowych nazywany jes procesem sochasycznym (losowym, przypadkowym) {X }, a realizację ych zmiennych w kolejnych okresach lub momenach czasu nazywamy szeregiem czasowym 1. W przypadku szeregów saysycznych dla pojedynczych procesów ekonomicznych mamy do czynienia ze zmiennymi losowymi skokowymi, kórych realizacje obserwujemy w odsępach rocznych, kwaralnych, miesięcznych, dziennych id. Każda zaobserwowana warość szeregu czasowego jes jedną i jedyną realizacją konkrenej zmiennej losowej. Nie można ponownie zaobserwować realizacji ej samej zmiennej ekonomicznej, gdyż nie możemy jak w naukach przyrodniczych wykonać powórzenia eksperymenu w (niemalże) ych samych warunkach. Na ym polega rudność wnioskowania o zachowaniach podmioów gospodarczych w dziedzinie czasu. Z drugiej srony kolejne zmienne losowe X nie są jednak niezależne. Na podsawie realizacji zmiennej w okresie można coś powiedzieć o realizacji zmiennej w okresie + k. Oczywiście im silniejsze są e związki, ym ławiej będzie na ej podsawie o precyzyjną prognozę. Siłę, rwałość i charaker międzyokresowych zależności możemy badać za pomocą łącznego (wielowymiarowego) rozkładu zmiennej losowej 2. Meody ych badań (zarówno eoreycznych, jak i empirycznych) saysyczne w swojej naurze zyskały pod koniec XX wieku duże uznanie wśród ekonomisów 3. Wymagają one przyjęcia kilku użyecznych założeń, kóre wysępują pod posacią ypowych modeli analizy szeregów czasowych, z kórych kilka najważniejszych wysarcza do opisu podsawowych cech dynamiki większości ekonomicznych szeregów czasowych. Siłę związków i inercję procesów sochasycznych opisujemy za pomocą łącznego rozkładu zmiennych losowych i jego paramerów. Do podsawowych paramerów łącznego rozkładu wielowymiarowej zmiennej losowej należą: średnia (warość oczekiwana) E(X ), wariancja σ 2 (X) = var(x ) = E(X EX ) (X EX ), auokowariancja cov(x, X + k ) = E(X EX ) (X + k EX + k ). Waro zauważyć, że analizę można ograniczyć do warości oczekiwanej rozkładu i macierzy wariancji-kowariancji, gdyż wariancja o specjalny rodzaj auokowariancji. Dla k = 0 mamy bowiem cov(x, X ) = var(x ). Jeżeli wariancja procesu jes sała (var(x ) = var(x + k )), zamias auokowariancji wygodnie posługiwać się jej unormowanym odpowiednikiem, j. funkcją auokorelacji cov X, X k corr X, X k (ang. auocorrelaion funcion, sąd w dalej var X w ym module i w programie Grel użyo skróu ACF). Zauważmy, że dla k = 0 cov funkcja ACF przyjmuje warość 1, gdyż X, X corr X, X 1, a dla po- var X zosałych warości z przedziału (-1, 1). Ponado funkcja ACF jes funkcją symeryczną corr(x, X k ) = corr(x, X + k ), dlaego badamy ją ylko dla k > 0. W zależności od sposobu kszałowania się paramerów rozkładu możemy mówić o różnych ypach procesów i modeli je objaśniających, spośród kórych wyjaśnimy znaczenie i zasosowanie najważniejszych. Najpierw jednak omówimy ważne poję- 1 W lieraurze zamiennie używa się określeń proces sochasyczny i szereg czasowy lub mianem szeregu czasowego określa się szereg zmiennych losowych, a nie obserwacji. 2 Mimo określenia wielowymiarowy rozkład zmiennej losowej prognozę szeregu czasowego jedynie na podsawie jego przeszłych warości nazywamy jednowymiarową analizą szeregów czasowych (ang. univariae ime series analysis). 3 W 2003 roku za rozwój meod analizy ekonomicznych szeregów czasowych Rober Engle i Clive Granger dosali Nagrodę Nobla w dziedzinie ekonomii. 3

cie sacjonarności silnej i słabej oraz wyjaśnimy, dlaczego ma ono ak duże znaczenie w przewidywaniach przyszłych realizacji procesu sochasycznego. Proces ściśle (silnie) sacjonarny Proces generujący dane (sochasyczny) nazywamy ściśle (silnie) sacjonarnym, jeżeli łączny rozkład zmiennych losowych X jes idenyczny i niezmienny w czasie 4. Pojęcie sacjonarności w akiej formie jes mało użyeczne, ponieważ znajdywanie eoreycznych rozkładów zmiennych losowych zbliżonych do rozkładów empirycznych nie należy do ławych zagadnień i wymaga znajomości meod nieparamerycznej weryfikacji hipoez saysycznych. Dlaego proces sacjonarny definiujemy na ogół za pomocą paramerów jego rozkładów. Proces słabo sacjonarny Proces sochasyczny nazywamy słabo sacjonarnym, jeżeli można określić nasępujące jego paramery, kóre są sałe w czasie: warość oczekiwaną E(Y ) = µ, dla = 1, 2,...,, wariancję, kóra nie jes nieskończona var(y ) = σ 2 <, dla = 1, 2,...,, auokowariancję, kóra zależy jedynie od rzędu opóźnienia, czyli od ego, na ile odległe od siebie w czasie są obserwacje cov(y, Y + k ) = γ k, dla każdego i k 0. Pokażemy eraz schemaycznie, czym różnią się ypowe szeregi sacjonarne od szeregów niesacjonarnych. Rysunek 1 Szeregi niesacjonarne ze względu na warość oczekiwaną Rysunek 2 Szeregi niesacjonarne ze względu na wariancję 4 Bardziej formalnie proces sochasyczny jes silnie (ściśle) sacjonarny, jeżeli łączny rozkład dowolnego zbioru n obserwacji X 1, X 2, X n jes idenyczny z łącznym rozkładem X 1 + k, X 2 + k, X n + k dla wszyskich n i k (por. Maddala, 2006: 579). 4

Szeregi czasowe z rysunków 1 i 2 różnią się od szeregów z rysunku 3. Wszyskie szeregi z rysunków 1 3 ułożono w en sposób, aby szeregi po lewej sronie charakeryzowały się większą regularnością niż szeregi po prawej sronie. Szeregi niesacjonarne ze względu na warość oczekiwaną (rys. 1) charakeryzują się bardziej lub mniej regularnymi endencjami do jednokierunkowych zmian (wzrosu albo spadku). Takimi szeregami mogą być szeregi cen różnych dóbr i insrumenów finansowych. Szeregi niesacjonarne ze względu na wariancję cechuje duża zmienność oscylacji. Zmiany gwałowne (o dużej wariancji) mogą poprzedzać i być poprzedzone okresami spokojnego przebiegu (o małej zmienności). W innym przypadku wariancja szeregu może rosnąć w okresie bieżącym pod wpływem zmian z okresów poprzednich, co powoduje, że pojedyncze szoki mogą mieć długorwały wpływ na kszałowanie się szeregu. Takie własności mogą wykazywać szeregi sóp zwrou z inwesycji w akcje lub waluy. Dla ich kszałowania się ważną rolę odgrywają nasroje i oczekiwania inwesorów. Dla szeregów sacjonarnych z kolei ani ich warości oczekiwane, ani wariancje nie powinny wykazywać żadnych rwałych endencji zmian (por. rys. 3). Dlaego o ławiej je objaśniać meodami saysycznymi, a ich przebieg ławiej jes przewidywać. Rysunek 3 Szeregi sacjonarne Jeżeli mówimy o modelowaniu, esymacji i wykorzysaniu szeregów sacjonarnych w prognozowaniu, o mamy na myśli sacjonarność w sensie słabym. Dla zmiennej losowej o rozkładzie normalnym określenie słabej sacjonarności jes równoznaczne z pojęciem silnej sacjonarności. Dlaego, aby sprawdzić, czy proces o rozkładzie normalnym jes ściśle sacjonarny, wysarczy poznać podsawowe paramery jego rozkładu. Na ogół dokonujemy jedynie weryfikacji sałości paramerów wielowymiarowego rozkładu zmiennej losowej, a nie esujemy konkreną posać ego rozkładu. Weryfikację ę można przeprowadzić za pomocą analizy funkcji auokorelacji. Dla procesu sacjonarnego korelogram (wykres funkcji ACF) powinien wraz ze wzrosem rzędu opóźnień szybko zanikać. Przyjrzyjmy się na rysunkom 4 6, sprawdźmy, jak wygląda korelogram dla procesów, kórych realizacje przedsawiono wcześniej na rysunkach 1 3. Rysunek 4 Korelogram dla szeregów niesacjonarnych ze względu na warość oczekiwaną 5

Rysunek 5 Korelogram dla szeregów niesacjonarnych ze względu na wariancję Jak zaem widać na wykresach funkcji ACF (uzyskanych w programie Grel), dla procesów regularnych (z lewej srony) można dosrzec większą lub mniejszą regularność zmian funkcji auokorelacji wraz ze wzrosem wielkości opóźnień. Korelogramy dla procesów niesacjonarnych wykazują duże warości nawe dla dużych opóźnień (w sosunku do rozmiarów próby) i nie zanikają do zera. Przeciwnie dzieje się dla procesów sacjonarnych, dla kórych funkcja auokorelacji szybko zanika wraz ze wzrosem opóźnienia, a nasępnie oscyluje wokół zera. Meoda analizy korelogramu nie jes jednak doskonałym narzędziem odróżniania ych procesów. Pominiemy jednak omówienie najpopularniejszych esów niesacjonarności, j. esów pierwiasków jednoskowych (ADF) i esów sacjonarności (KPSS) 5. Szeregi sacjonarne wysępują jednak wśród zmiennych ekonomicznych w zdecydowanej mniejszości. Z ych powodów musimy nauczyć się sprowadzać szeregi niesacjonarne do posaci sacjonarnej. Z doychczasowej analizy wynika, że powinniśmy szukać niesacjonarności w poziomach (niesacjonarność ze względu na średnią) lub w zmienności szeregu (niesacjonarność ze względu na wariancję). Jeżeli znajdziemy akie rwałe endencje zmian w szeregu czasowym, o będziemy mogli sprawdzić, czy odchylenia poziomów badanego szeregu lub jego zmienności od rendu (w średniej lub wariancji) są sacjonarne. Rozumowanie akie leży u podsaw różnych meod eliminacji rendu z szeregu czasowego, zwanych meodami derendyzacji. Mogą ona polegać na esymacji rendu deerminisycznego (liniowego lub nieliniowego) i odjęciu od oryginalnego szeregu warości wynikającej z ego rendu. Bardziej popularnym sposobem eliminacji rendu jes policzenie pierwszych różnic dla szeregu czasowego. Jes o najczęściej używana meoda derendyzacji prowadząca do wyznaczania rendu sochasycznego. Pierwsze przyrosy szeregu należy w szczególności liczyć w syuacji, gdy badany szereg nie jes sacjonarny ze względu na jego wariancję. Innym, mniej popularnym sposobem jes zasosowanie różnych meod filracji (wygładzania) szeregu, zmierzających do ego, aby wyróżnić w nim część sysemayczną. Omówimy ich zasosowanie w jednym z nasępnych emaów ego modułu. Rysunek 6 Korelogram dla szeregów sacjonarnych 5 Ich opis można znaleźć w dobrym podręczniki współczesnej ekonomerii (por. Maddala, 2006; Osińska, 2006), a realizację w programie Grel. 6

W wyniku usunięcia rendu (dowolną z meod) możemy orzymać szereg sacjonarny w sensie słabym i dalsze modelowanie przebiega za pomocą meod odpowiednich dla szeregów sacjonarnych. Naszym zadaniem jes wówczas rozpoznanie wzorca zmienności pozosałej (sacjonarnej) składowej szeregu czasowego. W klasie modeli liniowych możemy badać en wzorzec za pomocą modeli ARMA (auoregresyjne modele średniej ruchomej). Ich wykorzysaniem zajmiemy się w nasępnym emacie. Isnieje jednak granica empirycznego poznania procesów sochasycznych (j. losowych). Tą granicą jes proces czyso losowy, zwany białym szumem. Uważa się, że jes on efekem działania wielu niezależnych zakłóceń, kórych źródeł ani kierunku wpływu nie porafimy wyjaśnić. Oo jak definiujemy aki proces: Proces czyso losowy ( biały szum ) Białym szumem (ang. whie noise) nazywamy słabo sacjonarny proces sochasyczny o auokowariancji (dla różnych okresów) równej zero (cov(y, Y + k ) = γ k dla k 0). Jes o zaem proces sacjonarny, kóry ma płaski korelogram. Biały szum może być realizacją ciągu zmiennych losowych o niezależnych i jednakowych rozkładach (np. o rozkładzie normalnym), dlaego czasem w skrócie oznaczamy en proces jako IID (ang. idenically and indepedenly disribued). Waro zwrócić uwagę, że przyjmując w meodzie najmniejszych kwadraów klasyczne założenia doyczące składnika losowego (warość oczekiwana równa 0, brak auokorelacji i heeroskedasyczności oraz nieskorelowanie ze zmiennymi objaśniającymi), zakładamy, że powinien on mieć właśnie cechy procesu czyso losowego. Obecnie podamy ylko podsawowe definicje liniowych procesów sacjonarnych, j. procesu auoregresyjnego (AR) i średniej ruchomej (MA), kóre są składowymi procesu ARMA, i określimy, kiedy opisują one sacjonarny proces generujący dane. Proces auoregresyjny rzędu p AR(p) Jes o proces generowany przez model liniowy, w kórym realizacja procesu w okresie bieżącym zależy od realizacji szeregu w p kolejnych okresach poprzednich i składnika losowego w okresie bieżącym: X 1X 1 2 X 2... p X p, gdzie jes IID (0, 2 ). Proces AR o proces z pamięcią o przeszłych realizacjach szeregu. Przez kolejne podsawienia X dla poprzednich okresów (np. dla X 1 = φ 1 X 2 + φ 2 X 3 + + φ p X (p + 1) + ε 1 ) możemy każdy proces auoregresyjny przedsawić w zależności od poprzednich warości procesu losowego. Na przykład dla procesu AR(1) orzymamy, że paramery przy kolejnych opóźnieniach dla składnika losowego zmieniają się jak warości kolejnych wyrazów ciągu geomerycznego: X 2 3 1 1 1 2 1 3 Dla φ 1 < 1 proces aki ma ę własność, że pojedynczy szok będzie miał coraz mniejszy wpływ na kolejne realizacje procesu, gdyż 1 1... 1 1 1 1. Taki proces AR nazywamy sacjonarnym. W ogólnym przypadku dla p > 1 pro- s s 1 3 2 ces AR(p) jes sacjonarny, jeżeli wszyskie pierwiaski (rozwiązania) wielomianu W(z) = 1 φ 1 z φ 2 z 2 + φ p z p są co do modułu większe od jedności. Wysarczy więc znaleźć wszyskie rozwiązania równania W(z) = 0, aby ocenić sacjonarność procesu generującego dane w modelu auoregresyjnym 6. Rząd procesu AR(p) rozpoznajemy przez analizę wykresu funkcji auokorelacji cząskowej (w skrócie PACF). Jes o odpowiednik funkcji auokorelacji (ACF), ale... 6 Pierwiaski ego wielomianu mogą być liczbami rzeczywisymi lub urojonymi, czyli w ogólnym przypadku z 0 = a + bi, gdzie i 2 = ( 1). Dlaego dla pierwiasków, kóre nie są liczbami rzeczywisymi (b 0) ineresuje nas odległość euklidesowa rozwiązania od począku układu współrzędnych, czyli pierwiasek kwadraowy z (a 2 + b 2 ). 7

mierzy korelację między kolejnymi opóźnieniami po wyeliminowaniu wpływu pośrednich opóźnień 7. Funkcja PACF dla procesu auoregresyjnego rzędu p posiada bowiem dokładnie p kolejnych dodanich lub ujemnych warości, a nasępnie przyjmuje warość zero. Z kolei korelogram procesu AR przyjmuje warości zbieżne wykładniczo do zera. Inaczej można powiedzieć, że są one kolejnymi wyrazami ciągu geomerycznego. Proces średniej ruchomej rzędu q MA(q) Jes o proces generowany przez model liniowy, w kórym realizacja procesu w okresie bieżącym zależy od realizacji składnika losowego w okresie bieżącym i w q kolejnych okresach poprzednich: X 1 1 2 2... q q, gdzie jes IID (0, ). 2 Proces MA o proces z pamięcią o przeszłych warościach składnika losowego (szoków). Przez kolejne podsawienia ε = X (θ ε + θ ε + + θ ε 1) każdy proces średniej ruchomej możemy przedsawić jako nieskończony proces auo- 1 1 1 2 2 3 q q regresyjny AR( ). Na przykład dla procesu MA(1) orzymamy, że paramery przy kolejnych opóźnieniach dla realizacji procesu zmieniają się jak warości kolejnych wyrazów ciągu geomerycznego: X 2 s 1 1X 1 1 X 2... 1X s 1 X s 1... s Proces MA, kóry da się sprowadzić do sacjonarnego procesu auoregresyjnego nazywamy odwracalnym. Warunek odwracalności procesu MA(1) mówi, że θ 1 < 1. W ogólnym przypadku należy rozparywać, czy pierwiaski wielomianu W(z) = 1 + θ 1 z + θ 2 z 2 + + θ p z p leżą poza kołem jednoskowym. Rząd procesu MA(q) rozpoznajemy przez analizę wykresu funkcji auokorelacji (korelogramu, czyli ACF). Funkcja ACF dla procesu średniej ruchomej rzędu q posiada bowiem dokładnie q kolejnych dodanich lub ujemnych warości, a nasępnie przyjmuje warość zero. Z kolei funkcja PACF procesu MA przyjmuje warości wykładniczo zbieżne do zera. Pozosałe własności szeregów AR i MA omówimy w nasępnym emacie. Uzyskanie w rezulacie derendyzacji, dekompozycji lub/i meod AR i MA składnika losowego idenycznego z procesem białego szumu jes powierdzeniem, że analiza szeregu czasowego jednej zmiennej zosała zakończona. Oznacza o, że nie możemy wydzielić żadnych innych ważnych składowych procesu (zarówno sacjonarnych, jak i niesacjonarnych), a o, co pozosało ma charaker czyso losowy. 7 Dlaego dla rzędu opóźnienia 1 funkcje ACF i PACF mają równe warości. 8

2. Modele ARMA i procedura Boxa-Jenkinsa Dla szeregu sacjonarnego zamias sosować oddzielnie modele klasy AR i modele klasy MA do opisu powiązań między obserwacjami z kolejnych okresów wykorzysuje się modele auoregresyjne średniej ruchomej, czyli modele ARMA o rzędzie opóźnień (p,q). Proces generujący dane dla ARMA(p,q) ma wówczas posać: X X X... p X p 1 1 2 2... q 1 1 2 2 q, gdzie ε jes IID(0,σ 2 ). Dodając do modelu AR składniki MA (θ s ε s ), możemy uzyskać dużą redukcję wielkości rzędu opóźnień procesu generującego prognozy. Podobnie dla modelu MA użycie składników AR (φ s X s ) zmniejsza wielkość rzędu opóźnień wymaganą do pełnego opisu dynamiki szeregu. W rezulacie za pomocą mniejszej liczby składników AR i MA niż oddzielnie dla modelu AR i modelu MA można opisać dowolny liniowy proces sacjonarny, co jes korzysne z punku widzenia możliwości esymacji modelu i jego wykorzysania w prognozowaniu. Proces ARMA zawiera zarówno cechy procesu AR i MA, co najławiej dosrzec na korelogramie. Model ARMA generuje proces sacjonarny, jeżeli jego składowymi jes model sacjonarny AR i odwracalny MA. Należy pamięać, że celem poszukiwań użyecznego modelu prognosycznego nie jes użycie jak największej liczby paramerów, kóre jak najdokładniej opiszą zmienność szeregu czasowego. Wraz ze wzrosem liczby paramerów spada przecież liczba sopni swobody i osłabia się moc sosowanych esów saysycznych (w ym esów isoności). Z kolei zby duże dopasowanie szeregu może objąć opis nie ylko części procesu zwanej sygnałem, ale i losowego szumu, dla kórego w skończonych próbach można doparywać się przypadkowych regularności. Celem poszukiwań jes raczej odkrycie akiego modelu, kóry za pomocą ograniczonej liczby saysycznie isonych paramerów opisze najważniejsze cechy badanego procesu sochasycznego. Taki model nazywa się w lieraurze modelem oszczędnie sparameryzowanym (ang. parsimonious). Wybór akiego modelu możemy wspomóc sosowaniem odpowiednich kryeriów, kóre dzięki odpowiednio sformułowanym wagom i funkcjom analiycznym łączą ocenę sopnia dopasowania modelu do danych empirycznych (najczęściej oparą na 1 T 2 błędzie sandardowym esymacji SEE e ) z koniecznością zachowania umiaru w liczbie użyych w modelu paramerów (K). Ponieważ dodawanie T K 1 nowych zmiennych objaśniających może prowadzić do uray warości informacyjnej modelu, wybieramy model o najmniejszej warości kryerium, czyli model, w kórym uraa informacji jes najmniejsza 8. Różne sysemy wag prowadzą do najpopularniejszych kryeriów, akich jak kryerium informacyjne Akaike (w skrócie AIC), kryerium bayesowskie Schwarza (SBIC lub BIC) oraz kryerium Hannana-Quinn (HQ). Na przykład pierwsze z nich można zapisać jako 9 : 8 Dodawanie nawe saysycznie nieisonych zmiennych objaśniających mogło zwiększać współczynnik deerminacji zarówno zwykły, jak i skorygowany. Dlaego e miary dopasowania nie są polecane w wyborze modeli szeregów czasowych do prognozowania. 9 Kryeria informacyjne mają różne reprezenacje w lieraurze (por. Brooks, 2002: 257; Osińska, 2006: 54). 9

AIC T ln ˆ 2 2K, 2 gdzie T oznacza liczbę obserwacji, ˆ kwadra sandardowego błędu esymacji SEE (dla dużych prób zbliżony do MSE), a K liczbę szacowanych paramerów. Różne kryeria informacyjne mogą prowadzić do wyboru modeli ARMA o różnych rzędach opóźnień p i q. Minimalizacja kryerium AIC prowadzi na ogół (w dużych próbach) do wyboru modelu ze zby dużą liczbą paramerów. Z kolei sosowanie kryerium SBIC daje większą niepewność (wariancję) w wyborze odpowiedniego modelu częściej daje nieprawidłowe oceny niż kryerium Akaike. Kryerium HQ jes czymś pomiędzy, daje więc pośrednie rezulay. Jak sprawdzić, czy udało się wyodrębnić wszyskie ważne składowe AR i MA i ocenić, czy błędy uzyskane w okresie ex pos dla modelu ARMA mają charaker procesu białoszumowego? Odpowiedzi na o pyanie poszukiwali Box i Jenkins już w laach 70. XX wieku. Podejście zaproponowane przez Boxa i Jenkinsa (por. Brooks, 2002) sprowadza się do realizacji nasępujących eapów: 1. Idenyfikacja procesu opara na analizie korelogramu. Sprawdzenia, czy kowariancje są równe zero dokonujemy na podsawie wykresu funkcji auokorelacji i auokorelacji cząskowej. Liczba począkowych i saysycznie isonych warości funkcji PACF świadczy o rzędzie składowej AR, a liczba saysycznie isonych warości funkcji ACF o rzędzie składowej MA. Jeżeli na wykresie korelogramu dosrzeżemy, że funkcja ACF nie jes szybko zbieżna do zera, o przyjmujemy, że proces X jes niesacjonarny. Proponuje się wówczas dokonać derendyzacji szeregu za pomocą różnicowania, czyli policzenia jego przyrosów (różnic): pierwszych X lub kolejnych na przykład drugich 2 X = X X 1. Nasępnie dokonujemy wyboru modelu ARMA dla ak zmodyfikowanego (zinegrowanego) szeregu 10. 2. Esymacja modelu ARMA(p,q) Może ona przebiegać zarówno meodą najmniejszych kwadraów, jak i meodą największej wiarygodności. Realizuje ją auomaycznie większość pakieów kompuerowych (w programie Grel za pomocą opcji Model/Szeregi czasowe/model ARIMA). 3. Diagnosyka modelu Odbywa się na dwa sposoby. Albo umyślnie wybieramy model ze zby dużą liczbą składowych AR i MA, a nasępnie go redukujemy przez eliminację najwyższych rzędów opóźnień lub/i nieisonych składowych. Nasępnie porównujemy modele: wyjściowy i zredukowany za pomocą omówionych kryeriów informacyjnych i wybieramy model oszczędniej sparameryzowany. Drugi sposób polega na zasosowaniu rzędów opóźnień p i q wybranych w pierwszym eapie i wszechsronnym sprawdzeniu resz modelu ARMA(p,q), m.in. za pomocą korelogramu. Przykład 1 Jedna z hipoez dla rynku giełdowego zakłada, że na efekywnym informacyjnie rynku nie można w długim okresie osiągać sóp zwrou wyższych od przecięnej. Powierdzeniem ej hipoezy są losowo układające się sopy zwrou z indeksu giełdowego, kórych nie można w sposób sensowny przewidzieć. To znaczy, że przeszłe obserwacje nic nie mówią o przyszłych realizacjach procesu. Jednym słowem, dzienne sopy zwrou z indeksu giełdowego nie powinny wykazywać auokorelacji. Sprawdźmy, czy aka hipoez mogła być prawdziwa na Warszawskiej Giełdzie Papierów Warościowych w 1996 roku. Sawiamy zaem pyanie, czy są mocne podsawy, aby wierdzić, że sopy zwrou z indeksu giełdowego były czyso losowe. Aby dokonać niezbędnych obliczeń, wczyujemy do Grela dane zaware w pliku WIG20.xls. Definiujemy srukurę danych (opcja Dane/Srukura danych) jako szereg czasowy o częsoliwości dziennej (5 dni w ygodniu), rozpoczynający się w dowolnym dniu 11. 10 Przyrosy akie prowadzą do sacjonarności większości szeregów, a modele dla nich sformułowane nazywają się zinegrowanymi procesami ARMA (w skrócie ARIMA). 11 Kalendarz Grela i ak nie uwzględnia wolnych dni w Polsce, więc prawdziwe day nie będą przydane. 10

Nasępnie liczymy zwykłe sopy zwrou z szeregu WIG, korzysając z opcji Dodawanie zmiennych/pierwsze różnice dla wybranych zmiennych. Poem definiujemy nową zmienną rwig (dzienna sopa zwrou z indeksu), w okienku dialogowym wpisując rwig =d_wig/wig(-1) 12. Na wykresie (rys. 7) sopy zwrou (250 obserwacji dziennych) wyglądają na sacjonarny proces losowy, w kórym można jednak dosrzec pewne prawidłowości. Rysunek 7 Dzienne sopy zwrou z indeksu WIG20 w 1996 roku Zgodnie z meodologią Boxa i Jenkinsa decydujemy się na konsrukcję korelogramu dla szeregu sóp zwrou (korelogram wybieramy, klikając prawym przyciskiem myszy w wybraną serię). Rysunek 8 prezenuje kszałowanie się funkcji ACF i PACF dla kolejnych opóźnień. Rysunek 8 Dzienne sopy zwrou z indeksu WIG20 w 1996 roku Jak widać na korelogramie, z wyjąkiem opóźnienia o jeden okres dla funkcji ACF, jak i dla PACF, warości współczynników wzajemnej i cząskowej auokorelacji są pomijalnie małe. Poziome niebieskie linie wyznaczają bowiem 95-procenowe przedziały ufności worzone na podsawie założenia, że współczynniki korelacji mają rozkład normalny. Wniosek o isoności opóźnień do pierwszego rzędu włącznie powierdzają również rzy gwiazdki w oknie korelogram, oznaczające graniczny poziom isoności mniejszy lub równy 1%. Dla wyższych rzędów opóźnień wysępują najwyżej dwie gwiazdki, oznaczające poziom 5%. Zgodnie z podejściem Boxa-Jenkinsa powinniśmy albo wybrać model ARMA(1,1) i sprawdzić jego reszy, albo wybrać model o większej liczbie paramerów ARMA(2,2) i sopniowo go redukować, porównując kryeria informacyjne (AIC lub BIC). Esymację modelu ARMA i wybór rzędu opóźnień dokonuje się za pomocą opcji Model/Szeregi czasowe/model ARIMA. Na przykład dla modelu ARMA(2,2) wybieramy w oknie dialo- 12 Logarymiczne sopy zwrou można było uzyskać w jednym eapie, wybierając z opcji dodawanie zmiennych/przyrosy logarymów dla wybranych zmiennych. 11

gowym rząd AR: 2, Różnice: 0 i rząd MA: 2 oraz wyłączamy opcję wyraz wolny. Jako zmienną objaśnianą wybieramy rwig, pomijamy wybór zmiennych zależnych. Dobór meody esymacji nie powinien mieć większego znaczenia dla uzyskanych wyników. Sposób I. Tesujemy reszy modelu ARMA(1,1) W wyniku esymacji orzymujemy model z nieisonym składnikiem średniej ruchomej. W zasadzie na ym moglibyśmy zakończyć weryfikację modelu w ym podejściu, ale spróbujemy jeszcze sprawdzić inne własności resz akiego modelu. Najpierw wybieramy es normalności. Przy niskim poziomie isoności (1,5%) es Jarque-Bera wskazuje, że rozkład resz znacząco odbiega od rozkładu normalnego. Po zapisaniu resz jako oddzielnej serii (opcja Zapisz/reszy) możemy sprawdzić ich korelogram. Mimo że jes on całkiem płaski, o obecność nieisonego składnika MA i reszy odbiegające od rozkładu normalnego każą parzeć podejrzliwie na ak wyspecyfikowany model. Sposób II. Celowa nadmierna parameryzacja Tym razem zaczynamy od modelu na pewno zby dużego ARMA(2,2) i redukujemy go, eliminując saysycznie nieisone składowe. Ich eliminowanie przebiega w usalonej kolejności od składowej najmniej saysycznie isonej. W wyniku redukcji orzymano modele: ARMA(2,2) brak saysycznie isonych składników AR i MA, najmniej isona MA(2) AIC=-1370,82, BIC=-1353,23, wszyskie pierwiaski leżą poza kołem jednoskowym ARMA(2,1) jedynie AR(1) saysycznie isone na poziomie 7,9%, usuwamy AR(2) AIC=-1372,55, BIC=-1358,48, wszyskie pierwiaski leżą poza kołem jednoskowym ARMA(1,1) jedynie AR(1) saysycznie isone na poziomie 8,5%, usuwamy MA(1) AIC=-1374,16, BIC=-1363,61, wszyskie pierwiaski leżą poza kołem jednoskowym ARMA(1,0)=AR(1) saysycznie isony składnik AR na poziomie mniejszym niż 0,001% AIC=-1375,95, BIC=-1368,91, proces sacjonarny W rakcie posępowania nieusannie zmniejszały się warości obydwu kryeriów informacyjnych. Nie ma wąpliwości, że model AR(1): x = 0,304x 1 + ε najlepiej opisuje dynamikę szeregu. Co prawda nie ma podsaw do wnioskowania o normalności rozkładu resz, ale korelogram procesu reszowego wygląda poprawnie, zn. jes płaski. Zaem wbrew hipoezie rynku informacyjnie efekywnego, sopy zwrou z indeksu WIG nie układają się w sposób czyso losowy. W ogólnym przypadku posępowanie Boxa i Jenkinsa może prowadzić do różnych wyników w zależności od przyjęego sposobu wyboru modelu i rodzaju kryerium informacyjnego, kóre jes minimalizowane. W kolejnym emacie omówimy niesacjonarne modele szeregów czasowych, kóre służą do opisu kszałowania się empirycznych szeregów czasowych, oraz meody służące do oceny ich jakości saysycznej. 12

3. Modele rendów deerminisycznych i sochasycznych W dynamice wielu niesacjonarnych szeregów czasowych kursów waluowych, sóp procenowych, kursów akcji wyróżniamy względnie regularne zmiany jednokierunkowe i różnokierunkowe wahania nieregularne (losowe, przypadkowe). Waro oddzielić zmiany sysemayczne szeregu czasowego związane z endencją rozwojową (rendem) od zmian o charakerze przypadkowym. Oddzielanie od siebie ych składowych nie jes zadaniem ławym, gdyż możliwa jes inerakcja składnika losowego ze zmianami regularnymi. Wyróżniamy w zasadzie dwie skrajne syuacje: 1. Trend deerminisyczny. Składnik losowy jes niezależny od endencji rozwojowej. Szereg czasowy kszałuje się wokół zmiennego w czasie poziomu średniego, kóry można odworzyć za pomocą deerminisycznych funkcji czasu y* = f() o różnej posaci analiycznej. Czyso losowe odchylenia od ego poziomu są dołączane addyywnie (y = y* + ε ) lub muliplikaywnie (y = y* ε ) i nie wpływają na realizację funkcji rendu w bieżącym ani w kolejnych okresach. Dla szeregów czasowych jes szucznie skonsruowaną zmienną reprezenującą upływ czasu. Najczęściej za przyjmujemy numery kolejnych obserwacji w próbie, j. = 1, 2,, T. W najprosszej posaci model, kórego paramery srukuralne należy oszacować, przyjmuje posać funkcji liniowej y = α 0 + α 1 + ε, gdzie ε jes procesem białego szumu. Prognozę na dowolny okres T + k wyznaczamy według formuły na warość eoreyczną: y T * ˆ ˆ k 0 1( T k), gdzie ˆ 0 i ˆ 1 są ocenami paramerów srukuralnych uzyskanymi meodą najmniejszych kwadraów (MNK). Kolejne prognozy różnią się dla rendu liniowego o sałą * warość y * ˆ T k yt k 1 1. Proces en nie jes zaem sacjonarny ze względu na warość oczekiwaną. 2. Trend sochasyczny. Składnik losowy ma wpływ na kszałowanie się rendu. Szereg niesacjonarny można wówczas zapisać za pomocą niesacjonarnego modelu auoregresji. W najprosszej wersji rend sochasyczny przyjmuje posać procesu auoregresyjnego pierwszego rzędu AR(1): X = βx 1 + ε dla β 1, gdzie ε jes IID(0,σ 2 ). Podsawiając X 1 = βx 2 + ε 1, orzymujemy X = β(βx 2 + ε 1 ), co obrazuje jak składniki losowe z poprzednich okresów wpływają na sysemayczną część procesu w okresie. Prognozę ex pos na dowolny okres T + k wyznaczamy według formuły: x ˆ * T k xt k 1, gdzie ˆ jes oceną parameru srukuralnego modelu AR(1). W prognozie ex ane zasępujemy nieznane warości dla opóźnionej zmiennej objaśnianej x T + k 1 prognozami uzyskanymi w poprzedniej * * ieracji na podsawie równania: x ˆ T k xt k 1. Kolejne prognozy przyrasają dla procesu AR(1) w porównaniu do osaniej warości zmiennej x T + k 1 (dla prognoz ex pos) lub w sosunku do osaniej prognozy zmiennej x ˆT k 1 (dla prognoz ex ane) o sały procen ˆ 1 (np. dla ˆ 1, 05 o 5%). Trend sochasyczny może być zaem niesacjonarny ze względu na warość oczekiwaną. Jedynie dla granicznej warości β = 1 warość oczekiwana procesu nie zmienia się 13. Wówczas jednak proces nadal pozosaje niesacjonarny ze względu na wariancję. Pokażemy o eraz dla warości granicznej (β = 1) procesu AR(1). Formuła określająca kolejne warości zmiennych losowych ogranicza się wówczas do X = X 1 + ε, gdzie ε jes IID(0,σ 2 ), a aki proces nazywamy procesem błądzenia przypadkowego (ang. random walk). Wariancja ego procesu wynosi: var(x ) = σ 2, gdyż 13 Niekórzy auorzy (Maddala, 2006) definiują jedynie rend sochasyczny jako graniczny przypadek procesu auoregresyjnego dla β = 1, rakując wybuchowe przypadki procesu auoregresyjnego (dla β > 1) jako mało prawdopodobne. 13

X X o 1 jes sumą niezależnych składników losowych o skończonej wariancji. Trend wysępujący w wariancji procesu świadczy o ym, że nie jes o proces sacjonarny ze względu na wariancję. Jak się okazuje, prosym remedium na aką niesacjonarność jes policzenie pierwszych przyrosów dla zmiennych X = X X 1 = ε, gdyż var( X ) = σ 2 = cons. Proces błądzenia losowego jes więc przyrososacjonarny, ponieważ policzenie dla niego pierwszych różnic czyni go sacjonarnym w słabym sensie. Składową związaną z rendem deerminisycznym możemy wyodrębnić przez regresję zmiennej względem czasu. Precyzyjne usalenie analiycznej posaci funkcji y = f( ) opisującej rend badanego zjawiska częso nie jes prose. Trendy mogą być wzrosowe lub spadkowe, króko- lub długookresowe, liniowe i nieliniowe. Mając do dyspozycji obserwacje zmiennej, możemy przeprowadzić ich analizę graficzną. Polega ona na obserwacji, jak układają się warości empiryczne prognozowanej zmiennej. Jeśli punky na wykresie układają się w przybliżeniu w kszał wykresu znanej funkcji, o na ej podsawie możemy zaproponować wsępnie jej posać analiyczną jako opisującą kszałowanie się badanego zjawiska. Funkcja opisująca endencję rozwojową może być funkcją liniową (gdy przyrosy są sałe), kwadraową, wielomianem rzeciego sopnia, poęgową, logarymiczną, wykładniczą, odwronościową ip. Aby oszacować paramery srukuralne wybranej funkcji meodą najmniejszych kwadraów, należy pamięać, że funkcja a musi być liniowa względem paramerów lub do akiej dać się sprowadzić przez ransformację (np. przez policzenie logarymów z obu sron równania dla funkcji poęgowej, logarymicznej i wykładniczej lub przez inne podsawianie dla pozosałych funkcji). Prognozowanie na podsawie oszacowanej funkcji jes banalne, gdyż sprowadza się do podsawienia w miejsce odpowiedniej warości równej kolejnemu numerowi obserwacji. Pokażemy o na przykładzie. Przykład 2 Rozważmy szereg obserwacji oprocenowania kredyów mieszkaniowych. Wykres kszałowania się ej zmiennej prezenuje rysunek 9: Analizując wykres ego szeregu, widzimy, że charakeryzuje się on endencją spadkową. Zauważyć również można, że spadki w poszczególnych okresach nie są sobie równe, lecz są coraz mniejsze. O akiej funkcji powiemy, że charakeryzuje się malejącym empem spadku. W akim przypadku przyjęcie funkcji liniowej jako Rysunek 9 Sopa oprocenowania kredyów mieszkaniowych od sycznia 2005 do października 2006 14

aproksymany zmian warości szeregu może okazać się obarczone dużym błędem. Sprawdźmy, jakie orzymamy wówczas warości prognoz. W celu dokonania prognoz na podsawie liniowego modelu endencji rozwojowej należy oszacować paramery srukuralne funkcji y = α 0 + α 1 + ε. Esymacji możemy dokonać, wykorzysując opcję Regresja w pakiecie MS Excel (o nazwie Analysis Toolpak) (Narzędzia/Analiza danych/regresja) lub dowolny program do esymacji (polecany pakie Grel auorswa Corella insalacja na sronie hp://www.kufel.orun.pl, opis w podręczniku T. Kufla, 2004). Wyniki uzyskane w Excelu znajdują się w pliku przykl_rend.xls w arkuszu reg lin. Prognoz dokonujemy, wsawiając w miejsce rendu kolejne numery obserwacji. Wyniki obliczeń znajdują się w arkuszu 1 oraz prezenowane są na poniższym wykresie. Z uwagi na o, że kolejne przyrosy zmiennej nie są sałe, a szereg prognoz nie jes zbliżony (szczególnie w osanim okresie) do zaobserwowanych warości empirycznych zaproponujemy dwie kolejne posaci analiyczne funkcji rendu, j. rend logarymiczny y = β 0 + β 1 ln + ε i rend wielomianowy: y = γ 0 + γ 1 + γ 2 2 + ε. Funkcje e są liniowe względem paramerów po dokonaniu odpowiednich ransformacji, j. przez policzenie logarymu zmiennej objaśnianej dla funkcji logarymicznej oraz podsawienie 2 = 2 dla wielomianowego rendu. Wyniki esymacji znajdują się w pliku przykl_rend.xls w arkuszu reg log i reg wiel. Na podsawie oszacowanych posaci modelu możemy dokonać prognoz, podsawiając do równań yˆ 8,49 0,97 ln( ) oraz yˆ 8,47 0,32 0,009 kolejne numery obser- 2 wacji. W en sposób uzyskujemy również prognozy na przyszłe okresy (ex ane). Z porównania wykresów obydwóch prognoz (por. rys. 11) nie wynika, kóra z nich była lepsza w okresie ex pos. Wybór en jes isony dla wyniku prognozowania, ponieważ rend logarymiczny opisuje coraz wolniejszy spadek sopy procenowej w okresie ex ane, a rend wielomianowy odwrócenie endencji spadku sóp procenowych w połowie 2006 roku. Rysunek 10 Zesawienie warości rzeczywisych i prognozowanych na podsawie liniowego modelu rendu sopy oprocenowania kredyów mieszkaniowych 15

W arkuszu meody zosały policzone wygasłe błędy ex pos dla wszyskich meod rendu. Zarówno w przypadku miar precyzji RMSE, jak i MAPE błędy dla rendu liniowego są około dwa razy większe niż dla pozosałych meod (por. ab. 1). Jeszcze korzysniej wypada porównanie miar obciążenia dla prognoz nieliniowych, aczkolwiek obciążenie (w górę) również dla meody liniowej jes znikome (poniżej 0,5%). Spośród meod rendu nieliniowego niewiele bardziej precyzyjny i mniej obciążony jes rend wielomianowy. Prognozy ex pos według ej meody różniły się od warości empirycznych o ok. 2,2%, co w warościach bezwzględnych (według miar oparych na sumie kwadraów resz) sanowiło zaledwie 0,19 punku procenowego. Szereg jes jednak zby króki, aby określać jednoznacznie, kóry proces generujący dane jes odpowiedni do opisu zmian sóp kredyów mieszkaniowych. Trend liniowy Logarymiczny Wielomianowy RMSE (w punkach procenowych) 0,3787 0,1988 0,1910 MAPE (w %) 5,0989 2,4117 2,2027 MPE (w %) 0,2647 0,0778 0,0670 Rysunek 11 Zesawienie warości rzeczywisych i prognozowanych sóp oprocenowania kredyów na podsawie rendu logarymicznego i wielomianowego Tabela 1 Porównanie jakości prognoz wygasłych według różnych meod rendu Waro zauważyć, że do żadnego z omawianych modeli rendu nie można mieć dużych saysycznych zasrzeżeń. We wszyskich zmienne objaśniające rend okazały się saysycznie isone, a współczynniki deerminacji przekraczają 75%. Co więcej, różnice w sopniu objaśnienia zmienności sóp procenowych między modelami nieliniowymi (liczone współczynnikiem deerminacji) nie są znaczące (0,2 punku procenowego). To dlaego współczynnik R 2 nie jes polecany w przypadku oceny jakości prognoz dla szeregów niesacjonarnych. Oczywiście dla porównania modeli o różnej liczbie sopni swobody należy użyć współczynnika skorygowanego o liczbę sopni swobody (w Excelu nazywanego dopasowanym). Składową związaną z rendem sochasycznym rudno jes niekiedy wydzielić, gdyż w esymacji modeli auoregresyjnych napoykamy na wiele problemów, szczególnie związanych z esymacją paramerów akich modeli. Po pierwsze, nie ma dobrej 16

meody doboru rzędu opóźnień dla modelu auoregresyjnego AR(p), czyli maksymalnego opóźnienia p. Po drugie, wybór zby dużej liczby opóźnionych zmiennych objaśnianych prowadzi do problemów (przybliżonej) współliniowości. W rezulacie uzyskane paramery nie są precyzyjne, choć model może dawać dobre prognozy ex pos. Po rzecie, po prawej sronie w równaniach regresji wysępują opóźnione zmienne objaśniane. Są o zmienne losowe, kóre w przypadku wysokiej auokorelacji składników losowych w modelu, mogą powodować uraę zgodności esymaora KMNK. Szereg niesacjonarny może zawierać składowe związane zarówno z rendem deerminisycznym, jak i sochasycznym. Można je połączyć w jednym modelu: X X 1, 1. Jego odpowiednikiem dla procesu błądzenia losowego (gdy β = 1) jes ak zwany model błądzenia losowego z rendem (ang. random walk wih drif): X = µ + X 1 + ε. Kolejne warości akiego procesu różnią się, podobnie jak dla meody rendu liniowego, o sałą deerminisyczną warość µ i zmienny składnik losowy ε, gdyż X X 1 = µ + ε. Ten proces jednak jes niesacjonarny nie ylko ze względu na warość oczekiwaną (jak rend deerminisyczny), ale akże ze względu na wariancję. Niesacjonarne (ze względu na wariancję) zmienne objaśniana i objaśniająca są źródłem zespołu problemów we wnioskowaniu saysycznym, związanych z ak zwaną regresją pozorną. Eksperymeny numeryczne pokazały, że dobierając dowolne niesacjonarne szeregi czasowe generowane przez niepowiązane z sobą procesy błądzenia losowego, uzyskujemy częściej niż o saysycznie uzasadnione dobrze dopasowane modele o saysycznie isonych ocenach paramerów. Problemy z prawidłową oceną isoności opóźnionej zmiennej objaśnianej na podsawie rozkładu -Sudena sawiają pod znakiem zapyania użyeczność esu isoności w syuacji, gdy paramer auoregresji oscyluje wokół jedności. Częso wysępują wówczas problemy z usaleniem, czy mamy do czynienia z procesem błądzenia losowego, czy ze sacjonarnym procesem auoregresyjnym. Pokażemy o na przykładzie. Przykład 3 Wykres na rysunku 12 przedsawia miesięczny wolumen całkowiego eksporu owarów i usług z Polski do Unii Europejskiej w laach 1992 2002. Dane zosały uzyskane przez zamianę łańcuchowych indeksów wolumenu na indeksy jednopodsawowe (o podsawie w roku 1993). Dane wczyano do Grela i zapisano w posaci pliku ekspor.gd. Rysunek 12 Ekspor z Polski do Unii Europejskiej w cenach sałych Jak wynika z rysunku 12 szereg czasowy charakeryzuje się zarówno sysemaycznym wzrosem warości średniej, jak i wariancji (wzrasa ampliuda zmian). Deer- 17

minisyczna funkcja rendu, kóra mogłaby naśladować jego zachowanie, musiałaby mieć bardzo skomplikowaną posać analiyczną. Dlaego zdecydujemy się na sprawdzenie wysępowania rendu sochasycznego posaci X = βx 1 + ε, β 1. Po dodaniu opóźnionych zmiennych dla zmiennej exporeu (z menu Dodawanie zmiennych, wybór opcji opóźnienia dla wybranych zmiennych) esymujemy model wykorzysując opcję Model/Klasyczna meoda najmniejszych kwadraów. Ukazuje się nam wówczas nasępujące okno dialogowe: Aby uzyskać wybraną specyfikację, w powyższym oknie dialogowym należy wybrać model bez wyrazu wolnego (usuwamy sałą o symbolu cons) i dodać opóźnioną o jeden okres zmienną expor EU (symbol exporeu_1) poprzez opcję Opóźnienia/opóźnienia dla zmiennej zależnej: Model 1: Esymacja KMNK z wykorzysaniem 131 obserwacji 1992:02-2002:12 Zmienna zależna: exporeu Zmienna Współczynnik Błąd sand. Saysyka Warość p exporeu _ 1 0,994332 0,0160002 62,145 <0,00001 *** Tabela 2 Wyniki esymacji modelu AR(1) dla eksporu Polski do UE w laach 1992 2002 Srednia arymeyczna zmiennej zależnej = 187,634 Odchylenie sandardowe zmiennej zależnej = 77,856 Suma kwadraów resz = 175854 Błąd sandardowy resz = 36,7794 Wsp. deerminacji R-kwadra = 0,967435 Skorygowany wsp. R-kwadra = 0,967435 Saysyka F (1, 130) = 3861,99 (warość p < 0,00001) Saysyka esu Durbina-Wasona = 2,23079 Auokorelacja resz rzędu pierwszego = -0,117482 18

Ocena parameru β w ym modelu (zaznaczona w ab. 2 pogrubioną czcionką) nieznacznie różni się od jedności 14. A zaem isnieją silne saysyczne przesłanki, aby podejrzewać wysępowanie w zmiennej prognozowanej rendu sochasycznego (chociaż proces dla β < 1 jes sacjonarny). Jeżeli jednak do opóźnionej zmiennej objaśnianej dołączymy wyraz wolny (symbol cons w oknie dialogowym modelu), o również orzymamy model ze saysycznie isoną zmienną objaśniającą i wyrazem wolnym 15 : Xˆ 21,57 0,895X. 1 Model en zawiera zarówno oszacowany paramer rendu deerminisycznego (21,57), jak i sacjonarną część auoregresyjną. Czyelnikowi pozosawiamy sprawdzenie, że suma kwadraów i odchylenie sandardowe resz są wyższe dla drugiego modelu, mimo że skorygowany współczynnik deerminacji ego modelu jes dużo niższy (78,7% wobec 96,7%) 16. Model pierwszy jes oszczędniejszy pod względem liczby paramerów, kóre rzeba oszacować. Z wykorzysaniem większej liczby paramerów wiąże się spadek liczby sopni swobody, a z nim spadek jakości esów saysycznych, w ym zasadności wnioskowania o precyzji oszacowania paramerów srukuralnych modelu. O ym, kóry z ych modeli jes lepszy do formułowania prognoz muszą zaem zadecydować inne aspeky, o kórych powiemy w nasępnych emaach. Obydwie koncepcje rendu są konkurencyjne i w sosunku do obydwu powinniśmy zasosować inną meodę eliminacji rendu (derendyzacji). Analiza wykresu niesacjonarnego szeregu czasowego powinna pomóc w usaleniu zasady, jakiej podlega badany szereg. W pierwszym przypadku właściwe będzie odjęcie od warości empirycznych warości wynikających z rendu, gdyż proces en nie jes sacjonarny jedynie ze względu na średnią (czyli jes o proces rendosacjonarny). W drugim przypadku nie jes o wysarczające, gdyż proces nie jes sacjonarny ze względu na wariancję. Należy wówczas policzyć przyrosy zmiennych (jeżeli jes o proces przyrososacjonarny). W osaniej części ego modułu pokażemy, jakie mogą być konsekwencje nieprawidłowego doboru sposobu wyróżnienia rendu. Możemy je zaobserwować, analizując i porównując reszy dla różnych modeli w okresie próby. 14 Za pomocą esu liniowych resrykcji można sprawdzić, że nie ma podsaw do odrzucenia hipoezy β = 1. Wysarczy w opcji Tes liniowych resrykcji wpisać b[1] = 1. 15 Świadczą o ym wysokie co do warości bezwzględnej saysyki i niskie warości błędów pierwszego rodzaju w przypadku odrzucenia hipoezy o nieisoności zmiennej. W abelce Grela są o odpowiednio kolumny Saysyka i Warość p. 16 To kolejny dowód na o, żeby nie używać współczynnika deerminacji w ocenie jakości modelu. 19

4. Meody dekompozycji szeregów czasowych Szereg czasowy zawiera unikaowy wzorzec rozwoju procesu. Ten wzorzec zmian nazywamy dynamiką procesu. Wzorzec en bywa mniej lub bardziej regularny, gdyż składa się na niego regularny sygnał i zakłócający go szum (ang. noise). Uważa się, że zmiany sysemayczne (sanowiące sygnał) wywołane są przez ciągłe działanie zespołu przyczyn. Źródła ych zmian mogą być mniej lub bardziej rozpoznane. W prognozowaniu niesrukuralnym pozosają one poza zakresem zaineresowań prognosyka. Bardziej isona jes regularność zmian, kórą (dla szeregów sacjonarnych) moglibyśmy określić jako udział sygnału w całkowiej zmienności szeregu czasowego. Obok regularności równie ważna z punku widzenia przesłanek prognosycznych, a może nawe ważniejsza, jes rwałość zmian sysemaycznych. Trwałość możemy mierzyć, esując błędy prognoz, jakie model generuje w okresie ex pos. Dynamika procesu ujawnia różne ypy sygnałów. Niekóre z nich zosały zaprezenowane na wykresie szeregu czasowego na rysunkach 1 3 i omówione w poprzednich emaach. Z obserwacji realizacji procesu możemy wsępnie określić wzorzec jego rozwoju. Dokonujemy wówczas uogólnień, kóre w nauralny sposób pomagają porządkować obserwowane faky. Zadaniem prognosy jes rozpoznanie na podsawie analizy wykresu oraz zasad saysyki i dekompozycji szeregu czasowego, z jakim ypem zmian sysemaycznych mamy do czynienia, a nasępnie wykorzysanie ej wiedzy w formułowaniu prognozy. W dekompozycji szeregu czasowego dominują dwa podejścia. Pierwsze bardziej wymagające polega na ym, że formułujemy prawdopodobny model generujący dane (np. model rendu deerminisycznego lub sochasycznego) i dokonujemy jego weryfikacji w okresie próby (poniżej szczegółowo omówimy o podejście i zaprezenujemy jego aplikację dla danych empirycznych). Drugie podejście polega na wygładzeniu szeregu, co sprowadza się do odfilrowania z niego szumu i uzyskania sygnału jako pozosałej niobjaśnionej reszy. Ponieważ szum ma charaker różnokierunkowy, o do jego odfilrowania mogą służyć meody wygładzania uśredniające warości z kolejnych okresów (jak w modelach średniej ruchomej) lub wygładzające warości empiryczne z wykorzysaniem mechanizmu uczenia się na błędach (jak w modelach wygładzania wykładniczego). Nie będziemy omawiać ych meod, gdyż pokazaliśmy już zasosowanie najpopularniejszych z nich, j. meod średniej ruchomej (przykład 5 i 6 z modułu 2) i wygładzania wykładniczego (przykład 8 i 9 z moduł 2) 17. Niekóre z ych modeli nie uwzględniają ponado wahań okresowych (periodycznych), co czyni je nieużyecznymi w przypadku wysąpienia sezonowości. W analizie wahań sezonowych obok meody wygładzania wykładniczego (model Winersa) proponowana jes meoda wskaźników (por. Cieślak, 1996: 104 i nas.). Mimo że jes ona reklamowana jako meoda najpopularniejsza, o ma jedną podsawową wadę przeprowadza dekompozycję przez sopniowe eliminowanie poszczególnych składowych. Tymczasem ze względu na możliwe inerakcje między składowymi szeregu czasowego bardziej ineresujące są meody umożliwiające wyróżnianie różnych rodzajów wahań regularnych jednocześnie, czyli meody opare na zasadach modelowania ekonomerycznego. Meody e pozwalają jednocześnie oszacować poszczególne regular- 17 Uwaga! Jeżeli sosujemy meodę średniej ruchomej w dekompozycji szeregu niesacjonarnego ze względu na warość średnią, o dla właściwego zobrazowania rendu należy użyć scenrowanej średniej ruchomej, a jeżeli sosujemy wygładzanie wykładnicze, o powinniśmy sosować model uwzględniający w swojej konsrukcji rend (np. model Hola lub Winersa). 20

ne składowe szeregu czasowego, ale wymagają przyjęcia szeregu upraszczających założeń. Korzysając z meod ekonomerycznych, możemy w nasępujący sposób wyróżnić poszczególne rodzaje wahań dla szeregów czasowych: 1. Trend (składowa T) Analizując dane, mówimy, że warości szeregu sysemaycznie rosły lub zmniejszały się w obrębie próby, mając na myśli zaobserwowaną długorwałą endencję i kierunek zmian. W akich syuacjach wykorzysujemy omówione w poprzednim emacie modele rendu deerminisycznego lub sochasycznego. W zależności od rodzaju zaobserwowanych wahań w modelowaniu ekonomerycznym sosujemy szuczną zmienną. 2. Wahania sezonowe (S) Prawidłowości saramy się również odnaleźć w zachowaniu procesów w powarzających się w sposób regularny podokresach, zw. sezonach. Takie regularne powracanie szeregu do ych samych warości w określonych kalendarzowo powarzalnych podokresach nazywamy wahaniami sezonowymi. Sezony mogą doyczyć zarówno okresów powarzalnych w corocznych odsępach (dla miesięcy, pór roku czy kwarałów), w odsępie miesiąca i ygodnia (odpowiednio dla dni miesiąca i ygodnia), a nawe dla danych o wysokiej częsoliwości w każdym dniu, godzinie czy minucie. Sezonowością roczną charakeryzuje się sprzedaż wielu owarów konsumpcyjnych i ich ceny. W cyklach miesięcznych kszałują się ceny na rynku pieniężnym (zw. efek końca miesiąca). W ciągu ygodnia może regularnie zmieniać się zaporzebowanie klienów na goówkę w kasach banku. Akywność rynku giełdowego może również podlegać sysemaycznym zmianom w ciągu dnia w rakcie sesji giełdowej, kóra rwa na Giełdzie Papierów Warościowych w Warszawie od 9.00 do 15.30. Podobnie jak dla modeli rendu wyróżniamy zmiany sezonowe, kóre nie są zależne od składnika losowego (deerminisyczna sezonowość), oraz zmiany sezonowe, kóre zależą od wahań przypadkowych (sochasyczna sezonowość). W pierwszym przypadku w modelowaniu wykorzysujemy zmienne zerojedynkowe. Na przykład dla danych kwaralnych liniowe i sałe efeky sezonowe możemy opisać za pomocą nasępującego modelu: y Z Z Z..., 0 1 1 2 2 3 3 4 4 Z gdzie y zmienna objaśniana, Z j zmienne zerojedynkowe przyjmujące warość 1 w j-ym kwarale każdego roku, a w pozosałych warość 0, w specyfikacji pominięo pozosałe zmienne objaśniające. Paramery β j mierzyłyby wówczas sałe efeky sezonowe dla j-ego kwarału, czyli różnice poziomów analizowanego zjawiska w kolejnych kwarałach w sosunku do warości średniej wyznaczonej przez model. Aby oszacować aki model za pomocą MNK, należy w nim pominąć wyraz wolny ze względu na o, że jes on liniową kombinacją wszyskich sezonowych zmiennych zerojedynkowych. Alernaywnie w modelu z wyrazem wolnym należy pominąć jedną ze zmiennych zerojedynkowych, co dla danych kwaralnych może prowadzić do modelu posaci: y Z Z.... 0 1 1 2 2 3 3 Z Wedy jednak oszacowane paramery δ i informują o wielkości sałych efeków sezonowych w sosunku do pominięego kwarału (uaj w porównaniu do czwarego kwarału). Na podsawie uzyskanych ocen możemy znaleźć odchylenia od przecięnej kwaralnej wielkości zjawiska, sosując nasępujące przeliczenia: 21