ANALIZA I PROGNOZOWANIE SZEREGÓW CZASOWYCH Z PROGRAMEM SAS



Podobne dokumenty
3. Modele tendencji czasowej w prognozowaniu

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

MODELOWANIE POLSKIEJ GOSPODARKI Z PAKIETEM R Michał Rubaszek

3. Analiza własności szeregu czasowego i wybór typu modelu

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Ćwiczenie 5 PROGNOZOWANIE

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Ekonometria dynamiczna i finansowa Kod przedmiotu

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

Regresja linearyzowalna

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

INSTRUMENTY POCHODNE ARKUSZ DO SYMULACJI STRATEGII INWESTYCYJNYCH. Instrukcja obsługi

Wykład 2: Arkusz danych w programie STATISTICA

Arkadiusz Manikowski Zbigniew Tarapata. Prognozowanie i symulacja rozwoju przedsiębiorstw

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Analiza dynamiki zjawisk STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Wykład 5: Statystyki opisowe (część 2)

Analiza metod prognozowania kursów akcji

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

Wykład 5: Analiza dynamiki szeregów czasowych

Analiza zależności liniowych

METODY ILOŚCIOWE W ZARZĄDZANIU

Sposoby opisu i modelowania zakłóceń kanałowych

7.4 Automatyczne stawianie prognoz

Dopasowywanie modelu do danych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Etapy modelowania ekonometrycznego

Analiza autokorelacji

Instrukcja obsługi programu Do-Exp

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Wykład 4: Statystyki opisowe (część 1)

Typ szkoły: ZASADNICZA SZKOŁA ZAWODOWA Rok szkolny 2015/2016 Zawód: FRYZJER, CUKIERNIK, PIEKARZ, SPRZEDAWCA, FOTOGRAF i inne zawody.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Metody Ilościowe w Socjologii

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Po co w ogóle prognozujemy?

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

Analiza korespondencji

Sylabus Formularz opisu przedmiotu (formularz sylabusa) dla studiów I i II stopnia 1 wypełnia koordynator przedmiotu

PRZEWODNIK PO PRZEDMIOCIE

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

2) R stosuje w obliczeniach wzór na logarytm potęgi oraz wzór na zamianę podstawy logarytmu.

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

(x j x)(y j ȳ) r xy =

Zajęcia 1. Statystyki opisowe

Egzamin / zaliczenie na ocenę*

Prognozowanie popytu. mgr inż. Michał Adamczak

Indeksy dynamiki (o stałej i zmiennej podstawie)

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Brunon R. Górecki. Ekonometria. podstawy teorii i praktyki. Wydawnictwo Key Text

Kolumna Zeszyt Komórka Wiersz Tabela arkusza Zakładki arkuszy

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

PRZEWODNIK PO PRZEDMIOCIE. Statystyka opisowa. Zarządzanie. niestacjonarne. I stopnia. dr Agnieszka Strzelecka. ogólnoakademicki.

Wprowadzenie do szeregów czasowych i modelu ARIMA

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

5. Model sezonowości i autoregresji zmiennej prognozowanej

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Liniowy model ekonometryczny Metoda najmniejszych kwadratów Laboratorium 1.

Analiza Statystyczna

ZESTAW 1 SAS 4GL. Język stworzony na potrzeby przetwarzania dużych zbiorów danych. Składają się nań:

etrader Pekao Podręcznik użytkownika Portfel inwestycyjny

SCENARIUSZ LEKCJI: TEMAT LEKCJI: Postać kanoniczna funkcji kwadratowej. Interpretacja danych w arkuszu kalkulacyjnym

Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych klasa druga zakres rozszerzony

Recenzja rozprawy doktorskiej mgr Pradeep Kumar pt. The Determinants of Foreign

5.5. Wybieranie informacji z bazy

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Przykład 1 ceny mieszkań

Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

STATYSTYKA EKONOMICZNA

Tworzenie prezentacji, PowerPoint

Sterowanie wielkością zamówienia w Excelu - cz. 3

Nowy interfejs w wersji 11.0 C8 BETA

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE. Nie dotyczy. podstawowy i kierunkowy

Analiza składowych głównych. Wprowadzenie

Ekonomia II stopień ogólnoakademicki. stacjonarne wszystkie Katedra Matematyki Dr hab. Artur Maciąg. podstawowy. obowiązkowy polski.

Budowa argumentacji bezpieczeństwa z użyciem NOR-STA Instrukcja krok po kroku

A.Światkowski. Wroclaw University of Economics. Working paper

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB

Ekonometria i prognozowanie Econometrics and prediction

Podręczna pomoc Microsoft Power Point 2007

2 INSTALACJA OPROGRAMOWANIA. 3 3 GŁÓWNE OKNO PROGRAMU 3 4 MODUŁ OBSŁUGI ARCHIWUM 7

Następnie przypominamy (dla części studentów wprowadzamy) podstawowe pojęcia opisujące funkcje na poziomie rysunków i objaśnień.

SYLABUS. 4.Studia Kierunek studiów/specjalność Poziom kształcenia Forma studiów Ekonomia Studia pierwszego stopnia Studia stacjonarne i niestacjonarne

Transkrypt:

ANALIZA I PROGNOZOWANIE SZEREGÓW CZASOWYCH Z PROGRAMEM SAS

STANISŁAW ŁOBEJKO KAROLINA MASŁOWSKA RAFAŁ WOJDAN ANALIZA I PROGNOZOWANIE SZEREGÓW CZASOWYCH Z PROGRAMEM SAS redakcja naukowa STANISŁAW ŁOBEJKO OFICYNA WYDAWNICZA SZKOŁA GŁÓWNA HANDLOWA W WARSZAWIE WARSZAWA 2015

Stanisław Łobejko rozdziały: 1, 9 Karolina Masłowska rozdziały: 2, 4, 5 Rafał Wojdan rozdziały: 2, 3, 6, 7, 8 Recenzent Joanicjusz Nazarko Redaktor Danuta Dąbowska Copyright by Stanisław Łobejko, Karolina Masłowska, Rafał Wojdan & Szkoła Główna Handlowa w Warszawie, Warszawa 2014 Wszelkie prawa zastrzeżone. Kopiowanie, przedrukowywanie i rozpowszechnianie całości lub fragmentów niniejszej publikacji bez zgody wydawcy zabronione. Wydanie I ISBN 978-83-7378-958-6 Szkoła Główna Handlowa w Warszawie Oficyna Wydawnicza 02-554 Warszawa, al. Niepodległości 162 tel. +48 22 564 94 77, 22 564 95 46 www.wydawnictwo.sgh.waw.pl e-mail: wydawnictwo@sgh.waw.pl Projekt i wykonanie okładki Monika Trypuz Skład i łamanie Gemma Druk i oprawa QUICK-DRUK s.c. tel. +48 42 639 52 92 e-mail: quick@druk.pdi.pl Zamówienie 10/I/15

Spis treści Wstęp... 9 Rozdział 1 Wprowadzenie do analizy szeregów czasowych... 11 1.1. Dane i informacje w szeregach czasowych... 11 1.2. Dane i biblioteki w programie SAS 9.3... 15 Rozdział 2 Dekompozycja szeregu czasowego... 19 2.1. Składowe szeregu czasowego...................................... 19 2.2. Wyodrębnianie składowych szeregu czasowego...................... 21 2.3. Modele szeregów czasowych... 22 2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu... 25 Rozdział 3 Tendencja rozwojowa... 37 3.1. Pojęcie trendu... 37 3.2. Trend deterministyczny... 38 3.3. Trend stochastyczny... 44 3.4. Analiza szeregu czasowego z użyciem programu SAS tendencja rozwojowa... 48 Rozdział 4 Wyrównywanie szeregów czasowych... 61 4.1. Średnie ruchome... 61 4.2. Wyrównywanie wykładnicze... 64 4.3. Analiza szeregu czasowego z użyciem programu SAS wyrównywanie szeregów czasowych... 68

6 Spis treści Rozdział 5 Zjawisko sezonowości w szeregach czasowych... 81 5.1. Pojęcie sezonowości... 81 5.2. Wstęp do modelowania sezonowości... 84 5.3. Wskaźniki wahań sezonowych... 85 5.4. Wahania okresowe... 87 5.5. Analiza szeregu czasowego z użyciem programu SAS zjawisko sezonowości... 88 Rozdział 6 Stacjonarność szeregów czasowych... 101 6.1. Definicja stacjonarności szeregu czasowego... 101 6.2. Metody przekształcania szeregu czasowego niestacjonarnego w stacjonarny... 103 6.3. Analiza stacjonarności na podstawie funkcji autokorelacji... 106 6.4. Test Dickeya Fullera... 108 6.5. Analiza szeregu czasowego z użyciem programu SAS stacjonarność szeregów czasowych... 110 Rozdział 7 Modele ARMA... 117 7.1. Proces autoregresyjny AR(p)...................................... 118 7.2. Proces średniej ruchomej MA(q)... 123 7.3. Dualność AR(p) i MA(q)... 126 7.4. Twierdzenie Wolda o dekompozycji... 129 7.5. Klasa modeli ARMA... 130 7.5.1. Proces ARMA... 131 7.5.2. Proces ARIMA... 132 7.5.3. Proces SARIMA... 134 7.6. Stacjonarność i sezonowość w modelach ARMA... 136 7.7. Procedura ARIMA... 138 7.8. Identyfikacja modelu ARMA przy pomocy modułu Time Series Forecasting System... 140 Rozdział 8 Procedura STATESPACE... 151 8.1. Charakterystyka modeli State Space... 152 8.2. Działanie procedury STATESPACE... 154 8.3. Podsumowanie procedury wyboru wektora stanu... 158 8.4. Procedura STATESPACE w programie SAS... 159 8.5. Analiza szeregów czasowych z użyciem procedury STATESPACE... 160

Spis treści 7 Rozdział 9 Prognozowanie szeregów czasowych... 171 9.1. Istota prognozowania... 171 9.2. Rodzaje prognoz... 172 9.3. Podstawowe zasady prognozowania... 174 9.4. Błędy prognozy... 176 9.5. Prognozowanie w systemie SAS 9.3... 178 Wybrane strony internetowe... 181 Bibliografia... 181 Spis rysunków... 184 Spis tabel... 187

8 Spis treści

Wstęp 9 Wstęp Książka powstała w odpowiedzi na zgłaszaną przez studentów studiów dziennych oraz podyplomowych potrzebę posiadania pomocy dydaktycznej do laboratorium z Analizy i prognozowania szeregów czasowych z systemem SAS. Przedmiot ten jest realizowany w systemie wykład plus laboratorium komputerowe. W ramach zajęć słuchacze są zobowiązani do wykonania kilku projektów, które podlegają ocenie i są warunkiem uzyskania zaliczenia. Projekty zawierają nie tylko analizy statystyczne wykonane za pomocą programu komputerowego SAS 9.3, ale również część teoretyczną oraz interpretacje uzyskiwanych rezultatów i wnioski. Analizy były prowadzone za pomocą interfejsu okienkowego, a także z wykorzystaniem procedur programu SAS 9.3. Dzięki temu słuchacze poznawali zarówno teorię szeregów czasowych i prognozowania, jak również mieli możliwość wykorzystania zdobytej wiedzy teoretycznej do zastosowań praktycznych polegających na analizie wybranego szeregu czasowego. W ten sposób następowało łączenie teorii z praktyką. Taki sposób podejścia do nauczania przedmiotu z dziedziny statystyki w obecnej rzeczywistości, w której istnieje stosunkowo łatwy dostęp do wielu baz danych, wydaje się jak najbardziej uzasadniony, ponieważ umożliwia zdobycie nowych kompetencji analitycznych w zakresie analiz i prognozowania szeregów czasowych. Istnieje wiele publikacji poświęconych szeregom czasowym, ale w większości są to prace prezentujące teorię, w niektórych wypadkach wzbogaconą przykładami. Korzystanie z wiedzy teoretycznej zawartej w podręcznikach do analizy szeregów czasowych i prognozowania w trakcie zajęć laboratoryjnych z programem SAS 9.3 sprawiało słuchaczom pewne trudności. Dlatego też stworzony został podręcznik, który łączy

10 Wstęp w sobie część teoretyczną z zakresu przedmiotu analizy i prognozowania szeregów czasowych z częścią aplikacyjną interfejsu okienkowego oraz zestawem procedur oferowanych przez SAS 9.2. W celu ułatwienia przyswajania sobie wiedzy teoretycznej oraz nabywania praktycznych umiejętności wykorzystania oprogramowania SAS 9.3 do analizy i prognozowania, część aplikacyjna została oparta na przykładowym szeregu czasowym z biblioteki Sashelp, a więc dostępnym dla każdego użytkownika programu. W ten sposób podręcznik może być użyteczny dla każdego, kto będzie chciał poznać teorię szeregów czasowych oraz nauczyć się metod i sposobów analizy i prognozowania szeregów czasowych za pomocą programu SAS 9.3.

1.1. Dane i informacje w szeregach czasowych 11 Rozdział 1 Wprowadzenie do analizy szeregów czasowych 1.1. Dane i informacje w szeregach czasowych We współczesnych przedsiębiorstwach istnieje duże zapotrzebowanie na informacje gospodarcze o sytuacji na rynku, trendach w gospodarce czy wreszcie możliwych zmianach strukturalnych. Różny jest zakres informacji wymaganych w procesach decyzyjnych poszczególnych szczebli zarządzania. Niezależnie od szczebla zarządzania każdy menedżer w procesie podejmowania decyzji powinien dysponować szczegółowymi analizami zjawisk charakteryzujących dziedzinę, której decyzje będą dotyczyły. Rozwój technologii informacyjno komunikacyjnych sprawia, że przedsiębiorstwa gromadzą w formie elektronicznej wiele danych dotyczących działalności ich samych oraz ich klientów, a także parametrów charakteryzujących gospodarkę. Informacje te najczęściej są indeksowane czasem (zjawiska dzieją się w czasie), więc tworzą zbiory danych (ciągi danych) nazywane szeregami czasowymi. Dane właściwie przetworzone oraz poddane pogłębionym analizom mogą być bogatym źródłem informacji, w szczególności informacji zarządczych. Dzięki nim łatwiej jest podejmować decyzje obarczone mniejszym ryzykiem, a przedsiębiorstwo może odnosić sukcesy rynkowe. Pomaga w tym zastosowanie nowoczesnych komputerowych narzędzi do gromadzenia, przetwarzania oraz analizowania danych. Dodatkowo niektóre programy statystyczne, jak na przykład SAS, umożliwiają także prognozowanie przyszłych poziomów zjawiska na podstawie danych historycznych. Podstawowym materiałem

12 Rozdział 1. Wprowadzenie do analizy szeregów czasowych do analiz statystycznych są dane. Dane to surowe fakty, liczby lub inne szczegóły dotyczące pewnych zdarzeń. Najczęściej są zapisywane i przechowywane w postaci sformalizowanych zapisów na nośniku danych. Na podstawie danych tworzone są informacje. Informacja powstaje na bazie danych, którymi są liczby i fakty opisujące obiektywnie istniejącą rzeczywistość. Dane poddane analizie (przetworzeniu) stają się informacją. Informacja to dane umieszczone w określonym kontekście nadającym im znaczenie. Informacje, które mogą być pomocne w procesie zarządzania firmą tworzą informację zarządczą, która daje podstawę do efektywnego podejmowania decyzji. Zależności pomiędzy surowymi danymi i informacją w procesie podejmowania decyzji można przedstawić graficznie: Decyzje i działania Informacja zarządcza Informacja Dane Rysunek 1. Informacja w procesie decyzyjnym Źródło: opracowanie własne na podstawie J. Stoner, Ch. Wankel, Kierowanie, PWE, Warszawa 1992.

1.1. Dane i informacje w szeregach czasowych 13 Aby efektywnie wykorzystywać możliwości, jakie oferują nam nowoczesne techniki analizy danych, należy mieć dostęp do najnowszych danych. Dane w przedsiębiorstwie mogą być pozyskiwane z różnych źródeł, które najogólniej można podzielić na: wewnętrzne, zewnętrzne, oraz pierwotne, wtórne. Szczegółową charakterystykę różnych rodzajów źródeł informacji przedstawia tabela 1. Tabela 1. Typowa klasyfikacja źródeł danych Kryterium Rodzaj Przykład Granice organizacyjne przedsiębiorstwa Cel gromadzenia informacji Etap procesu decyzyjnego Kraj pochodzenia wewnętrzne zewnętrzne wtórne pierwotne analityczne progno styczne kontrolne krajowe zagraniczne raporty sprzedażowe, finansowe, bilans, budżet, raporty roczne, wewnętrzne gazetki, szkolenia, zebrania prasa ogólna i specjalistyczna, publikacje instytucji badawczych, rządowych i samorządowych raporty powstające dla innych celów niż rozwiązanie danego problemu badawczego firmy raporty powstałe dla innych celów niż rozwiązanie danego problemu raporty dotyczące analizy sprzedaży według poszczególnych produktów, rynków, klientów, oceny wizerunku, pozycji prognozy dotyczące potencjału danego rynku, możliwości wejścia lub wyjścia konkurentów raporty dotyczące skuteczności i efektywności promocji, rentowności kanałów dystrybucji opracowania statystyczne, raporty krajowych urzędów, ministerstw, organizacji i instytutów branżowych opracowania statystyczne urzędów poszczególnych krajów oraz organizacji, czasopisma zagraniczne Źródło: E. Frąckiewicz, Informacyjne uwarunkowania podejmowania decyzji marketingowych, Przegląd Organizacji 2006, nr 3, s. 41. Dane pochodzące z różnych źródeł mogą być też różnej jakości. Należy oceniać je pod kątem ich 1 : prawdziwości, jednoznaczności, 1 P. Dittman, Metody prognozowania sprzedaży w przedsiębiorstwie, Wyd. AE im. O. Langego, Wrocław 2000, s. 38.

14 Rozdział 1. Wprowadzenie do analizy szeregów czasowych identyfikowalności zjawiska przez zmienną/zmienne, kompletności, aktualności w przyszłości, kosztu zbierania i opracowywania, porównywalności. Dane charakteryzujące rozwój zjawisk gospodarczych lub społecznych są odnotowywane i gromadzone wraz z upływem czasu, tworząc ciągi liczbowe określane mianem szeregów czasowych. Szereg czasowy to uporządkowany zbiór obserwacji statystycznych (zbiór stanów zmiennych), charakteryzujących zmiany poziomu określonego zjawiska w czasie 2. Szereg czasowy momentów przedstawia dane charakteryzujące zjawisko (stan obiektu) w określonych momentach czasu, którymi są najmniejsze (dalej niepodzielne) jednostki czasu, jak np. kurs euro na zakończenie sesji dla kolejnych dni miesiąca. Szereg czasowy okresów przedstawia dane charakteryzujące zjawisko (stan obiektu) w określonych okresach czasu. Okres czasu to pewien odcinek, np. dzień, tydzień, miesiąc czy rok. Taki szereg czasowy okresów tworzy na przykład średni kurs euro dla kolejnych dni miesiąca. W tym wypadku każda wartość szeregu jest średnią z poziomów kursów odnotowanych w danym dniu w trakcie trwającej zwykle kilka godzin sesji giełdowej, a więc wartość ta jest uśrednionym poziomem dla całego (kilkugodzinnego) odcinka czasu w danym dniu notowań. Jednowymiarowy szereg czasowy jest to zbiór stanów jednej zmiennej Y, uporządkowanych według wartości zmiennej czasowej t (t = 1, 2,... n), charakteryzujących zjawisko (stan obiektu), np. kurs jednej waluty dla kolejnych dni miesiąca. Wielowymiarowy szereg czasowy jest to zbiór stanów m zmiennych Y 1, Y 2,..., Y m, uporządkowanych według wartości zmiennej czasowej t (t = 1, 2,... n), charakteryzujących zjawisko (stan obiektu), np. kurs kilku walut dla kolejnych dni miesiąca. Szeregi przekrojowe Jednowymiarowy szereg przekrojowy jest to zbiór stanów jednej zmiennej Y, z których każdy odnosi się do tego samego momentu lub okresu t i do innego j tego obiektu (j = 1, 2,..., k), np. kurs jednej waluty w kilku bankach. Wielowymiarowy szereg przekrojowy jest to zbiór stanów m zmiennych Y 1, Y 2,..., Y m, z których każdy odnosi się do tego samego momentu lub okresu t i do innego j tego obiektu (j = 1, 2,..., k), charakteryzujących zjawisko (stan obiektu), np. kurs kilku walut w kilku bankach. Rodzaje szeregów czasowych przedstawia rysunek 2. 2 A. Frenkiel, G. Kildiszew, Analiza szeregów czasowych i prognozowanie, PWE, Warszawa 1976, s. 13.

1.2. Dane i biblioteki w programie SAS 9.3 15 Szeregi czasowe momentów Wielowymiarowe szeregi czasowe Jednowymiarowe szeregi czasowe Szeregi czasowe okresów Rysunek 2. Rodzaje szeregów czasowych Źródło: Prognozowanie w zarządzaniu przedsiębiorstwem, t. 2, Prognozowanie na podstawie szeregów czasowych, red. J. Nazarko, Wyd. Politechniki Białostockiej, Białystok 2004, s. 20. 1.2. Dane i biblioteki w programie SAS 9.3 Program SAS 9.3 to rozbudowane narzędzie analityczne umożliwiające przeprowadzanie zaawansowanych analiz statystycznych i ekonometrycznych. SAS 9.3 Analiza szeregów czasowych Prognozowanie na bazie szeregów czasowych Budowa modeli ekonometrycznych Rysunek 3. Możliwości programu SAS 9.3 Źródło: opracowanie własne na podstawie dokumentacji programu SAS.

16 Rozdział 1. Wprowadzenie do analizy szeregów czasowych Program SAS umożliwia realizację wielu funkcji, wśród których najważniejsze to: ekstrapolacja trendów, wygładzanie wykładnicze (metoda Holta Wintersa, modele bez trendu, trend liniowy, wykładniczy, sezonowość addytywna lub multiplikatywna), modele strukturalne szeregów czasowych oraz modele ze składnikiem nieobserwowalnym (unobserved components model), regresja dynamiczna i modele funkcji transferowych, prognozowanie wielowymiarowych szeregów czasowych za pomocą wektorowej autoregresji (modele VAR) oraz ogólnych modeli przestrzeni stanów fazowych (state space models), automatyczne wykrywanie obserwacji odstających i zmian strukturalnych szeregu, dekompozycja szeregów czasowych oraz korekcja ze względu na sezonowość, analiza spektralna oraz analiza widma mieszanego w celu wyszukiwania okresowości lub cyklicznych wzorów w danych. Program SAS 9.3 zawiera wiele procedur umożliwiających m.in.: analizę szeregów czasowych, prognozowanie na podstawie szeregów czasowych, modelowanie i symulację systemów, badanie sezonowości, przeprowadzanie analiz ekonometrycznych, analizy i raportowanie finansowe, dostęp do danych ekonometrycznych i finansowych, zarządzanie danymi. Dodatkowo program SAS 9.3 posiada dołączony interaktywny interfejs użytkownika Time Series Forecasting System (TSFS), który umożliwia posługiwanie się procedurami bez konieczności znajomości tych procedur i języka 4GL (4th Generation Language). Niezależnie od zaimplementowanych i dostępnych poprzez komputerowy (okienkowy) interfejs procedur, posługując się językiem 4GL można tworzyć własne procedury, umożliwiające wykonywanie operacji na całych zbiorach danych. Język 4GL posiada dwa typy bloków programowych: DATA Step bloki przekształcające zbiory z danymi (wczytywanie danych z plików tekstowych, tworzenie plików tekstowych, scalanie zbiorów, wpisywanie i usuwanie zmiennych i obserwacji), PROC Step bloki wykonujące wyspecjalizowane procedury (sortowanie danych, transpozycje zbiorów, analiza statystyczna, tworzenie wykresów i map oraz wiele innych). Elementami języka są słowa kluczowe, nazwy procedur, nazwy zmiennych, stałe i znaki specjalne. Nazwa zmiennej może składać się z od jednego do ośmiu znaków

1.2. Dane i biblioteki w programie SAS 9.3 17 alfanumerycznych i znaku _. Małe i duże litery w nazwie nie są rozróżniane. Nazwa musi zaczynać się od litery lub znaku _. Instrukcje w języku 4GL kończą się średnikiem. Instrukcje można rozpoczynać w dowolnej kolumnie i mogą zajmować jedną lub kilka linii. Komentarze mogą mieć postać instrukcji, zaczynającej się od *, a kończącej się średnikiem: * to jest komentarz; lub znajdować się między znakami /* i */: /* to też jest komentarz */ W SAS ie są tylko dwa rodzaje zmiennych i stałych: znakowe mogą mieć długość do 200 znaków, przykład instrukcji podstawienia stałej znakowej do zmiennej znakowej: zm_znak = AAAaaaBBBbbbCCCccc ; numeryczne mogą zajmować od 3 do 8 bajtów (domyślnie 8 bajtów) i są zapamiętywane zawsze w postaci zmiennoprzecinkowej, przykład instrukcji podstawienia stałej do zmiennej numerycznej: zm_numer = 3.14; Stałe numeryczne można zapisywać także w notacji wykładniczej np.: 2.456E+10. Daty przechowywane są w postaci numerycznej jako liczba dni, które minęły od 1 stycznia 1960 r. (dla dni wcześniejszych będzie to liczba ujemna). Możliwe jest też przechowywanie łączne daty i czasu jako liczby sekund, które upłynęły od godziny 0:00 1 stycznia 1960 roku. Dane, na których operuje SAS, przechowywane są w zbiorach o specjalnym formacie, możliwym do odczytania tylko z poziomu systemu SAS. Dla użytkownika są to tabele dwuwymiarowe. Kolumny takiej tabeli nazywane są zmiennymi, a wiersze obserwacjami. Do zbiorów odwołujemy się, podając ich nazwy. Nazwa biblioteki jest dwuczłonowa: nazwabiblioteki.nazwa zbioru, gdzie pierwszy człon to nazwa biblioteki SAS zawierającej plik, a drugi człon to nazwa zbioru. Tworzenie biblioteki 1. Kliknąć Widok Explorator 2. Kliknąć Plik Nowy 3. W oknie Nowa biblioteka dokonać jej specyfikacji. Chcąc, aby biblioteka była tworzona za każdym uruchomieniem komputera, włączyć opcję Włącz po uruchomieniu. 4. Kliknąć Ok. <Nazwa biblioteki> to nazwa biblioteki SAS a. Jest to jedna z nazw standardowych lub nazwa podana wcześniej przez użytkownika poleceniem: libname aa /położenie pliku w drzewie katalogów systemu plikowego komputera/;

18 Rozdział 1. Wprowadzenie do analizy szeregów czasowych Polecenie to musi być wpisane w oknie PROGRAM i podane do wykonania klikaniem Locals Submit. Listę bibliotek standardowych, które są wcześniej predefiniowane, możemy zobaczyć w oknie LIBNAME wyświetlającym wszystkie aktywne biblioteki. Okno LIBNAME pojawi się po naciśnięciu Globals Access Display Libraries w oknie PROGRAM. Wśród bibliotek standardowych mamy zdefiniowaną bibliotekę WORK do przechowywania zbiorów tymczasowych. Jej zawartość jest kasowana po wyjściu z systemu SAS.

2.1. Składowe szeregu czasowego 19 Rozdział 2 Dekompozycja szeregu czasowego 2.1. Składowe szeregu czasowego Szereg czasowy to ciąg danych uporządkowanych chronologicznie w czasie, przy czym pomiar danych wykonywany jest z dokładnym i stałym krokiem czasowym. Wyróżniamy dwa rodzaje szeregów czasowych ze względu na okres, który obejmują dane: szereg czasowy momentów i okresów. Szereg czasowy momentów obrazuje dane charakteryzujące zjawisko (stan obiektu) w określonych momentach czasu, np. kurs euro na zakończenie sesji dla kolejnych dni miesiąca. Natomiast szereg czasowy okresów przedstawia dane charakteryzujące zjawisko (stan obiektu) w określonych okresach czasu, np. średni kurs euro dla kolejnych dni miesiąca. W wypadku szeregu czasowego momentów wartości badanego zjawiska mają charakter zasobów. W szeregach czasowych okresów wartości badanego zjawiska mają charakter strumieni. Do składowych części szeregu czasowego zaliczamy składniki systematyczne oraz przypadkowe, zwane inaczej składnikami losowymi lub wahaniami przypadkowymi. Składowe systematyczne są efektem oddziaływania na zmienną prognozowaną stałego zestawu czynników i mogą występować w postaci tendencji rozwojowej, wahań okresowych (sezonowych lub cyklicznych) albo mogą mieć stały przeciętny poziom. Składowa systematyczna określa procesy deterministyczne, podczas gdy składowa losowa proces stochastyczny. Część resztowa szeregu nie podlega objaśnieniu i zawiera przypadkowe wahania szeregu wokół części systematycznej.

20 Rozdział 2. Dekompozycja szeregu czasowego W klasycznej analizie rozwoju zjawiska w czasie zakłada się, że poziom badanego zjawiska (Y t ) jest funkcją następujących składników: T t trendu, C t wahań cyklicznych, S t wahań sezonowych, I t wahań przypadkowych. Składowe te mogą mieć charakter zjawiska systematycznego lub ich występowanie może być dziełem przypadku. Dlatego też składowe szeregu czasowego dzielimy na dwie podstawowe grupy: składowe o charakterze systematycznym oraz składowe przypadkowe. Składowe o charakterze systematycznym to: trend, stały poziom oraz składowe okresowe, które mogą mieć charakter sezonowy lub cykliczny. Składowe przypadkowe charakteryzują działanie czynników o charakterze losowym i są nieprzewidywalne co do siły oraz kierunku. Składowe szeregu czasowego przedstawia rysunek 4. Składowe szeregu czasowego Składowa systematyczna Składowa przypadkowa Trend Składowa okresowa Stały poziom Wahania cykliczne Wahania sezonowe Rysunek 4. Składowe szeregu czasowego Źródło: P. Dittmann, Prognozowanie w przedsiębiorstwie, Oficyna Ekonomiczna, Kraków 2008, s. 51. W szeregach czasowych mogą występować obserwacje istotnie odbiegające od pozostałych obserwacji w szeregu. Są to wartości nietypowe dla danego zjawiska, spowodowane różnego rodzaju zaburzeniami w jego przebiegu. Występowanie obserwacji nietypowych

2.2. Wyodrębnianie składowych szeregu czasowego 21 może prowadzić do zniekształcenia wyników analizy szeregu czasowego, dlatego też należy je zastąpić np. średnią arytmetyczną obserwacji sąsiednich. Należy jednak zwrócić uwagę na przyczyny występowania wartości odstających w szeregu, ponieważ mogą one obrazować ważne wydarzenia ekonomiczne mające znaczący wpływ w przebiegu całego szeregu czasowego. Tak więc fakt występowania wartości odstających powinien być dokładnie zbadany jeszcze przed rozpoczęciem analizy statystycznej. Podczas analizy wykresu szeregu czasowego można również dostrzec punkty zwrotne, w których następuje zmiana kierunku trendu lub zmiana tempa zmian wartości zmiennej. 2.2. Wyodrębnianie składowych szeregu czasowego W celu wyodrębnienia składowych szeregu należy przeprowadzić jego dekompozycję. Dekompozycja szeregu czasowego jest metodą statystyczną umożliwiającą wyodrębnienie poszczególnych składowych w modelu szeregu czasowego. Wstępna identyfikacja poszczególnych składowych możliwa jest również za pomocą analizy kształtu i przebiegu wykresu szeregu. Rysunek 5. Szeregi czasowe z różnymi rodzajami składowych Źródło: M. Cieślak, Prognozowanie gospodarcze. Metody i zastosowania, PWN, Warszawa 2005.

22 Rozdział 2. Dekompozycja szeregu czasowego W szeregu czasowym nie wszystkie składniki muszą występować równocześnie. Istnieją szeregi czasowe, w których nie występuje sezonowość ani cykliczność. Dla takiego szeregu budujemy model dwuskładnikowy. Y t = T t + I t W modelu dwuskładnikowym dekompozycję szeregu czasowego przeprowadza się w dwóch etapach: 1. wyodrębnienie trendu, określenie jego siły i kierunku; 2. pomiar wahań przypadkowych. Jeśli w szeregu czasowym występują wahania sezonowe, a nie występują cykliczne, to dla takiego szeregu budujemy model trójskładnikowy. Y t = T t + S t + I t W modelu trójskładnikowym dodatkowo określa się siłę i kierunek wahań. W praktyce bardzo często mamy do czynienia z szeregami o dwóch lub trzech składnikach. Szeregi, w których występuje cykliczność zwykle dotyczą zjawisk ekonomicznych badanych w długich, ponaddziesięcioletnich okresach. 2.3. Modele szeregów czasowych Szeregi czasowe można podzielić na dwa podstawowe typy w zależności od relacji zachodzących pomiędzy poszczególnymi składnikami modelu: szereg addytywny oraz multiplikatywny. Typ szeregu zależy od wzajemnych relacji składowych szeregu, a więc także od sposobu, w jaki wpływają one na prognozowaną zmienną. Model addytywny dotyczy szeregu czasowego, w którym obserwowane wartości zmiennej prognozowanej stanowią sumę składowych szeregu, a więc wartość trendu jest pomniejszana lub powiększana o stałe wartości czynnika sezonowości. Składowe w szeregu addytywnym są niezależne i nie zachodzą między nimi interakcje. Wahania addytywne charakteryzują się stałą amplitudą wahań i nie są zależne od poziomu zjawiska w czasie. Każdy z elementów w modelu addytywnym wyrażony jest w tych samych jednostkach. Podczas przeprowadzania dekompozycji szeregu czasowego wahania sezonowe, jak i przypadkowe, stanowią odchylenie od trendu lub od przeciętnego poziomu zmiennej prognozowanej.

2.3. Modele szeregów czasowych 23 Model addytywny: Y t = T t + C t + S t + I t Rysunek 6. Model addytywny szeregu czasowego z trendem Źródło: opracowanie własne. W wypadku modelu multiplikatywnego oryginalny szereg czasowy wyrażony jest jako iloczyn jego części składowych. Oznacza to, że wartość trendu jest pomniejszana lub powiększana proporcjonalnie przez odpowiednią miarę sezonowości. Wartość oczekiwana składnika losowego w modelu multiplikatywnym wynosi 1. Wahania multiplikatywne mają zmienną amplitudę, a ich siła oddziaływania zależy od zmian zjawiska w czasie. Model multiplikatywny: Y t = T t * C t * S t * I t Rysunek 7. Model multiplikatywny szeregu czasowego z trendem Źródło: opracowanie własne. Wahania multiplikatywne wyrażane są w ujęciu względnym, relatywnym lub w wartościach procentowych. Wahania addytywne przedstawiane są natomiast w ujęciu absolutnym lub w jednostkach, w których mierzona jest badana cecha. Ponieważ model multiplikatywny nie może być wykorzystywany w wypadku szeregów czasowych o niewielkiej liczbie rekordów, jak również szeregów czasowych,

24 Rozdział 2. Dekompozycja szeregu czasowego które przyjmują bardzo małe wartości lub równe zeru, poza dekompozycją klasyczną (addytywną i multiplikatywną) wyróżniamy również pseudo addytywną i log addytywną dekompozycję. W dekompozycji pseudo addytywnej wahania sezonowe oraz składowe szeregu czasowego połączone są związkiem addytywno multiplikatywnym. W modelu tym zarówno wahania sezonowe jak i wahania przypadkowe są zależne od poziomu trendu, ale jednocześnie nie są uzależnione od siebie nawzajem. Szereg oryginalny może być przedstawiony w następujący sposób: Model pseudo addytywny Y t = T t + T t * (S t 1) + T t * (I t 1) = T t * (S t + I t 1) Rysunek 8. Model pseudo addytywny z trendem bocznym Źródło: opracowanie własne. Dekompozycja log addytywna pod względem budowy jest taka sama jak addytywna, jednak opisuje zmienną logy t, zamiast Y t. Model log addytywny logy t = T t + C t + S t + I t lub Rysunek 9. Modele log addytywne szeregów czasowych Źródło: opracowanie własne. Ponieważ uznaje się, że ten rodzaj dekompozycji może być stosowany do szeregów, w których amplituda wahań sezonowych rośnie lub maleje proporcjonalnie do

2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu 25 wartości szeregu, często traktowana jest ona jako dekompozycja multiplikatywna, co jest błędem. Różnice są widoczne po zastosowaniu procedury X 11, która daje możliwość zarówno dekompozycji log addytywnej, jak i multiplikatywnej. Estymatory trendu po dekompozycji log addytywnej wymagają korekty błędu, ponieważ średnie arytmetyczne użyte do wyrównywania są większe od średnich geopatycznych. Dodatkowo przy dekompozycji log addytywnej do wartości odstających wymagane jest użycie innych wartości odstających niż przy dekompozycji multiplikatywnej 3. Według wytycznych Eurostatu dekompozycję log addytywną powinno się stosować do szeregu z trendem zarówno w średniej, jak i w wariancji, natomiast multiplikatywną do szeregów z trendem tylko w średniej. Uznaje się również, że ten rodzaj dekompozycji ma dobre zastosowanie dla danych charakteryzujących się rozkładem Poissona. 2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu Analizę szeregów czasowych przeprowadzamy z użyciem metod i narzędzi statystycznych zaimplementowanych do programu SAS 9.3. znajdujących się w dwóch modułach noszących nazwy: Time Series Viewer oraz Times Series Forecasting System (rysunek 10). Rysunek 10. Okno wyboru modułów programu SAS 9.3 Źródło: opracowanie własne na podstawie programu SAS. 3 E. Ghysels, D.R. Osborn, The econometric analysis of seasonal time series, Cambridge University Press, Cambridge 2001.

26 Rozdział 2. Dekompozycja szeregu czasowego Narzędzia oraz opcje, jakie posiadają oba moduły będą stopniowo opisywane w każdym kolejnym kroku analizy. Analizy prezentowane w podręczniku będą przeprowadzane na szeregu danych o nazwie AIR znajdującym się w bibliotece Sashelp. Szereg ten przedstawia liczbę pasażerów linii lotniczych. Analizę szeregu czasowego AIR rozpoczniemy od dokonania jego dekompozycji, do czego użyjemy modułu Time Series Viewer. Po uruchomieniu programu SAS, otwieramy, tak jak to zostało pokazane na rysunku powyżej, pasek Rozwiązania, następnie wybieramy zakładkę Analiza i z rozwiniętej listy wybieramy moduł Time Series Viewer. W kolejnym kroku dokonujemy wyboru szeregu czasowego, na którym będziemy pracować, wykonując następujące czynności: 1. wybór biblioteki, w której znajduje się szereg czasowy, 2. wybór szeregu czasowego, 3. wybór zmiennej czasowej, 4. wybór zmiennej opisującej zjawisko, którego zmiany w czasie zaobserwowaliśmy. 1 2 4 5 3 Rysunek 11. Okno wyboru szeregu czasowego Źródło: opracowanie własne na podstawie programu SAS. Kroki 1, 2 i 4 wykonujemy poprzez zaznaczenie odpowiednich parametrów, przy czym po wyborze zmiennej w kroku 4 musi się ona wyświetlić w oknie Variable. Wyboru zmiennej czasowej dokonujemy, wskazując właściwą zmienną w oknie Time ID Variable Specification.

2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu 27 Rysunek 12. Okno identyfikacji zmiennej czasowej Źródło: opracowanie własne na podstawie programu SAS. W powyższym oknie należy wybrać spośród dostępnych zmiennych tę, która opisuje czas. Możliwa jest również zmiana specyfikacji okresów w czasie, w którym obserwowane jest dane zjawisko. Po wyborze zmiennej czasowej i zatwierdzeniu jej poprzez użycie przycisku OK, nazwa tej zmiennej wyświetli się w oknie Time ID. Następnie wybieramy przycisk Graph, co zostało zaznaczone jako krok 5. W wyniku powyższych działań otrzymujemy nowe menu do analizy szeregu czasowego, jak również wykres naszego szeregu czasowego. W tle widzimy natomiast podstawowe okna programu SAS, czyli Wynik, Log i Edytor.

28 Rozdział 2. Dekompozycja szeregu czasowego Rysunek 13. Okno modułu Time Series Viewer Źródło: opracowanie własne na podstawie programu SAS. Narzędzia zawarte w module Time Series Viewer dają możliwość zwiększenia lub pomniejszenia fragmentu wykresu poprzez jego zaznaczenie, zlogarytmizowania szeregu czasowego, zróżnicowania szeregu czasowego w stopniu pierwszym, zróżnicowania szeregu sezonowo, powrotu do menu wyboru szeregu czasowego, zablokowania pracy w danym momencie tylko na jednym szeregu czasowym, wyświetlenia szeregu w postaci wykresu, wyświetlenia szeregu w postaci tabeli z danymi, wyświetlenia wykresów obrazujących testy na pierwiastki jednostkowe, sezonowe pierwiastki jednostkowe, występowanie białego szumu oraz wykresy autokorelacji, częściowej autokorelacji i odwrotnej autokorelacji, a także transformacji szeregu czasowego.

2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu 29 Korzystając z wyżej wymienionych narzędzi, przeprowadzamy wstępną analizę wykresu szeregu czasowego. Analiza jego kształtu i przebiegu dostarcza nam wielu ważnych informacji. Po pierwsze, możemy stwierdzić, że jednym ze składników tego szeregu czasowego jest trend i że jest on rosnący, ponieważ wartości obserwowanego zjawiska rosną z roku na rok. Gdyby trend nie był składnikiem tego szeregu czasowego, to wykres byłby poziomy, a wartości w danych okresach ciągle wahałyby się wokół jednej stałej wartości. Brak trendu Trend rosnący Trend malejący Rysunek 14. Graficzna prezentacja szeregu czasowego AIR Źródło: opracowanie własne na podstawie programu SAS. Widoczne są również wahania wartości, które najprawdopodobniej są wahaniami sezonowymi. Jako że pierwsza część wykresu do roku 1955 nie wskazuje jednoznacznie na wahania sezonowe, warto jest podzielić ten wykres na dwie części do 1955 i po 1955 roku oraz powiększyć. Można tego dokonać, używając przycisku powiększenia i zaznaczając wybrany obszar. Rysunek 15. Wykresy fragmentów szeregu czasowego Źródło: opracowanie własne na podstawie programu SAS.

30 Rozdział 2. Dekompozycja szeregu czasowego Analiza powyższych wykresów wskazuje już jednoznacznie, że kolejnym składnikiem tego szeregu czasowego są wahania sezonowe, ponieważ co roku w tych samych okresach obserwujemy wzrosty lub spadki zjawiska. Dzięki dotychczasowej analizie znamy już dwa składniki naszego szeregu czasowego, które będą miały w późniejszej fazie wpływ na wybór odpowiedniego modelu dla tego szeregu czasowego. Znamy także kierunek trendu. Są to wstępne informacje na temat składników, jakie mogą występować w analizowanym szeregu czasowym oraz cechującej ten szereg zmienności badanego zjawiska. Informacje te posłużą jako materiał pomocniczy przy budowie modelu szeregu czasowego. W celu ich głębszego poznania należy wykonać pełną analizę. Dlatego do dalszej analizy tego zjawiska pod kątem jego dekompozycji wykorzystamy funkcję transformacji szeregu czasowego. Po wybraniu funkcji transformacji ukazuje się okno zatytułowane Series Viewer Transformation. Rysunek 16. Opcje modułu do przeprowadzania klasycznej dekompozycji Źródło: opracowanie własne na podstawie programu SAS. U dołu okna widzimy blok zatytułowany Classical Decomposition, który umożliwia dokonanie klasycznej dekompozycji szeregu czasowego polegającej na wyodrębnieniu jego podstawowych składowych. Przed rozpoczęciem dekompozycji musimy dokonać wyboru typu modelu szeregu czasowego, zaznaczając w oknie odpowiednią pozycję. W celu określenia, z jakim typem szeregu czasowego mamy do czynienia: addytywnym czy multiplikatywnym, wykorzystujemy informacje uzyskane z wcześniejszej analizy kształtu wykresu. Przeprowadzona wcześniej analiza pokazała, że jest to szereg, w którym występują wahania okresowe, a ich amplituda ma charakter rosnący w czasie, co wskazuje na jego multiplikatywny charakter. Gdyby amplituda wahań w czasie była stała (constans), to wskazywałoby to na addytywny charakter szeregu czasowego.

2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu 31 Linie rozchodzące się = szereg multiplikatywny Linie równoległe= szereg addytywny Rysunek 17. Amplitudy wahań dla szeregu addytywnego i multiplikatywnego Źródło: opracowanie własne na podstawie programu SAS. Po określeniu charakteru naszego szeregu czasowego w dolnej części okna Series Viewer Transformation uaktywnia się okienko noszące nazwę Classical Decomposition, umożliwiające wybór następujących opcji: ¾Seasonal Adjusted Series wyświetla wykres szeregu czasowego bez sezonowości, ¾Trend cycle Component wyświetla wykres wyłącznie trendu wyodrębnionego z szeregu czasowego, ¾Seasonal Component wyświetla wykres wyłącznie składnika sezonowego wyodrębnionego z szeregu czasowego, ¾Irregular Component wyświetla wykres wyłącznie wahań przypadkowych wyodrębnionych z szeregu czasowego. Po zaznaczeniu opcji Seasonal Adjusted Series pojawia się następujący wykres: Rysunek 18. Krzywa trendocykliczna dla szeregu AIR Źródło: opracowanie własne na podstawie programu SAS.

32 Rozdział 2. Dekompozycja szeregu czasowego Wykres trendu potwierdza wstępne wnioski wskazujące na to, że jest on istotnym składnikiem tego szeregu czasowego. Trend ten jest rosnący i mógłby być opisany funkcją liniową nachyloną pod kątem ok. 40 stopni do osi odciętych. Mimo wystąpienia dwóch krótkich okresów, w których trend ulega lekkiemu spowolnieniu, w pozostałych okresach obserwacji zjawiska cechuje się on stałym i stosunkowo silnym wzrostem. Rysunek 19. Składnik sezonowy występujący w szeregu AIR Źródło: opracowanie własne na podstawie programu SAS. Wykres składnika sezonowego wskazuje na potrzebę uwzględnienia tej składowej w ogólnym wzorze opisującym badany szereg czasowy. Wahania sezonowe są stałe w czasie. Widoczne są stosunkowo duże wzrosty wartości szeregu czasowego w miesiącach letnich, co można łatwo wytłumaczyć wzrostem zainteresowania lotami w okresie wakacyjnym. Mimo że wahania sezonowe są umiarkowane i stabilne, to w połączeniu z trendem skutkują coraz większymi wahaniami okresowymi (z roku na rok) proporcjonalnie do skali zjawiska.

2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu 33 Rysunek 20. Składnik resztowy występujący w szeregu AIR Źródło: opracowanie własne na podstawie programu SAS. Wykres wahań przypadkowych daje podstawę do stwierdzenia, że wahania występujące w szeregu wywierają wpływ na obserwowane zjawisko. Szczególnie w latach 1949 1954 zakres wahań przypadkowych jest bardzo duży. Oprócz stwierdzenia faktu występowania wahań przypadkowych, należy także ustalić, czy ich wpływ na zaobserwowane wartości zjawiska opisanego przez szereg czasowy jest istotny statystycznie. W dalszych analizach znajdziemy odpowiedź na to pytanie. Rysunek 21. Szereg AIR wygładzony sezonowo Źródło: opracowanie własne na podstawie programu SAS.

34 Rozdział 2. Dekompozycja szeregu czasowego Wykres trendu razem ze składnikiem losowym, a więc po usunięciu wahań sezonowych (Seasonally Adjusted Series), wskazuje na to, iż wahania przypadkowe zaburzają linię trendu, szczególnie pod koniec obserwowanego okresu, co z kolei sugeruje, że komponent losowy może być istotny statystycznie. Jak widać na przestrzeni badanego okresu, wpływ składnika losowego na poziomy wartości zjawiska jest zmienny. Wpływ ten jest stosunkowo słaby w początkowym okresie, bardzo słaby w środkowym oraz silny w okresie końcowym. Dotychczasowa analiza szeregu czasowego AIR pokazała rosnącą wariancję oraz stosunkowo duże wahania przypadkowe. W celu zniwelowania niekorzystnego wpływu tych dwóch czynników warto zastosować transformację logarytmiczną, która pozwoli nam ustabilizować wariancję i zniwelować siłę wartości odstających. Taka transformacja jest również sugerowana w dokumentacji SAS do szeregów multiplikatywnych. Rysunek 22. Szereg AIR po dokonaniu transformacji logarytmicznej Źródło: opracowanie własne na podstawie programu SAS. Z powyższego wykresu wynika, że rzeczywiście transformacja logarytmiczna stabilizuje wariancję. Wskutek tego zabiegu wykres szeregu czasowego AIR przypomina model addytywny, który jest łatwiejszy do analizy i prognozowania. Analizując wykres pozbawiony składnika sezonowego, po zastosowaniu transformacji logarytmicznej, możemy zauważyć pozytywne zmiany dotyczące wielkości wahań przypadkowych. Obecny wykres dużo bardziej przypomina liniowy wykres trendu. Natomiast wykresy wahań sezonowych, jak i wahań przypadkowych, nie różnią się znacznie od wykresów tych elementów, w których transformacja

2.4. Analiza szeregu czasowego z użyciem programu SAS dekompozycja szeregu 35 logarytmiczna nie została zastosowana. Warto jednak zwrócić uwagę na wartości, w których mieszczą się wahania obu tych składników szeregu. W porównaniu do wcześniejszych wykresów widełki tych wahań są znacznie mniejsze. Rysunek 23. Szereg AIR wygładzony sezonowo po zastosowaniu transformacji logarytmicznej Źródło: opracowanie własne na podstawie programu SAS. Składnik sezonowy Przedział wahań po transformacji 0,96 1,04 w porównaniu do 0,8 1,3 przed transformacją Rysunek 24. Składnik sezonowy szeregu AIR po zastosowaniu transformacji logarytmicznej Źródło: opracowanie własne na podstawie programu SAS. Składnik resztowy Przedział wahań po transformacji 0,98 1,02 w porównaniu do 0,875 1,100 przed transformacją Rysunek 25. Składnik losowy szeregu AIR po zastosowaniu transformacji logarytmicznej Źródło: opracowanie własne na podstawie programu SAS.

36 Rozdział 2. Dekompozycja szeregu czasowego Wnioski: Analizowany szereg czasowy AIR jest trójskładnikowy i składa się z trendu, wahań sezonowych i przypadkowych. Po analizie graficznej możemy uznać, że zarówno sezonowość, jak i składnik losowy są istotne statystycznie. W dalszej analizie sprawdzimy słuszność powyższego stwierdzenia, jak również użycia transformacji logarytmicznej. Postać ogólna wzoru dla tego szeregu czasowego wygląda następująco: logy t = T t * C t * S t * I t Warto przeczytać Time Series Transformation, Decomp Statement, Seasonal Decomposition, Classical Decomposition. Uwaga Należy pamiętać, że dekompozycja multiplikatywna i transformacje mogą być stosowane tylko dla szeregów ściśle dodatnich!!! Działania na szeregach, np. różnicowanie, które będą powodować utratę ścisłej dodatniości szeregu, spowodują pojawienie się komunikatu o błędzie.

3.1. Pojęcie trendu 37 Rozdział 3 Tendencja rozwojowa 3.1. Pojęcie trendu Trendem, czyli tendencją rozwojową, nazywamy ogólny kierunek zmian zjawiska w czasie, który jest wywołany przez systematyczne, jednokierunkowe zmiany poziomu badanego zjawiska spowodowane działaniem stałego zestawu czynników. Jest to długookresowa skłonność do jednokierunkowych zmian (wzrostu lub spadku) wartości badanej zmiennej. Trend wyznaczany jest przez przyczyny główne, które działają stale i niezmiennie charakteryzują dane zjawisko w czasie. Znajomość przebiegu tendencji rozwojowej pozwala na analizę ogólnego obrazu rozwoju badanego zjawiska. Wyróżniamy dwa główne kierunki trendu: trend rosnący, kiedy wzrasta wartość zmiennej w czasie, oraz trend malejący, kiedy wartość zmiennej spada. W wielu analizach występuje również trend boczny, w którym nie dostrzegamy wyraźnego trendu malejącego lub rosnącego. Ten typ trendu zauważalny jest szczególnie w analizach giełdowych. Trend możemy również podzielić pod względem elementów, które go definiują na trend deterministyczny i stochastyczny.

38 Rozdział 3. Tendencja rozwojowa Zmienna losowa zawierająca trend stochastyczny (y 1 ) oraz trend deterministyczny (y 2 ) Rysunek 26. Szereg czasowy z trendem stochastycznym i deterministycznym Źródło: A. Welfe, Ekonometria. Metody i ich zastosowanie, PWE, Warszawa 2009, s. 362. 3.2. Trend deterministyczny Trend deterministyczny, inaczej nazywany trendem, w średniej oznacza nielosową funkcję zmiennej czasowej t, która opisuje zmienność w czasie wartości średniej procesu. Zmiany w wartości średniej kojarzone są ze zmianami długookresowymi, które mają gładki i spokojny przebieg, dlatego funkcji opisującej trend deterministyczny przypisuje się te same atrybuty 4. Podstawowy wzór funkcji trendu deterministycznego wygląda następująco: gdzie: t zmienna czasowa T t = f(t) 4 M. Piłatowska, Alternatywne metody eliminacji trendu a interpretacja modelu ekonometrycznego, materiały na IV Ogólnopolskie Seminarium Naukowe, Katedra Ekonometrii i Statystyki UMK, Toruń 1997.

3.2. Trend deterministyczny 39 W wypadku trendu deterministycznego wyróżniamy różne modele trendu: Trend liniowy: T t = β 0 + β 1 t t zmienna czasowa β 0, β 1 parametry modelu Rysunek 27. Trend liniowy Źródło: M. Mazurkiewicz, Modele Szeregów Czasowych, http://www.ioz.pwr.wroc.pl/pracownicy/mazurkiewicz/ w3.pdf Trend wielomianowy: T t = β 0 + β 1 t +... + β k t k k ustalony stopień wielomianu Rysunek 28. Trend wielomianowy Źródło: M. Mazurkiewicz, Modele Szeregów Czasowych, http://www.ioz.pwr.wroc.pl/pracownicy/mazurkiewicz/ w3.pdf

40 Rozdział 3. Tendencja rozwojowa Trend wykładniczy: T t = β 0 + β 1 r t r stała Rysunek 29. Trend wykładniczy Źródło: M. Mazurkiewicz, Modele Szeregów Czasowych, http://www.ioz.pwr.wroc.pl/pracownicy/mazurkiewicz/ w3.pdf Trend logistyczny: T t = β 0 (1 + β 1 exp( β 2 t)) 1 β 0, β 1, β 2 > 0 Rysunek 30. Trend logistyczny Źródło: M. Mazurkiewicz, Modele Szeregów Czasowych, http://www.ioz.pwr.wroc.pl/pracownicy/mazurkiewicz/ w3.pdf

3.2. Trend deterministyczny 41 Trend Gompertza: T t = β 0 exp( β 1 exp( β 2 t)) β 0 punkt nasycenia, β 0, β 1, β 2 > 0 Rysunek 31. Trend Gompertza Źródło: http://en.wikipedia.org/wiki/gompertz_function Trend ilorazowy: Rysunek 32. Trend ilorazowy Źródło: M. Mazurkiewicz, Modele Szeregów Czasowych, http://www.ioz.pwr.wroc.pl/pracownicy/mazurkiewicz/ w3.pdf

42 Rozdział 3. Tendencja rozwojowa Trend logarytmiczny: T t = β 0 + β 1 ln t Rysunek 33. Trend logarytmiczny Źródło: M. Mazurkiewicz, Modele Szeregów Czasowych, http://www.ioz.pwr.wroc.pl/pracownicy/mazurkiewicz/ w3.pdf Trend trygonometryczny: A i = r i cos(θ) gdzie: ω częstotliwość z okresem θ zmiana fazy r i amplituda Rysunek 34. Trend trygonometryczny Źródło: http://bm2.genes.nig.ac.jp/rgm2/r_current/library/mfilter/man/trfilter.html

3.2. Trend deterministyczny 43 Spośród wymienionych wyżej trendów warto zwrócić uwagę na trend logistyczny, Gompertza i trygonometryczny. Pierwsze dwa mają prawie identyczne wykresy i oba używane są do przewidywania rozwoju rynku. Należy jednak pamiętać, że wybór modelu trendu może mieć znaczący wpływ na prognozę, ponieważ proces Gompertza jest asymetryczny, podczas gdy proces logistyczny jest symetryczny. Badanie i opis dokonania poprawnego wyboru trendu logistycznego lub Gompertza zostały zawarte w pracy P.H. Fransesa A method to select between Gompertz and Logistic Trend Curves 5. W wypadku trendu trygonometrycznego mamy do czynienia z rodziną trendów cyklicznych opartych na funkcji periodycznej lub quasi periodycznej. Ten rodzaj trendu jest stosowany do szeregów czasowych, których zachowanie wykazuje periodyczność. Istotną rzeczą podczas korzystania z tego modelu trendu jest poprawne zdeterminowanie częstotliwości przy użyciu np. analizy harmonicznej lub spektralnej. Podsumowując charakterystykę trendu deterministycznego, warto przytoczyć również fakt, że może być on traktowany jako specjalny rodzaj trendu stochastycznego. Można to udowodnić, przekształcając ogólny wzór na trend cykliczny, który przyjmuje następującą postać:, który po przekształceniach przyjmuje postać 6 : T t = f(t,12), gdzie: f(t) jest deterministyczną funkcją t oraz 12 okresową zmiennością trendu. W literaturze przedmiotu można napotkać opisy trendu deterministycznego poprzez składnik trendu i dodatkowo biały szum opisujący stochastyczny proces stacjonarny. Nie ma to dużego znaczenia dla samego zapisu, ponieważ biały szum jest dodawany do elementów opisujących trend, czyli każdy z powyższych wzorów posiadałby dodany na końcu równania składnik losowy. Jednak taki zapis należy rozumieć jako proces deterministyczny lub stochastyczny określony przez dany rodzaj 5 P.H. Franses, A method to select between Gompertz and Logistic Trend Curves, Technological Forecasting and Social Change 1994, no. 46, s. 45 49. 6 Szczegółowy opis przekształceń można znaleźć w notatkach z wykładu, R. Tsay, Lecture 5: Seasonal Time Series, Trend Analysis & Component Model Bus 41910, Time Series Analysis.

44 Rozdział 3. Tendencja rozwojowa trendu. Ponieważ biały szum jest zagadnieniem związanym ze stacjonarnością szeregu czasowego, zostanie szczegółowo omówiony w dalszej części pracy. 3.3. Trend stochastyczny Trendem stochastycznym określamy proces, w którym zarówno poziom, jak i nachylenie trendu ulegają zmianom wraz z upływem czasu. Wpływ na zmiany w poziomie i nachyleniu trendu mają wszystkie zakłócenia występujące w danym okresie, które z równą siłą oddziałują na bieżącą wartość zmiennej, bez względu na to, jak odległe są w czasie 7. Za podstawowy model trendu stochastycznego można uznać poniższy wzór: ξ = ΔT t składnik losowy. W literaturze przedmiotu powyższy rodzaj trendu wraz z wartością Y 0 opisują proces stochastyczny określany jako ścieżka losowa lub błądzenie losowe (random walk). Wzór tego procesu wygląda następująco: Ścieżka losowa: Jeżeli do powyższego wzoru dodamy trend deterministyczny, to uzyskamy sposób generowania danych (data generating process), który jest definiowany jako ścieżka losowa z dryfem (random walk with drift). Poniższy wzór obrazuje postać tego procesu: 7 Źródło: A. Welfe, Ekonometria. Metody i ich zastosowanie, PWE, Warszawa 2009, s. 361.

3.3. Trend stochastyczny 45 Ścieżka losowa z dryfem: Rysunek 35. Ścieżka losowa (y 1 ) oraz ścieżka losowa z dryfem (y 2 ) Źródło: A. Welfe, Ekonometria. Metody i ich zastosowanie, PWE, Warszawa 2009, s. 362. Tak samo jak w wypadku trendu deterministycznego, mamy różne rodzaje trendu stochastycznego. Wśród nich wyróżniamy trend liniowy, kwadratowy i sezonowy. Stochastyczny trend liniowy: T t = β t + ε t β t nachylenie trendu, β t = μ t 1 + ν t ν t biały szum niezależny od ε t ε t biały szum Rysunek 36. Stochastyczny trend liniowy Źródło: http://gieldowyracjonalista.blogspot.com/

46 Rozdział 3. Tendencja rozwojowa Trend kwadratowy: T t = β t + ε t, gdzie (1 B) 2 β t = ν t Rysunek 37. Trend kwadratowy Źródło: http://tamino.wordpress.com/2010/07/26/summer-ice/ Trend sezonowy: T t = β t + ε t Rysunek 38. Trend sezonowy Źródło: http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=mmed&part=a643 W powyższych wzorach trend stochastyczny mógłby być zapisany dwuskładnikowo i zdefiniowany tak jak poniżej, przez poziom i nachylenie trendu.

3.3. Trend stochastyczny 47 Poziom trendu: T t = T t 1 + β t 1 + η t Nachylenie trendu: β t = β t 1 + δ t gdzie: δ t, η t składniki losowe, zwane hiper parametrami. Gdyby wariancja δ t i η t była równa zero, czyli ani poziom, ani nachylenie trendu nie byłyby pod wpływem losowych szoków występujących w danym okresie, to mielibyśmy do czynienia z trendem deterministycznym, którego wzór wyglądałby następująco: μ t = μ 0 + β 0 t Modelowanie za pomocą trendu stochastycznego jest obecnie dość nowatorską i mało popularną metodą. Jej główną zaletą w porównaniu do modelowania za pomocą trendu deterministycznego jest fakt, że adaptuje się do występujących załamań danego zjawiska, przez co daje możliwości prognozy o mniejszych błędach. Z drugiej jednak strony modelowanie stochastyczne wymaga wprowadzenia egzogenicznych złożonych strukturalnych testów załamań obserwowanego zjawiska, co jest wymagającym zadaniem 8. Warto przeczytać C.A. Sims, Modeling Trends, Prepared for presentation at the American Statistical Association Meetings August 1989. J. Caiado, N. Crato, Discrimination between deterministic trend and stochastic trend processes, Proceedings of the XIth International Conference on Applied Stochastic Models and Data Analysis, s. 1419 1424. R.B. Bhaskara, Deterministic and stochastic trends in the time series models: A guide for the applied economist, Applied Economics 2010, vol. 42, no. 17, s. 2193 2202. R. Tsay, Lecture 5: Seasonal Time Series, Trend Analysis & Component Model, Bus 41910, Time Series Analysis. M. Piłatowska, Alternatywne metody eliminacji trendu a interpretacja modelu ekonomicznego, materiały na IV Ogólnopolskie Seminarium Naukowe w Toruniu, Katedra Ekonometrii i Statystyki UMK, Toruń 1997. D.M. Meko, Detrending GEOS 585A, Applied Time Series Analysis, http://www.ltrr.arizona.edu/~dmeko/geos585a.html 8 Więcej na temat zalet i wad obu sposób modelowania można znaleźć w: R.B. Bhaskara, Deterministic and stochastic trends inthe time series models: A guide for the applied economist, Applied Economics 2010, vol. 42, no. 17, s. 2193 2202.