Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki
... poczynając od XIV wieku zegar czynił nas najpierw stróżów czasu, następnie ciułaczy czasu, i wreszcie obecnie - niewolników czasu. W trakcie tego procesu zaczęliśmy lekceważyć słońce i pory roku, ponieważ w świecie stworzonym przez sekundy i minuty autorytet natury doznał uszczerbku. Neil Postman, Zabawić się na śmierć
Definicja szeregu czasowego Szeregiem czasowym będziemy nazywać ciąg obserwacji dowolnej cechy statystycznej, dokonanych w kolejnych momentach czasowych. Wartości szeregu będziemy oznaczać symbolem: Y t (t = 1,..., T) Tak zdefiniowany szereg czasowy ma charakter jednowymiarowy i obecnie zajmiemy się specjalną grupą metod statystycznych, które służą do porównywania a także prognozowania kolejnych jego wartości. Oczywiście, do badania danych czasowych można też stosować poznane uprzednio metody tabelarycznej i graficznej analizy danych, choć jak pokazano na następnym slajdzie nie zawsze ma to sens.
Czy liczby wiedzą skąd pochodzą Sposób doboru metod analizy statystycznych jest, a przynajmniej winien być, bardzo mocno związany z charakter zbioru danych oraz ich merytorycznym znaczeniem. Ten sam zbiór liczb musi być inaczej traktowany, gdy dotyczy danych czasowych, a inaczej, gdy dotyczy danych przekrojowych lub ankietowych. Na wcześniejszych wykładach, jako najbardziej popularną metodę opisu danych liczbowych wskazano wyznaczanie statystyk opisowych, poniższy przykład pokazuje, że dla danych czasowych to nie zawsze ma sens. Wykres przedstawia dynamikę dwóch zjawisk nieco różniących się kierunkiem zmian! Tymczasem statystyki opisowe dla obu szeregów czasowych są identyczne: Średnia = 10085 Minimum = 5261 Maksimum = 16495
Analiza graficzna danych czasowych (1) Znaczenie analizy graficznej danych czasowych jest ogromne poniekąd zostało to już uzasadnione na slajdzie nr 4. Metody graficznej analizy danych zostały omówione na wykładach 5. Poniżej zaprezentowano, dla przypomnienia, kilka form graficznej prezentacji danych, w których wykorzystano pewne dodatkowe możliwości programu STATISTICA. Obrazkowy wykres rozrzutu
Analiza graficzna danych czasowych (2)
Analiza graficzna danych czasowych (3)
Wykresy warstwowe Ludność zamieszkująca na poszczególnych kontynentach w latach 1950-2010 i 2011-2050 Źródło: www.census.gov
Indeksy dynamiki (o stałej i zmiennej podstawie) Proste indeksy dynamiki określają tempo zmian pojedynczego szeregu czasowego. Wyodrębnia się dwa podstawowe typy indeksów: indeksy o stałej podstawie; indeksy o zmiennej podstawie. Indeksy o stałej podstawie wyznacza się na podstawie wzoru: Indeks (dla okresu t) = Wartość w okresie t / Wartość w okresie bazowym I t/t = Y t / Y T * 100 Indeksy o zmiennej podstawie wyznacza się na podstawie wzoru: Indeks (dla okresu t) = Wartość w okresie t / Wartość w okresie poprzednim I t/t-1 = Y t / Y t-1 * 100
Indeksy złożone Indeksy złożone (agregatowe) pozwalają ocenić tempo i kierunek zmian wartości kombinacji wielu zmiennych jednocześnie. Do najczęściej stosowanych (ale nie tylko) indeksów złożonych należą formuły wiążące ilość towarów i ich ceny. Takie indeksy stosowane do pewnego koszyka dóbr służą między innymi do szacowania poziomu inflacji. Jako przykład indeksu agregatowego omówiony zostanie indeks Laspeyresa w indeksie tym odnosi się sumaryczną wartość koszyka dóbr w danym okresie do wartości tego samego koszyka dób w okresie bazowym. Indeks Laspeyresa = p i q 0 100 p q Oznaczenia: p i ceny poszczególnych dóbr, q i ilości poszczególnych dóbr 0 0
Przykład wyznaczania i interpretacji indeksów dynamiki Przykłady będą dotyczyć danych o: liczbie wypadków drogowych w państwach Unii Europejskiej; poziomie przewozów pasażerów koleją w państwach OECD; ludności państw świata w latach 1950-2010 i prognozach do roku 2050; innych zjawisk społecznych i gospodarczych. Szczegóły obliczeniowe podane zostały w materiałach do zajęć laboratoryjnych nr 6. Prognozowane zmiany procentowe ludności państw europejskich w latach 2000-2050
Sezonowość zjawisk czasowych Zdarza się, iż przedmiotem zainteresowania badacza jest nie tyko dynamika danego zjawiska w całym rozważanym okresie (wyodrębnienie trendu, opis dynamiki, prognoza) ale także wyodrębnienie wahań sezonowych, jeśli takowe istnieją. Na przykładzie zaprezentowany zostanie sposób wyznaczania wskaźników sezonowości dla szeregu czasowego danych miesięcznych, dotyczącego liczby wypadków drogowych w Polsce w ostatnich kilkunastu latach. Umiejętność opisu sezonowości pewnego zjawiska pozwala lepiej zarządzać zasobami, lepiej planować i podejmować bardziej przemyślane decyzje. Wskaźniki sezonowości mogą mieć charakter addytywny lub multiplikatywny. Wskaźniki addytywne pozwalają na ocenienie o ile dla danego typu okresu wartości odchylają się od modelu bez efektu sezonowości (są to więc odchylenia bezwzględne, czyli +/-). Wskaźniki multiplikatywne pokazują stosunek poziomu zjawiska w danym typie okresu do poziomu w modelu bez sezonowości, tak więc pozwalają ocenić ile razy w danym okresie badane zjawisko wzrasta (spada).
Sezonowość zjawisk czasowych (przykład) Na rysunku przedstawiono multiplikatywne wskaźniki sezonowości dla stopy bezrobocia w Polsce do roku 2009. Łatwo można wyodrębnić okresy, w których poziom bezrobocia wzrasta. Wskaźniki pokazują ile razy stopa bezrobocia jest wyższa od średniej rocznej. Dla przykładu, w lutym stopa bezrobocia jest 1,039 razy wyższa niż wartość średnioroczna a sierpniu stanowi 0,953 średniej rocznej.