Indeksy dynamiki (o stałej i zmiennej podstawie) Proste indeksy dynamiki określają tempo zmian pojedynczego szeregu czasowego. Wyodrębnia się dwa podstawowe typy indeksów: indeksy o stałej podstawie; indeksy o zmiennej podstawie. Indeksy o stałej podstawie wyznacza się na podstawie wzoru: Indeks (dla okresu t) = Wartość w okresie t / Wartość w okresie bazowym I t/t = Y t / Y T * 100 Indeksy o zmiennej podstawie wyznacza się na podstawie wzoru: Indeks (dla okresu t) = Wartość w okresie t / Wartość w okresie poprzednim I t/t-1 = Y t / Y t-1 * 100
Indeksy dynamiki (zastosowanie) Dzięki wyznaczeniu indeksów dynamiki można: porównać tempo zmian szeregów czasowych wyrażonych w zupełnie innych jednostkach (np. tempo zmian cen benzyny i zarobków Polaków); porównać tempo zmian tej samej cechy dla różnych obiektów (np. liczba ofiar wypadków drogowych w Polsce, Niemczech i we Francji); lepiej poznać wewnętrzną strukturę danych np. stałe indeksy dynamiki w ujęciu rok do roku świadczą o tym, że mamy do czynienia z trendem wykładniczym.
Przygotowanie arkusza danych w EXCELU Przykład będzie dotyczył danych o liczbie wypadków drogowych w Polsce, we Francji, Niemczech i w Wielkiej Brytanii w latach 1991-2011. Analizą obejmiemy jednak tylko dane z lat 2000-2011. Krok 1 wybór odpowiednich danych Za pomocą polecenia Dane / Podzbiór tworzymy nowy arkusz zawierający dane z interesujących nas państw Krok 2 kopiowanie danych z programu STATISTICA do Excela Obliczenia łatwiej będzie wykonać w programie Excel. Zaznaczamy interesujący nas zakres danych (od 2000 roku) i kopiujemy za pomocą polecenie Edycja / Kopiuj z nagłówkami. Wklejamy dane w nowym arkuszu programu Excel.
Indeksy dynamiki o stałej podstawie Wyznaczanie indeksu o stałej podstawie polega na odniesieniu wartości z danego roku do wartości roku bazowego (a następnie pomnożeniu przez 100). Wartości indeksów względem 2000 roku przedstawiono poniżej. Zastosowanie narzędzia Formatowanie warunkowe pozwala przedstawić dane w interesujący sposób. =B2/B$2*100 Zastosowanie narzędzie Formatowania warunkowego, dostępnych w programie Excel, pozwala w ciekawy sposób przedstawić zmiany skutków wypadków drogowych w postaci mapy kolorów Przykładowe wnioski: W całym badanym okresie nastąpił spadek liczby ofiar wypadków drogowych we wszystkich krajach. Największy we Francji niemal dwukrotny (dokładnie o 49,1%), podobnie w Niemczech i Wielkiej Brytanii. W Polsce liczba ofiar wypadków drogowych spadła w 2011 roku w stosunku do roku 2011 o jedną trzecią (33,4%).
Indeksy dynamiki o zmiennej podstawie Wyznaczanie indeksu o zmiennej podstawie polega na odniesieniu wartości z danego roku do wartości z roku poprzedniego (a następnie pomnożeniu przez 100). Wartości indeksów względem w ujęciu rok do roku przedstawiono poniżej. =B3/B2*100 Przykładowe wnioski: Odejmując od indeksów dynamiki wartość 100 otrzymujemy zmiany procentowe. Zmiany liczby ofiar wypadków drogowych w Niemczech były bardzo systematyczne, dopiero w roku 2011 zanotowano wzrost w stosunku do roku 2010. W Polsce, okresy spadkowe, były przeplatane latami, w których liczba wypadków wzrastała.
Prezentacja graficzna indeksów dynamiki Krok 1 kopiowanie danych z Excela do programu STATISTICA Po zaznaczeniu odpowiedniego obszaru danych w arkuszu Excela wklejamy je do programu STATISTICA wykorzystując polecenie Edycja / Wklej z nagłówkami / i w zależności od tego, czy dane posiadają nazwy przypadków i/lub zmiennych wskazujemy odpowiednią opcję. Krok 2 wykorzystanie wykresów liniowych lub wykresów słupkowych (z poziomem odchyleń) Wyniki można przedstawić w formie wielokrotnego wykresu liniowego (lepsza opcja dla indeksów o stałej podstawie) lub wykresu słupkowego (lepsza opcja dla indeksów o zmiennej podstawie)
Prezentacja graficzna indeksów dynamiki (1)
Prezentacja graficzna indeksów dynamiki (2)
Indeksy złożone Indeksy złożone (agregatowe) pozwalają ocenić tempo i kierunek zmian wartości kombinacji wielu zmiennych jednocześnie. Do najczęściej stosowanych (ale nie tylko) indeksów złożonych należą formuły wiążące ilość towarów i ich ceny. Takie indeksy stosowane do pewnego koszyka dóbr służą między innymi do szacowania poziomu inflacji. Jako przykład indeksu agregatowego omówiony zostanie indeks Laspeyresa w indeksie tym odnosi się sumaryczną wartość koszyka dóbr w danym okresie do wartości tego samego koszyka dób w okresie bazowym. Indeks Laspeyresa = p i q 0 100 p q Oznaczenia: p i ceny poszczególnych dóbr, q i ilości poszczególnych dóbr 0 0
Analiza i przekształcenia szeregów czasowych w programie STATISTICA Specjalistyczne narzędzia poświęcone analizie struktury szeregów czasowych i prognozowaniu zebrane są w programie STATISTICA w module Szeregi czasowe i prognozowanie (STATYSTYKA / Zaawansowane modele liniowe i nieliniowe). Znajdują się tam narzędzia pozwalające dokonywać różnych przekształceń szeregów czasowych, co pozwala na lepsze poznanie ich struktury. Zestaw takich podstawowych narzędzi jest dostępnych po wybraniu polecenia OK (przekształcenia, autokorelacje, ).
Operacje na danych czasowych - przegląd danych Na każdym etapie pracy z szeregiem czasowym użytkownik ma możliwość przeglądnięcia (w formie wykresu lub tabeli) wyjściowego szeregu czasowego wraz z jego przekształceniami. Służy do tego zakładka Przegląd. W zakładce tej ustalamy też sposób opisywania kolejnych obserwacji na wykresach i w tabelach. Lista zmiennych i ich przekształceń Możliwość wyświetlania w formie tabeli lub wykresu jednej lub kilku zmiennych i ich przekształceń Sposób opisywania danych w tabeli lub na wykresie
Operacje na danych czasowych - różnicowanie Wyznaczenie różnic pomiędzy kolejnymi wartościami szeregu czasowego, pozwala lepiej wejrzeć w jego strukturę. Zagadnienie jest bardzo szerokie i skomplikowane, ale pewne spostrzeżenia są dosyć oczywiste: analiza różnic pomiędzy kolejnymi wartościami pozwala odkryć strukturę szeregu, która dla danych oryginalnych może być zaburzona przez występowanie np. trendu; jeżeli uda nam się sporządzić prognozę dla szeregu różnic, tym samym możemy też prognozować kolejne wartości oryginalnego szeregu; po zróżnicowaniu danych charakteryzujących się trendem liniowym, otrzymujemy szereg o wahaniach losowych, po zróżnicowaniu trendu kwadratowego otrzymujemy trend liniowy, etc. Różnicując dane możemy odejmować nie tylko sąsiednie obserwacje na przykład, aby wyeliminować sezonowość miesięczną, należałoby zastosować opóźnienie równe 12. Po wykonaniu różnicowania, przekształcona zmienna może być dalej analizowana. W przypadku bardziej złożonych, nieliniowych trendów, dane można różnicować wielokrotnie.
Operacje na danych czasowych - wygładzanie średnią ruchomą (1) Kolejną, dość często stosowaną operacją dokonywaną na szeregach czasowych jest wyliczanie tzw. średniej ruchomej. Średnia ruchoma może być wyznaczana z dowolnej liczby kolejnych obserwacji, przy czym wynik może być przypisany do obserwacji środkowej lub ostatniej. Dla przykładu, podano wzory pozwalające na wyznaczenie średniej ruchomej 5-okresowej, której wyniki są przypisane do środkowej: i ostatniej obserwacji: Y i * = (Y i-2 + Y i-1 + Y i + Y i+1 + Y i+2 )/5 Y i * = (Y i-4 + Y i-3 + Y i-2 + Y i-1 + Y i )/5 Wyznaczenie średniej ruchomej pozwala na zniwelowanie wahań przypadkowych, z drugiej strony powoduje jednak zmniejszenie liczby obserwacji w szeregu.
Operacje na danych czasowych - wygładzanie średnią ruchomą (2) W programie STATISTICA wyliczenie i przedstawienie średniej ruchomej w formie arkusza danych bądź wykresu jest bardzo łatwe, w tym celu w oknie Przekształcenia zmiennych należy wybrać zakładkę Wygładzanie. Istnieje możliwość wyliczenia średniej ruchomej z dowolnej liczby okresów, może to być średnia z obserwacji poprzedzających, można też dowolnie przypisać wagi kolejnym obserwacjom. Na wykresie przedstawiono oryginalny szereg i szereg wygładzony średnią ważoną 5-okresową liczby wypadków w Niemczech w latach 1991-2011.
Operacje na danych czasowych - opóźnianie Kolejną ważną operacją, wykonywaną często na danych czasowych jest ich opóźnianie. W ten sposób, tworząc przesuniętą kopię oryginalnego szeregu czasowego można na przykład dokonać porównania wartości aktualnych i historycznych. Na przykład, opóźnienie szeregu o jeden okres to wyznaczenia tak zwanej prognozy naiwnej. Opóźnienie szeregu średnich ruchomych o jeden okres pozwala na wyznaczenie prognozy będącą średnią poprzednich obserwacji. W programie STATISTICA opóźnienie szeregu czasowego może być wykonane w zakładce Przesunięcie / Przesuń szereg w przód.
Prognoza naiwna i za pomocą średniej ruchomej - konstruowanie Za pomocą narzędzi analizy szeregów czasowych w programie STATISTICA sporządzona zostanie prognoza liczby wypadków w Niemczech przy zastosowaniu dwóch metod: metody naiwnej; średniej ruchomej 5-okresowej; Wartości zmiennej oryginalnej i prognozowanej zostały następnie wyświetlone w nowym arkuszu programu STATISTICA. W tym celu wykorzystano możliwość wyliczania średniej ruchomej z poprzednich obserwacji oraz opóźniania szeregu. Fragment arkusza wyników przedstawiono poniżej. Prognozy na 2012 rok wyróżniono kolorem żółtym.
Błędy prognozy (1) - dwie filozofie wyznaczania Zawsze podczas wyznaczania prognozy powstaje kwestia jej wiarygodności, bowiem nikt nie spodziewa się, iż każda prognoza będzie w 100% sprawdzalna (a doświadczenie uczy, że jest raczej zupełnie odwrotnie). Optymalna byłaby możliwość podania prognozowanej wartości wraz ze spodziewanym błędem. Niestety, jest to zadanie bardzo trudne, gdyż sprowadza się do konieczności sporządzenia kolejnej prognozy, tym razem dla błędu prognoz. W praktyce, rozwiązuje się to najczęściej w ten sposób, iż wyznacza się błędy prognoz wygasłych, czyli dla wszystkich poprzednich obserwacji wyznacza się wartości prognozowane, oblicza odpowiednie miary błędu, uśrednia i podaje jako błąd prognozy. Zakłada się potem, że błąd faktycznie przeprowadzanej prognozy będzie zbliżony od uśrednionych wartości wcześniejszych błędów.
Błędy prognozy (2) - rodzaje Istnieje wiele rodzajów błędów prognoz. Wszystkie one bazują oczywiście na porównywaniu wartości obserwowanych i dopasowanych na podstawie wybranego modelu zjawiska. Oto najczęściej spotykane z mierników błędów prognoz: Błąd średni (ME) jest to średnia arytmetyczna wartości reszt (błędu), przy czym znaczenie tej miary jest ograniczone przez fakt, że dodatnie i ujemne wartości błędu znoszą się nawzajem. Średni błąd bezwzględny (MAE) jest to dużo lepszy miernik dopasowania modelu, gdyż obliczany jest jako średnia wartości bezwzględnych reszt. Wartość średniego błędu bezwzględnego równa zero oznacza, że model jest idealnie dopasowany do danych. Średni błąd kwadratowy (MSE) charakteryzuje się podobnymi własnościami jak średni błąd bezwzględny, ponadto jest bardziej wrażliwy na wartości odstające. Średni błąd procentowy (MPE) błąd procentowy dla danego okresu czasowego wyliczany jest jako iloraz reszty (błędu) i wartości obserwowanej wyrażony w procentach. Średnia arytmetyczna procentowych błędów prognozy jest często bardziej przydatna niż błąd średni, gdyż pokazuje względne niedopasowanie modelu. Wspólna jest wada obu tych miar czyli znoszenie się nawzajem odchyleń o różnych znakach. Średni bezwzględny błąd procentowy (MAPE) najdoskonalsza ze wszystkich wymienionych charakterystyk, jest łatwo interpretowalna i kumuluje w sobie zalety wszystkich wyszczególnionych wcześniej miar.
Błędy prognozy (3) - wyznaczanie w arkuszu programu STATISTICA Dla prognoz liczby wypadków drogowych w Niemczech wyznaczonych za pomocą metody naiwnej i średniej ruchomej wyznaczone zostaną reszty obu modeli a następnie błędy prognoz typu MAE i MAPE. W tym celu wykorzystane zostaną formuły arkusza danych programu STATISTICA a następnie wartości z kolumn MAE i MAPE zostaną uśrednione np. za pomocą podręcznych statystyk opisowych. Prognoza za pomocą średniej ruchomej: MAE = 1099 MAPE = 18,8% Prognoza naiwna: MAE = 401 MAPE = 6,3%
Błędy prognozy (4) - KOMENTARZ Zarówno na podstawie błędów typu MAE jak i MAPE stwierdzamy, iż prognoza za pomocą średniej ruchomej 5-okresowej daje dużo gorsze wyniki, niż prognoza za pomocą metody naiwnej. Może być to zaskakujące, metoda średniej ruchomej wydaje się brać pod uwagę większą ilość informacji, więc można byłoby się spodziewać lepszych wyników. Jak się okazuje, w przypadku gdy w szeregu występują wyraźne trendy, metody średnich ruchomych nie mogą być stosowane. Gwoli ścisłości, także prognoza skonstruowana za pomocą metody naiwnej daje duże błędy. Zadanie do samodzielnego rozwiązania: Proszę skonstruować prognozę za pomocą modelu trendu liniowego i obliczyć mierniki prognoz MAE i MAPE. Wyniki należy porównać z błędami prognoz metody naiwnej oraz 5-okresowej średniej ruchomej.