Indeksy dynamiki (o stałej i zmiennej podstawie)

Podobne dokumenty
Wykład 5: Analiza dynamiki szeregów czasowych

Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Dopasowywanie modelu do danych

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Wykład 5: Statystyki opisowe (część 2)

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

3. Modele tendencji czasowej w prognozowaniu

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

5. Model sezonowości i autoregresji zmiennej prognozowanej

Analiza autokorelacji

Wykład 4: Statystyki opisowe (część 1)

Co to jest analiza regresji?


Ćwiczenie 5 PROGNOZOWANIE

Statystyka. Wykład 11. Magdalena Alama-Bućko. 22 maja Magdalena Alama-Bućko Statystyka 22 maja / 41

Analiza dynamiki zjawisk STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Zajęcia 1. Statystyki opisowe

4. Średnia i autoregresja zmiennej prognozowanej

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

7.4 Automatyczne stawianie prognoz

Praktyczny Excel. Wykresy i grafika. w Excelu krok po kroku

Wprowadzenie do teorii prognozowania

You created this PDF from an application that is not licensed to print to novapdf printer (

Wydatki [zł] Wydatki 36,4 38, ,6 37,6 40, , ,5 33 Czas

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Statystyka. Wykład 13. Magdalena Alama-Bućko. 18 czerwca Magdalena Alama-Bućko Statystyka 18 czerwca / 36

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Wykład 2: Arkusz danych w programie STATISTICA

Microsoft PowerPoint Poziom Zaawansowany PROGRAM SZKOLENIOWY. Plan szkolenia zawiera: Microsoft Excel Poziom Zaawansowany

Wprowadzenie do MS Excel

Analiza współzależności zjawisk

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Analiza Zmian w czasie

PROGRAM SZKOLENIA. Excel w Analizach danych.

Analiza zależności liniowych

najlepszych trików Excelu

Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010

PROGRAM SZKOLENIA. Excel w logistyce.

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

MS Excel. Podstawowe wiadomości

Praktyczny Excel. 50 praktycznych formuł na każdą okazję

Statystyki opisowe i szeregi rozdzielcze

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Prognozowanie popytu. mgr inż. Michał Adamczak

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Statystyka. Wykład 10. Magdalena Alama-Bućko. 15 maja Magdalena Alama-Bućko Statystyka 15 maja / 32

Prognozowanie na podstawie modelu ekonometrycznego

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Wykład 2: Grupowanie danych (szeregi statystyczne) + porady dotyczące analizy danych w programie STATISTICA

Statystyka. Wykład 12. Magdalena Alama-Bućko. 29 maja Magdalena Alama-Bućko Statystyka 29 maja / 47

Program szkolenia EXCEL OD PODSTAW POPOŁUDNIOWY (WIECZOROWY)

Excel zadania sprawdzające 263

Statystyka. Wykład 11. Magdalena Alama-Bućko. 21 maja Magdalena Alama-Bućko Statystyka 21 maja / 31

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Analiza regresji - weryfikacja założeń

LABORATORIUM Z FIZYKI

PROGRAM SZKOLENIA. Excel Średniozaawansowany z wprowadzeniem do tabel przestawnych i makr.

Podstawy obsługi arkusza kalkulacyjnego Excel

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

TP1 - TABELE PRZESTAWNE od A do Z

ABC 2002/XP PL EXCEL. Autor: Edward C. Willett, Steve Cummings. Rozdział 1. Podstawy pracy z programem (9) Uruchamianie programu (9)

Program Szkolenia. Excel Podstawowy. COGNITY praktyczne, skuteczne szkolenia i konsultacje

Program szkoleniowy. 16 h dydaktycznych (12 h zegarowych) NAZWA SZCZEGÓŁY CZAS. Skróty dostępu do narzędzi

Żurek INFOBroker. Szkolenia warsztaty konsultacje MS Excel. tel

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Regresja linearyzowalna

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

ECDL zaawansowany, moduł EXCEL

Struktura terminowa rynku obligacji

TREŚCI NAUCZANIA z przedmiotu pracowania ekonomiczno - informatyczna na podstawie programu nr 341[02]/MEN/ klasa 3 TE

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Program szkolenia MS Excel - Poziom Zaawansowany 30 godz. (wymagana znajomość obsługi programu w zakresie średnio zaawansowanym)

W tym celu korzystam z programu do grafiki wektorowej Inkscape 0.46.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Excel 2007 PL. Pierwsza pomoc

3. Analiza własności szeregu czasowego i wybór typu modelu

KORELACJE I REGRESJA LINIOWA

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Kolumna Zeszyt Komórka Wiersz Tabela arkusza Zakładki arkuszy

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA

W.Stachowski Wielkości w analizie kosztowej Strona 1

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Wprowadzenie do analizy korelacji i regresji

Program szkolenia EXCEL W ANALIZACH DANYCH.

Transkrypt:

Indeksy dynamiki (o stałej i zmiennej podstawie) Proste indeksy dynamiki określają tempo zmian pojedynczego szeregu czasowego. Wyodrębnia się dwa podstawowe typy indeksów: indeksy o stałej podstawie; indeksy o zmiennej podstawie. Indeksy o stałej podstawie wyznacza się na podstawie wzoru: Indeks (dla okresu t) = Wartość w okresie t / Wartość w okresie bazowym I t/t = Y t / Y T * 100 Indeksy o zmiennej podstawie wyznacza się na podstawie wzoru: Indeks (dla okresu t) = Wartość w okresie t / Wartość w okresie poprzednim I t/t-1 = Y t / Y t-1 * 100

Indeksy dynamiki (zastosowanie) Dzięki wyznaczeniu indeksów dynamiki można: porównać tempo zmian szeregów czasowych wyrażonych w zupełnie innych jednostkach (np. tempo zmian cen benzyny i zarobków Polaków); porównać tempo zmian tej samej cechy dla różnych obiektów (np. liczba ofiar wypadków drogowych w Polsce, Niemczech i we Francji); lepiej poznać wewnętrzną strukturę danych np. stałe indeksy dynamiki w ujęciu rok do roku świadczą o tym, że mamy do czynienia z trendem wykładniczym.

Przygotowanie arkusza danych w EXCELU Przykład będzie dotyczył danych o liczbie wypadków drogowych w Polsce, we Francji, Niemczech i w Wielkiej Brytanii w latach 1991-2011. Analizą obejmiemy jednak tylko dane z lat 2000-2011. Krok 1 wybór odpowiednich danych Za pomocą polecenia Dane / Podzbiór tworzymy nowy arkusz zawierający dane z interesujących nas państw Krok 2 kopiowanie danych z programu STATISTICA do Excela Obliczenia łatwiej będzie wykonać w programie Excel. Zaznaczamy interesujący nas zakres danych (od 2000 roku) i kopiujemy za pomocą polecenie Edycja / Kopiuj z nagłówkami. Wklejamy dane w nowym arkuszu programu Excel.

Indeksy dynamiki o stałej podstawie Wyznaczanie indeksu o stałej podstawie polega na odniesieniu wartości z danego roku do wartości roku bazowego (a następnie pomnożeniu przez 100). Wartości indeksów względem 2000 roku przedstawiono poniżej. Zastosowanie narzędzia Formatowanie warunkowe pozwala przedstawić dane w interesujący sposób. =B2/B$2*100 Zastosowanie narzędzie Formatowania warunkowego, dostępnych w programie Excel, pozwala w ciekawy sposób przedstawić zmiany skutków wypadków drogowych w postaci mapy kolorów Przykładowe wnioski: W całym badanym okresie nastąpił spadek liczby ofiar wypadków drogowych we wszystkich krajach. Największy we Francji niemal dwukrotny (dokładnie o 49,1%), podobnie w Niemczech i Wielkiej Brytanii. W Polsce liczba ofiar wypadków drogowych spadła w 2011 roku w stosunku do roku 2011 o jedną trzecią (33,4%).

Indeksy dynamiki o zmiennej podstawie Wyznaczanie indeksu o zmiennej podstawie polega na odniesieniu wartości z danego roku do wartości z roku poprzedniego (a następnie pomnożeniu przez 100). Wartości indeksów względem w ujęciu rok do roku przedstawiono poniżej. =B3/B2*100 Przykładowe wnioski: Odejmując od indeksów dynamiki wartość 100 otrzymujemy zmiany procentowe. Zmiany liczby ofiar wypadków drogowych w Niemczech były bardzo systematyczne, dopiero w roku 2011 zanotowano wzrost w stosunku do roku 2010. W Polsce, okresy spadkowe, były przeplatane latami, w których liczba wypadków wzrastała.

Prezentacja graficzna indeksów dynamiki Krok 1 kopiowanie danych z Excela do programu STATISTICA Po zaznaczeniu odpowiedniego obszaru danych w arkuszu Excela wklejamy je do programu STATISTICA wykorzystując polecenie Edycja / Wklej z nagłówkami / i w zależności od tego, czy dane posiadają nazwy przypadków i/lub zmiennych wskazujemy odpowiednią opcję. Krok 2 wykorzystanie wykresów liniowych lub wykresów słupkowych (z poziomem odchyleń) Wyniki można przedstawić w formie wielokrotnego wykresu liniowego (lepsza opcja dla indeksów o stałej podstawie) lub wykresu słupkowego (lepsza opcja dla indeksów o zmiennej podstawie)

Prezentacja graficzna indeksów dynamiki (1)

Prezentacja graficzna indeksów dynamiki (2)

Indeksy złożone Indeksy złożone (agregatowe) pozwalają ocenić tempo i kierunek zmian wartości kombinacji wielu zmiennych jednocześnie. Do najczęściej stosowanych (ale nie tylko) indeksów złożonych należą formuły wiążące ilość towarów i ich ceny. Takie indeksy stosowane do pewnego koszyka dóbr służą między innymi do szacowania poziomu inflacji. Jako przykład indeksu agregatowego omówiony zostanie indeks Laspeyresa w indeksie tym odnosi się sumaryczną wartość koszyka dóbr w danym okresie do wartości tego samego koszyka dób w okresie bazowym. Indeks Laspeyresa = p i q 0 100 p q Oznaczenia: p i ceny poszczególnych dóbr, q i ilości poszczególnych dóbr 0 0

Analiza i przekształcenia szeregów czasowych w programie STATISTICA Specjalistyczne narzędzia poświęcone analizie struktury szeregów czasowych i prognozowaniu zebrane są w programie STATISTICA w module Szeregi czasowe i prognozowanie (STATYSTYKA / Zaawansowane modele liniowe i nieliniowe). Znajdują się tam narzędzia pozwalające dokonywać różnych przekształceń szeregów czasowych, co pozwala na lepsze poznanie ich struktury. Zestaw takich podstawowych narzędzi jest dostępnych po wybraniu polecenia OK (przekształcenia, autokorelacje, ).

Operacje na danych czasowych - przegląd danych Na każdym etapie pracy z szeregiem czasowym użytkownik ma możliwość przeglądnięcia (w formie wykresu lub tabeli) wyjściowego szeregu czasowego wraz z jego przekształceniami. Służy do tego zakładka Przegląd. W zakładce tej ustalamy też sposób opisywania kolejnych obserwacji na wykresach i w tabelach. Lista zmiennych i ich przekształceń Możliwość wyświetlania w formie tabeli lub wykresu jednej lub kilku zmiennych i ich przekształceń Sposób opisywania danych w tabeli lub na wykresie

Operacje na danych czasowych - różnicowanie Wyznaczenie różnic pomiędzy kolejnymi wartościami szeregu czasowego, pozwala lepiej wejrzeć w jego strukturę. Zagadnienie jest bardzo szerokie i skomplikowane, ale pewne spostrzeżenia są dosyć oczywiste: analiza różnic pomiędzy kolejnymi wartościami pozwala odkryć strukturę szeregu, która dla danych oryginalnych może być zaburzona przez występowanie np. trendu; jeżeli uda nam się sporządzić prognozę dla szeregu różnic, tym samym możemy też prognozować kolejne wartości oryginalnego szeregu; po zróżnicowaniu danych charakteryzujących się trendem liniowym, otrzymujemy szereg o wahaniach losowych, po zróżnicowaniu trendu kwadratowego otrzymujemy trend liniowy, etc. Różnicując dane możemy odejmować nie tylko sąsiednie obserwacje na przykład, aby wyeliminować sezonowość miesięczną, należałoby zastosować opóźnienie równe 12. Po wykonaniu różnicowania, przekształcona zmienna może być dalej analizowana. W przypadku bardziej złożonych, nieliniowych trendów, dane można różnicować wielokrotnie.

Operacje na danych czasowych - wygładzanie średnią ruchomą (1) Kolejną, dość często stosowaną operacją dokonywaną na szeregach czasowych jest wyliczanie tzw. średniej ruchomej. Średnia ruchoma może być wyznaczana z dowolnej liczby kolejnych obserwacji, przy czym wynik może być przypisany do obserwacji środkowej lub ostatniej. Dla przykładu, podano wzory pozwalające na wyznaczenie średniej ruchomej 5-okresowej, której wyniki są przypisane do środkowej: i ostatniej obserwacji: Y i * = (Y i-2 + Y i-1 + Y i + Y i+1 + Y i+2 )/5 Y i * = (Y i-4 + Y i-3 + Y i-2 + Y i-1 + Y i )/5 Wyznaczenie średniej ruchomej pozwala na zniwelowanie wahań przypadkowych, z drugiej strony powoduje jednak zmniejszenie liczby obserwacji w szeregu.

Operacje na danych czasowych - wygładzanie średnią ruchomą (2) W programie STATISTICA wyliczenie i przedstawienie średniej ruchomej w formie arkusza danych bądź wykresu jest bardzo łatwe, w tym celu w oknie Przekształcenia zmiennych należy wybrać zakładkę Wygładzanie. Istnieje możliwość wyliczenia średniej ruchomej z dowolnej liczby okresów, może to być średnia z obserwacji poprzedzających, można też dowolnie przypisać wagi kolejnym obserwacjom. Na wykresie przedstawiono oryginalny szereg i szereg wygładzony średnią ważoną 5-okresową liczby wypadków w Niemczech w latach 1991-2011.

Operacje na danych czasowych - opóźnianie Kolejną ważną operacją, wykonywaną często na danych czasowych jest ich opóźnianie. W ten sposób, tworząc przesuniętą kopię oryginalnego szeregu czasowego można na przykład dokonać porównania wartości aktualnych i historycznych. Na przykład, opóźnienie szeregu o jeden okres to wyznaczenia tak zwanej prognozy naiwnej. Opóźnienie szeregu średnich ruchomych o jeden okres pozwala na wyznaczenie prognozy będącą średnią poprzednich obserwacji. W programie STATISTICA opóźnienie szeregu czasowego może być wykonane w zakładce Przesunięcie / Przesuń szereg w przód.

Prognoza naiwna i za pomocą średniej ruchomej - konstruowanie Za pomocą narzędzi analizy szeregów czasowych w programie STATISTICA sporządzona zostanie prognoza liczby wypadków w Niemczech przy zastosowaniu dwóch metod: metody naiwnej; średniej ruchomej 5-okresowej; Wartości zmiennej oryginalnej i prognozowanej zostały następnie wyświetlone w nowym arkuszu programu STATISTICA. W tym celu wykorzystano możliwość wyliczania średniej ruchomej z poprzednich obserwacji oraz opóźniania szeregu. Fragment arkusza wyników przedstawiono poniżej. Prognozy na 2012 rok wyróżniono kolorem żółtym.

Błędy prognozy (1) - dwie filozofie wyznaczania Zawsze podczas wyznaczania prognozy powstaje kwestia jej wiarygodności, bowiem nikt nie spodziewa się, iż każda prognoza będzie w 100% sprawdzalna (a doświadczenie uczy, że jest raczej zupełnie odwrotnie). Optymalna byłaby możliwość podania prognozowanej wartości wraz ze spodziewanym błędem. Niestety, jest to zadanie bardzo trudne, gdyż sprowadza się do konieczności sporządzenia kolejnej prognozy, tym razem dla błędu prognoz. W praktyce, rozwiązuje się to najczęściej w ten sposób, iż wyznacza się błędy prognoz wygasłych, czyli dla wszystkich poprzednich obserwacji wyznacza się wartości prognozowane, oblicza odpowiednie miary błędu, uśrednia i podaje jako błąd prognozy. Zakłada się potem, że błąd faktycznie przeprowadzanej prognozy będzie zbliżony od uśrednionych wartości wcześniejszych błędów.

Błędy prognozy (2) - rodzaje Istnieje wiele rodzajów błędów prognoz. Wszystkie one bazują oczywiście na porównywaniu wartości obserwowanych i dopasowanych na podstawie wybranego modelu zjawiska. Oto najczęściej spotykane z mierników błędów prognoz: Błąd średni (ME) jest to średnia arytmetyczna wartości reszt (błędu), przy czym znaczenie tej miary jest ograniczone przez fakt, że dodatnie i ujemne wartości błędu znoszą się nawzajem. Średni błąd bezwzględny (MAE) jest to dużo lepszy miernik dopasowania modelu, gdyż obliczany jest jako średnia wartości bezwzględnych reszt. Wartość średniego błędu bezwzględnego równa zero oznacza, że model jest idealnie dopasowany do danych. Średni błąd kwadratowy (MSE) charakteryzuje się podobnymi własnościami jak średni błąd bezwzględny, ponadto jest bardziej wrażliwy na wartości odstające. Średni błąd procentowy (MPE) błąd procentowy dla danego okresu czasowego wyliczany jest jako iloraz reszty (błędu) i wartości obserwowanej wyrażony w procentach. Średnia arytmetyczna procentowych błędów prognozy jest często bardziej przydatna niż błąd średni, gdyż pokazuje względne niedopasowanie modelu. Wspólna jest wada obu tych miar czyli znoszenie się nawzajem odchyleń o różnych znakach. Średni bezwzględny błąd procentowy (MAPE) najdoskonalsza ze wszystkich wymienionych charakterystyk, jest łatwo interpretowalna i kumuluje w sobie zalety wszystkich wyszczególnionych wcześniej miar.

Błędy prognozy (3) - wyznaczanie w arkuszu programu STATISTICA Dla prognoz liczby wypadków drogowych w Niemczech wyznaczonych za pomocą metody naiwnej i średniej ruchomej wyznaczone zostaną reszty obu modeli a następnie błędy prognoz typu MAE i MAPE. W tym celu wykorzystane zostaną formuły arkusza danych programu STATISTICA a następnie wartości z kolumn MAE i MAPE zostaną uśrednione np. za pomocą podręcznych statystyk opisowych. Prognoza za pomocą średniej ruchomej: MAE = 1099 MAPE = 18,8% Prognoza naiwna: MAE = 401 MAPE = 6,3%

Błędy prognozy (4) - KOMENTARZ Zarówno na podstawie błędów typu MAE jak i MAPE stwierdzamy, iż prognoza za pomocą średniej ruchomej 5-okresowej daje dużo gorsze wyniki, niż prognoza za pomocą metody naiwnej. Może być to zaskakujące, metoda średniej ruchomej wydaje się brać pod uwagę większą ilość informacji, więc można byłoby się spodziewać lepszych wyników. Jak się okazuje, w przypadku gdy w szeregu występują wyraźne trendy, metody średnich ruchomych nie mogą być stosowane. Gwoli ścisłości, także prognoza skonstruowana za pomocą metody naiwnej daje duże błędy. Zadanie do samodzielnego rozwiązania: Proszę skonstruować prognozę za pomocą modelu trendu liniowego i obliczyć mierniki prognoz MAE i MAPE. Wyniki należy porównać z błędami prognoz metody naiwnej oraz 5-okresowej średniej ruchomej.