PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU

Podobne dokumenty
3. Modele tendencji czasowej w prognozowaniu

7.4 Automatyczne stawianie prognoz

Analiza autokorelacji

Rozdział 8. Regresja. Definiowanie modelu

Wprowadzenie do analizy korelacji i regresji

Regresja linearyzowalna

Analiza metod prognozowania kursów akcji

Dopasowywanie modelu do danych

Analiza regresji - weryfikacja założeń

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

3. Analiza własności szeregu czasowego i wybór typu modelu

ANALIZA SZEREGÓW CZASOWYCH I PROGNOZOWANIE

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

5. Model sezonowości i autoregresji zmiennej prognozowanej

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Ćwiczenia IV

Przykład 2. Stopa bezrobocia

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Ćwiczenie 5 PROGNOZOWANIE

Ekonometryczna analiza popytu na wodę

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Prognozowanie liczby pacjentów poradni ortopedycznej

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka i Analiza Danych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Ekonometria Ćwiczenia 19/01/05

Prognozowanie na podstawie modelu ekonometrycznego

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

4. Średnia i autoregresja zmiennej prognozowanej

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Metody Prognozowania

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Etapy modelowania ekonometrycznego

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

MODELE LINIOWE. Dr Wioleta Drobik

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

STATYSTYKA MATEMATYCZNA

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Wykład 4: Statystyki opisowe (część 1)

Wiadomości ogólne o ekonometrii

Co to jest analiza regresji?

KORELACJE I REGRESJA LINIOWA

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

A.Światkowski. Wroclaw University of Economics. Working paper

Ekonometria. Zajęcia

Regresja logistyczna (LOGISTIC)

Analiza zależności liniowych

Indeksy dynamiki (o stałej i zmiennej podstawie)

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Sterowanie wielkością zamówienia w Excelu - cz. 3

Regresja nieparametryczna series estimator

Co trzeba wiedzieć korzystając z modelu ARIMA i które parametry są kluczowe?

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

POLITECHNIKA OPOLSKA

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Wykład 5: Analiza dynamiki szeregów czasowych

Prognoza terminu sadzenia rozsady sałaty w uprawach szklarniowych. Janusz Górczyński, Jolanta Kobryń, Wojciech Zieliński

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Niestacjonarne zmienne czasowe własności i testowanie

Metody Ilościowe w Socjologii

Stosowana Analiza Regresji

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Ekonometria. Weryfikacja modelu. Paweł Cibis 6 kwietnia 2006

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Analiza Współzależności

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

PAWEŁ SZOŁTYSEK WYDZIAŁ NAUK EKONOMICZNYCH

PDF created with FinePrint pdffactory Pro trial version

Stanisław Cihcocki. Natalia Nehrebecka

METODY STATYSTYCZNE W BIOLOGII

APROKSYMACJA ZJAWISK RYNKOWYCH NARZĘDZIEM WSPOMAGAJĄCYM PODEJMOWANIE DECYZJI

Transkrypt:

PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU prof. dr hab. Andrzej Sokołowski 2 W tym opracowaniu przedstawiony zostanie przebieg procesu poszukiwania modelu prognostycznego wykorzystującego jedynie przeszłe informacje na temat zjawiska prognozowanego. Celem postępowania jest zatem zbudowanie modelu szeregu czasowego dobrze oddającego jego przebieg w przeszłości, opisującego wewnętrzne prawidłowości analizowanego zjawiska oraz pozwalającego na sformułowanie sensownych prognoz. Informacje statystyczne dotyczą hurtowej sprzedaży pewnego wyrobu (oznaczamy go symbolem B). Dane są rzeczywiste i obejmują kolejne dni powszednie. Każda analiza szeregu czasowego powinna rozpoczynać się od oglądu graficznej ilustracji przebiegu tego szeregu. Przy pomocy dostępnej z każdego modułu opcji Wykresy tworzymy liniowy wykres Zmiennej B. Sprzedaż produktu B Zazwyczaj w ekonomicznych szeregach czasowych doszukujemy się następujących składników: trend, wahania okresowe, jednorazowe interwencje oraz wahania losowe. W rozpatrywanym szeregu trudno jednoznacznie przewidzieć czy mamy tu do czynienia z trendem, a jeżeli tak to którego stopnia. Zauważamy stosunkowo dużą wariancję procesu oraz liczne pojedyncze gwałtowne spadki i wzrosty sprzedaży. Przy poszukiwaniu modelu prognostycznego wykorzystamy 179 obserwacji szeregu, pozostawiając cztery ostatnie wartości do orientacyjnej oceny trafności prognoz. W tym celu wykorzystamy przycisk Select cases (Wybierz obserwacje), definiując warunek jako v0<180. 2 Akademia Ekonomiczna w Krakowie. 30 Copyright StatSoft Polska,

Identyfikacja i estymacja trendu W opcji Wykresy można dopasowywać funkcje trendu różnych postaci i mimo, że program podaje analityczną postać funkcji trendu, warto tę opcję wykorzystywać tylko do wstępnego zidentyfikowania typu tendencji rozwojowej. Jednoznaczna identyfikacja modelu trendu wymaga przeprowadzenia testowania istotności parametrów. Przy niezbyt skomplikowanych modelach trendu zaleca się skorzystanie z modułu Regresja wielokrotna. Wydaje się, że w naszym przypadku po ocenie przebiegu szeregu czasowego na wykresie, można rozsądnie założyć, że trend jest wielomianem stopnia nie wyższego niż trzeci. W celu oszacowania takiego trendu, do zbioru danych wprowadzamy zmienne T2 oraz T3 oznaczające odpowiednio drugą i trzecią potęgę zmiennej czasowej (numeru dnia w zbiorze danych). W module Regresja wielokrotna jako zmienną zależną wybieramy B, zaś jako zmienne niezależne T, T2 oraz T3. Szacujemy model i przy pomocy przycisku Podsumowanie regresji uzyskujemy następujące okno wyników: Zauważamy, że nie wszystkie wartości p są mniejsze od poziomu istotności 0,05. Największa wartość prawdopodobieństwa testowego odpowiada zmiennej T3, co oznacza, że w analizowanym szeregu nie występuje trend trzeciego stopnia. Zgodnie z zasadą regresji krokowej eliminujemy zmienną, której odpowiada największa wartość p i ponownie szacujemy model. Otrzymujemy następujący wynik: Tym razem wszystkie wartości p są bardzo małe i oszacowany model uznajemy za ostateczny. Stwierdzamy, że w badanym szeregu czasowym zaobserwowano istotny statystycznie trend wielomianowy stopnia drugiego opisany równaniem: TREND = 15293,96 87,42 T + 0,39 T 2 Zgodnie z tym równaniem zdefiniujemy w zbiorze danych zmienną TREND. Po jej wyliczeniu możemy wykreślić trend na rysunku. Ponownie uwidacznia się duża wariancja wokół linii trendu. Przypominamy, że trend był szacowany z opuszczeniem ostatnich czterech wartości. Są one jednak uwidocznione na rysunku i wszystkie znajdują się powyżej zwykłej ekstrapolacji trendu. Copyright StatSoft Polska, 31

Trend Analiza struktury harmonicznej szeregu Dla identyfikacji ewentualnych wahań okresowych obecnych w szeregu należy przede wszystkim wyeliminować z niego trend. Do eliminacji trendu wykorzystamy prostą metodę różnicowania. Ponieważ stwierdziliśmy występowanie trendu drugiego stopnia dlatego dla jego wyeliminowania należy dwukrotnie policzyć pierwsze różnice. Różnicowania dokonujemy w module Szeregi czasowe/prognozowanie. Ponieważ w module tym program zapamiętuje automatycznie zadaną przez użytkownika liczbę ostatnio dokonanych przekształceń szeregu zatem nie ma potrzeby zapamiętywania wyników kolejnych różnicowań w zbiorze danych. Poniższy rysunek jest wykresem drugich różnic. Wykres zmiennej B po różnicowaniu D(-1); D(-1) 15000 15000 5000 5000 0 0-5000 -5000 - - -15000-15000 - - 0 20 40 60 80 100 120 140 160 180 Teraz szereg jest pozbawiony trendu. Wydaje się też, że wariancja jest dość stabilna. Na podstawie szeregu pozbawionego trendu możemy wyznaczyć wartość funkcji autokorelacji. 32 Copyright StatSoft Polska,

Opóźn Kor. S.E 1 -,569,0745 2 +,048,0743 3 -,026,0741 4 +,034,0739 5 +,100,0737 6 -,175,0735 7 +,088,0733 8 +,054,0730 9 -,061,0728 10 -,007,0726 11 +,039,0724 12 -,045,0722 13 +,071,0719 14 -,200,0717 15 +,304,0715 16 -,231,0713 17 +,164,0711 18 -,157,0708 19 +,049,0706 Funkcja autokorelacji Q p 58,27,0000 58,69,0000 58,81,0000 59,03,0000 60,86,0000 66,53,0000 67,96,0000 68,50,0000 69,21,0000 69,22,0000 69,51,0000 69,91,0000 70,88,0000 78,62,0000 96,74,0000 107,3,0000 112,6,0000 117,5,0000 118,0,0000-1.0-0.5 0.0 0.5 1.0 Wartości funkcji autokorelacji wskazują, że można podejrzewać iż w szeregu występują składowe okresowe o okresach: 6, 14, 15, 16, 17, 18 dni. Wyraźnie zaznacza się składowa autoregresyjna rzędu pierwszego. Ta identyfikacja ma charakter wstępny. Budowa modelu prognostycznego Przechodzimy do modułu Regresja wielokrotna i szacujemy model zawierający trend oraz wstępnie zidentyfikowane składowe okresowe w postaci odpowiednio opóźnionych zmiennych autoregresyjnych. Zmienne takie tworzymy w zbiorze danych kopiując oryginalną zmienną B i odpowiednio ją opóźniając oraz nadając właściwe nazwy. Po estymacji modelu wstępnego i wyeliminowaniu zmiennej B opóźnionej o sześć, czternaście i siedemnaście jednostek czasu otrzymujemy model ostateczny. Model (2) można zapisać jako: B ˆ 2 t = 14069, 57 80, 20 t + 0, 35 t + 0, 33 Bt 1 + 0, 20 Bt 15 0, 21 Bt 16 0, 22 Bt 18 Parametry tego modelu są istotne statystycznie. Po wprowadzeniu nowej zmiennej o nazwie PROGN_2 (prognoza otrzymana z modelu 2) sporządzamy rysunek szeregu empirycznego oraz wartości teoretycznych Modelu 2. Copyright StatSoft Polska, 33

Model 2 Próba opisu reszt odstających Model 2 na ogół dobrze podąża z szeregiem, ale nie jest w stanie zadowalająco opisać dużych odchyleń dodatnich i ujemnych. Ponieważ szereg czasowy dotyczy sprzedaży hurtowej, więc można przypuszczać, że wystąpienie dużej reszty może mieć jakiś wpływ na kształtowanie się szeregu w najbliższej przyszłości. Jeżeli odbiorcy kupili bardzo dużo danego towaru w pewnym dniu, to przy założeniu pewnej równomierności sprzedaży detalicznej można przypuszczać, że sprzedaż hurtowa w następnym dniu będzie mniejsza. Ten wpływ obserwacji odstających może być oczywiście dłuższy niż jeden dzień. W naszym modelu przetestujemy ten wpływ w okresie do trzech dni. W związku z tym przeglądamy reszty Modelu 2 (używając kolejno przycisków Analiza reszt oraz Wartości przewidywane i reszty) i znajdujemy obserwacje dla których reszty standaryzowane przekroczyły ±1,5. Liczba ta została wybrana drogą empiryczną. Do zbioru danych wprowadzamy zmienne zerojedynkowe identyfikujące te duże reszty osobno dodatnie, osobno ujemne. Zmienne te oznaczamy RPLUS oraz RMIN. Zmiennych tych nie ma sensu bezpośrednio wykorzystywać do modelowania, gdyż przy procesie prognozowania znamy tylko reszty przeszłe, a nie przyszłe. Dlatego w zbiorze danych tworzymy opóźnione zmienne resztowe (opóźnione o 1, 2 oraz 3 dni) oznaczając je przez RPLUS_1, RPLUS_2, RPLUS_3 dla reszt dodatnich i analogicznie dla reszt ujemnych. Po zastosowaniu procedury regresji krokowej otrzymujemy następujący rezultat: Widzimy, że duża reszta dodatnia ma jak się można było spodziewać ujemny wpływ na popyt w następnym dniu, natomiast duża reszta ujemna jest rekompensowana zwiększonymi zakupami za dwa dni. 34 Copyright StatSoft Polska,

Model, którego opis zawiera okno wyników powyżej nazwiemy Modelem 3. Po zdefiniowaniu zmiennej prognozowanej w zbiorze danych sporządzamy rysunek przedstawiający szereg oryginalny i wartości teoretyczne wynikające z Modelu 3. Model 3 Z trzech porównywanych modeli, ten ostatni charakteryzuje się najmniejszą wartością średniego błędu dopasowania (około 2242). Statystyka Durbina-Watsona jest niemal dokładnie równa swej wartości przeciętnej w warunkach braku autokorelacji i wynosi 1,948. Współczynnik autokorelacji reszt rzędu pierwszego wynosi tylko 0,024. Kolejny rysunek przedstawia rozkład reszt. 35 Rozkład reszt Modelu 3 30 25 Liczba obs 20 15 10 5 0-7000 - -5000 - -3000 - -1000 0 1000 3000 5000 7000 Rozkład reszt nieźle pasuje do rozkładu normalnego. Wyrównywanie wykładnicze Obok przedstawionego powyżej modelu zaprezentujemy też dwie konkurencyjne procedury prognostyczne. Stosunkowo atrakcyjną procedurą, nawet dla mało wprawnych ekonometryków jest Copyright StatSoft Polska, 35

wyrównywanie wykładnicze. Wyjątkowo przyjazny moduł tej metody oraz pełna automatyzacja procesu poszukiwania najlepszych ocen parametrów modelu pozwala na błyskawiczne uzyskiwanie samego modelu oraz prognoz. Użytkownik programu musi na wstępie zdefiniować charakter trendu, wiodące wahanie okresowe oraz sposób powiązania składników szeregu czasowego (addytywny lub multiplikatywny). Z zaproponowanych postaci trendu wybieramy trend wykładniczy, jako najbardziej zbliżony do tendencji zaobserwowanej w naszym szeregu, przyjmujemy za wiodącą okresowość 15 dni (największy moduł współczynnika autokorelacji poza opóźnieniem 1) oraz addytywną konstrukcję modelu (wahania okresowe nie są proporcjonalne do trendu). Po tych decyzjach uzyskujemy model, którego dopasowanie przedstawiamy na rysunku. Wyrównywanie wykładnicze (składnik okresowy 15) Jak widać model ignoruje gwałtowne pojedyncze wzrosty lub spadki sprzedaży. Ponadto podobnie jak następny przedstawiany model umożliwia uwzględnienie tylko jednej składowej harmonicznej. Model ARIMA Przy budowie modelu ARIMA wykorzystujemy te informacje, które uzyskaliśmy w toku poprzednich rozważań. Ponieważ zidentyfikowano trend drugiego stopnia zatem przed estymacją współczynników modelu przeprowadzamy dwukrotnie różnicowanie rzędu pierwszego, co doprowadza szereg do stacjonarności względem wartości przeciętnej. Przyjmujemy, że podstawową harmoniką występującą w zjawisku jest 15 dni. Podejmujemy próbę eliminacji tej składowej przez różnicowanie sezonowe z opóźnieniem 15. Poprzez kolejne powiększanie wartości parametrów p, q, P, Q, kontrolę istotności parametrów oraz funkcji autokorelacji reszt znajdujemy dopuszczalny model ARIMA(2,2,1)(0,1,1). Opis danych empirycznych przez ten model ilustruje rysunek. 36 Copyright StatSoft Polska,

Model ARIMA Wartości teoretyczne modelu ARIMA mają o wiele większą wariancję niż w przypadku pozostałych modeli. Obserwujemy pojedyncze skoki modelu w górę lub w dół. Po bliższej analizie można zauważyć, że ujemne odchylenia od ogólnej tendencji następują w modelu przeważnie w dzień po rzeczywistym skoku. To zjawisko jest niepokojące dla procesu prognozowania. Porównanie prognoz Na wstępie analizy opuściliśmy w procesie estymacji cztery ostatnie obserwacje. Teraz wartości te wykorzystamy do porównania trafności prognoz. Porównanie to ma charakter wstępny. Model ostateczny został przekazany użytkownikowi i on zadecyduje, czy trafność prognoz jest wystarczająca z punktu widzenia skuteczności decyzji ekonomicznych podejmowanych na ich podstawie. Porównanie trafności prognoz. Dzień Wartość rzeczywista Model 3 Wyrównywanie wykładnicze ARIMA 180 14871,0 13312,6 12664,5 12288,5 181 12830,9 15015,2 10903,2 13228,0 182 16396,2 12690,5 10832,8 12432,8 183 14034,4 14113,4 11611,7 12061,3 Średni błąd prognozy - 2288 / 15,7% 3369 / 23,2% 2570 / 17,7% Copyright StatSoft Polska, 37

17000 Porównanie prognoz 15000 13000 11000 180 181 182 183 B MODEL3 WYRWYK ARIMA Zarówno dane zawarte w Tabeli porównujące prognozy jak i analiza rysunku przemawiają za przyjęciem Modelu 3 jako ostatecznego modelu prognostycznego. 38 Copyright StatSoft Polska,