Zasad budowania prognoz ekonometrcznch
Klasczne założenia teorii predkcji 1. Znajomość modelu kształtowania się zmiennej prognozowanej Znajomość postaci analitcznej wstępującch zależności międz zmiennmi modelu Znajomość wartości ocen parametrów strukturalnch Znajomość wartości ocen parametrów struktur stochastcznej (wariancji resztowej, macierz wariancji i kowariancji ocen parametrów strukturalnch) 2
3 2. Stabilność prawidłowości ekonomicznej w czasie. Model powinien bć dobrm odzwierciedleniem badanch prawidłowości nie tlko w okresie, z którego pochodzą dane do estmacji, lecz również w okresie, na któr się prognozuje Stabilność postaci analitcznej modelu Stabilność zbioru zmiennch objaśniającch Stabilność wartości parametrów strukturalnch
3. Stabilność rozkładu składnika losowego Rozkład składnika losowego nie ulega zmianom w czasie Mał i stabiln błąd szacunku modelu (odchlenie standardowe reszt) gwarantuje otrzmanie prognoz obarczonch małm błędem sstematcznm Założenia 2 i 3 mogą bć werfikowalne 4
5 4. Znajomość wartości zmiennch objaśniającch modelu w okresie prognozowanm Plan, założenia Prognoz zmiennch objaśniającch na podstawie tendencji rozwojowej lub na podstawie modeli opisowch
6 5. Dopuszczalność ekstrapolacji modelu poza zaobserwowan obszar zmienności zmiennch objaśniającch Ma na celu zapobieżenie bezkrtcznm uogólnieniom Nie ma gwarancji budow dobrch prognoz na podstawie zaobserwowanego poziomu zmienności zmiennch objaśniającch w przeszłości
UWAGA! W przpadku prognozowania krótkookresowego przjmuje się, że założenia klasczne są spełnione Wnioskowanie na dłuższe okres wmaga jednak modfikacji założeń ze względu na niestałość struktur ekonomicznej i możliwość zmian parametrów modeli w czasie 7
Zmodfikowane założenia teorii predkcji 1. Znajomość modelu kształtowania się zmiennej prognozowanej, któr odzwierciedla prawidłowość rozwoju tej zmiennej także w przpadku prawie stabilności tej prawidłowości (zmian powolne, stabilne, mierzalne) 2. Stabilność lub prawie stabilność prawidłowości ekonomicznej w czasie 3. Stabilność lub prawie stabilność rozkładu składnika losowego modelu 4. Znajomość wartości zmiennch objaśniającch modelu lub ich rozkładu prawdopodobieństw w okresie prognozowanm 5. Możliwość ekstrapolacji modelu poza obszar zmienności z 8 błędem nie większm od zadanego
Zasad predkcji ilościowej reguł, na podstawie którch buduje się prognoz Zasada predkcji nieobciążonej: PROGNOZY PUNKTOWE E Y T T Wartość oczekiwana rozkładu zmiennej prognozowanej w okresie T Prognozę ustala się na poziomie nadziei matematcznej zmiennej prognozowanej w okresie, na któr się prognozuje z dokładnością do błędu estmacji modelu. 9 Uzasadnienie wted, gd proces wnioskowania jest wielokrotnie powtarzan a własność tej zasad: E Y T T 0 ujawnia się prz porównaniu wielu prognoz i odpowiadającch im realizacji.
Gd proces wnioskowania w przszłość ma charakter jednorazow lub powtarzaln w dużch odstępach czasu, znajduje zastosowanie: Zasada predkcji według największego prawdopodobieństwa: T M 0 Y T Wartość najbardziej prawdopodobna zmiennej prognozowanej (moda, dominanta) w okresie T Prognozę ustala się na poziomie wartości najbardziej prawdopodobnej. 10 ZASADY STATYSTYCZNE POKAZUJĄ JAK CZĘSTO SIĘ MYLIMY
ZASADA EKONOMICZNA POKAZUJE JAKIE SĄ KOSZTY POPEŁNIENIA POMYŁKI Zasada minimalizacji oczekiwanej strat: gdzie: T min u błąd predkcji W(u) funkcja strat u E W u W wniku realizacji tej zasad otrzmujem prognozę, która musi zapewniać najmniejsz poziom ewentualnch strat 11
Zmienna prognozowana ma rozkład smetrczn: Zasad statstczne dają takie same prognoz. Zmienna prognozowana ma rozkład asmetrczn: Większe uzasadnienie ma zasada największego prawdopodobieństwa. 12
Zasada predkcji oparta na przedziale ufności: PROGNOZY PRZEDZIAŁOWE P T I T T Przedział predkcji Wiargodność predkcji W przpadku predkcji powtarzalnej, wiargodność prognoz określa przbliżon procent prognoz trafnch w długim ciągu predkcji Obejmują przszłą realizację 13
Rola składnika losowego w procesie predkcji Jeśli przjmiem model ekonometrczn postaci: Xb Składnik losow można zdefiniować jako różnicę międz rzeczwistą wartością zmiennej objaśnianej a jej wartością teoretczną: u u Xb Wpłw składników losowch na proces predkcji realizuje się przez: wwołanie odchleń wartości zmiennej prognozowanej od prognoz fakt, że średnie błęd szacunku parametrów strukturalnch modelu zależą od wariancji składników losowch 14
Wpłw składników losowch na proces predkcji jest tm większ im większa jest ich wariancja Jeśli wariancja składników losowch jest duża, to nie możliwe jest oszacowanie modelu ekonometrcznego z wstarczającą do celów prognostcznch dokładnością. Nie możliwe jest też zbudowanie dokładnch prognoz. 15 Jeśli wariancja składników losowch zmienia się w czasie (wzrasta), oznacza to, że w miarę upłwu czasu rząd odchleń wartości zmiennej prognozowanej od prognoz jest coraz większ, tm samm dokładność wnioskowania w przszłość maleje. Jeśli dodatkowo wzrost wariancji składników losowch w czasie jest wraźn i trwał, nie możem wkorzstwać do celów prognostcznch zbudowanego modelu.
UWAGA: składnik losow nie jest bezpośrednio obserwowaln 16 Możem otrzmać ocen jego wartości poprzez obliczenie reszt: 0,2 0,15 0,1 0,05 0-0,05-0,1-0,15-0,2 uˆ Xbˆ 0 5 10 15 20 25 reszt Reszt osclują wokół zera wariancja składnika losowego nie zwiększa się w czasie
Wariancja składnika losowego nie jest stała wzrasta w miarę upłwu czasu, a oszacowan model nie jest aktualn. Ab wkorzstać go do celów predkcji należ go radkalnie poprawić. 0,25 0,2 0,15 0,1 0,05 0-0,05-0,1-0,15-0,2 0 5 10 15 20 25 reszt 17
Błąd ex-ante większ od zakładanego E T A P Y P R O G N O Z O W A N I A 18 Sformułowanie zadania prognostcznego Podanie przesłanek prognostcznch Wbór metod prognozowania Wznaczenie prognoz Ocena dopuszczalności prognoz Werfikacja prognoz Obiekt, zjawisko, zmienne, cel, dopuszczalność, horzont Co kształtuje dane zjawisko, zebranie materiału statstcznego Określenie błędu ex-ante Określenie błędu ex-post
Szeregi czasowe
Definicja szeregu Zbiór wartości badanej cech (zjawiska) uporządkowan chronologicznie nazwam szeregiem czasowm lub chronologicznm. Szereg czasow tworzą przkładowo dane określające wielkość produkcji energii elektrcznej w kolejnch miesiącach lat 1991-94. 20
Przkład 1. Produkcja energii elektrcznej w latach 1991-1994 st lut mar kwi maj cze 1991 14,0 12,9 12,8 11,3 10,6 9,2 1992 13,4 12,2 12,5 11,0 9,6 9,0 1993 13,4 12,2 12,8 10,7 9,3 8,9 1994 12,9 12,3 12,7 10,9 9,9 9,4 lip sie wrz paź lis gru 1991 9,0 9,0 9,3 11,2 12,1 13,3 1992 9,0 9,0 9,7 12,0 12,3 13,2 1993 8,7 9,1 9,8 11,5 13,0 13,5 1994 9,3 9,5 9,8 12,3 12,3 13,6 21
22 Sposób prezentacji - tabela
Sposób prezentacji - graficznie 15 energia 14 13 12 11 10 9 8 0 10 20 30 40 50 23
Szereg czasow może dotczć badania tzw. zasobów (np. liczba ludności, liczba ciągników w rolnictwie, średnia temperatura dobowa). strumieni (np. wielkość wdobcia węgla, ilość wprodukowanej energii elektrcznej, wielkość produkcji mleka). 24 Szereg czasow zasobów otrzmam w wniku prowadzenia pomiarów danego zjawiska w ściśle określonm momencie czasowm. Szereg czasow strumieni otrzmam w wniku sumowania wartości badanego zjawiska w ściśle określonm przedziale czasowm.
Jednowmiarow szereg czasow (pokazuje stan zmiennej prognozowanej w momencie lub okresie t, gdzie: t = 1,2,3...,n) [ 3 1, 2,,..., n] Tabela 1. L. pracującch w roku 2000 w Polsce (stan w końcu kwartału) Liczba pracującch w ts. osób 2000 Q1 Q2 Q3 Q4 14319 14518 14727 14540 25
Wielowmiarow szereg czasow (pokazuje stan kilku zmiennch w okresie lub momencie t) Y 11 21... 12 22............ 1n 2n... m1 m2... mn Tabela 2. Podaż pieniądza M1 i M2 w Polsce w pierwszej połowie roku 2002 m1 m2 m3 m4 m5 m6 26 M1 111,7 115,4 114,8 116,3 121,6 126,1 M2 322,2 324,6 319,0 317,6 322,0 321,9
Jednowmiarow szereg przekrojow (pokazuje ciąg zaobserwowanch stanów zmiennej prognozowanej, z którch każd odnosi się do tego samego okresu [momentu] ale do różnch obiektów)... 1 2 k 27 Przkład: Samochod osobowe na 100 mieszkańców w wbranch krajach w roku 2003 Dochod ludności w Polsce w roku 2002 według województw
Wielowmiarow szereg przekrojow (dotcz kilku zmiennch opisującch zjawisko, w odniesieniu do tego samego momentu [okresu] ale do różnch obiektów) Y 11 21... 12 22............ 1k 2k... m1 m2... mk 28 Przkład: Liczba lekarz w Polsce w roku 2003 według województw i według specjalności
Szereg przekrojowo-czasow (utworzon przez szeregi czasowe m zmiennch opisującch k obiektów) Y Y gdzie: Y k macierz z wielowmiarowego szeregu czasowego dla obiektu k Y Y 1 2... k 29 Przkład: Samochod zarejestrowane w Polsce w latach 1999-2003 według województw i tpów samochodów (osobowe, ciężarowe, autobus)
Składowe szeregów czasowch Stał (przeciętn) poziom zmiennej Składowa sstematczna Tendencja rozwojowa (trend) Składowa okresowa (periodczna) Składowa przpadkowa, (składnik losow, wahania przpadkowe) Wahania sezonowe Wahania ckliczne 30
31
Dekompozcja szeregu to proces wodrębnienia poszczególnch składowch danego szeregu czasowego. Identfikację poszczególnch składowch szeregu czasowego konkretnej zmiennej umożliwia: - ocena wzrokowa sporządzonego wkresu, - analiza autokorelacji, - odpowiednie test np. Danielsa, Bartletta lub von Neumanna. Dla wielu szeregów czasowch wstarczająco adekwatne mogą się okazać modele ujmujące tlko niektóre składowe szeregu czasowego: 32
Tendencja rozwojowa 15 14 13 12 11 10 9 Ttuł wkresu = -0,003x + 11,227 R 2 = 0,0006 8 0 10 20 30 40 50 33
Analiza szeregu czasowego Wrównanie szeregu czasowego pozwala na weliminowanie z szeregu wahań przpadkowch, a prz odpowiednim postępowaniu także wahań okresowch. Porównanie szeregu pierwotnego z wrównanm pozwala z kolei na określenie wskaźników mierzącch wahania okresowe. 34
Podstawowe tp szeregów czasowch Badając zachowanie się szeregu czasowego oraz przeprowadzając dekompozcje, najczęściej rozpatruje się modele: a) model addtwn t = f(t) + g(t) + h(t) + t lub t = const + g(t) + h(t) + t b) model multiplikatwn t = f(t) g(t) h(t) t lub t = const g(t) h(t) t c) modele mieszane t = f(t) + g(t) + h(t) t t = f(t) h(t) +g(t) t t = f(t) g(t) t + h(t) t = f(t) h(t) t + g(t) 35
gdzie: Podstawowe tp szeregów czasowch f(t) - funkcja czasu, charakterzująca tendencję rozwojową, nazwaną funkcją trendu; g(t) - funkcja czasu, charakterzująca wahania sezonowe; h(t) - funkcja czasu, charakterzująca wahania ckliczne; - zmienna losowa (składnik losow); const. - stał (średni) poziom prognozowanej zmiennej. Zakłada się, że wartość oczekiwana składnika losowego dla modeli addtwnch równa się 0, a dla modeli multiplikatwnch l. 36
Szereg addtwn Zakłada się, że obserwowane wartości zmiennej prognozowanej są sumą składowch szeregu czasowego (składowe są niezależne). Zakłada się, że wartość oczekiwana składnika losowego dla modeli addtwnch równa się 0. 37
Szereg multiplikatwn Zakłada się, że obserwowane wartości zmiennej prognozowanej są ilocznem składowch szeregu czasowego. Zakłada się, że wartość oczekiwana składnika losowego dla modeli multiplikatwnch wnosi l. 38
Przesłanki użcia modelu szeregu czasowego zjawisko jest zbt złożone, b można je opisać i zrozumieć bez użcia modeli zadaniem prognost jest przewidzenie tego, co się zdarz, a nie wjaśnienie, dlaczego to się zdarz koszt zdobcia wiedz o przcznach wstąpienia zjawisk są bardzo wsokie 39
Podstawowe tp szeregów czasowch Rodzaje szeregów czasowch: 1. Modele naiwne. 2. Modele średniej ruchomej. 3. Wgładzanie wkładnicze. 3.1.Prost model wgładzania wkładniczego. 3.2.Model liniow Holta. 3.3.Model Wintersa. 4. Modele tendencji rozwojowej. 4.1. Modele analitczne. 4.2. Modele adaptacjn. Trend pełzając. 5. Modele składowej periodcznej. 5.1. Metoda wskaźników. 5.2. Analiza harmoniczna. 5.3. Inne modele. 6. Modele ARMA i ARIMA. 40
Modele adaptacjne
Charakterstka ogólna metod adaptacjnch Stosowane prz szeregach czasowch; podstawą prognozowania są tu modele trendu Duża elastczność i zdolność dostosowawcza: do zmian kierunku lub prędkości trendu do zniekształceń lub wahań sezonowch Prognoz opierają się na założeniu segmentowego rozwoju zjawiska w czasie gładkość w pewnch przedziałach czasowch Doskonałe i bardzo proste narzędzia prognozowania krótkookresowego
Metod naiwne najprostsze metod adaptacjne Metoda oparta na błądzeniu przpadkowm: T n Zakłada, że wartość prognoz (w okresie T=n+1) jest równa ostatniej zaobserwowanej wartości zmiennej prognozowanej (w okresie n).
Przkład 1 t t T q 2 t 1 48 - - 2 51 48 9 S * 18 4 2,12 3 49 51 4 4 50 49 1 5 48 50 4 V * 2,12 49,5 100 4,3% 6 x 48 18
Metoda dla szeregu czasowego z trendem: T n n n 1 Prz obliczaniu prognoz uwzględniam ostatni przrost wartości zmiennej prognozowanej
Przkład 2 t t n - n-1 T q t 2 1 48 - - - 2 51 3 - - 3 49-2 54 25 S * 43 3 3,79 4 50 1 47 9 5 48-2 51 9 6 x x 46 43 V * 3,79 49 100 7,73%
Metoda dla zmiennej wkazującej tendencję do zmian o pewien procent prognozowanie w oparciu o średnie tempo zmian: T n i T n Przkład 3: t t i T 1 48 0,0625-2 x x 51
Metoda dla szeregu czasowego z wahaniami sezonowmi T n 1 m Zakłada się, że prognozą jest poziom ostatniej znanej realizacji badanej zmiennej w okresie jednoimiennm; m - oznacza liczbę faz w cklu
Przkład 4: t t T q t 2 1 48 - - m 4 2 51 - - 3 49 - - 4 50 - - 5 48 48 0 S * 17 4 2,06 6 49 51 4 7 52 49 9 8 48 50 4 V * 2,06 49,25 100 4,18% 9 x 48 17
Podsumowanie metod naiwnch: Metod naiwne są najprostszmi metodami prognozowania krótkookresowego; Wkorzstuje się je najczęściej do porównań trafności prognoz zbudowanch na ich podstawie oraz na podstawie bardziej złożonch metod, oraz do ocen celowości stosowania innch metod prognozowania.
Metoda średniej ruchomej Gd zaobserwowan w okresie badawczm poziom wartości zmiennej prognozowanej jest względnie stał, z pewnmi niewielkimi odchleniami przpadkowmi. Średnia ruchoma prosta: t n n 1 T k t Prognoza jest tu średnią artmetczną wartości zmiennej prognozowanej z wbranego przedziału czasu (przedziału wgładzania); k stała wgładzania (przjmuje się tę, dla której wartość średniego błędu expost prognoz wgasłch jest najmniejsza) k 1
Średnia ruchoma ważona: T t n n Uwzględnia postulat nadawania zróżnicowanego znaczenia informacjom z różnch okresów; w t - waga w t t n n k k t 1 (0,1 w 1 t 1 w t
Gd zmienna charakterzuje się wraźnm trendem : Należ zastosować metodę podwójnej średniej ruchomej Wstępne wgładzenie danch obliczenie średnich ruchomch (zwkłch dla k nieparzstego i scentrowanch dla k parzstego) Obliczenie prognoz na podstawie wartości wgładzonch, zgodnie z formułą średniej prostej lub ważonej
Podsumowanie: Liczba wrazów średniej ruchomej (k) czli stała wgładzania, jest określana przez prognostę. Wraz ze wzrostem wartości stałej wgładzania rośnie efekt wrównwania. Średnia ruchoma wznaczona z większej liczb wrazów będzie silniej wgładzała szereg, lecz jednocześnie będzie wolniej reagowała na zmian poziomu prognozowanej zmiennej. Wznaczona z mniejszej liczb wrazów będzie szbciej odzwierciedlała aktualne zmian zachodzące w wartościach prognozowanej zmiennej, lecz większ wpłw będą wwierał na nią wahania przpadkowe (mniejsz będzie efekt wgładzania szeregu).
W przpadku modelu średniej ruchomej ważonej prognosta musi określić liczbę wrazów średniej oraz wagi nadawane poszczególnm wrazom. Modele średniej ruchomej stosuje się na ogół do prognozowania, gd w rozpatrwanm okresie poziom wartości zmiennej prognozowanej jest prawie stał, z niewielkimi odchleniami losowmi, a w szeregu czasowm nie wstępują tendencja rozwojowa i wahania sezonowe oraz ckliczne. Do ocen dopuszczalności prognoz można użć średniego kwadratowego błędu prognoz ex post (s*). W razie pojawienia się w szeregu czasowm liniowej tendencji rozwojowej, do konstrukcji prognoz można zastosować model podwójnej średniej ruchomej. Wgładzon (średnią ruchomą prostą lub ważoną) szereg wartości zmiennej prognozowanej poddaje się powtórnemu wgładzeniu metodą średniej ruchomej.
Metoda wrównania wkładniczego Założenie: przrost wartości trendu zmiennej prognozowanej są w przbliżeniu stałe lub zmieniają się w regularn sposób szereg czasow jest stacjonarn (nie wkazuje wraźnie zaznaczonego trendu, ale może mieć wahania sezonowe) 1. Wartości wgładzone (ocen wartości trendu): ˆ ˆ BEZ WAHAŃ SEZONOWYCH: 1 t 1 t 1 ˆ t 1 t > 1
α stała wgładzania (zależ od charakteru zmiennej prognozowanej jeśli wkazuje częste i nieregularne zmian, większą wagę nadaje się informacjom najnowszm, wówczas stała wgładzania jest bliska jedności) najczęściej wznacza się ją doświadczalnie na podstawie prognoz wgasłch prz różnch stałch
Prognozę dla okresu T wznacza się ze wzoru: T ˆ n h ˆ n ŷn - najnowsza ocena wartości trendu h realne czasowe wprzedzenie prognoz (odległość okresu, na któr się prognozuje, od wjściowego okresu prognoz) h T t n
ŷ t t T q t 2 t Przkład 5: 1 48,0 48,0 - - - 2 49,0 48,6 0,6 - - 3 48,0 48,2-0,4 49,2 1,44 4 48,5 48,4 0,2 47,9 0,38 5 49,0 48,8 0,4 48,6 0,20 6 50,0 49,5 0,7 49,1 0,77 7 49,0 49,2-0,3 50,2 1,56 8 48,0 48,5-0,7 48,9 0,81 9 49,0 48,8 0,3 47,8 1,54 10 x x x 49,1 6,7 ŷ t S V * * 0,98 2,01%
Metoda wrównania wkładniczego może bć stosowana też dla szeregu z wahaniami sezonowmi. Algortm postępowania jest następując: -oczszczenie szeregu z wahań sezonowch poprzez utworzenie nowej zmiennej, zgodnie ze wzorem: t w z t g z j t t j t t -zbudowanie prognoz z T metodą wrównania wkładniczego -obliczenie prognoz T zgodnie ze wzorem: t w z t g z j T T j T T
Przpadek, gd szereg zmiennej prognozowanej charakterzuje się trendem (nie jest stacjonarn): METODA PODWÓJNEGO WYGŁADZANIA WYKŁADNICZEGO Wartości szeregu czasowego są dwukrotnie wgładzone
Podsumowanie: parametr a nazwa się stałą wgładzania i zawiera się w przedziale 0<a<1 ocena trendu t jest średnią ważoną najnowszej realizacji zmiennej oraz poprzedniej ocen trendu wartość wgładzania wznacza się z reguł ekspermentalnie, konstruując na podstawie próbki wstępnej prognoz dla różnch wartości a i wbierając te wartość, prz której wznaczon średni kwadratow błąd wgasłch bł najmniejsz.
PODSUMOWANIE metod adaptacjnch ZALETY: Prostota obliczeń Wgodne narzędzie prognozowania krótkookresowego WADY: Problem z właściwm określeniem stałch wgładzania oraz wag Komplikacja obliczeń w przpadku, gd poziom wartości zmiennej prognozowanej charakterzuje się wraźnm trendem lub wstępuje sezonowość