Ekonometria Wykład 4 Prognozowanie, sezonowość Dr Michał Gradzewicz Katedra Ekonomii I KAE
Plan wykładu Prognozowanie Założenia i własności predykcji ekonometrycznej Stabilność modelu ekonometrycznego Test Chowa Prognoza punktowa i jej błąd ex ante Prognoza przedziałowa Miary trafności ex post prognozy punktowej ME, MAE, MAPE, MSE, RMSE Sezonowość Wygładzanie wykładnicze Prognozowanie jest trudne, zwłaszcza wtedy, gdy dotyczy przyszłości Niels Bohr
Prognozowanie Prognozowanie ekonometryczne (predykcja ekonometryczna) wnioskowanie o nieznanych wartościach zmiennej objaśnianej w oparciu o model ekonometryczny objaśniający kształtowanie się tej zmiennej Wynikiem prognozowania jest prognoza: Punktowa Przedziałowa Horyzont prognozy okres dla którego prognozujemy (pojęcie definiowane wyłącznie dla prognozy szeregów czasowych) Model prognostyczny musi: Być wszechstronnie i pozytywnie zweryfikowany (szczególnie założenia związane z twierdzeniem Gaussa-Markowa) Przedstawiać stabilne relacje między zmiennymi Ekstrapolacja zmiennych objaśniających (X) musi być uzasadniona Najprościej prognozuje się w przypadku modelu z wszystkimi zmiennymi endogenicznymi (ponieważ są one wyjaśniane przez model i do prognozowania na wiele okresów możemy podejść do problemu rekurencyjnie) W przypadku występowania zmiennych egzogenicznych istotne są sposoby ich determinacji w horyzoncie prognozy Ekonometryczne Zestaw wartości zmiennych egzogenicznych w przyszłości tworzący scenariusz Każda prognoza ekonometryczna ma charakter warunkowy
Dokładność prognoz i źródła błędów Główne źródła błędów prognoz (nie wszystkie są kwantyfikowalne): Błąd estymacji (wynikający z faktu, że β β) Błąd losowy (zazwyczaj zakłada się, że realizacja składnika losowego w horyzoncie prognozy wynosi 0, co jest prawdą jedynie w sensie wartości oczekiwanej) Błąd struktury stochastycznej (założenia MNK, chociaż pozytywnie zweryfikowane mogą być jednak niespełnione, np. ze względu na poziom istotności testów statystycznych) Błąd specyfikacji modelu niewłaściwy wybór postaci analitycznej dla prognozowanego zjawiska Błąd pomiaru, związany z korektami danych statystycznych (np. w przypadku PKB i jego komponentów) Błąd warunków endogenicznych zmiana reżimu kształtowania się zmiennych(ej) objaśnianych(ej) przed model Błąd warunków egzogenicznych przyjęcie błędnych wartości dla zmiennych objaśniających Błędy prognozy ex post oraz ex ante
Zasady prognozowania Zasady wykonywania prognozy punktowej Zasada prognozowania według wartości oczekiwanej, czyli zasada predykcji nieobciążonej, jest to najczęściej stosowana zasada prognozy Zasada prognozowania według największego prawdopodobieństwa wyznaczenie prognozy na podstawie dominanty rozkładu prognozowanej zmiennej; w przypadku spełnienia założenia o normalności składnika losowego pokrywa się ona z poprzednią zasadą Zasada prognozowania według mediany prognoza punktową jest mediana rozkładu (czyli prawdopodobieństwo otrzymania większej lub mniejszej wartości wynosi 50%), rzadko spotykana w praktyce Zasada prognozowania minimalizującego oczekiwaną stratę, stosowana gdy błąd prognozy możemy utożsamić ze stratą, minimalizujemy oczekiwana stratę
Test Chowa stabilności modelu ekonometrycznego Jak przetestować czy wnioski z modelu (parametry), który oszacowaliśmy, są takie same w różnych podokresach Jest to test stabilności parametrów modelu dla dwóch podprób, kiedy punkt zwrotny, czyli czas podziału, jest znany Hipotezy testowe: H 0 : β 1 = β 2 vs. H 1 : β 1 β 2 Szacujemy model dla całego okresu i liczymy jego sumę kwadratów reszt RSS (RSS = σt t=1 e 2 t ) oraz podobnie dla 2 podokresów (oznaczając je RSS 1 = στ 2 t=1 e t oraz RSS 2 = σt t=τ+1 e 2 t ) Statystyka testowa F = (RSS RSS 1 RSS 2 )/(k + 1) (RSS 1 + RSS 2 )/[T 2 k + 1 ] F k+1, T 2 k+1 Jeśli wartość statystyki testowej jest wyższa od wartości krytycznej (czyli suma kwadratów reszt z obu podokresów istotnie różni się od sumy kwadratów reszt dla całego okresu), to odrzucamy H 0 konkludując, że parametry modelu są różne w obu podpróbach
Prognoza punktowa Dysponujemy oszacowanym modelem y t = b 0 + b 1 X 1t + b k X kt = x t b Gdzie b jest wektorem oszacowanych parametrów, a x t wierszowym wektorem wartości zmiennych objaśniających w okresie t Niech okres prognozy to τ, τ > T Prognozą punktową zmiennej y w okresie τ nazywamy: y τ P = x τ b Prognoza ta ma charakter warunkowy (jest warunkowana wartościami przyjętych zmiennych objaśniających)
Błąd prognozy ex ante (1) Błąd prognozy ex ante uwzględnia dwa źródła powstawania błędów prognoz: Błędy estymacji (wynikający z faktu, że β b) Błędy struktury stochastycznej modelu (wynikający z faktu, że D 2 ε > 0) Błąd prognozy ex ante jest różnicą pomiędzy rzeczywistą, ale nieznaną wartością zmiennej objaśnianej w okresie τ w wartością prognozy: e τ P = y τ y τ P Błąd prognozy jest zmienną losową o zerowej wartości oczekiwanej: E e τ P = 0 oraz wariancji: D 2 e τ P = σ 2 1 + x τ X X 1 x τ Dlaczego? Wartość rzeczywista: y τ = x τ β + ε τ Predykcja (pamiętajmy, że E ε τ = 0): y τ = x τ b Błąd predykcji e P τ = x τ β + ε τ x τ b = x τ β b + ε τ Wartość oczekiwana błędu i jego wariancja (pamiętajmy, że β b = β E[β]): E e P τ = x τ E β b + Eε τ = 0 D 2 e P τ = D 2 x τ β b + ε τ X; x τ = σ 2 + D 2 β b x τ X; x τ = σ 2 + x τ [σ 2 X X 1 ]x τ = σ 2 1 + x τ X X 1 x τ
Błąd prognozy ex ante (2) Estymatorem wariancji składnika losowego σ 2 jest S 2 = σe t 2 błąd prognozy ex ante: T (k+1), zatem średni S τ P = S 1 + x τ X X 1 x τ Zatem na dokładność (precyzję) prognozy wpływa: Precyzja oszacowania modelu (w sensie wariancji składnika losowego) Względnej odległości wartości x τ w okresie prognozy od zmienności wartości X w próbie (na podstawie której dokonujemy estymacji modelu) Z kolei średni względny błąd prognozy ex ante θ τ = S τ P y P τ Informuje jak duży jest błąd w relacji do wartości prognozy na okres τ
Prognoza przedziałowa Znajomość średniego błędu prognozy ex ante pozwala zbudować przedział ufności dla punktowej prognozy, którego rozpiętość informuje o precyzji prognozy Jeśli ε t N(, ), to zmienna losowa: t = y τ y τ P S τ P t T k+1,α Zatem dla danego poziomu ufności 1 α i wartości krytycznej testu t α P y P τ t α S P τ < y τ < y P τ + t α S P τ = 1 α
Ocena ex post prognozy punktowej Załóżmy, że mamy m prognoz y τ P oraz rzeczywistych wartości y τ, τ {1,, m} Różnica y τ y τ P jest błędem prognozy dla okresu τ (realizacją zmiennej losowej) W praktyce czasami estymuje się model ekonometryczny na krótszej próbie {1, T m}, aby przeprowadzić analizę kształtowania się błędów prognozy w podpróbie pozostałych ostatnich obserwacji {T m + 1, T} Średni błąd predykcji (mean error ME) m ME = 1 m (y τ y P τ ) τ=1 powinien być bliski 0 (wyraźne odchylenia od zera oznaczają, że predykcja jest obciążona), ponieważ błędy in plus są kompensowane błędami in minus Średni absolutny błąd predykcji (mean absolute error MAE) m MAE = 1 m y τ yp τ τ=1 Porównanie ME i MAE daje informacje o systematycznie wyższych/niższych prognozach niż realizacjach (w przypadku podobnych wartości obu mierników). Różne od siebie MAE i ME oznaczają, że błędy mają odmienne znaki
Ocena ex post prognozy punktowej (2) Średni absolutny błąd procentowy (mean absolute percentage error MAPE) MAPE = 1 m y τ τ=1 Informuje o przeciętnym błędzie skorygowanym o jego znak, w relacji do wysokości prognoz m yτ y τ P Błąd średniokwadratowy (mean square error MSE) MSE = 1 m y τ yp 2 τ τ=1 Pierwiastek błędu średniokwadratowego (root mean square error RMSE) m m RMSE = MSE = 1 m τ=1 y τ y τ P 2 Informuje o skali odchyleń prognozy, w sensie średniokwadratowym. RMSE znacząco różne od MAE świadczy o bardzo wysokich, co do skali, błędach w okresie prognozy
Jak wygląda sezonowość w danych? 16,000 16,000 15,500 EMPBA 15,500 EMPBA Final seasonally adjusted series 15,000 15,000 14,500 14,500 14,000 14,000 13,500 13,500 13,000 13,000 12,500 1996 1998 2000 2002 2004 2006 2008 2010 2012 12,500 1996 1998 2000 2002 2004 2006 2008 2010 2012 EMPBA by Season 16,000 15,500 15,000 14,500 14,000 13,500 13,000 12,500 Q1 Q2 Q3 Q4 Means by Season
Radzenie sobie z sezonowością seasonal dummies Sezonowość jest cechą danych w postaci szeregów czasowych o częstotliwości zbierania krótszej niż rok (najczęściej kwartalnych czy miesięcznych) Jednym z prostszych sposobów uwzględnienia sezonowości w modelu jest dodanie zmiennych zerojedynkowych oznaczających dany kwartał (seasonal dummies), np. y t = f X t + γ 1 D(1) + γ 2 D(2) + γ 3 D(3) + γ 4 D(4) + ε t 1 jeśli dotyczy to kwartalu i Gdzie D i = ቊ 0 w pozostałych kwartalach Jeśli dane zaczynają się od przykładowo 1Q1995 r., to zmienne te mają postać: D 1 = 1 0 0 0 1 0 0 0 T, D 2 = 0 1 0 0 0 1 0 0 0 1 0 T, itp. Dlaczego nie można uwzględnić łącznie wszystkich zmiennych sezonowych i stałej? 1 1 0 0 0 1 0 1 0 0 1 0 0 1 0 1 D 1 D 2 D 3 D 4 = 1 0 0 0 1 1 1 0 0 0 1 0 1 0 0 Zatem D 1 + D 2 + D 3 + D 4 = 1, czyli wystąpiłaby dokładna współliniowość (macierz taka miałaby niepełny rząd kolumnowy) Częściej stosuje się zbliżoną postać, typu: y t = γ + f X t + γ 2 D(2) + γ 3 D(3) + γ 4 D(4) + ε t Stała γ odpowiada wtedy wartości przeciętnej zmiennej w 1Q, parametr γ 2 - o ile Q2 różni się od Q1 (wartość przeciętna w Q2 to γ + γ 2, gdyż wartość jednostkową przyjmują jedynie stała i zmienna D(2), a D(3) i D(4) są równe 0)
Radzenie sobie z sezonowością cd Czasami spotykane jest inne podejście do uniknięcia sezonowości, wykorzystujące fakt, że suma odchyleń sezonowych w roku jest zerowa: y t = γ + f X t + γ 2 D 2 D 1 + γ 3 D 3 D 1 + γ 4 D 4 D 1 + ε t Wtedy np. γ 2 jest miarą efektu sezonowego w 2Q (bo γ jest wspólne dla wszystkich kwartałów), podobnie w 3Q i 4Q, a w 1Q γ 1 = (γ 2 + γ 3 + γ 4 ) Alternatywa I: modelowanie rocznych przyrostów, czyli np. dla zmiennych kwartalnych: Δ 4 y t = y t y t 4 w praktyce częściej spotykane dla logarytmów zmiennej: Δ 4 ln y t = ln y t ln(y t 4 ), bo zmiana logarytmów to dynamiki roczne (wrócimy do tego tematu na wykładzie o nieliniowościach) Alternatywa II: zastosowanie profesjonalnych programów do odsezonowywania zmiennych X-12 czy jego nowsza wersja X13 (stosowany w US) lub TRAMO/SEATS (stosowany w Europie)
dl12manu MANU_SA MANU ld_manu Jaki jest efekt różnych operacji na danych 130 120 y t f(y t ) = log y t log(y t 1 ) 0,25 0,2 110 0,15 100 0,1 90 0,05 80 0 70-0,05 60-0,1 50-0,15 40-0,2 30 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014-0,25 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 0.25 0.2 f(y t ) = log y t log(y t 12 ) f(y t ) = TRAMO/SEATS(y t ) 120 110 0.15 100 0.1 90 0.05 80 0 70-0.05 60-0.1 50-0.15 40-0.2 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 30 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014
Wygładzanie wykładnicze Metody wygładzania (wyrównywania) wykładniczego są uogólnieniem metody średnich ruchomych Bywają one wykorzystywane do prognozowania Przedstawię tu najprostszą metodę Browna Oznaczenia: y t - wartości obserwowane, y t - wartości wygładzone, e t = y t y t Metoda ma charakter rekurencyjny: przyjmujmy punkt początkowy: y 1 = y 1 y t = αy t + 1 α y t 1 dla t = 2, 3,, T α < 0; 1 > jest parametrem wygładzania, im niższe α, tym szereg jest bardziej wygładzony y t = y t 1 + α y t y t 1 = y t 1 + αe t 1, zatem α mówi jak bardzo błąd popełniony w poprzednim okresie wpływa na bieżące dopasowanie Literatura sugeruje, żeby wybierać raczej α < 1 2 Prognoz wyznaczana jest na podstawie ostatniej obserwacji: y τ P = αy T + 1 α y T Jest to prognoza stała, zatem używa się ją raczej do prognozowanie na 1 okres (wtedy τ = T + 1)
Wygładzanie wykładnicze w Gretlu (α = 0.2)