Ekonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Podobne dokumenty
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

5. Model sezonowości i autoregresji zmiennej prognozowanej

Ćwiczenia IV

4. Średnia i autoregresja zmiennej prognozowanej

3. Modele tendencji czasowej w prognozowaniu

Wprowadzenie do teorii prognozowania

1.9 Czasowy wymiar danych

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Motto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Zajęcia

Ekonometria Ćwiczenia 19/01/05

Własności statystyczne regresji liniowej. Wykład 4

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Spis treści 3 SPIS TREŚCI

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

7.4 Automatyczne stawianie prognoz

Natalia Neherbecka. 11 czerwca 2010

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

EKONOMETRYCZNA PROGNOZA ODPŁYWÓW Z BEZROBOCIA

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Ekonometria egzamin 07/03/2018

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Ćwiczenie 5 PROGNOZOWANIE

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Etapy modelowania ekonometrycznego

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Metoda najmniejszych kwadratów

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Kolokwium ze statystyki matematycznej

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Metody Ilościowe w Socjologii

Stanisław Cichocki. Natalia Nehrebecka

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

1 Modele ADL - interpretacja współczynników

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Modele zapisane w przestrzeni stanów

Przykładowy model ekonometryczny. Sebastian Michalski

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wnioskowanie statystyczne. Statystyka w 5

Stanisław Cichocki Natalia Neherbecka

Ekonometria Wykład 5. Procesy stochastyczne, stacjonarność, integracja. Dr Michał Gradzewicz Katedra Ekonomii I KAE

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Metoda największej wiarogodności

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Prognozowanie na podstawie modelu ekonometrycznego

STATYSTYKA

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Hipotezy statystyczne

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2010/2011

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Imię, nazwisko i tytuł/stopień KOORDYNATORA przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, dr

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Hipotezy statystyczne

Rozdział 8. Regresja. Definiowanie modelu

Prawdopodobieństwo i rozkład normalny cd.

Wprowadzenie do analizy korelacji i regresji

Przykład 2. Stopa bezrobocia

przedmiotu Nazwa Pierwsza studia drugiego stopnia

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Metody Ekonometryczne

Testowanie hipotez statystycznych.

Budowa modelu i testowanie hipotez

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

1.1 Klasyczny Model Regresji Liniowej

Statystyka i eksploracja danych

Wiadomości ogólne o ekonometrii

Czasowy wymiar danych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Metoda najmniejszych kwadratów

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Transkrypt:

Ekonometria Wykład 4 Prognozowanie, sezonowość Dr Michał Gradzewicz Katedra Ekonomii I KAE

Plan wykładu Prognozowanie Założenia i własności predykcji ekonometrycznej Stabilność modelu ekonometrycznego Test Chowa Prognoza punktowa i jej błąd ex ante Prognoza przedziałowa Miary trafności ex post prognozy punktowej ME, MAE, MAPE, MSE, RMSE Sezonowość Wygładzanie wykładnicze Prognozowanie jest trudne, zwłaszcza wtedy, gdy dotyczy przyszłości Niels Bohr

Prognozowanie Prognozowanie ekonometryczne (predykcja ekonometryczna) wnioskowanie o nieznanych wartościach zmiennej objaśnianej w oparciu o model ekonometryczny objaśniający kształtowanie się tej zmiennej Wynikiem prognozowania jest prognoza: Punktowa Przedziałowa Horyzont prognozy okres dla którego prognozujemy (pojęcie definiowane wyłącznie dla prognozy szeregów czasowych) Model prognostyczny musi: Być wszechstronnie i pozytywnie zweryfikowany (szczególnie założenia związane z twierdzeniem Gaussa-Markowa) Przedstawiać stabilne relacje między zmiennymi Ekstrapolacja zmiennych objaśniających (X) musi być uzasadniona Najprościej prognozuje się w przypadku modelu z wszystkimi zmiennymi endogenicznymi (ponieważ są one wyjaśniane przez model i do prognozowania na wiele okresów możemy podejść do problemu rekurencyjnie) W przypadku występowania zmiennych egzogenicznych istotne są sposoby ich determinacji w horyzoncie prognozy Ekonometryczne Zestaw wartości zmiennych egzogenicznych w przyszłości tworzący scenariusz Każda prognoza ekonometryczna ma charakter warunkowy

Dokładność prognoz i źródła błędów Główne źródła błędów prognoz (nie wszystkie są kwantyfikowalne): Błąd estymacji (wynikający z faktu, że β β) Błąd losowy (zazwyczaj zakłada się, że realizacja składnika losowego w horyzoncie prognozy wynosi 0, co jest prawdą jedynie w sensie wartości oczekiwanej) Błąd struktury stochastycznej (założenia MNK, chociaż pozytywnie zweryfikowane mogą być jednak niespełnione, np. ze względu na poziom istotności testów statystycznych) Błąd specyfikacji modelu niewłaściwy wybór postaci analitycznej dla prognozowanego zjawiska Błąd pomiaru, związany z korektami danych statystycznych (np. w przypadku PKB i jego komponentów) Błąd warunków endogenicznych zmiana reżimu kształtowania się zmiennych(ej) objaśnianych(ej) przed model Błąd warunków egzogenicznych przyjęcie błędnych wartości dla zmiennych objaśniających Błędy prognozy ex post oraz ex ante

Zasady prognozowania Zasady wykonywania prognozy punktowej Zasada prognozowania według wartości oczekiwanej, czyli zasada predykcji nieobciążonej, jest to najczęściej stosowana zasada prognozy Zasada prognozowania według największego prawdopodobieństwa wyznaczenie prognozy na podstawie dominanty rozkładu prognozowanej zmiennej; w przypadku spełnienia założenia o normalności składnika losowego pokrywa się ona z poprzednią zasadą Zasada prognozowania według mediany prognoza punktową jest mediana rozkładu (czyli prawdopodobieństwo otrzymania większej lub mniejszej wartości wynosi 50%), rzadko spotykana w praktyce Zasada prognozowania minimalizującego oczekiwaną stratę, stosowana gdy błąd prognozy możemy utożsamić ze stratą, minimalizujemy oczekiwana stratę

Test Chowa stabilności modelu ekonometrycznego Jak przetestować czy wnioski z modelu (parametry), który oszacowaliśmy, są takie same w różnych podokresach Jest to test stabilności parametrów modelu dla dwóch podprób, kiedy punkt zwrotny, czyli czas podziału, jest znany Hipotezy testowe: H 0 : β 1 = β 2 vs. H 1 : β 1 β 2 Szacujemy model dla całego okresu i liczymy jego sumę kwadratów reszt RSS (RSS = σt t=1 e 2 t ) oraz podobnie dla 2 podokresów (oznaczając je RSS 1 = στ 2 t=1 e t oraz RSS 2 = σt t=τ+1 e 2 t ) Statystyka testowa F = (RSS RSS 1 RSS 2 )/(k + 1) (RSS 1 + RSS 2 )/[T 2 k + 1 ] F k+1, T 2 k+1 Jeśli wartość statystyki testowej jest wyższa od wartości krytycznej (czyli suma kwadratów reszt z obu podokresów istotnie różni się od sumy kwadratów reszt dla całego okresu), to odrzucamy H 0 konkludując, że parametry modelu są różne w obu podpróbach

Prognoza punktowa Dysponujemy oszacowanym modelem y t = b 0 + b 1 X 1t + b k X kt = x t b Gdzie b jest wektorem oszacowanych parametrów, a x t wierszowym wektorem wartości zmiennych objaśniających w okresie t Niech okres prognozy to τ, τ > T Prognozą punktową zmiennej y w okresie τ nazywamy: y τ P = x τ b Prognoza ta ma charakter warunkowy (jest warunkowana wartościami przyjętych zmiennych objaśniających)

Błąd prognozy ex ante (1) Błąd prognozy ex ante uwzględnia dwa źródła powstawania błędów prognoz: Błędy estymacji (wynikający z faktu, że β b) Błędy struktury stochastycznej modelu (wynikający z faktu, że D 2 ε > 0) Błąd prognozy ex ante jest różnicą pomiędzy rzeczywistą, ale nieznaną wartością zmiennej objaśnianej w okresie τ w wartością prognozy: e τ P = y τ y τ P Błąd prognozy jest zmienną losową o zerowej wartości oczekiwanej: E e τ P = 0 oraz wariancji: D 2 e τ P = σ 2 1 + x τ X X 1 x τ Dlaczego? Wartość rzeczywista: y τ = x τ β + ε τ Predykcja (pamiętajmy, że E ε τ = 0): y τ = x τ b Błąd predykcji e P τ = x τ β + ε τ x τ b = x τ β b + ε τ Wartość oczekiwana błędu i jego wariancja (pamiętajmy, że β b = β E[β]): E e P τ = x τ E β b + Eε τ = 0 D 2 e P τ = D 2 x τ β b + ε τ X; x τ = σ 2 + D 2 β b x τ X; x τ = σ 2 + x τ [σ 2 X X 1 ]x τ = σ 2 1 + x τ X X 1 x τ

Błąd prognozy ex ante (2) Estymatorem wariancji składnika losowego σ 2 jest S 2 = σe t 2 błąd prognozy ex ante: T (k+1), zatem średni S τ P = S 1 + x τ X X 1 x τ Zatem na dokładność (precyzję) prognozy wpływa: Precyzja oszacowania modelu (w sensie wariancji składnika losowego) Względnej odległości wartości x τ w okresie prognozy od zmienności wartości X w próbie (na podstawie której dokonujemy estymacji modelu) Z kolei średni względny błąd prognozy ex ante θ τ = S τ P y P τ Informuje jak duży jest błąd w relacji do wartości prognozy na okres τ

Prognoza przedziałowa Znajomość średniego błędu prognozy ex ante pozwala zbudować przedział ufności dla punktowej prognozy, którego rozpiętość informuje o precyzji prognozy Jeśli ε t N(, ), to zmienna losowa: t = y τ y τ P S τ P t T k+1,α Zatem dla danego poziomu ufności 1 α i wartości krytycznej testu t α P y P τ t α S P τ < y τ < y P τ + t α S P τ = 1 α

Ocena ex post prognozy punktowej Załóżmy, że mamy m prognoz y τ P oraz rzeczywistych wartości y τ, τ {1,, m} Różnica y τ y τ P jest błędem prognozy dla okresu τ (realizacją zmiennej losowej) W praktyce czasami estymuje się model ekonometryczny na krótszej próbie {1, T m}, aby przeprowadzić analizę kształtowania się błędów prognozy w podpróbie pozostałych ostatnich obserwacji {T m + 1, T} Średni błąd predykcji (mean error ME) m ME = 1 m (y τ y P τ ) τ=1 powinien być bliski 0 (wyraźne odchylenia od zera oznaczają, że predykcja jest obciążona), ponieważ błędy in plus są kompensowane błędami in minus Średni absolutny błąd predykcji (mean absolute error MAE) m MAE = 1 m y τ yp τ τ=1 Porównanie ME i MAE daje informacje o systematycznie wyższych/niższych prognozach niż realizacjach (w przypadku podobnych wartości obu mierników). Różne od siebie MAE i ME oznaczają, że błędy mają odmienne znaki

Ocena ex post prognozy punktowej (2) Średni absolutny błąd procentowy (mean absolute percentage error MAPE) MAPE = 1 m y τ τ=1 Informuje o przeciętnym błędzie skorygowanym o jego znak, w relacji do wysokości prognoz m yτ y τ P Błąd średniokwadratowy (mean square error MSE) MSE = 1 m y τ yp 2 τ τ=1 Pierwiastek błędu średniokwadratowego (root mean square error RMSE) m m RMSE = MSE = 1 m τ=1 y τ y τ P 2 Informuje o skali odchyleń prognozy, w sensie średniokwadratowym. RMSE znacząco różne od MAE świadczy o bardzo wysokich, co do skali, błędach w okresie prognozy

Jak wygląda sezonowość w danych? 16,000 16,000 15,500 EMPBA 15,500 EMPBA Final seasonally adjusted series 15,000 15,000 14,500 14,500 14,000 14,000 13,500 13,500 13,000 13,000 12,500 1996 1998 2000 2002 2004 2006 2008 2010 2012 12,500 1996 1998 2000 2002 2004 2006 2008 2010 2012 EMPBA by Season 16,000 15,500 15,000 14,500 14,000 13,500 13,000 12,500 Q1 Q2 Q3 Q4 Means by Season

Radzenie sobie z sezonowością seasonal dummies Sezonowość jest cechą danych w postaci szeregów czasowych o częstotliwości zbierania krótszej niż rok (najczęściej kwartalnych czy miesięcznych) Jednym z prostszych sposobów uwzględnienia sezonowości w modelu jest dodanie zmiennych zerojedynkowych oznaczających dany kwartał (seasonal dummies), np. y t = f X t + γ 1 D(1) + γ 2 D(2) + γ 3 D(3) + γ 4 D(4) + ε t 1 jeśli dotyczy to kwartalu i Gdzie D i = ቊ 0 w pozostałych kwartalach Jeśli dane zaczynają się od przykładowo 1Q1995 r., to zmienne te mają postać: D 1 = 1 0 0 0 1 0 0 0 T, D 2 = 0 1 0 0 0 1 0 0 0 1 0 T, itp. Dlaczego nie można uwzględnić łącznie wszystkich zmiennych sezonowych i stałej? 1 1 0 0 0 1 0 1 0 0 1 0 0 1 0 1 D 1 D 2 D 3 D 4 = 1 0 0 0 1 1 1 0 0 0 1 0 1 0 0 Zatem D 1 + D 2 + D 3 + D 4 = 1, czyli wystąpiłaby dokładna współliniowość (macierz taka miałaby niepełny rząd kolumnowy) Częściej stosuje się zbliżoną postać, typu: y t = γ + f X t + γ 2 D(2) + γ 3 D(3) + γ 4 D(4) + ε t Stała γ odpowiada wtedy wartości przeciętnej zmiennej w 1Q, parametr γ 2 - o ile Q2 różni się od Q1 (wartość przeciętna w Q2 to γ + γ 2, gdyż wartość jednostkową przyjmują jedynie stała i zmienna D(2), a D(3) i D(4) są równe 0)

Radzenie sobie z sezonowością cd Czasami spotykane jest inne podejście do uniknięcia sezonowości, wykorzystujące fakt, że suma odchyleń sezonowych w roku jest zerowa: y t = γ + f X t + γ 2 D 2 D 1 + γ 3 D 3 D 1 + γ 4 D 4 D 1 + ε t Wtedy np. γ 2 jest miarą efektu sezonowego w 2Q (bo γ jest wspólne dla wszystkich kwartałów), podobnie w 3Q i 4Q, a w 1Q γ 1 = (γ 2 + γ 3 + γ 4 ) Alternatywa I: modelowanie rocznych przyrostów, czyli np. dla zmiennych kwartalnych: Δ 4 y t = y t y t 4 w praktyce częściej spotykane dla logarytmów zmiennej: Δ 4 ln y t = ln y t ln(y t 4 ), bo zmiana logarytmów to dynamiki roczne (wrócimy do tego tematu na wykładzie o nieliniowościach) Alternatywa II: zastosowanie profesjonalnych programów do odsezonowywania zmiennych X-12 czy jego nowsza wersja X13 (stosowany w US) lub TRAMO/SEATS (stosowany w Europie)

dl12manu MANU_SA MANU ld_manu Jaki jest efekt różnych operacji na danych 130 120 y t f(y t ) = log y t log(y t 1 ) 0,25 0,2 110 0,15 100 0,1 90 0,05 80 0 70-0,05 60-0,1 50-0,15 40-0,2 30 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014-0,25 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 0.25 0.2 f(y t ) = log y t log(y t 12 ) f(y t ) = TRAMO/SEATS(y t ) 120 110 0.15 100 0.1 90 0.05 80 0 70-0.05 60-0.1 50-0.15 40-0.2 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 30 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014

Wygładzanie wykładnicze Metody wygładzania (wyrównywania) wykładniczego są uogólnieniem metody średnich ruchomych Bywają one wykorzystywane do prognozowania Przedstawię tu najprostszą metodę Browna Oznaczenia: y t - wartości obserwowane, y t - wartości wygładzone, e t = y t y t Metoda ma charakter rekurencyjny: przyjmujmy punkt początkowy: y 1 = y 1 y t = αy t + 1 α y t 1 dla t = 2, 3,, T α < 0; 1 > jest parametrem wygładzania, im niższe α, tym szereg jest bardziej wygładzony y t = y t 1 + α y t y t 1 = y t 1 + αe t 1, zatem α mówi jak bardzo błąd popełniony w poprzednim okresie wpływa na bieżące dopasowanie Literatura sugeruje, żeby wybierać raczej α < 1 2 Prognoz wyznaczana jest na podstawie ostatniej obserwacji: y τ P = αy T + 1 α y T Jest to prognoza stała, zatem używa się ją raczej do prognozowanie na 1 okres (wtedy τ = T + 1)

Wygładzanie wykładnicze w Gretlu (α = 0.2)