Modelowanie ekonometryczne

Podobne dokumenty
Metody Ilościowe w Socjologii

3. Analiza własności szeregu czasowego i wybór typu modelu

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Rozdział 8. Regresja. Definiowanie modelu

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Ekonometria. Zajęcia

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Statystyka matematyczna i ekonometria

MODELE LINIOWE. Dr Wioleta Drobik

3. Modele tendencji czasowej w prognozowaniu

Wprowadzenie do analizy korelacji i regresji

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Stacjonarność Integracja. Integracja. Integracja

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Statystyka i Analiza Danych

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Natalia Neherbecka. 11 czerwca 2010

Etapy modelowania ekonometrycznego

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści 3 SPIS TREŚCI

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Regresja i Korelacja

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

KORELACJE I REGRESJA LINIOWA

MODELOWANIE POLSKIEJ GOSPODARKI Z PAKIETEM R Michał Rubaszek

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Analiza autokorelacji

Analiza współzależności zjawisk

ANALIZA DYNAMIKI DOCHODU KRAJOWEGO BRUTTO

5. Model sezonowości i autoregresji zmiennej prognozowanej

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

4. Średnia i autoregresja zmiennej prognozowanej

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Przykład 2. Stopa bezrobocia

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2010/2011

Imię, nazwisko i tytuł/stopień KOORDYNATORA przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, dr

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Ekonometria dynamiczna i finansowa Kod przedmiotu

przedmiotu Nazwa Pierwsza studia drugiego stopnia

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Analiza regresji - weryfikacja założeń

Stanisław Cichocki Natalia Neherbecka

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

t y x y'y x'x y'x x-x śr (x-x śr)^2

KARTA PRZEDMIOTU. 12. PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Odniesienie do kierunkowych efektów kształcenia (symbol)

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Analiza składowych głównych. Wprowadzenie

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Weryfikacja hipotez statystycznych

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

1.1 Klasyczny Model Regresji Liniowej

Analiza współzależności dwóch cech I

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

PDF created with FinePrint pdffactory Pro trial version

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4.

Wiadomości ogólne o ekonometrii

Transkrypt:

Modelowanie ekonometryczne Kamil Skoczylas Kamilskoczylas@wp.pl 1. Wstęp Otaczający nas świat to zbiór różnych zjawisk. W zależności od zainteresowań człowiek staje się obserwatorem niektórych z nich. Zjawiska fizyczne czy chemiczne z reguły mogą być opisane za pomocą jednego równania, które uznawane jest za aksjomat. Modele ekonometryczne różnią się znacząco od równań, ponieważ bardzo rzadko w stu procentach pokrywają się z rzeczywistością. Wyrażane mogą być za pomocą różnych postaci funkcyjnych, jednak najczęściej spotykana jest postać liniowa. Popularność tego podejścia opisu wynika głównie z prostoty interpretacji. Ekonometria korzysta z dorobku innych nauk takich jak statystyka, informatyka czy matematyka. Przedrostek eko został przyjęty ze względu na miejsce, w którym dany zbiór technik opisywania rzeczywistości jest stosowany czyli ekonomii. Zjawisko które jest opisywane nazywane jest zmienna zależną bądź objaśnianą. Składniki modelu, które opisują daną rzecz znane są jako zmienne niezależne bądź objaśniające. Przy obecnych technikach predykcji zmiennych częściej używane są te drugie terminy, ponieważ wartości na podstawie których są określane zmienne objaśniane mogą być modelowane. 2. Pojęcia używane w modelowaniu ekonometrycznym Korelacja - często nazywana współzależnością, jest główną miarą zależności zmiennej objaśnianej od zmiennej objaśniającej. Najpopularniejszym narzędziem jest Współczynnik korelacji liniowej Pearsona, jego wartość zależy od kowariancji oraz odchyleń standardowych zmiennych, które są badane. Korelacja jest wykorzystywana przy budowie macierzy korelacji, która daje ogólny obraz zależności występujących pomiędzy wektorem zmiennej objaśnianej a macierzą zmiennych objaśniających Współczynnik Pearsona jest wyrażony wzorem: r XY = cov(x, Y) σ X σ Y

Autokorelacja funkcja przypisująca wartość współczynnika korelacji Pearsona dla szeregu czasowego opóźnionego o k jednostek czasu względem tego samego szeregu czasowego. Na jej podstawie możemy stwierdzić występowanie zależności wartości obecnej od wartości, która wystąpiła wcześniej. Jest to jedno z podstawowych narzędzi wykorzystywanych przy budowie modeli dynamicznych, których główną cechą jest występowanie opóźnień w szeregu czasowym. Regresja metoda szacowania wartości oczekiwanej zmiennej objaśnianej za innych zmiennych. Estymacja (parametrów regresji) to element wnioskowania statystycznego, która pozwala uzyskiwać uogólnione wyniki z badania próby losowej. Wyniki zazwyczaj różnią się od wartości rzeczywistych, a różnice w wartościach nazywa się resztami. We wzorze funkcji opisującej jakąś zależność reszty są wyrażone jako czynnik losowy. Najczęściej wykorzystywaną metodą regresji jest metoda najmniejszych kwadratów, która działa w taki sposób, aby reszty modelu wynikające z różnic pomiędzy wartością teoretyczną a wartością rzeczywistą były minimalne. Reszty są podnoszone do drugiej potęgi, aby suma nie została zaburzona przez redukcję wyrazów o przeciwnych znakach. n S = e i 2 i=1 = min Autoregresja metoda prognozowania statystycznego, w której wartość szeregu czasowego X n+1 zależy od wartości przeszłych tego samego szeregu wraz ze współczynnikami modelu wynikającymi z regresji, określanych jako a 0 X n + a 0 X n 1 + + a k X n k + c + ε. Wyraz wolny c może świadczyć o obecności trendu, gdy c 0. ε jest to błąd modelu. Proces stochastyczny- jest to funkcja zmiennych losowych(x) oraz nielosowego argumentu, nazwijmy, którym jest czas(t). Funkcję tę można więc zapisać jako X t1. Średnia ruchoma również metoda predykcyjna, kryjąca w swojej nazwie prostą koncepcję. Wybór rodzaju średniej zależy od badacza, najczęściej wykorzystywana jest średnia arytmetyczna. Średnia jest liczona dla określonej liczby obserwacji i przesuwana po szeregu czasowym, tak aby ilość obserwacji wchodzących do średniej pozostała taka sama. Zazwyczaj szereg jest dzielony na próbę uczącą i testową w celu weryfikacji odchyleń od wartości rzeczywistych. Metodę tę czasem nazywa się Rolling Window. 1 Osińska M. Ekonometria finansowa, wydawnictwo PWE, Warszawa 2006

Proces stacjonarny jest to proces stochastyczny charakteryzujący się stałą w czasie wartością oczekiwaną oraz stałą wariancją i kowariancją. Jeśli któreś założenie nie jest spełnione proces jest niestacjonarny, wtedy nie ma ściśle określonego kierunku zmian, a wnioskowanie na podstawie takiego szeregu zazwyczaj prowadzi do błędów. Nie stanowi to problemu, ponieważ proces niestacjonarny może zostać sprowadzony do stacjonarnego za pomocą modelu, który sprawi, że powyższe założenia o stacjonarności będą spełnione. Biały szum wywodzi się ze stacjonarności procesu stochastycznego, taki też jest. W przypadku większości dynamicznych modeli ekonometrycznych, własności białego szumu są pożądane dla reszt modeli, a więc jego własności w czasie to: wartość oczekiwana równa 0, wariancja równa wariancji oraz kowariancja składników resztowych równa 0. 3. Prezentacja wybranych modeli ekonometrycznych Klasyczny model regresji liniowej jest używany do modelowania wartości zmiennej objaśnianej, której funkcja ma postać liniową, a jej parametry są estymowane na podstawie zależności zachodzących wewnątrz zbioru elementów przyjętych do szacowania zmiennej objaśniającej włączając tą zmienną. Model jest akceptowany, gdy jest zweryfikowana jego poprawność. Weryfikację przeprowadza się za pomocą określonych narzędzi takich jak: współczynnik determinacji, który mówi o poziomie w jakim model dopasowuje się do zmiennej objaśnianej, współczynnik zbieżności, który mówi w jakim stopniu model nie wyjaśnia zmiennej objaśniającej. Na tym etapie przeprowadza się także testy istotności parametrów modelu takich jak na przykład test F-Fishera-Snedecora. Weryfikację modelu poprzedza jego budowa, która powinna uwzględniać takie elementy jak: rozsądny dobór elementów poparty logicznym powiązaniem, choć dopuszczalne są odstępstwa; eliminacja zmiennych quasistałych, czyli takich które charakteryzują się niską zmiennością, a więc nie wnoszą zbyt wiele informacji do modelu; analiza korelacji, której problem był poruszany wcześniej; metodę doboru zmiennych, ja w szczególności polecam metodę Hellwiga, stworzoną we Wrocławiu ze względu na jej kompleksowość; estymację parametrów, choć metod jest o wiele więcej. Za wszystkimi jednak stoi podobna koncepcja. Jego postać określona jest wzorem: y = a 0 + a 1 x 1 + a j x j + + a m x m, gdzie: - j=1,2,,m

- y postać teoretyczna - a m - parametry strukturalne - x m - wartości empiryczne zmiennych objaśniających Modele Klasy ARIMA Autoregressive integrated moving average, tak właśnie wygląda rozbicie ARIMA na słowa. AR jest to autoregresja, której problem był poruszany wcześniej; I odpowiada początkowemu krokowi różnicowania, który odpowiada za dopasowanie modelu do procesów niestacjonarnych tak jakby proces był stacjonarny; MA jest to średnia ruchoma czy też krocząca, czyli taka która zmienia się wraz z czasem, wyznacza wartość na podstawie n ostatnich obserwacji, tak wyjaśniane było to wcześniej. Różnicowanie idea używana przy założeniu błądzenia losowego, które ma postać: X t = X t 1 + Z t X t -błądzenie losowe X t 1 - poprzednia wartość błądzenia losowego Z t - biały szum, wartość losowa Działanie integrated, czyli procesu różnicowania: Z t = X t X t 1 Proces staje się stacjonarny dopiero wtedy, gdy jest spełnione są założenia o stałej w czasie średniej i wariancji, widać zatem, że proces różnicowania pozwala na stworzenie procesu stacjonarnego na podstawie procesu niestacjonarnego. Modeli klasy ARIMA używa się w celu zrozumienia danych lub też ich predykcji. Kombinacja powyższych 3 metod pozwala na uchwycenie zależności zachodzących w szeregu czasowym. Z reguły oczekiwane działanie wygląda tak, że wybierając odpowiedni model decydujemy się na wpasowanie modelu do danych, następnie szacowana jest zależność w czasie na podstawie autoregresji, a ostatecznie wyniki wygładzane są za pomocą średniej ruchomej. W praktyce jednak badacze często wykonują symulację polegającą na dopasowaniu modelu do kryterium informacyjnego Akaikego, tak aby wartość współczynnika była najmniejsza. Skutkuje to dobraniem postaci, która jest optymalna pod względem złożoności modelu oraz jego wartości informacyjnej.

Występują różne odmiany modeli ARIMA. Najpopularniejszym spośród nich jest ARMA, czyli taki który nie ma możliwości wpasowania się do danych. Kolejnym jest SARIMA uwzględniający sezonowość w procesie. VARIMA, używana jako modelowanie wielu scenariuszy przy pomocy modelu, można to określić jako metoda symulacji Monte Carlo na podstawie otrzymanego modelu. Jeśli chcemy wychwycić zależność długiego okresu najlepiej jest użyć modelu FARIMA, który zwany jest też ARFIMA. Ogólny wzór na model ARIMA to: α(b)y t = β(b)ε t, Gdzie: α(b) = 1 α 1 B α p B p operator regresji rzędu p, β(b) = 1 β 1 B β p B q operator średniej ruchomej rzędu q, ε t - reszty modelu, czynnik losowy, proces białego szumu co można przedstawić jako: Y t = α(b) = 1 α 1 B α p B p + ε t β 1 Bε t 1 β p B q ε t q Modele klasy ARCH Modele klasy ARCH są to modele autoregresji z warunkową heteroskedastycznością. Pojęcie heteroskedastyczności to odwrotność homoskedastyczności, która jest definiowana jako posiadanie tej samej, skończonej wariancji przez wszystkie zmienne losowe w ciągu lub wektorze zmiennych losowych. W modelach ARCH zakłada się, że wariancja błędu losowego danego okresu jest określana przez błędy losowe z poprzednich okresów. Modele te stosuje się przy procesach stacjonarnych o zmiennej wariancji. Uniwersytet Ekonomiczny we Wrocławiu może poszczycić się wybitnym specjalistą z zakresu modelowania ekonometrycznego a szczególnie modeli klasy ARCH, Profesor nadzwyczajny UE Krzysztof Piontek napisał na ich temat dużą liczbę prac, rozważając zastosowanie ich różnych form. Modele ARCH dobrze sprawdzają się przy prognozowaniu krótkoterminowym oraz analizie ryzyka. Reszty modeli mogą być ponownie modelowane w celu usunięcia z nich takich właściwości jak autokorelacja, grube ogony czy rozkład reszt inny niż normalny czy gromadzenie zmienności. Przy wykorzystywaniu modeli ARCH występują efekty tego też modelu. Model z resztami ARCH może być aproksymacją innego modelu bez efektu ARCH,

dzieje się tak jeśli do modelowania weźmiemy złe zmienne bądź błędną specyfikę modelu. Błędy występują też, gdy dane nie są dostosowane ze względu na czas ekonomiczny oraz na czas kalendarzowy. Ostatnim efektem jest skupianie danych, które występuje, jeśli dane napływają w pakietach. Najbardziej popularnym modelem ARCH jest GARCH, w którym G reprezentuje generalizację modelu GARCH. Polega ona na tym, że końcowe zależności modelu są bardziej oparte na bezpośrednich wartościach poprzedzających okres prognostyczny. Dzięki temu sprawdza się lepiej przy opisie rozkładów o grubych ogonach. Dodatkowo jest bardziej przydatny, ponieważ prognozowanie procesów finansowych na krótki okres nie jest rozwiązaniem większości problemów, GARCH z powodzeniem radzi sobie z dużymi rzędami opóźnień w czasie 2. Dodatkowo szacowanie wariancji warunkowej h t przy ARCH prowadzi często do złamania założenia co do nieujemności h t. Model GARCH ma następującą postać: y t = x tξ + ε t, gdzie: x t wektor zmiennych niezależnych ξ-ksi, wektor parametrów t = 1,2,,T. Dalsze własności zarezerwowane dla tego modelu jak i modelu ARCH, są dość mocno skomplikowane i jako, że w potrzebnych pojęciach nie napisałem o rozkładzie normalnym o wariancji warunkowej, tutaj zakończę rozważania na temat postaci modelu. 4. Podsumowanie Modelowanie ekonometryczne jest bardzo przydatnym obszarem zainteresowań. Nie wykluczone, że proces decyzyjny w sztucznej inteligencji nie będzie oparty właśnie na podstawie tej metody. Osobiście uważam, że nie ma lepszego sposobu wnioskowania niż przez model ekonometryczny. Nie zdajemy sobie sprawy ale w codziennych czynnościach kierujemy się właśnie takim schematem jaki możemy stworzyć za pomocą modelu. Podejmując decyzję o zakupie przedmiotu pod uwagę bierzemy cenę, jakość, dostępność a następnie przypisujemy wagi odpowiednim cechom, które nas interesują, a następnie wybieramy najkorzystniejszą dla nas. Tak, ekonometria otacza nas. To, że szereg czasowy możemy opisać za pomocą licz, to tylko początek, możemy do tego użyć wartości prawda i fałsz, Tak, Nie, może, ciężko 2 Krawczyk T. Modelowanie ryzyka inwestycyjnego, wydawnictwo CeDeWu Sp. z o.o., Warszawa 2013

stwierdzić i innych, które jesteśmy w stanie wyodrębnić i stworzyć model decyzyjny. Wielu naukowców pokłada w tej dziedzinie nauki duże nadzieje. Aktualnie dostęp do wiedzy na temat modelowania jest bardzo prosty. Możemy korzystać z pomocy tutorów z całego świata. W celu sprawnego tworzenia modelu warto jest nauczyć się, któregoś z analitycznych języków programowania. Mam nadzieję, że opis powyższych metod decyzyjno-prognostycznych był opisem ciekawym i pełnym nowych informacji.