Ekonometria - ćwiczenia 1 Mateusz Myśliwski Zakład Ekonometrii Stosowanej Instytut Ekonometrii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa 5 października 2012
1 Sprawy organizacyjne 2 Czym jest ekonometria? Dane ekonomiczne 3 - definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej 4 Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych
Ćwiczenia: grupa 211+213 piątek, 8.00-10.35, sala 108G grupa 212+214 piątek, 10.45-13.20, sala 108G Informacje o zaliczeniu przedmiotu oraz polecanej literaturze w sylabusie, oraz na stronie http://akson.sgh.waw.pl/~mm43624 Konsultacje: środy, g. 19.00, sala 217M (inny termin po kontakcie mailowym) Kontakt: mateusz.mysliwski@gmail.com
Czym jest ekonometria? Dane ekonomiczne Ekonometria wykorzystuje metody statystyczne do szacowania siły zależności ekonomicznych, testowania teorii ekonomicznych oraz do oceny efektywności polityk publicznych i skutków zmian regulacji, na podstawie zgromadzonych danych. Najbardziej intuicyjnym i prawdopodobnie najczęściej używanym zastosowaniem ekonometrii jest prognozowanie wielkości makroekonomicznych, jednak zakres stosowalności omawianych m.in. podczas tego kursu metod jest znacznie szerszy i obejmuje chociażby ekonomię pracy edukacji, zdrowia, czy ekonomię polityczną.
Ekonometria a data mining Czym jest ekonometria? Dane ekonomiczne W odróżnieniu od ekonometrii, gdzie budowa modelu prowadzącego do odkrycia pewnych zależności jest poprzedzona obserwacją rzeczywistości i studiowaniem teorii ekonomicznej, data mining skupia się wyłącznie na mechanicznym wyszukiwaniu wzorców i podobieństw w dużych zbiorach danych. Obserwacja rzeczywistości Ekonometria Data mining Dane Dane Teoria ekonomiczna Teoria ekonomiczna Wnioski Hipotezy badawcze Hipotezy badawcze Modelowanie ekonometryczne Wnioski
Czym jest ekonometria? Dane ekonomiczne Podstawowa cecha odróżniająca dane ekonomiczne od danych wykorzystywanych np. w naukach przyrodniczych - dane ekonomiczne nie pochodzą z eksperymentu. Dane nieeksperymentalne bywają nazywane obserwacyjnymi, lub historycznymi (retrospektywnymi). Dane można podzielić według kilku kryteriów, m.in. 1 Ze względu na stopień agregacji: mikrodane - dane o pojedynczych jednostkach, podejmujących decyzje ekonomiczne np. firma, gospodarstwo domowe, makrodane - dane otrzymane w wyniku agregacji danych indywidualnych na poziomie regionu, kraju. 2 Moment pomiaru: zasób - wartość zmiennej mierzona jest w określonym punkcie czasu (np. liczba ludności), strumień - wartość zmiennej mierzona w pewnym przedziale czasu (np. PKB). 3 Możliwość pomiaru ilościowe - wartości zmiennych są wyrażone w jednostkach mierzalnych, jakościowe - zmienne przyjmują wartości niemierzalne.
Czym jest ekonometria? Dane ekonomiczne W praktyce najczęściej wykorzystywany jest następujący podział danych: 1 Dane przekrojowe - wyrażają stan zjawiska w ustalonym momencie czasu w odniesieniu do różnych obiektów np. PKB per capita w krajach UE w roku 2010. 2 Szereg czasowy - dane przedstawiające zmienność badanego zjawiska w kolejnych jednostkach czasu np. PKB per capita w Polsce w latach 1990-2010. 3 Dane panelowe - złożenie szeregu czasowego i danych przekrojowych np. PKB per capita w krajach UE w latach 1990-2010.
Przykład - dane przekrojowe Czym jest ekonometria? Dane ekonomiczne Źródło: Wooldridge J. (2009): Introductory Econometrics. A Modern Approach, 4e, South-Western CENAGE Learning.
Przykład - szereg czasowy Czym jest ekonometria? Dane ekonomiczne Źródło: Wooldridge J. (2009): Introductory Econometrics. A Modern Approach, 4e, South-Western CENAGE Learning.
Przykład - dane panelowe Czym jest ekonometria? Dane ekonomiczne Źródło: Wooldridge J. (2009): Introductory Econometrics. A Modern Approach, 4e, South-Western CENAGE Learning.
- definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej to formalny opis stochastycznej zależności wyróżnionej wielkości, zjawiska lub przebiegu procesu ekonomicznego (zjawisk, procesów) od czynników, które je kształtują, wyrażony w formie równania lub układu równań. y i = f (x 1i, x 2i,..., x ki ) +ε i } {{ } Model ekonomiczny ε i jest nazywany składnikiem lub zaburzeniem losowym. Można go postrzegać jako wszystkie pozostałe czynniki, mające potencjalnie wpływ na kształtowanie się zmiennej y.
Przykład - przestępczość - Becker (1968) - definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej W bardzo znanym artykule, Gary Becker zaproponował teorię, zgodnie z którą decyzja o podjęciu działalności przestępczej jednostki wynika z zasady maksymalizacji indywidualnej użyteczności. Bardzo ogólnie, ten model ekonomiczny można zapisać jako: y = f (x 1, x 2, x 3, x 4, x 5, x 6, x 7 ), gdzie: y - liczba godzin poświęcanych na działalność przestępczą, x 1 - wynagrodzenie za godzinę gangsterki, x 2 - wynagrodzenie za godzinę legalnego zatrudnienia, x 3 - pozostały dochód, x 4 - prawdopodobieństwo zostania złapanym, x 5 - prawdopodobieństwo zostania skazanym w przypadku złapania, x 6 - oczekiwana długość wyroku, x 7 - wiek.
- definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej Przykład - przestępczość - Becker (1968) - c.d. y = f (x 1, x 2, x 3, x 4, x 5, x 6, x 7 ), Przejście od powyższego modelu ekonomicznego do modelu ekonometrycznego wymaga kilku zabiegów: 1 Określenia lub przyjęcia założeń co do formy funkcyjnej f ( ). 2 Skonfrontowania założeń modelu ekonomicznego z dostępnością danych i obserwowalnością niektórych zmiennych.
- definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej Klasyfikacja modeli ekonometrycznych: 1 Liczba równań w modelu modele jednorównaniowe modele wielorównaniowe 2 Postać analityczna zależności funkcyjnych modelu modele liniowe modele nieliniowe 3 Rola czynnika czasu w równaniach modelu modele statyczne modele dynamiczne 4 Charakter powiązań między nieopóźnionymi zmiennymi endogenicznymi w modelu wielorównaniowym modele proste modele rekurencyjne modele o równaniach współzależnych
Podstawy Sprawy organizacyjne - definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej Model regresji prostej: Model regresji wielorakiej: y i = β 0 + β 1 x 1i + ε i, i = 1, 2,..., n (1) y i = β 0 + β 1 x 1i + β 2 x 2i +... + β k x ki + ε i, i = 1, 2,..., n (2) y - zmienna objaśniana (zależna, regresant), x 1, x 2,..., x k - zmienne objaśniające (niezależne, regresory), β 0, β 1,..., β k - parametry strukturalne modelu, ε - składnik losowy.
Przykład powraca - definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej Wróćmy do przykładu z przestępczością: y = f (x 1, x 2, x 3, x 4, x 5, x 6, x 7 ), gdzie: y - liczba godzin poświęcanych na działalność przestępczą, x 1 - wynagrodzenie za godzinę gangsterki, x 2 - wynagrodzenie za godzinę legalnego zatrudnienia, x 3 - pozostały dochód, x 4 - prawdopodobieństwo zostania złapanym, x 5 - prawdopodobieństwo zostania skazanym w przypadku złapania, x 6 - oczekiwana długość wyroku, x 7 - wiek. Zakładając, że f ( ) jest funkcją liniową, oraz że mamy informacje o wszystkich charakterystykach, model ekonometryczny przestępczości można zapisać jako: przest i = β 0 +β 1 haracz i +β 2 legalne i +β 3 dochod i +β 4 p zlap i +β 5 p skaz i +β 6 wyrok i +β 7 wiek i +ε i
- definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej Zapis modelu w postaci macierzowej: y = Xβ + ε (3) y - wektor obserwacji zmiennej objaśnianej, o wymiarach n 1, x - macierz zaobserwowanych wartości zmiennych objaśniających, o wymiarach n (k + 1), β - wektor parametrów strukturalnych modelu, o wymiarach (k + 1) 1, ε - wektor składników losowych, o wymiarach n 1.
- definicja Klasyfikacja modeli ekonometrycznych Jednorównaniowy liniowy model ekonometryczny Zapis modelu w postaci macierzowej y = y 1 y 2. y n (n 1) β = 1 x 11 x 12... x 1k 1 x 21 x 22... x X = 2k.... 1 x n1 x n2... x nk β 0 β 1. β k (k 1) ε = ε 1 ε 2. ε n (n 1) (n (k+1))
Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych Metoda najmniejszych kwadratów (ang. ordinary least squares OLS) jest najprostszym i najpopularniejszym sposobem szacowania parametrów strukturalnych liniowego modelu ekonometrycznego, która przy spełnieniu pewnych założeń, daje wyniki dobrej jakości. Model regresji w postaci macierzowej: Wartości teoretyczne: y = Xβ + ε (4) ŷ = X ˆβ (5) ŷ - wektor wartości teoretycznych zmiennej objaśnianej, ˆβ - wektor ocen (oszacowań) parametrów. Reszty z modelu: e = y ŷ = y X ˆβ (6) MNK polega na znalezieniu wektora parametrów strukturalnych, minimalizującego sumę kwadratów reszt: ˆβ = argmin e T e (7)
Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych Najważniejszy wzór na tym przedmiocie ˆβ = (X T X) 1 X T y
Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych Twierdzenie Gaussa-Markowa Jeżeli spełnione są poniższe założenia: Elementy macierzy X są nielosowe, nieskorelowane ze składnikiem losowym (ε), inaczej E(X T ε) = 0 Macierz zmiennych objaśniających X ma pełny rząd kolumnowy - rz(x) = k + 1 n Wartość oczekiwana składnika losowego wynosi zero - E(ε) = 0 Składnik losowy jest sferyczny - D 2 (ε) = σ 2 I Składnik losowy ma rozkład normlany - ε N(0, σ 2 ), to estymator KMNK jest BLUE (Best Linear Unbiased Estimator), tj. liniowym, nieobciążonym estymatorem o najmniejszej wariancji w swojej klasie.
Własności estymatorów Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych 1 Nieobciążenie wartość oczekiwana estymatora jest równa prawdziwej wartości parametru w populacji, tj. E( ˆβ) = β. 2 Efektywność najmniejsza wariancja w danej klasie estymatorów (np. w klasie estymatorów liniowych i nieobciążonych). 3 Zgodność stochastyczna zbieżność do prawdziwej wartości, gdy n, tj. lim n P( ˆβ n β < δ) = 1 δ > 0. Dodatkowo estymator jest liniowy, jeśli każda składowa wektora β jest liniową funkcją składowych wektora zmiennej losowej y.
Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych Macierz kowariancji: Estymator wariancji składnika losowego: D 2 ( ˆβ) = σ 2 (X T X) 1 (8) S 2 = e T e n (k + 1) = (y X ˆβ) T )(y X ˆβ) = yt y ˆβ T X T y n (k + 1) n (k + 1) (9) Estymator macierzy kowariancji: ˆD 2 ( ˆβ) = S 2 (X T X) 1 (10)
Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych Średni błąd szacunku: S j = d jj, j = 0, 1,..., k (11) Średni względny błąd szacunku: S w j = S j ˆβ 100, j = 0, 1,..., k (12) j
Estymator KMNK Założenia i własności Estymator wariancji składnika losowego Testy istotności zmiennych Test istotności t-studenta Hipotezy Statystyka testowa Obszar odrzucenia hipotezy zerowej H 0 : β j = 0 H 1 : β j 0 (13) t = ˆβ j S j t n (k+1) (14) (, t n (k+1) > < t n (k+1), ) (15)
Operacje macierzowe w Excelu =TRANSPONUJ(zakres) transpozycja, =MACIERZ.ODW(zakres) odwracanie macierzy, =MACIERZ.ILOCZYN(macierz1;macierz2) mnożenie macierzy. Po wykonaniu formuły, wynik pojawia się tylko w 1 komórce. Należy zaznaczyć tę komórkę wraz z całym zakresem wyniku (np. jeśli transponujemy macierz 5x3 to zaznaczyć obszar 3x5), wcisnąć F2, a następnie Ctrl+Shift+Enter.
Zadanie 1.13. M. Grossman i F. Chaloupka opublikowali w 1998 r. wyniki badań nad pytaniem, czy można na gruncie ekonomicznym znaleźć potwierdzenie uzależniających własności kokainy. Skonstruowali w tym celu jednorównaniowy liniowy model ekonometryczny, w którym zmienną objaśnianą była konsumpcja kokainy. Zgromadzone przez autorów dane miały charakter przekrojowo-czasowy i obejmowały zarówno indywidualne cechy młodych Amerykanów (płeć, rasę, dochody, miejsce zamieszkania), jak i ceny narkotyków w poszczególnych stanach Stanów Zjednoczonych. 1 Zaproponuj sposób weryfikacji hipotezy, że kokaina ma własności uzależniające. 2 Grossman i Chaloupka stwierdzili, że znak oszacowania parametru przy opóźnionej zmiennej objaśnianej jest dodatni. Zinterpretuj ten wynik. 3 Autorzy stwierdzili zależność konsumpcji kokainy od jej ceny. Dla zmiennych objaśniających przyjmujących wartości równe ich medianom, długookresowa cenowa elastyczność konsumpcji kokainy jest równa -1,35, natomiast natychmiastowy efekt jednorazowej zmiany ceny wynosi -0,50. Czy te wyniki są sprzeczne z wnioskami z punktu 2? 4 Oszacowanie parametru przy zmiennej zero-jedynkowej przyjmującej wartość 1 dla obszarów, na których marihuana nie jest zdelegalizowana i 0 w przeciwnym przypadku, przyjęło wartość dodatnią. Czy kokaina i marihuana są dobrami substytucyjnymi czy komplementarnymi? 5 Oszacowanie parametru przy zmiennej objaśniającej, opisującej wiek, od którego w danym stanie można legalnie pić alkohol, przyjęło wartość dodatnią. Czy kokaina i alkohol są dobrami substytucyjnymi czy komplementarnymi?