Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Podobne dokumenty
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Natalia Neherbecka. 11 czerwca 2010

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Własności statystyczne regresji liniowej. Wykład 4

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka

Uogólniona Metoda Momentów

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Modele wielorównaniowe (forma strukturalna)

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Ekonometria egzamin 07/03/2018

Ekonometria Ćwiczenia 19/01/05

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Egzamin z ekonometrii - wersja ogólna

Testowanie hipotez statystycznych

Problem równoczesności w MNK

Zawansowane modele wyborów dyskretnych

Metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Rozdział 8. Regresja. Definiowanie modelu

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Weryfikacja hipotez statystycznych

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Metoda największej wiarogodności

Metoda najmniejszych kwadratów

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Egzamin z ekonometrii wersja ogolna

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Wprowadzenie do analizy korelacji i regresji

Testowanie hipotez statystycznych

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Autokorelacja i heteroskedastyczność

Metody Ekonometryczne

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Materiał dla studentów

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Uogolnione modele liniowe

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Monte Carlo, bootstrap, jacknife

Prawdopodobieństwo i rozkład normalny cd.

Stosowana Analiza Regresji

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Statystyka i Analiza Danych

Ekonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE

PDF created with FinePrint pdffactory Pro trial version

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej. Modele nieliniowe Funkcja produkcji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Egzamin z ekonometrii wersja IiE, MSEMAT

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Modele selekcji próby

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Egzamin z ekonometrii wersja IiE, MSEMAT

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

MODELE LINIOWE. Dr Wioleta Drobik

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Proces modelowania zjawiska handlu zagranicznego towarami

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Estymacja parametrów rozkładu cechy

Stanisław Cichocki. Natalia Nehrebecka

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Transkrypt:

Mikroekonometria 4 Mikołaj Czajkowski Wiktor Budziński

Endogeniczność regresja liniowa W regresji liniowej estymujemy następujące równanie: i i i KMRL zakłada, że wszystkie zmienne objaśniające są egzogeniczne tj. E ( ε X) = 0 Jeżeli ten warunek jest niespełniony mówimy o endogeniczności zmiennych objaśniających Złamanie tego założenia ma poważne konsekwencje estymator MNK przestaje być zgodny Może to wynikać z różnych przyczyn: Korelacja ze zmienną pominiętą Y = X β + ε Sprzężenie zwrotne między zmienna objaśnianą i objaśniającą

Metoda zmiennych instrumentalnych Rozwiązanie zastosowanie zmiennych instrumentalnych Znalezienie zmiennych, które są silnie skorelowane ze zmienną, którą podejrzewamy o endogeniczność, ale nie są skorelowane z błędem losowym Nie jest to zadanie łatwe Podstawowym estymatorem jest tzw. Dwustopniowa Metoda Najmniejszych Kwadratów (2MNK)

Dwustopniowa Metoda Najmniejszych Kwadratów W pierwszym kroku liczymy regresję, w której wyjaśniamy wszystkie zmienne z podstawowego modelu zmiennymi instrumentalnymi ( ) 1 B= ZZ ZX Wśród zmiennych instrumentalnych Z mogą być egzogeniczne zmienne z X W drugim kroku wyjaśniamy Y przy użyciu wartości dopasowanych z pierwszych regresji X = XB : β2mnk = XX XY Estymator jest zgodny jeżeli instrumenty są nieskorelowane z błędem losowym Aby model skonwergował potrzebujemy co najmniej tyle samo zmiennych instrumentalnych co zmiennych endogenicznych 1

Zadanie 1. Korzystając z danych me.medexp3.dta przeprowadź regresję objaśniającą wysokość wydatków na leki posiadaniem dodatkowego ubezpieczenia medycznego 1. Przeprowadź zwykłą regresję liniową, w której logarytm wydatków na leki jest objaśniany przez to czy, ktoś posiada dodatkowe ubezpieczenie od pracodawcy (hi_empun), liczbę chorób przewlekłych (totchr), wiek (age), płeć (female), kolor skóry (blhisp) oraz logarytm dochodu (linc) 2. Porównaj wyniki z estymatorem 2MNK, gdzie zmienna hi_empun jest endogeniczna, a jako instrument wykorzystana jest zmienna ssiratio. Czy wyniki różnią od tych uzyskanych z MNK? 3. Sprawdź czy wykorzystane instrumenty są dobrymi predyktorami zmiennej hi_empun 4. Porównaj wyniki z modelem, w którym wykorzystane są 3 dodatkowe instrumenty: firmsz, lowincome i multlc

Testowanie endogeniczności Popularne są dwa testy na endogeniczność 1. Test Hausmana Jeżeli w modelu nie ma endogeniczności to zastosowanie estymatora 2MNK nie powinno specjalnie zmienić oszacowań parametrów H 0 : endogeniczność nie występuje Jeśli H 0 spełnione estymator 2MNK jest nieefektywny, ale nie powinien powodować niezgodności Statystyka testu ( ) 1 H = β β ( V V ) ( β β ) 2MNK MNK 2MNK MNK 2MNK MNK Statystyka ma rozkład chi-kwadrat z liczbą stopni swobody równą liczbie parametrów

Testowanie endogeniczności 2. Test Wu (i Hausmana) H 0 : endogeniczność nie występuje Zakłada się, że mamy następujący model v i Gdzie jest zmienną, której nie obserwujemy i która jest e skorelowana z X i Chcemy zbadać istotność tej zmiennej tj. czy ρ = 0 Robimy to dwu stopniowo 1. e Estymujemy X, z czego liczymy reszty i = Ziθ+ Xβ i + ui 2. e Estymujemy Y = X β + αx + ρuˆ + ε, i testujemy ρ = 0 Statystyka ma rozkład F Y = X β + αx + ρv + ε e i i i i i i i i i i uˆi

Zadanie 1. c.d. 5. Przetestuj model pod kątem występowania endogeniczności Wykorzystaj test Hausmana Wykorzystaj test Wu Uwaga: Aby uodpornić testy na heteroskedastyczność można we wszystkich regresjach dodać opcję vce(robust)

Słabe instrumenty Pomimo, że estymator 2MNK jest zgodny w nieskończonej próbie, w skończonej próbie jest on obciążony Więcej zmiennych instrumentalnych może powodować większe obciążenie Kiedy zmienne instrumentalne są słabo skorelowane ze zmienną endogeniczną mówimy o problemie 'słabych instrumentów' (ang. weak instruments) Słabe instrumenty mogą również zwiększać obciążenie

Słabe instrumenty Mniej formalne testowanie czy instrumenty są 'słabe' można przeprowadzić na dwa sposoby 1. Licząc korelacje zmiennej endogenicznej ze zmiennymi instrumentalnymi 2. Sprawdzając łączną istotność instrumentów w regresji pomocniczej w 2MNK Reguła kciuka mówi, że jeśli statystyka F jest mniejsza niż 10 to instrumenty są słabe 6. Sprawdź czy instrumenty ssiratio, firmsz, lowincome i multlc są słabe

Słabe instrumenty Formalny test na słabość instrumentów można przeprowadzić wykorzystując procedurę Stock i Yogo Tak jak wcześniej wykorzystują oni test F na łączną istotność instrumentów Jeżeli jest więcej niż jedna zmienna endogeniczna wykorzystywane są wartości własne macierzowego odpowiednika statystyki F W tej procedurze wartości krytyczne są jednak inne niż w standardowym teście F Liczone na dwa sposoby

Słabe instrumenty Jeżeli mamy o co najmniej 2 instrumenty więcej niż zmiennych endogenicznych to wartość krytyczna może zostać policzona na podstawie Największego obciążenia (relatywnie do MNK) jakie jesteśmy w stanie zaakceptować Liczby zmiennych instrumentalnych Liczby zmiennych endogenicznych Dla dowolnej liczby zmiennych instrumentalnych wartość krytyczna może zostać policzona na podstawie Największego obciążenia testu Walda na istotność zmiennych endogenicznych jakie jesteśmy w stanie zaakceptować Liczby zmiennych instrumentalnych + liczby zmiennych endogenicznych

Słabe instrumenty 7. Przeprowadź test na słabość instrumentów kiedy: Mamy tylko jeden instrument ssiratio Kiedy wykorzystujemy wszystkie 4 instrumenty: ssiratio, firmsz, lowincome i multlc

Słabe instrumenty Problem słabych instrumentów można próbować rozwiązać Stosując inny estymator niż 2MNK LIML (Limited Information Maximum Likelihood) GMM (Generalized Method of Moments) Wykorzystując bootstrap i JIVE Znajdując inne instrumenty

Praca domowa ME.4 (grupy 2-osobowe) 1. Wykorzystaj zbiór danych me.wagehw.dta aby sprawdzić wpływ lat edukacji na logarytm płac 1. Policz regresję w której logarytm płacy jest wyjaśniany przez wybrane zmienne. (Uwaga: nie wykorzystuj edukacji rodziców oraz tego czy respondent mieszkał blisko college u) 2. Istnieje obawa, że liczba lat edukacji jest endogeniczna przez to, że nie kontrolujemy np. inteligencji. Przygotuj dwa modele 2MNK: jeden, w którym za zmienne instrumentalne przyjmiesz wykształcenie rodziców (fatheduc i motheduc) oraz drugi w którym za zmienne instrumentalne przyjmiesz czy respondent mieszkał blisko college u (nearc2 i nearc4). 1. Wyjaśnij dlaczego te zmienne mogą być dobrymi zmiennymi instrumentalnymi 2. Przetestuj endogeniczność dla obu modeli testami Hausmana i Wu 3. Sprawdź czy nie występuje problem słabych instrumentów wykorzystaj zarówno metody formalne jak i mniej formalne

Regresja kwantylowa W KMRL modelujemy warunkową średnią zmiennej objaśnianej: Pokazaliśmy, że można modelować równocześnie również jej drugi 2 moment, to jest warunkową wariancję: var y Z = σ Z W przypadku rozkładu normalnego, te dwa momenty w sposób jednoznaczny definiują rozkład zmiennej objaśnianej W praktyce, zmienne ciągłe mogą mieć różne inne rozkłady Czasem chcielibyśmy modelować inne charakterystyki rozkładu, aby lepiej zrozumieć co się dzieje w danych Rozwiązanie regresja kwantylowa ( X ) = ( X ) E y µ i i i ( ) ( ) i i i

Regresja kwantylowa Kwantylem rzędu τ nazywamy taką wartość λτ, dla której zachodzi: F ( λ ) = τ Taka wartość, że wartości mniejsze lub równe od niej przyjmowane są z prawdopodobieństwem τ, a większe z prawdopodobieństwem 1 τ Kwantyl można policzyć korzystając ze wzoru: W regresji kwantylowej chcemy zobaczyć, jak różne kwantyle zmiennej objaśnianej zależą od wybranych zmiennych objaśniających 1 Definiuje się tzw. kwantyle warunkowe: Q ( y X ) = F ( τ X ) τ Zazwyczaj, analogicznie jak w regresji liniowej, zakłada się zależność liniową: Q τ ( y i Xi) = Xβ i τ Uwaga: w tej notacji parametry mogą być różne dla każdego kwantyla τ λτ = i F 1 ( τ) i i y i

Regresja kwantylowa estymacja Najprostszym wariantem regresji kwantylowej jest tzw. regresja na medianie Staramy się znaleźć postać funkcyjną warunkowej mediany Parametry znajdujemy minimalizując następującą funkcję celu: Q ( β ) N 0,5 = 0,5 y i 1 i Xβ = i 0,5 Bardziej ogólnie, aby oszacować parametry dowolnego kwantyla minimalizujemy funkcję: ( ) τ ( 1 τ) Q β = y Xβ + y Xβ τ i i τ i i τ iy : X β iy : Xβ i i τ i i τ W literaturze model ten jest również nazywany estymatorem LAD (ang. Least Absolute Deviations) Do optymalizacji używa się metod programowania liniowego (metoda simpleks)

Zadanie 2. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków na leki jest objaśniany przez to, czy ktoś posiada dodatkowe ubezpieczenie od pracodawcy (hi_empun), liczbę chorób przewlekłych (totchr), wiek (age), płeć (female), kolor skóry (blhisp) oraz logarytm dochodu (linc) Domyślnie Stata liczy regresję na medianie Policz model regresji kwantylowej dla kwantyli innych rzędów np. 0,25 i 0,75

Zalety regresji kwantylowej Brak założeń na temat rozkładu zmiennej zależnej Można modelować cały rozkład zmiennej, a nie tylko wybrane momenty Łatwość wykrycia heteroskedastyczności Bardziej odporna na występowanie outlierów niż KMRL dla średniej Kwantyl zmiennej przekształconej przy pomocy ściśle rosnącej funkcji g( x) jest równy przekształconemu kwantylowi oryginalnej zmiennej: ( ( i) Xi) = τ ( y i Xi) Q g y g Q τ ( )

2019-03-11 14:46:53 Wady regresji kwantylowej Wzory analityczne na macierz kowariancji estymatora regresji kwantylowej są skomplikowane, a przez to rzadko stosowane W praktyce stosuje się metody symulacyjne np. bootstrap, przez co model liczy się dłużej niż np. regresja liniowa Współcześnie nie jest to duży problem