Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Podobne dokumenty
Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Zawansowane modele wyborów dyskretnych

Uogolnione modele liniowe

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

ZNACZENIE KONSEKWENCYJNOŚCI W BADANIACH METODĄ WYCENY WARUNKOWEJ STOSUJĄCYCH PYTANIA DYSKRETNEGO WYBORU

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 8. Mikołaj Czajkowski Wiktor Budziński

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Matematyka ubezpieczeń majątkowych r.

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Mikroekonometria 2. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Mikroekonometria 8. Mikołaj Czajkowski Wiktor Budziński

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Stanisław Cichocki. Natalia Nehrebecka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Uogólniony model liniowy

Stanisław Cichocki. Natalia Nehrebecka

Metoda największej wiarogodności

Testowanie hipotez statystycznych.

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Metody systemowe i decyzyjne w informatyce

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Metoda najmniejszych kwadratów

Modele selekcji próby

Metoda Monte Carlo. Jerzy Mycielski. grudzien Jerzy Mycielski () Metoda Monte Carlo grudzien / 10

Analiza przeżycia. Wprowadzenie

Metoda najmniejszych kwadratów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka

Propensity score matching (PSM)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Metody probabilistyczne

Rozdział 1. Modele regresji przestrzennej zmiennych ukrytych i ograniczonych

Metody systemowe i decyzyjne w informatyce

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Stanisław Cichocki. Natalia Nehrebecka

Algorytmy MCMC i ich zastosowania statystyczne

Analiza Wyborów Dyskretnych

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej. Modele nieliniowe Funkcja produkcji

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Rozpoznawanie obrazów

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

STATYSTYKA

Agata Boratyńska Statystyka aktuarialna... 1

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Kolokwium ze statystyki matematycznej

Testowanie hipotez statystycznych.

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wnioskowanie bayesowskie

Stanisław Cichocki. Natalia Nehrebecka

Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Prawdopodobieństwo i statystyka

Spis treści 3 SPIS TREŚCI

Własności statystyczne regresji liniowej. Wykład 4

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wstęp. Regresja logistyczna. Spis treści. Hipoteza. powrót

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

1.1 Wstęp Literatura... 1

Kalibracja. W obu przypadkach jeśli mamy dane, to możemy znaleźć równowagę: Konwesatorium z Ekonometrii, IV rok, WNE UW 1

Prawdopodobieństwo i statystyka r.

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Regresja nieparametryczna series estimator

Statystyka i Analiza Danych

STUDIA I STOPNIA EGZAMIN Z EKONOMETRII

Transkrypt:

Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński

Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana co roku) Możemy spodziewać się korelacji składników losowych (ε) dla tych samych osób (nawet jeśli pomiędzy osobami nadal będą niezależne) Połączenie wszystkich danych i zignorowanie korelacji powoduje problemy (estymator ML nie będzie zgodny) Estymacja wszystkich korelacji wymaga szacowania prawdopodobieństwa z T i -mianowego rozkładu Trudne z uwagi na ocenzurowany charakter obserwowalnej zmiennej (np. 0 lub 1) i zwykle niewielką liczbę obserwowanych okresów dla osoby (T i )

Dane panelowe modele binarne Specyfikacja dla danych przekrojowych Y Y Specyfikacja dla danych panelowych Y Y X β it it it 1Xβ 0 it it it X β u it it it i it 1 Y it 0 ; i 1,..., N; t 1,..., T ; i 1,..., N; t 1,..., T u i mierzy nieobserwowalną, specyficzną dla osoby heterogeniczność Forma zależności między ui a Xit daje model z efektami 'losowymi' lub 'stałymi' i i

Dane panelowe modele binarne Specyfikacja dla danych panelowych Y Y X β u it it it i it 1 Model z efektami stałymi u i X mogą być skorelowane u i to jakiś element it, który jest stały dla danego respondenta w każdym okresie Brak restrykcji, ale może powodować 'problem przypadkowych parametrów' Model z efektami losowymi u i X są niezależne Zakładamy, że Y it 0 u i ; i 1,..., N; t 1,..., T i ma jakiś (określony) rozkład w populacji Narzuca restrykcje na rozkład heterogeniczności w populacji Forma modelu nie oznacza, że efekty są takie czy inne to tylko wybór ekonometrycznego podejścia do problemu i it it i

Zadanie 1. Opieka zdrowotna w Niemczech Wykorzystując projekt me.gerhealth.dta skonstruuj model, w którym odbycie wizyty u lekarza (Y = 1(docvis > 0)) wyjaśniane jest przez stałą, płeć, wiek, dochód, posiadanie dzieci, liczbę lat edukacji i bycie w małżeństwie 1. Potraktuj wszystkie obserwacje jako niezależne 2. Skonstruuj model efektów losowych 1. Czy korelacje są istotne? 2. Dlaczego model konwerguje dłużej? 3. Porównaj wyniki (charakterystyki modeli, parametry, efekty krańcowe)

Dane panelowe modele binarne Model efektów losowych nakłada pewne restrykcje Określony rozkład ui Stałe korelacje pomiędzy okresami Model efektów stałych Yit Yit i dit X it β it 1 Y 0 it ; i 1,..., N; t 1,..., Ti dit = 1 dla respondenta i, 0 w p.p. (w modelu jedna stała dla każdej osoby) Xit nie zawiera teraz stałej Model wymaga estymacji dodatkowych N-1 parametrów! Mogą ich być tysiące

Dane panelowe modele binarne Model efektów stałych Funkcja LL dla modelu efektów stałych N T lnl lnpr Y X β i1 t1 Krańcowe prawdopodobieństwo (Pr) może mieć jedną z form poznanych wcześniej (np. logit, probit, ) Funkcja nieco trudniejsza w estymacji (z powodu rozmiaru), ale nie to jest głównym problemem Problemy statystyczne it i it

Dane panelowe modele binarne Model efektów stałych Możliwe problemy statystyczne W praktyce zwykle T i jest stałe i małe Każde i szacowane jest na podstawie T i obserwacji Model może nie konwergować Estymator także może nie być zgodny, bo jest funkcją To jest tzw. 'problem przypadkowych parametrów' Obciążenie rzędu 100% (T = 2) 10% (T = 8) Model jest nieidentyfikowalny jeśli występują w nim zmienne objaśniające, które nigdy nie zmieniają się z okresu na okres Model jest nieidentyfikowalny dla obserwacji, dla których zmienna objaśniana ma tę samą wartość w każdym okresie (m.in. dla obserwacji dla których T i = 1)

Zadanie 1. Opieka zdrowotna w Niemczech c.d. Wykorzystując projekt me.gerhealth.dta skonstruuj model, w którym odbycie wizyty u lekarza (Y = 1(docvis > 0)) wyjaśniane jest przez stałą, płeć, wiek, dochód, posiadanie dzieci, liczbę lat edukacji i bycie w małżeństwie 3. Skonstruuj model efektów stałych 1. Czy wszystkie obserwacje zostały wykorzystane? 2. Czy wszystkie zmienne zostały wykorzystane? 3. Który model lepiej pasuje do danych RE czy FE? 4. Dodaj efekty stałe dla lat

Dane Panelowe Analogicznie, panelowy charakter mogą mieć dane uporządkowane i o liczności zdarzeń xtpoisson panelowa regresja Poissona xtnbreg panelowa regresja ujemna dwumianowa xtologit panelowa regresja uporządkowana

Praca domowa ME.12 (grupy 3-osobowe) 1. Dane zawarte w me.usahealth.dta pochodzą z eksperymentu społecznego w USA, w którym rodziny losowo przyporządkowano do różnych rodzajów ubezpieczeń medycznych i przez kilka lat zbierano dane o tym, jak z nich korzystają. Celem badania było sprawdzenie, w jaki sposób wysokość udziału własnego (coinsurance rate) wpływa na korzystanie z usług medycznych. Proszę to zweryfikować, kontrolując inne istotne zmienne. 1. Uwzględniając panelowy charakter danych, skonstruuj model efektów losowych (liczności zdarzeń) wyjaśniający to, ile razy osoba poszła do lekarza (mdu). Porównaj model Poissona z modelem Ujemnym dwumianowym. 2. Uwzględniając panelowy charakter danych, skonstruuj model efektów losowych wyjaśniający to, czy osoba poniosła jakiekolwiek wydatki na pozaszpitalną opiekę medyczną (med > 0). 3. W powyższych modelach zinterpretuj wyniki jakościowo oraz ilościowo 4. Zbadaj, czy w powyższych modelach istnieją statystycznie istotne efekty stałe dla lat. Czy w poszczególnych latach liczba wizyt u lekarza lub p-stwo poniesienia kosztu na opiekę medyczną były takie same? 5. Czy cel badania można osiągnąć stosując model efektów stałych?

Model parametrów losowych W modelu efektów losowych zakładamy, że stała może być różna dla różnych respondentów i że indywidualne stałe przyjmują wartości się według określonego rozkładu Teoretycznie nie ma powodów, żeby ograniczać się tylko do stałej Może inne parametry również powinny być losowe? Widzieliśmy podczas wcześniejszych zajęć przykłady obserwowalnej heterogeniczności preferencji Co jeśli ta heterogeniczność nie jest powodowana zmiennymi, które mamy w próbie? Jak uwzględnić nieobserwowaną heterogeniczność?

Model parametrów losowych Wróćmy do wyboru wielomianowego U X β ijt ijt i ijt Dane panelowe indeks t mówi o sytuacji wyboru tego samego respondenta Parametry są indeksowane po i, inny wektor parametrów dla każdej osoby (heterogeniczność preferencji) Za mało informacji w danych by oszacować parametry dla każdego (podobnie jak z efektami stałymi, tylko gorzej) Zakładamy więc, że są to parametry losowe każdy ma inne wartości parametrów, ale pochodzą one z założonego rozkładu Taki model nazywa się modelem parametrów losowych

Model parametrów losowych Warunkowe prawdopodobieństwo w k-tej sytuacji wyboru dane przez wzór na MNL exp Xijkβi PY ijk 1 βi exp X β Ale parametry są nam nieznane, musimy uzyskać prawdopodobieństwo bezwarunkowe Liczymy całkę (wielowymiarową) Z powodu parametrów losowych, prawdopodobieństwa dla różnych sytuacji wyboru są zależne 1, 2, l ilk β β θ β t P Y Y Y P Y f d ij1 ij2 ijtt ij t i i i t i

Model parametrów losowych Łączne prawdopodobieństwo dane przez: 1, 2, β β θ β t P Y Y Y P Y f d ij1 ij2 ijtt ij t i i i t f βi θ to gęstość założonego rozkładu. Zależy ona od parametrów, które będziemy estymować Estymacja metodą Symulowanej Największej Wiarygodności Całkę przybliżamy liczbami pseudo-, albo quasi-losowymi 1 L P Y Y Y P Y 1 2 T r R r 1, 2, β i ij ij ij T ijtt i t

Zadanie 2. Sortowanie śmieci 1. Wczytaj zbiór danych me.recycling.dta 2. Dokonaj estymacji MNL 3. Dokonaj estymacji modelu z parametrami losowymi zakładając normalne rozkłady 1. Oszacuj średnie WTP 2. Czy wyniki będą takie same dla różnych ziaren? 4. Dokonaj estymacji modelu z parametrami losowymi zakładając rozkład log-normalny dla kosztu 1. Ponownie oszacuj średnie WTP

Model klas ukrytych Alternatywą jest tzw. model klas ukrytych Zamiast zakładać jakiś określony rozkład ciągły, zakładamy rozkład dyskretny Parametry przyjmują np. dwie dowolne wartości z pewnymi prawdopodobieństwami Trochę tak, jakbyśmy zakładali, że istnieją pewne segmenty rynku Funkcja wiarygodności dana przez c 1, 2, L P Y Y Y P Y β i ij1 ij2 ijtt c c ijtt c t to prawdopodobieństwo przynależności dla klasy c

Zadanie 2. Sortowanie śmieci c.d. 5. Dokonaj estymacji modelu klas ukrytych Z dwiema klasami Z trzema klasami Porównaj wyniki Analogiczne możliwości dla innych modeli fmm funkcja pozwalająca na estymację modeli z klasami ukrytymi dla różnych rozkładów, m.in. Poissona albo Ujemnego Dwumianowego mepoisson model Poissona z parametrami losowymi