Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Podobne dokumenty
Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

65120/ / / /200

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Mikroekonometria 15. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Natalia Nehrebecka. Wykład 2

Prawdopodobieństwo i statystyka r.

Mikroekonometria 7. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Funkcje i charakterystyki zmiennych losowych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Natalia Nehrebecka. Zajęcia 3

Weryfikacja hipotez dla wielu populacji

Matematyka ubezpieczeń majątkowych r.

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Natalia Nehrebecka. Zajęcia 4

STATYSTYKA MATEMATYCZNA

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Natalia Nehrebecka. Dariusz Szymański

Definicje ogólne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Pattern Classification

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Statystyka. Zmienne losowe

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Statystyka Inżynierska

Procedura normalizacji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

EKONOMETRIA I Spotkanie 1, dn

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Regresja liniowa i nieliniowa

Krzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Dobór zmiennych objaśniających

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.


EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Trzecie laboratoria komputerowe ze Staty Testy

Nieparametryczne Testy Istotności

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Prawdopodobieństwo i statystyka r.

Uogolnione modele liniowe

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Matematyka ubezpieczeń majątkowych r.

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

dy dx stąd w przybliżeniu: y

IID = 2. i i i i. x nx nx nx

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Macierz prawdopodobieństw przejścia w pojedynczym kroku dla łańcucha Markowa jest postaci

Prawdopodobieństwo i statystyka r.

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

Parametry zmiennej losowej

będą niezależnymi zmiennymi losowymi o tym samym 2 x

Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

= σ σ. 5. CML Capital Market Line, Rynkowa Linia Kapitału

STATYSTYKA. Zmienna losowa skokowa i jej rozkład

Markowa. ZałoŜenia schematu Gaussa-

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Statystyka Matematyczna Anna Janicka

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

JEDNOWYMIAROWA ZMIENNA LOSOWA

Stanisław Cichocki Natalia Nehrebecka. Wykład 2

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

± Δ. Podstawowe pojęcia procesu pomiarowego. x rzeczywiste. Określenie jakości poznania rzeczywistości

PODSTAWA WYMIARU ORAZ WYSOKOŚĆ EMERYTURY USTALANEJ NA DOTYCHCZASOWYCH ZASADACH

Statystyka Matematyczna Anna Janicka

Metody predykcji analiza regresji

Oligopol dynamiczny. Rozpatrzmy model sekwencyjnej konkurencji ilościowej jako gra jednokrotna z pełną i doskonalej informacją

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Transkrypt:

Mkroekonometra 10 Mkołaj Czajkowsk Wktor Budzńsk

Jak analzować dane o charakterze uporządkowanym? Dane o charakterze uporządkowanym Wybór jednej z welkośc na uporządkowanej skal Skala ne ma nterpretacj absolutnej, tylko uporządkowaną Przykłady: Oceny konsumencke produktów (IMDB, Amazon, etc.) Skala Lkerta (stopeń braku zgody / zgody z określonym stwerdzenam) Ratng kredytowe (S&P, Moody s, Ftch) Kolejność zawodnków w turneju, zawodach

Wybór uporządkowany Model funkcj wskaźnkowej / użytecznośc losowej y = X β +ε X charakterystyk konsumenta Zwykle lnowa specyfkacja funkcj ε składnk losowy, neobserwowalne ndywdualne dosynkratycznośc Rozkład normalny uporządkowany probt Rozkład logstyczny uporządkowany logt Obserwujemy J różnych ocen Interesuje nas estymacja β oraz J-1 progów, które kategoryzują (cenzurują) y * na y < y < + y = 1,..., J y = j dla α < y < α j 1 j

Wybór uporządkowany Obserwujemy y y... = 1 dla y α = 2 dla α < y α y = J dla y > α J 1 1 1 2 α 1 α 2 α J 1 + y = 1 y = 2 y = J Jeśl w modelu (X) jest stała, to tak jakby α 1 = 0 (normalzacja)

Wybór uporządkowany Model jest nelnowy... ( = 1 X) = F( α1 Xβ) ( = 2 X) = ( α2 Xβ) ( α1 Xβ) P y P y F F ( = X) = 1 ( α J 1 Xβ) P y J F poneważ F (dystrybuanta rozkładu normalnego, logstycznego, ) jest funkcją nelnową Prawdopodobeństwa muszą być dodatne, węc: α < α <... < αj 1 2 1

Wybór uporządkowany funkcja ML Z prawdopodobeństw funkcja najwększej warygodnośc lnl N = = 1 ln ( P( y )) Suma logarytmów prawdopodobeństw wybranych wartośc I dalej estymacja normalne

Zadane 1. Analza odpowedz na pytana śwatopoglądowe dotyczące Morza Bałtyckego Ahtanen et al. (2013) badane reprezentatywnej próby meszkańców 9 krajów nadbałtyckch (n = 9627) Wśród pytań pytana śwatopoglądowe, m.n.: Martw mne stan środowska Morza Bałtyckego Ja także wpływam na stan środowska Morza Bałtyckego Skala odpowedz: 1 zdecydowane sę ne zgadzam 2 raczej sę ne zgadzam 3 trudno powedzeć 4 raczej sę zgadzam 5 zdecydowane sę zgadzam

Zadane 1. Analza odpowedz na pytana śwatopoglądowe dotyczące Morza Bałtyckego 1. Wykorzystaj zbór me.baltc.dta do przeanalzowana, jake charakterystyk respondentów pozwalają wyjaśnć ch odpowedz na pytane o to czy stan środowska Bałtyku ch martw (envw) 2. Znterpretuj wynk jakoścowo 3. Znterpretuj wynk loścowo

Jak analzować dane o lczbe wystąpeń jakegoś zjawska? Dane o lczbe zdarzeń (ang. count data) Zmenna objaśnana przyjmuje wartośc całkowte (0,1,2, ) Lczby mają bezpośredną nterpretację Przykłady Lczba wzyt u lekarza, w parku narodowym, na basene Lczba dzec, zachorowań, aresztowań, zabójstw w danym okrese / na jednostce powerzchn Lczba wadlwych sztuk w procese produkcyjnym

Regresja Possona Potrzebna metoda, która uwzględn charakter zmennej zależnej Regresja Possona Zmenna zależna y traktowana jak zmenna losowa o rozkładze Possona ( y X ) P Y = = exp ln( λ ) = X β ( ) y λ λ y! Oczekwana lczba zdarzeń w okrese ( y X ) = ( y X ) = λ = ( Xβ) E var exp Slne założene modelu: średna = warancj rozkładu wrócmy do tego

Regresja Possona estymacja Model Possona można estymować za pomocą regresj nelnowej, ale proścej za pomocą MNW Funkcja LL suma logarytmów prawdopodobeństw zaobserwowanych lośc Gradent Hesjan ( λ Xβ ( )) lnl= + y ln y! Hesjan ujemne określony dla wszystkch β X Optymalzacja metodą Newtona N = 1 N lnl = X β = 1 2 lnl = ββ ( y λ ) N = 1 λ XX

Zadane 2. Lczba podróży nad Morze Bałtycke Ahtanen et al. (2013) badane reprezentatywnej próby meszkańców 9 krajów nadbałtyckch (n = 9627) Pytana dotyczące lczby podróży nad Morze Bałtycke w cągu ostatnch 12 mesęcy szczegółów ostatnej podróży Dystans, środek transportu, czas, 1. Wykorzystaj zbór me.baltc.dta do przeprowadzena regresj Possona lczby wzyt nad morze (TRIPS), wyjaśnając je stałą specyfczną dla kraju kosztem podróży (TC_km) Znterpretuj wynk Jaka jest nadwyżka konsumenta wynkająca z możlwośc wzyt nad Morzem Bałtyckm?

Nadwyżka konsumenta Oczekwana lczba podróży jest funkcją m.n. kosztu podróży E ( y X) = exp( Xβ ) Funkcja popytu y= exp( x) Parametr przy koszce jest ujemny, węc funkcja ma tak kształt:

Nadwyżka konsumenta Funkcja popytu dana przez Nadwyżka konsumenta to: + exp CS = exp x dx = TC ( β ) ( y X ) = ( Xβ) E exp ( βtc ) Nadwyżka konsumenta na jedną wzytę jest węc dana przez: CS per trp Mnus odwrotność parametru dla kosztu podróży 2. Oszacuj nadwyżkę konsumenta borąc pod uwagę także koszt alternatywny czasu podróży (TC_tme) β = CS = 1 E ( y X ) β

Regresja Possona ekwdyspersja Jednym z założeń modelu ekwdyspersja Średna = warancja rozkładu E ( y ) ( ) λ ( X = var y X = = exp βx) To założene może w praktyce ne być spełnone Test nadmernej dyspersj: H : var 0 ( y) = E( y) ( ) = ( ) + ( ) ( ) H : var y E y g E y 2 1 α Prosta regresja lnowa objaśnająca z (warancja mnus średna) przez w (średna): λˆ ( ) 2 ( ) y ˆ λ y g ˆ λ z = w = g( ˆ λ ) = ˆ λ ( ˆ λ ) = ˆ λ 2 lub g ˆ λ ˆ λ średna przewdywana przez model Sprawdzamy stotność współczynnka w regresj bez stałej 3. Sprawdź czy regresja Possona jest w naszym przypadku uzasadnona

Model ujemny dwumanowy Model ujemny dwumanowy rozszerzene modelu Possona, polegające na wprowadzenu dodatkowego składnka losowego (neobserwowalnej heterogencznośc) do średnej ln E ( y X ) = Xβ + = ln + lnu ( ) ε λ y (pod warunkem x u ) ma rozkład Possona z warunkową średną warancją µ ( λ )( λ ) (, ) = exp y u u f y X u y! Bezwarunkowy rozkład ( X ) f y ( X ) + exp ( λu )( λu ) ( ) f y = g u du y! 0 y

Model ujemny dwumanowy Funkcja gęstośc u determnuje bezwarunkowy rozkład y Wygodne założyć rozkład gamma, E( u ) = 1 θ g( u) u u Γ θ θ 1 = exp( θ ) ( θ ) Wtedy bezwarunkowy rozkład y dany jest przez ( X ) f y = θ y θ λ + y θ θ 1 ( λu)( λu) θ u exp( θu) y! Γ( θ ) + ( ) ( ( ) ( θ ) exp y 1 0 λ θ) θ y θ λ Γ ( θ + y) θ + y ( y 1) ( θ)( λ θ) = + Γ + Γ = Γ + Γ + exp 0 u u du θ + y 1 du

Model ujemny dwumanowy Warunkowa średna λ Warunkowa warancja λ 1+ ( 1 ) Uwag: ( θ λ) Ekwdyspersję można przetestować ex post jako 1 θ = 0 Możlwe nne specyfkacje u np. rozkład normalny

Zadane 2. Lczba podróży nad Morze Bałtycke 4. Skonstruuj model regresj ujemnej dwumanowej Czy restrykcja 1 θ = 0 jest uzasadnona? Czy zmenły sę oszacowana CS?

Model ujemny dwumanowy overdyspersja Jednym z możlwych rozszerzeń modelu modelowane determnant overdyspersj Heterogenczność średnej warancj zawsze ważna dla danych mkroekonomcznych Parametr dyspersj θ wyłapuje ogólne skalowane rozkładu (średna vs. warancja) Ogólne warancja to var ( y X) = λ( 1+ ( 1 θ) λ) Zróbmy węc θ θ ( = exp δz) Teraz θ (a węc ogólnej warancja) funkcją obserwowalnych zmennych charakteryzujących respondentów Z 5. Skonstruuj model regresj ujemnej dwumanowej z różnym pozomem overdyspersj dla różnych krajów De facto jest to próba lepszego dopasowana rozkładów trochę nny rozkład lczby wyceczek dla każdego kraju

Zero nflated models Częstym problemem jest duża lczba obserwacj przyjmująca wartość 0 Znane rozkłady, take jak Posson czy ujemny dwumanowy, ne przewdują ponadproporcjonalnej lośc obserwacj 0, węc źle pasują Możlwym rozwązanem są tzw. Zero Inflated Models Załóżmy, że mamy dwa typy konsumentów Uczestnków rynku robą lczbę wyceczek zależną od kosztu (w tym możlwe 0 wyceczek) Neuczestnków rynku nezależne od kosztu tak ne pojadą nad Bałtyk Oba segmenty pownny być modelowane osobno, a ne jako jeden cągły rozkład

Zero nflated models 0 w danych może sę pojawć z dwóch powodów Ktoś jest uczestnkem rynku, ale tak sę zdarzyło, że w ostatnm roku ne pojechał an razu Ktoś ne jest uczestnkem rynku, węc pojechał 0 razy Prawdopodobeństwo pojechana k razy będze wtedy dane przez ( ) ( ) ( ) ( ) ( ) p = Z + 1 p Z F y X jeśl y 0 P Y= y X, Z = ( 1 p( Z) ) F( y X) jeśl y 0 Gdze p( Z) to prawdopodobeństwo byca poza rynkem, zazwyczaj modelowane bnarnym logtem albo probtem F( y X) to p-stwo zaobserwowana danej lczby zdarzeń, opsane np. modelem Possona albo Ujemnym dwumanowym

Zero nflated models 6. Dokonaj estymacj modelu Zero Inflated Negatve Bnomal Porównaj dopasowane do danych ze wcześnejszym modelam

2018-05-16 15:56:55 Praca domowa ME.10 (grupy 2 lub 3-osobowe) 1. Wykorzystaj projekt me.baltc.dta do przeanalzowana, jake charakterystyk respondentów pozwalają wyjaśnć ch ocenę własnego wpływu na środowsko Bałtyku (env) 1. Wyberz najlepszą, Twom zdanem, specyfkację 2. Znterpretuj wynk używając nterpretacj jakoścowej oraz loścowej (wykorzystując efekty krańcowe) 2. Wykorzystując projekt me.usahealth.dta skonstruuj model lcznośc zdarzeń objaśnający lczbę wzyt u lekarza (mdu) 1. Wyberz najlepszą, Twom zdanem, postać funkcyjną specyfkację Uwzględnj zmenne socjodemografczne, wskaźnk stanu zdrowa oraz udzał własny w kosztach opek medycznej 2. Znterpretuj wynk używając nterpretacj jakoścowej oraz loścowej (wykorzystując efekty krańcowe)