Mkroekonometra 10 Mkołaj Czajkowsk Wktor Budzńsk
Jak analzować dane o charakterze uporządkowanym? Dane o charakterze uporządkowanym Wybór jednej z welkośc na uporządkowanej skal Skala ne ma nterpretacj absolutnej, tylko uporządkowaną Przykłady: Oceny konsumencke produktów (IMDB, Amazon, etc.) Skala Lkerta (stopeń braku zgody / zgody z określonym stwerdzenam) Ratng kredytowe (S&P, Moody s, Ftch) Kolejność zawodnków w turneju, zawodach
Wybór uporządkowany Model funkcj wskaźnkowej / użytecznośc losowej y = X β +ε X charakterystyk konsumenta Zwykle lnowa specyfkacja funkcj ε składnk losowy, neobserwowalne ndywdualne dosynkratycznośc Rozkład normalny uporządkowany probt Rozkład logstyczny uporządkowany logt Obserwujemy J różnych ocen Interesuje nas estymacja β oraz J-1 progów, które kategoryzują (cenzurują) y * na y < y < + y = 1,..., J y = j dla α < y < α j 1 j
Wybór uporządkowany Obserwujemy y y... = 1 dla y α = 2 dla α < y α y = J dla y > α J 1 1 1 2 α 1 α 2 α J 1 + y = 1 y = 2 y = J Jeśl w modelu (X) jest stała, to tak jakby α 1 = 0 (normalzacja)
Wybór uporządkowany Model jest nelnowy... ( = 1 X) = F( α1 Xβ) ( = 2 X) = ( α2 Xβ) ( α1 Xβ) P y P y F F ( = X) = 1 ( α J 1 Xβ) P y J F poneważ F (dystrybuanta rozkładu normalnego, logstycznego, ) jest funkcją nelnową Prawdopodobeństwa muszą być dodatne, węc: α < α <... < αj 1 2 1
Wybór uporządkowany funkcja ML Z prawdopodobeństw funkcja najwększej warygodnośc lnl N = = 1 ln ( P( y )) Suma logarytmów prawdopodobeństw wybranych wartośc I dalej estymacja normalne
Zadane 1. Analza odpowedz na pytana śwatopoglądowe dotyczące Morza Bałtyckego Ahtanen et al. (2013) badane reprezentatywnej próby meszkańców 9 krajów nadbałtyckch (n = 9627) Wśród pytań pytana śwatopoglądowe, m.n.: Martw mne stan środowska Morza Bałtyckego Ja także wpływam na stan środowska Morza Bałtyckego Skala odpowedz: 1 zdecydowane sę ne zgadzam 2 raczej sę ne zgadzam 3 trudno powedzeć 4 raczej sę zgadzam 5 zdecydowane sę zgadzam
Zadane 1. Analza odpowedz na pytana śwatopoglądowe dotyczące Morza Bałtyckego 1. Wykorzystaj zbór me.baltc.dta do przeanalzowana, jake charakterystyk respondentów pozwalają wyjaśnć ch odpowedz na pytane o to czy stan środowska Bałtyku ch martw (envw) 2. Znterpretuj wynk jakoścowo 3. Znterpretuj wynk loścowo
Jak analzować dane o lczbe wystąpeń jakegoś zjawska? Dane o lczbe zdarzeń (ang. count data) Zmenna objaśnana przyjmuje wartośc całkowte (0,1,2, ) Lczby mają bezpośredną nterpretację Przykłady Lczba wzyt u lekarza, w parku narodowym, na basene Lczba dzec, zachorowań, aresztowań, zabójstw w danym okrese / na jednostce powerzchn Lczba wadlwych sztuk w procese produkcyjnym
Regresja Possona Potrzebna metoda, która uwzględn charakter zmennej zależnej Regresja Possona Zmenna zależna y traktowana jak zmenna losowa o rozkładze Possona ( y X ) P Y = = exp ln( λ ) = X β ( ) y λ λ y! Oczekwana lczba zdarzeń w okrese ( y X ) = ( y X ) = λ = ( Xβ) E var exp Slne założene modelu: średna = warancj rozkładu wrócmy do tego
Regresja Possona estymacja Model Possona można estymować za pomocą regresj nelnowej, ale proścej za pomocą MNW Funkcja LL suma logarytmów prawdopodobeństw zaobserwowanych lośc Gradent Hesjan ( λ Xβ ( )) lnl= + y ln y! Hesjan ujemne określony dla wszystkch β X Optymalzacja metodą Newtona N = 1 N lnl = X β = 1 2 lnl = ββ ( y λ ) N = 1 λ XX
Zadane 2. Lczba podróży nad Morze Bałtycke Ahtanen et al. (2013) badane reprezentatywnej próby meszkańców 9 krajów nadbałtyckch (n = 9627) Pytana dotyczące lczby podróży nad Morze Bałtycke w cągu ostatnch 12 mesęcy szczegółów ostatnej podróży Dystans, środek transportu, czas, 1. Wykorzystaj zbór me.baltc.dta do przeprowadzena regresj Possona lczby wzyt nad morze (TRIPS), wyjaśnając je stałą specyfczną dla kraju kosztem podróży (TC_km) Znterpretuj wynk Jaka jest nadwyżka konsumenta wynkająca z możlwośc wzyt nad Morzem Bałtyckm?
Nadwyżka konsumenta Oczekwana lczba podróży jest funkcją m.n. kosztu podróży E ( y X) = exp( Xβ ) Funkcja popytu y= exp( x) Parametr przy koszce jest ujemny, węc funkcja ma tak kształt:
Nadwyżka konsumenta Funkcja popytu dana przez Nadwyżka konsumenta to: + exp CS = exp x dx = TC ( β ) ( y X ) = ( Xβ) E exp ( βtc ) Nadwyżka konsumenta na jedną wzytę jest węc dana przez: CS per trp Mnus odwrotność parametru dla kosztu podróży 2. Oszacuj nadwyżkę konsumenta borąc pod uwagę także koszt alternatywny czasu podróży (TC_tme) β = CS = 1 E ( y X ) β
Regresja Possona ekwdyspersja Jednym z założeń modelu ekwdyspersja Średna = warancja rozkładu E ( y ) ( ) λ ( X = var y X = = exp βx) To założene może w praktyce ne być spełnone Test nadmernej dyspersj: H : var 0 ( y) = E( y) ( ) = ( ) + ( ) ( ) H : var y E y g E y 2 1 α Prosta regresja lnowa objaśnająca z (warancja mnus średna) przez w (średna): λˆ ( ) 2 ( ) y ˆ λ y g ˆ λ z = w = g( ˆ λ ) = ˆ λ ( ˆ λ ) = ˆ λ 2 lub g ˆ λ ˆ λ średna przewdywana przez model Sprawdzamy stotność współczynnka w regresj bez stałej 3. Sprawdź czy regresja Possona jest w naszym przypadku uzasadnona
Model ujemny dwumanowy Model ujemny dwumanowy rozszerzene modelu Possona, polegające na wprowadzenu dodatkowego składnka losowego (neobserwowalnej heterogencznośc) do średnej ln E ( y X ) = Xβ + = ln + lnu ( ) ε λ y (pod warunkem x u ) ma rozkład Possona z warunkową średną warancją µ ( λ )( λ ) (, ) = exp y u u f y X u y! Bezwarunkowy rozkład ( X ) f y ( X ) + exp ( λu )( λu ) ( ) f y = g u du y! 0 y
Model ujemny dwumanowy Funkcja gęstośc u determnuje bezwarunkowy rozkład y Wygodne założyć rozkład gamma, E( u ) = 1 θ g( u) u u Γ θ θ 1 = exp( θ ) ( θ ) Wtedy bezwarunkowy rozkład y dany jest przez ( X ) f y = θ y θ λ + y θ θ 1 ( λu)( λu) θ u exp( θu) y! Γ( θ ) + ( ) ( ( ) ( θ ) exp y 1 0 λ θ) θ y θ λ Γ ( θ + y) θ + y ( y 1) ( θ)( λ θ) = + Γ + Γ = Γ + Γ + exp 0 u u du θ + y 1 du
Model ujemny dwumanowy Warunkowa średna λ Warunkowa warancja λ 1+ ( 1 ) Uwag: ( θ λ) Ekwdyspersję można przetestować ex post jako 1 θ = 0 Możlwe nne specyfkacje u np. rozkład normalny
Zadane 2. Lczba podróży nad Morze Bałtycke 4. Skonstruuj model regresj ujemnej dwumanowej Czy restrykcja 1 θ = 0 jest uzasadnona? Czy zmenły sę oszacowana CS?
Model ujemny dwumanowy overdyspersja Jednym z możlwych rozszerzeń modelu modelowane determnant overdyspersj Heterogenczność średnej warancj zawsze ważna dla danych mkroekonomcznych Parametr dyspersj θ wyłapuje ogólne skalowane rozkładu (średna vs. warancja) Ogólne warancja to var ( y X) = λ( 1+ ( 1 θ) λ) Zróbmy węc θ θ ( = exp δz) Teraz θ (a węc ogólnej warancja) funkcją obserwowalnych zmennych charakteryzujących respondentów Z 5. Skonstruuj model regresj ujemnej dwumanowej z różnym pozomem overdyspersj dla różnych krajów De facto jest to próba lepszego dopasowana rozkładów trochę nny rozkład lczby wyceczek dla każdego kraju
Zero nflated models Częstym problemem jest duża lczba obserwacj przyjmująca wartość 0 Znane rozkłady, take jak Posson czy ujemny dwumanowy, ne przewdują ponadproporcjonalnej lośc obserwacj 0, węc źle pasują Możlwym rozwązanem są tzw. Zero Inflated Models Załóżmy, że mamy dwa typy konsumentów Uczestnków rynku robą lczbę wyceczek zależną od kosztu (w tym możlwe 0 wyceczek) Neuczestnków rynku nezależne od kosztu tak ne pojadą nad Bałtyk Oba segmenty pownny być modelowane osobno, a ne jako jeden cągły rozkład
Zero nflated models 0 w danych może sę pojawć z dwóch powodów Ktoś jest uczestnkem rynku, ale tak sę zdarzyło, że w ostatnm roku ne pojechał an razu Ktoś ne jest uczestnkem rynku, węc pojechał 0 razy Prawdopodobeństwo pojechana k razy będze wtedy dane przez ( ) ( ) ( ) ( ) ( ) p = Z + 1 p Z F y X jeśl y 0 P Y= y X, Z = ( 1 p( Z) ) F( y X) jeśl y 0 Gdze p( Z) to prawdopodobeństwo byca poza rynkem, zazwyczaj modelowane bnarnym logtem albo probtem F( y X) to p-stwo zaobserwowana danej lczby zdarzeń, opsane np. modelem Possona albo Ujemnym dwumanowym
Zero nflated models 6. Dokonaj estymacj modelu Zero Inflated Negatve Bnomal Porównaj dopasowane do danych ze wcześnejszym modelam
2018-05-16 15:56:55 Praca domowa ME.10 (grupy 2 lub 3-osobowe) 1. Wykorzystaj projekt me.baltc.dta do przeanalzowana, jake charakterystyk respondentów pozwalają wyjaśnć ch ocenę własnego wpływu na środowsko Bałtyku (env) 1. Wyberz najlepszą, Twom zdanem, specyfkację 2. Znterpretuj wynk używając nterpretacj jakoścowej oraz loścowej (wykorzystując efekty krańcowe) 2. Wykorzystując projekt me.usahealth.dta skonstruuj model lcznośc zdarzeń objaśnający lczbę wzyt u lekarza (mdu) 1. Wyberz najlepszą, Twom zdanem, postać funkcyjną specyfkację Uwzględnj zmenne socjodemografczne, wskaźnk stanu zdrowa oraz udzał własny w kosztach opek medycznej 2. Znterpretuj wynk używając nterpretacj jakoścowej oraz loścowej (wykorzystując efekty krańcowe)