Mkroekonometra 10 Mkołaj Czajkowsk Wktor Budzńsk
Wybór uporządkowany Wybór uporządkowany (ang. ordered choce) Wybór jednej z welkośc na podanej skal Skala wartośc są uporządkowane Przykłady: Oceny konsumencke produktów (IMDB, Amazon, etc.) Ratng (S&P, Moody s) Dane anketowe (satysfakcja z życa, stan zdrowa, etc.) Skala Lkerta
Wybór uporządkowany Model funkcj wskaźnkowej / użytecznośc losowej y = Xβ+ε X charakterystyk konsumenta Zwykle lnowa specyfkacja funkcj ε składnk losowy, neobserwowalne ndywdualne dosynkratycznośc Rozkład normalny uporządkowany probt Rozkład logstyczny uporządkowany logt Obserwujemy J różnych ocen Interesuje nas estymacja β oraz J-1 progów, które kategoryzują (cenzurują) y * na y < y < + y = 1,..., J y = j dla α < y < α j 1 j
Wybór uporządkowany Obserwujemy y y... = 1 dla y α = 2 dla α < y α y = J dla y > α J 1 1 1 2 α 1 α 2 α J 1 + y = 1 y = 2 y = J Jeśl w modelu (X) jest stała, to tak jakby α 1 = 0 (normalzacja)
Wybór uporządkowany Model jest nelnowy... ( = 1 X) = F( α1 Xβ) ( = 2 X) = ( α2 Xβ) ( α1 Xβ) P y P y F F ( = X) = 1 ( α J 1 Xβ) P y J F poneważ F (dystrybuanta rozkładu normalnego, logstycznego, ) jest funkcją nelnową Prawdopodobeństwa muszą być dodatne, węc: α < α <... < αj 1 2 1
Wybór uporządkowany funkcja ML Z prawdopodobeństw funkcja najwększej warygodnośc N lnl= ln = 1 ( P( y )) Suma logarytmów prawdopodobeństw wybranych wartośc I dalej estymacja normalne
Case study analza odpowedz na pytana śwatopoglądowe dotyczące Morza Bałtyckego Ahtanen et al. (2013) badane reprezentatywnej próby meszkańców 9 krajów nadbałtyckch (n = 9627) Wśród pytań pytana śwatopoglądowe, m.n.: Martw mne stan środowska Morza Bałtyckego Ja także wpływam na stan środowska Morza Bałtyckego Skala odpowedz: 1 zdecydowane sę ne zgadzam 2 raczej sę ne zgadzam 3 trudno powedzeć 4 raczej sę zgadzam 5 zdecydowane sę zgadzam
Case study analza odpowedz na pytana śwatopoglądowe dotyczące Morza Bałtyckego 1. Wykorzystaj zbór me.baltc.lpj do przeanalzowana, jake charakterystyk respondentów pozwalają wyjaśnć ch odpowedz na pytane o ocenę stanu ekologcznego Bałtyku (envw) ORDERED; lhs =...? zmenna o wartoścach od 0 do J-1 ; rhs =... (; model = logt? opcjonalne - domyślne probt) ;... $ Perwszy próg jest normalzowany do 0 Model mus zawerać stałą jako perwszą zmenną objaśnającą Wszystke wartośc zmennej lhs (0,J-1) muszą występować w danych Inaczej jeden z progów nemożlwy do estymacj
Interpretacja wynków Interpretacja parametrów Znak jak zmena sę y* ze zmaną X Efekty krańcowe nelnowe, wymagają uwzględnena formy funkcyjnej pozomów X ; partal effects PARTIALS;... SIMULATE;...
Rozszerzena heteroskedastyczność Rozluźnene założena o stałośc warancj składnka losowego ( σ 2 = ε 1) Dodane obserwowalnych zmennych (z) objaśnających warancję składnka losowego (multplkatywne) 2 2 σ = exp( γz ) ε ORDERED; lhs =... ; rhs =... ; het ; hfn =...? zmenne objaśnające dla warancj e ;... $ 1. Uzupełnj model wyjaśnający oceny stanu ekologcznego Bałtyku o możlwość zróżncowana warancj składnka losowego względem krajów
Lczność zdarzeń Lczność zdarzeń (ang. count data) Zmenna objaśnana przyjmuje wartośc całkowte (0,1,2, ) Lczby mają bezpośredną nterpretację Przykłady: lczba wzyt u lekarza, w parku narodowym, na basene, lczba zachorowań w danym okrese / na jednostce powerzchn, lczba aresztowań, zabójstw, dzec, lczba wadlwych sztuk w procese produkcyjnym,
Regresja Possonowska Potrzebna metoda, która uwzględn charakter zmennej zależnej Regresja Possona Zmenna zależna y traktowana jak zmenna losowa o rozkładze Possona ( y X ) P Y = = exp ln( λ ) = Xβ ( ) y λ λ Oczekwana lczba zdarzeń w okrese y! ( y X ) = ( y X ) = λ = ( Xβ) E var exp Slne założene modelu: średna = warancj rozkładu wrócmy do tego
Regresja Possonowska estymacja Model Possonowsk można estymować za pomocą regresj nelnowej, ale proścej za pomocą metody ML Funkcja LL suma logarytmów prawdopodobeństw zaobserwowanych lośc Gradent Hesjan N = 1 ( λ Xβ ( )) lnl= + y ln y! N lnl = X β = 1 2 lnl = ββ ( y λ ) N = 1 λ XX Hesjan ujemne określony dla wszystkch β X Optymalzacja metodą Newtona
Case study lczba podróży nad Morze Bałtycke Ahtanen et al. (2013) badane reprezentatywnej próby meszkańców 9 krajów nadbałtyckch (n = 9627) Pytana dotyczące lczby podróży nad Morze Bałtycke w cągu ostatnch 12 mesęcy szczegółów ostatnej podróży Dystans, środek transportu, czas, 1. Wykorzystaj zbór me.baltc.lpj do przeprowadzena regresj Possonowskej lczby wzyt nad morze (TRIPS), wyjaśnając je stałą specyfczną dla kraju kosztem podróży (TC_km) POISSON; lhs =... ; rhs =... ;... $
Case study lczba podróży nad Morze Bałtycke Oczekwana lczba podróży jest funkcją m.n. kosztu podróży E ( y X) = exp( Xβ ) Funkcja popytu y= exp( x) Parametr przy koszce jest ujemny, węc funkcja ma tak kształt:
Case study lczba podróży nad Morze Bałtycke Funkcja popytu dana przez ( y X ) = ( Xβ) E exp Nadwyżka konsumenta (na podróż) to: + 0 1 CS = exp( β x) dx= β Mnus odwrotność parametru przy koszce podróży! SIMULATE ; scenaro: & tc_km = 0(10)150 ; plot $ WALD ; fn1 = -1/b_tc_km $ 2. Oszacuj nadwyżkę konsumenta borąc pod uwagę także koszt alternatywny czasu podróży (TC_tme)
Regresja Possonowska ekwdyspersja Jednym z założeń modelu ekwdyspersja Średna = warancja rozkładu E ( y ) ( ) λ ( X = var y X = = exp βx) To założene może w praktyce ne być spełnone Test nadmernej dyspersj: H :var 0 1 ( y) = E( y) ( ) = ( ) + α ( ) ( ) H :var y E y g E y Prosta regresja lnowa z na w Gdze: z λˆ = ( y ˆ λ ) 2 ˆ λ 2 y w ( ˆ λ ) g = ˆ λ 2 średna przewdywana przez model ( ) lub g( ) ˆ λ = ˆ λ ˆ λ = ˆ λ 2 Rozkład ch-kwadrat z 1 stopnem swobody czy α jest stotne? NLOGIT automatyczne podaje statystykę testu dla obu warantów g
Regresja Possonowska ekwdyspersja 3. Sprawdź czy regresja Possona jest w naszym przypadku uzasadnona Wartość krytyczna rozkładu ch-kwadrat z 1 stopnem swobody = 3.84 Wększe wartośc odrzucamy hpotezę zerową Restrykcja ekwdyspersj neuzasadnona Trzeba wybrać mnej restrykcyjny model
Model ujemny dwumanowy Model ujemny dwumanowy rozszerzene modelu Possona, poprzez wprowadzene neobserwowalnej heterogencznośc do średnej ln( E ( y X) ) = Xβ + ε = lnλ + lnu y (pod warunkem x u ) ma rozkład Possona z warunkową średną warancją μ ( λ )( λ ) (, ) = exp y u u f y X u y! Bezwarunkowy rozkład ( X ) f y ( X ) + exp ( λu )( λu ) ( ) f y = g u du y! 0 y
Model ujemny dwumanowy Funkcja gęstośc u determnuje bezwarunkowy rozkład y Wygodne założyć rozkład gamma, θ g( u) u u Γ ( θ ) E( u )= 1 θ θ 1 = exp( θ ) Wtedy bezwarunkowy rozkład y dany jest przez ( X ) f y = θ y θ λ + y θ θ 1 ( λu)( λu) θ u exp( θu) y! Γ( θ ) + ( ) ( ( ) ( θ ) exp y 1 0 λ θ) θ y θ λ Γ ( θ + y) θ + y ( y 1) ( θ)( λ θ) = + Γ + Γ = Γ + Γ + exp 0 u u du θ + y 1 du
Model ujemny dwumanowy Warunkowa średna λ Warunkowa warancja λ( 1+ ( 1 θ) λ) Uwag: Ekwdyspersję można przetestować ex post jako Możlwe nne specyfkacje u np. rozkład normalny POISSON;... ; heterogenety $ 1 θ = 0 Normalną neobserwowalną heterogenczność można dodać także do modelu ujemnego dwumanowego* NEGBIN ;... ; heterogenety $
Case study lczba podróży nad Morze Bałtycke 4. Skonstruuj model regresj ujemnej dwumanowej NEGBIN ; lhs =... ; rhs =... ;... $ Czy restrykcja jest uzasadnona? 1 θ = 0 Czy zmenły sę oszacowana CS?
Model ujemny dwumanowy nne formy Powyższa specyfkacja to tylko jedna z możlwych NB-2 Inna możlwość NB-1 POISSON; model = NB1; $ θ zamenamy na Funkcja gęstośc przyjmuje formę: θλ Γ ( θλ + y) θ P( Y= y X ) = Γ ( y + 1) Γ ( θλ )( 1 + θ ) Ogólnej NB-P θλ y+ θλ POISSON; model = NBP; $ θ (z modelu NB-2) zamenamy na Dodatkowy parametr P P θλ ( y ) 2 P ( y 1) ( θλ ) θλ 2 P 2 P y θλ 2 Γ θλ + θ 2 P λ θλ P( Y= y X) = 2 P 2 P Γ + Γ θλ + λ θλ + λ Modele NB-1 NB-2 to szczególne przypadk, dla P=1 P=2
Model ujemny dwumanowy nne formy Dla tych model Warunkowa średna Warunkowa warancja Istneje wele nnych specyfkacj postac funkcyjnych Uogólnony model Possona Gamma Polya-Aeppl Neg-Bn X Rozkład logarytmczny ( ) = exp( ) = λ E y X βx P ( θ λ 1 ) ( y X ) = λ + ( ) var 1 1 POISSON; model = gamma; $ POISSON; model = polya; $ POISSON; model = NBX; $ POISSON; model = GP / GP1 / GP2 / GPP; $ Dla zborów o dużych wartoścach y (klkadzesąt-klkaset) dość dobrze dzałają rozkłady cągłe
Model ujemny dwumanowy heteroskedastyczność Jednym z możlwych rozszerzeń modelu heteroskedastyczność Heterogenczność średnej warancj zawsze ważna dla danych mkroekonomcznych Parametr dyspersj θ wyłapuje ogólne skalowane rozkładu (średna vs. warancja) węc ne umożlwa heteroskedastycznośc P Ogólne warancja to ( ) λ ( ( θ) λ 1 var y X = 1+ 1 ) Zróbmy węc θ θ ( = exp δ Z) Teraz θ (a węc ogólnej warancja) funkcją obserwowalnych zmennych charakteryzujących respondentów Z 5. Skonstruuj model regresj ujemnej dwumanowej z heteroskedastycznoścą obserwacj dla różnych krajów NEGBIN ;... ; hfn =... $
Praca domowa ME.10 (grupy 2 lub 3-osobowe) 1. Wykorzystaj projekt me.baltc.lpj do przeanalzowana, jake charakterystyk respondentów pozwalają wyjaśnć ch ocenę własnego wpływu na środowsko Bałtyku (env) 1. Wyberz najlepszą, Twom zdanem, specyfkację 2. Znterpretuj wynk używając nterpretacj jakoścowej oraz loścowej (wykorzystując efekty cząstkowe) 2. Wykorzystując projekt me.baltc.lpj skonstruuj model lcznośc zdarzeń objaśnający lczbę wyceczek nad Bałtyk 1. Wyberz najlepszą, Twom zdanem, postać funkcyjną specyfkację 2. Znterpretuj wynk używając nterpretacj jakoścowej oraz loścowej (wykorzystując efekty cząstkowe) 04.12.2015 11:49:49