Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16
Model efektów nieobserwowalych dla prób panelowych Zmienna ukryta y i = x it β+ c i + u it Zmienna obserwowalna { 1 dla y y i = i 0 0 dla yi < 0 Kluczowe założenie: c i zależne od x it = model efektów stałych c i niezależne od x it = model efektów losowych Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 2 / 16
Estymator efektów stałych - problem parametrów pobocznych Warunkowa funkcja prawdopodobieństwa: Pr (y i = 1 c i ) = Pr (x it β+ c i + u it 0) = F (x it β+ c i ) Czy można w tym przypadku zastosować estymator analogiczny do estymatora LSDV i oszacować model z dodatkowymi zmiennymi zerojedynkowymi dla każdej jednostki? Niestety estymator taki będzie zgodny tylko dla T i N, dla T ustalonego nie będzie zgodny Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 3 / 16
Estymator efektów stałych - problem parametrów pobocznych c.d. Estymator LSDV w liniowym modelu efektów nieobserwowalnych jest o tyle wyjątkowy, że można dla niego pokazać β FE p β dla N i T ustalonego mimo, że ĉ nie jest zgodny (ĉ p c dla N i T ustalonego) co wynika z asymptotycznej niezależności obu estymatorów Wynik ten generalnie nie jest prawdziwy w przypadku modeli nieliniowych problem parametrów pobocznych (incidental parameters problem) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 4 / 16
Model logitowy z efektami stałymi Okazuje się, że w przypadku modelu logitowegoprawdopodobieństwa warunkowego względem ilości sukcesów n i dla jednostki i, nie zależy od c i Na przykład dla T = 2 Pr (y i2 = 1 x i, c i, n i = 1) = Pr (y i2 = 1, n i = 1 x i, c i ) Pr (n i = 1 x i, c i ) Pr (y i2 = 1 x i, c i ) Pr (y i1 = 0 x i, c i ) = Pr (y i1 = 0, y i2 = 1 x i, c i ) + Pr (y i1 = 1, y i2 = 0 x i, c i ) Λ (x i2 β + c i ) [1 Λ (x i1 β + c i )] = [1 Λ (x i1 β + c i )] Λ (x i2 β + c i ) + Λ (x i1 β + c i ) [1 Λ (x i2 β + c i )] = Λ [(x i2 x i1 ) β] Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 5 / 16
Model logitowy z efektami stałymi c.d. Ogólnie Pr (y i x i, c i, n i = n) = ( ) exp T i=1 y it x it β exp ( a Ri a t y it x it β ) } where R i R T oraz R i = {a : a t {0, 1}, T i=1 a i = n i Funkcję wiarygodności budujemy przy użyciu tej prawdopodobieństwa Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 6 / 16
Model probitowy z efektami losowymi Obserwacje dla poszczególnych jednostek nie są niezależne Obserwacje dla różnych jednostek są od siebie niezależne zgodnym ale nieefektywnym estymatorem jest w takim przypadku estymator pseudo ML (identyczny w sensie obliczeniowym do estymatora ML). macierz wariancji dla oszacowań powinniśmy w tym przypadku uzyskać za pomocą estymatora warstwowego (cluster ) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 7 / 16
Model probitowy z efektami losowymi Estymator ML Warunkowa funkcja prawdopodobieństwa dla obserwacji dla jednostki i: Pr (y i c i ) = T t=1 [Φ (x it β+ c i )] y it [1 Φ (x it β+ c i )] 1 y it Załóżmy, że efekty losowe są pochodzą z wielowymiarowego rozkładu normalnego i są niezależne: c N ( 0, σ 2 ui ) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 8 / 16
Model probitowy z efektami losowymi Estymator ML c.d. Bezwarunkowa funkcja prawdopodbieństwa ma więc następującą postać: Pr (y i ) = T t=1 ( ci 1 σ c φ [Φ (x it β+ c i )] y it [1 Φ (x it β+ c i )] 1 y it σ c ) dc i Tego rodzaju całki nie da się policzyć analitycznie - zamiast tego stosujemy metody numeryczne (kwadratury) W modelu probitowym z efektami losowymi obserwacje są niezależne pomiędzy jednostkami, więc funkcja wiarygodności ma standardową postać: N l (β) = ln Pr (y i ) i=1 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 9 / 16
Kwadratury Kwadratura polega na zastąpieniu całki sumą policzoną dla pewnego zbioru punktów. W najprostszym przypadku: b a f (x) dx gdzie d = a b S, x i = a + (i + 0.5) d S 1 f (xi ) d s=0 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 10 / 16
Model probitowy i logitowy na estymowane rangach charakterystyka danych mamy K alternatyw dysponujemy uszeregowaniem alternatyw pod względem ich atrakcyjności y ki > y ki >... > y ki uszeregowanie nie musi być kompletne Metoda szacowania: oparta na estymatorze dla modelu proporcjonalnego hazardu Cox-a Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 11 / 16
Model probitowy z endogenicznymi zmiennymi objaśniającymi c.d. Model yi1 = y 2i β + x 1i γ + u 1i = z i δ + u 1i y 2i = x 1i α 1 +x 2i α 2 + u 2i = x i α + u 2i Zmienna y 2i jest bezpośrednio obserwowalna i endogeniczna w równaniu dla zmiennej ukrytej y i1, ponieważ Cov (u 1i, u 2i ) = 0. Zakładamy, że wektor błędów losowych u i N (0, Σ) przy czym przyjmujemy założenie identyfikujące parametry, że Σ 11 = 1 Powyższy model ma strukturę rekursywną y 2i pojawia się w równaniu dla yi1 ale y i1 nie pojawia się w równaniu dla y 2i. Równanie dla y 2i może być traktowane jako forma zredukowana Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 12 / 16
Zmienna obserwowalna { 1 dla y y 1i = i 0 0 dla yi < 0 Funkcja prawdopodobieństwa dla zdarzenia i f (y 1i, y 2i x 1i, x 2i ) = Pr (y 1i y 2i, x 1i, x 2i ) f (y 2i x 1i, x 2i ) ( ) = [Φ (m i )] y 1i [1 Φ (m i )] 1 y 1 1i σ φ y2i x 1i α σ gdzie m i = z i δ+ ρ (y 2i x i α) (1 ρ 2 ) 1 2 a ρ jest współczynikiem korelacji między u 1i i u 2i Z użyciem tej funkcji prawdopodbieństwa możemy stworzyć funkcję wiarygodności Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 13 / 16
Załóżenie o symetrii rozkładu Asymetryczny logit (skewed logit) Założenie o symetrii rozkładu w mówi, że F (z) = 1 F (z) Założenie to implikuje, że efekt cząstkowy jest najwyższy dla F (x i β) = 1 2 Istotnie efekt cząstkowy E (y i x i ) x i = f (x i β) β k a dla rozkładu symetrycznego wartość modalna jest zawsze równa medianie Jeśli chcemy to zzałożenie uchylić powinniśmy użyć modelu o niesymetrycznym rozkładzie błędu loswego dla zmiennej ukrytej Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 14 / 16
Załóżenie o symetrii rozkładu Asymetryczny logit (skewed logit) Model: prawdopodbieństwo sukcesu dla F (z) = 1 Dla α = 1 otrzymujemy logita Pr (y i = 1) = F (x i β) 1 [1 + exp (x)] α, α > 0 W innych przypadkach rozkład zmiennej losowej jest niesymetryczny Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 15 / 16
Załóżenie o symetrii rozkładu loglog model Model: prawdopodbieństwo sukcesu Pr (y i = 1) = F (x i β) dla F (z) = 1 exp [ exp (z)] W tym przypadku dystrybuanta jest także niesymetryczna Model ten używamy gdy liczba sukcesów (bądź porażek jest mała) Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 16 / 16