Ekonometria Ćwiczenia 6 Krzysztof Pytka Zakład Wspomagania i Analizy Decyzji (SGH) 29 listopada 2011
Mapa drogowa na dziś Mapa drogowa na dziś 1 Wstęp Mapa drogowa na dziś 2 3 4 Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszkałych w RPA Reguła optymalnego progu odcięcia 5 Funkcja łącząca w modelu probitowym 6
Przykłady zmiennych jakościowych (dwumianowych) jako regresant: Biznes: default potencjalnego klienta bankowego, churn abonenta do innej sieci, identyfikacja spamu przez serwery pocztowe, zakłady bukmacherskie; Ekonomia: uczestnictwo w rynku pracy, odmowa udzielenia kredytu, prognoza decyzji banku centralnego w sprawie stóp procentowych; Statystyka medyczna: określenie determinantów zachorowalności na chorobę, mierzenie skuteczności działania leków; Socjologia: udział w wyborach, dostanie kosza od dziewczyny/chłopaka (QJE 2006), używanie środków antykoncepcyjnych; Wojskowość: określenie grupy docelowej zamachów terrorystycznych Hezbollahu.
Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszkałych w RPA CHD i = α 0 +α 1 tobacco i +α 2 ldl i +α 3 famhist i +α 4 age i +α 5 alcohol i +ε i gdzie: CHD i pacjent chory na chorobę wieńcową, tobacco roczne spożycie tytoniu [kg], ldl poziom złego cholesterolu we krwi, famhist i występowanie chorób wieńcowych w rodzinie, alcohol i roczne spożycie alkoholu.
ilustracja graficzna
Anatomia funkcji logistycznej Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia f (x) = Własności funkcji: a + c (a > 0, b > 0, g > 0, ) 1 + be gx 1 lim x + f (x) = a maksymalna wartość funkcji (którą osiąga w nieskończoności), 2 f (0) = a 1+b 3 punkt przegięcia w x 0 = ln b g
Funkcja logistyczna ilustracja Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia a = 10, b = 2 1 3, g = 0.04
Funkcja łącząca Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia p i = 1 1 + exp( Z i ) = exp(z i) exp(z i ) + 1 gdzie: Z i = α 0 + α 1 X 1i + + α K X Ki + ε i
Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszkałych w RPA CHD i = α 0 + α 1 tobacco i + α 2 ldl i + α 3 famhist i + α 4 age i + ε i gdzie: CHD i pacjent chory na chorobę wieńcową, tobacco roczne spożycie tytoniu [kg], ldl poziom złego cholesterolu we krwi, famhist i występowanie chorób wieńcowych w rodzinie.
Reguła optymalnego progu odcięcia Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia
Reguła optymalnego progu odcięcia Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia
Reguła optymalnego progu odcięcia Anatomia funkcji logistycznej Funkcja łącząca w modelu logitowym Zachorowalność na choroby wieńcowe wśród mężczyzn zamieszka Reguła optymalnego progu odcięcia
Funkcja łącząca Funkcja łącząca w modelu probitowym gdzie: p i = Zi 1 2π exp( t2 2 )dt, Z i = α 0 + α 1 X 1i + + α K X Ki + ε i
Modele dwumianowe - porównanie Funkcja łącząca w modelu probitowym
1 Próba ucięta (ang. truncated) obserwuje się tylko część populacji dla pewnego przedziału zmiennej endogenicznej, 2 Próba cenzurowana dla pewnego przedziału wartość zmiennej endogenicznej nie jest obserwowana; obserwowany jest jedynie fakt przynależności do przedziału ukrycia lub wartość tej zmiennej poza tym przedziałem.
oraz: y i = α 0 + α 1 + X i + ε i { yi = y y i = 0 i dla yi > 0, dla yi 0.
Amerykanów naaffair i = α 0 + α 1 yrsmarr i + α 2 age i + α 3 kids i + α 4 male i + α 5 educ i + ε i gdzie: naaffair i liczba romansów w roku, naaffairi poziom skłonności do romansów, yrsmarr i staż małżeński, age i wiek, kids i liczba dzieci, male i płeć, educ i lata edukacji.
Zdrady vs. skłonność do zdrady Oczekiwana skłonność do zdrady: Wartość oczekiwana: E(naaffairi ) = α 0 + α 1 yrsmarr i + α 2 age i Efekt krańcowy: E(naaffair i ) x i = α i
Zdrady vs. skłonność do zdrady Oczekiwany poziom zdrad: gdzie: dla wartości naaffair i > 0: E(naaffair i naaffair i > 0, X i ) = dla wszystkich wartości naaffair i : c i = ˆ naaffair i σ naaffair ˆ i + σ f (c i) F (c i ), E(naaffair i X i ) = F (c i )( naaffair ˆ i ) + σf (c i ). f ( ) funkcja gęstości rozkładu normalnego, F ( ) dystrybuanta rozkładu normalnego.
Zdrady vs. skłonność do zdrady Efekty krańcowe w modelu tobitowym: dla wartości naaffair i > 0: gdzie: E(naaffair i naaffair i > 0, X i ) x j = α j {1 f (c i) F (c i ) [c i + f (c i) F (c i ) ]} dla wszystkich wartości naaffair i : ˆ naaffair i σ E(naaffair i X i ) x j = α j F (c i ). c i = f ( ) funkcja gęstości rozkładu normalnego, F ( ) dystrybuanta rozkładu normalnego.
ilustracja graficzna
ilustracja graficzna
Standardowy model tobitowy: y i = α 0 + α 1 X i + ε i oraz: { yi = y y i = 0 i dla yi > 0, dla yi 0.
Standardowy model tobitowy: y i = α 0 + α 1 X i + ε i Teatralny model tobitowy: Q t = α 0 + α 1 p t + ε t oraz: { yi = y y i = 0 i dla yi > 0, dla yi 0. oraz: { Qt = Q t dla Q t < 1838, Q t = 1838 dla Q t 1838.