Materiaªy do zaawans. ekon. Z10

Podobne dokumenty
Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii r. Piotr Wójcik, KTRG WNE UW

Stanisław Cichocki. Natalia Nehrebecka

Szacowanie modeli wielowartościowych w pakiecie STATA

Ekonometria dla IiE i MSEMat Z12

Stanisław Cichocki. Natalia Nehrebecka

1 Metoda Największej Wiarogodności

Binarne zmienne zależne

Ekonometria egzamin semestr drugi 14/06/09

Wykªad 6: Model logitowy

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Zbiór pyta«zaawansowanej ekonometrii. c Rafaª Wo¹niak 1

Ekonometria dla IiE i MSEMat Z7

Binarne zmienne zależne

Analiza Szeregów Czasowych. Egzamin

Analiza czynników wpływających na poziom wykształcenia.

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

2 Logit i logit wielomianowy

6 Modele wyborów dyskretnych dla danych panelowych

2.3 Modele nieliniowe

Heteroskedastyczość w szeregach czasowyh

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

NIE STRASZNY NAM KRYZYS, CZYLI JAK NIE DAĆ SIĘ DEPRESJI Determinanty depresji w Polsce

Ekonometria ćwiczenia Kolokwium 2 semestr 22/05/05. / 4 pkt. / 4 pkt. / 3 pkt. / 4 pkt. /22 pkt. Regulamin i informacje dodatkowe

Uniwersytet Warszawski Wydział Nauk Ekonomicznych. Determinanty kryzysów bankowych

Czasowy wymiar danych

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testowanie hipotez statystycznych

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Szacowanie modeli dla nielosowej selekcji w pakiecie STATA

Modele warunkowej heteroscedastyczności

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Metoda najmniejszych kwadratów

(LMP-Liniowy model prawdopodobieństwa)

Modelowanie wielopoziomowe model z losowym nachyleniem

4 Logit wielomianowy, warunkowy i zagnieżdżony

Egzamin z ekonometrii

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Paweł Strawiński Ćwiczenia

Stanisław Cichocki. Natalia Nehrebecka

WYKORZYSTANIE MODELU LOGITOWEGO DO ANALIZY BEZROBOCIA WŚRÓD OSÓB NIEPEŁNOSPRAWNYCH W POLSCE W 2010 ROKU

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Budowa modelu i testowanie hipotez

postanowiono zbadać co wpływa na przyznanie wyróżnienia. Hipotezy testujemy na poziomie istotności 0,05. Zadanie 1 Na podstawie danych

Problem równoczesności w MNK

Wst p i organizacja zaj

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Egzamin z ekonometrii - wersja IiE, MSEMAT

Statystyka medyczna II. 7. Wstęp do regresji logistycznej. Regresja logistyczna prosta, porównanie z miarami ryzyka.

Estymacja modeli ARDL przy u»yciu Staty

1 Modele ADL - interpretacja współczynników

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Egzamin z ekonometrii IiE

Ekonometria. wiczenia 7 Modele nieliniowe. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Egzamin z ekonometrii - wersja ogólna

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Egzamin z ekonometrii - wersja ogólna

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Diagnostyka w Pakiecie Stata

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Zmienne sztuczne i jakościowe

Uogolnione modele liniowe

Egzamin z ekonometrii wersja IiE, MSEMAT

Matematyka z elementami statystyki

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria - wykªad 8

3. (8 punktów) EGZAMIN MAGISTERSKI, Biomatematyka

Biostatystyka, # 4 /Weterynaria I/

Podstawy statystycznego modelowania danych Analiza prze»ycia

Biostatystyka, # 5 /Weterynaria I/

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Autokorelacja i heteroskedastyczność

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

Diagnostyka w Pakiecie Stata

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

1.9 Czasowy wymiar danych

Egzamin z ekonometrii wersja IiE, MSEMAT

Metody probablistyczne i statystyka stosowana

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Dr Łukasz Goczek. Uniwersytet Warszawski

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

3 Modele wyborów dyskretnych

Zamów książkę w księgarni internetowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Rozdziaª 4. Jednowymiarowe modele szeregów czasowych

Zastosowanie modeli hazardu do szacowania długości czasu pozostawania bez pracy w Niemczech i w Polsce. 2. Wybór i opis właściwej metody analizy

Efekty przestrzenne w konwergencji polskich podregionów

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Transkrypt:

Faculty of Economic Sciences, University of Warsaw Warsaw, 23-04-2012

Probit wiczenie 1. Moshe Ben-Akiva and Steven Lerman, Discrete Choice Analysis, Theory and Application to Travel Demand, MIT Press, 1985. Przytoczone w: R. Carter Hill, William E. Griths, Guay C. Lim, Principles of Econometrics, Wiley & Sons, 2008. Zmnienna obja±niana (y): AUTO i - czy dana osoba wybiera transport publiczny czy wªasny samochód. Zmienna obja±niaj ca (x): DTIME i = (bus time - auto time) - ró»nica mi dzy czasem dojazdu autobusem a samochodem.

Poda interpretacje oszacowa«i efektów cz stkowych. probit auto dtime Probit regression Number of obs = 21 LR chi2(1) = 16.73 Prob > chi2 = 0.0000 Log likelihood = -6.1651585 Pseudo R2 = 0.5758 auto Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- dtime.2999898.1028673 2.92 0.004.0983735.5016061 _cons -.0644338.3992438-0.16 0.872 -.8469372.7180696. mfx compute Marginal effects after probit y = Pr(auto) (predict) =.45971697 variable dy/dx Std. Err. z P> z [ 95% C.I. ] X ---------+-------------------------------------------------------------------- dtime.119068.041 2.90 0.004.038713.199423 -.122381

Probit wiczenie 2. Dhillon, Shilling and Sirmans, Choosing Between Fixed and Adjustable Rate Mortgages, Journal of Money, Credit and Banking, 19(1), 1987, 260-267. Exercise 16.3. R. Carter Hill, William E. Griths, Guay C. Lim, Principles of Econometrics, Wiley & Sons, 2008. Zmnienna obja±niana (y): ADJUST i adjustable-rate mortgage - kredyt hipoteczny

Poda interpretacje oszacowa«i efektów cz stkowych Probit regression Number of obs = 78 LR chi2(6) = 27.19 Prob > chi2 = 0.0001 Log likelihood = -39.207128 Pseudo R2 = 0.2575 adjust Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- fixrate.4987284.2624758 1.90 0.057 -.0157148 1.013172 margin -.4309509.1739101-2.48 0.013 -.7718083 -.0900934 yield -2.383964 1.083047-2.20 0.028-4.506698 -.2612297 maturity -.0591854.6225826-0.10 0.924-1.279425 1.161054 points -.2999138.2413875-1.24 0.214 -.7730246.1731971 networth.0838286.037854 2.21 0.027.0096361.1580211 _cons -1.877266 4.120677-0.46 0.649-9.953644 6.199112 variable dy/dx Std. Err. z P> z [ 95% C.I. ] X ---------+-------------------------------------------------------------------- fixrate.189926.0993 1.91 0.056 -.00469.384542 13.2494 margin -.1641149.06634-2.47 0.013 -.294146 -.034083 2.29192 yield -.9078622.41481-2.19 0.029-1.72088 -.094845 1.60641 maturity -.022539.23714-0.10 0.924 -.487333.442255 1.05833 points -.1142133.09137-1.25 0.211 -.293291.064865 1.49795 networth.0319236.0144 2.22 0.027.003705.060142 3.50401

Tablica klasykacyjna. Wyznaczy R 2 liczebno±ciowe Probit model for adjust -------- True -------- Classified D ~D Total -----------+--------------------------+----------- + 21 8 29-11 38 49 -----------+--------------------------+----------- Total 32 46 78 Classified + if predicted Pr(D) >=.5 True D defined as adjust!= 0 -------------------------------------------------- Sensitivity Pr( + D) 65.63% Specificity Pr( - ~D) 82.61% Positive predictive value Pr( D +) 72.41% Negative predictive value Pr(~D -) 77.55% -------------------------------------------------- False + rate for true ~D Pr( + ~D) 17.39% False - rate for true D Pr( - D) 34.38% False + rate for classified + Pr(~D +) 27.59% False - rate for classified - Pr( D -) 22.45% -------------------------------------------------- Correctly classified 75.64% --------------------------------------------------

Logit wiczenie 3. Moshe Ben-Akiva and Steven Lerman, Discrete Choice Analysis, Theory and Application to Travel Demand, MIT Press, 1985. Przytoczone w: R. Carter Hill, William E. Griths, Guay C. Lim, Principles of Econometrics, Wiley & Sons, 2008. Zmnienna obja±niana (y): AUTO i - czy dana osoba wybiera transport publiczny czy wªasny samochód. Zmienna obja±niaj ca (x): DTIME i = (bus time - auto time) - ró»nica mi dzy czasem dojazdu autobusem a samochodem.

Poda interpretacje oszacowa«i efektów cz stkowych. logit auto dtime Logistic regression Number of obs = 21 LR chi2(1) = 16.73 Prob > chi2 = 0.0000 Log likelihood = -6.1660422 Pseudo R2 = 0.5757 auto Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- dtime.5310983.2064228 2.57 0.010.126517.9356795 _cons -.2375754.7504766-0.32 0.752-1.708483 1.233332. mfx compute Marginal effects after logit y = Pr(auto) (predict) =.42492892 variable dy/dx Std. Err. z P> z [ 95% C.I. ] X ---------+-------------------------------------------------------------------- dtime.1297815.04968 2.61 0.009.032404.227159 -.122381

Logit wiczenie 4. Exercise 16.5 R. Carter Hill, William E. Griths, Guay C. Lim, Principles of Econometrics, Wiley & Sons, 2008. Zmnienna obja±niana (y): FOURYR i college (1), 2-letni (0) - ucze«wybraª 4-letni Zmienna obja±niaj ca (x): GRADES i 13-point scale with 1 indicating highest grade and 13 the lowest; FAMINC i gross family income in $1000; FAMSIZ numebr of family members. Are the signs of the estimated coecients consistent with your expectations? Are the estimated coecients statistically signicant?

Poda interpretacje oszacowa«i efektów cz stkowych Logistic regression Number of obs = 778 LR chi2(3) = 118.56 Prob > chi2 = 0.0000 Log likelihood = -429.94775 Pseudo R2 = 0.1212 fouryr Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- grades -.3807142.0424187-8.98 0.000 -.4638533 -.2975752 faminc.0088447.0026056 3.39 0.001.0037377.0139516 famsiz.0123708.0657936 0.19 0.851 -.1165823.1413239 _cons 2.648235.4145694 6.39 0.000 1.835694 3.460776 Marginal effects after logit y = Pr(fouryr) (predict) =.7088208 variable dy/dx Std. Err. z P> z [ 95% C.I. ] X ---------+-------------------------------------------------------------------- grades -.0785771.00847-9.27 0.000 -.095186 -.061968 6.04384 faminc.0018255.00053 3.45 0.001.000787.002864 55.4669 famsiz.0025533.01358 0.19 0.851 -.024064.029171 4.18895

Statystyka Walda fouryr Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- grades -.3807142.0424187-8.98 0.000 -.4638533 -.2975752 faminc.0088447.0026056 3.39 0.001.0037377.0139516 famsiz.0123708.0657936 0.19 0.851 -.1165823.1413239 _cons 2.648235.4145694 6.39 0.000 1.835694 3.460776. test faminc ( 1) [fouryr]faminc = 0 chi2( 1) = 11.52 Prob > chi2 = 0.0007. test famsiz ( 1) [fouryr]famsiz = 0 chi2( 1) = 0.04 Prob > chi2 = 0.8509

Statystyka Walda fouryr Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- grades -.3807142.0424187-8.98 0.000 -.4638533 -.2975752 faminc.0088447.0026056 3.39 0.001.0037377.0139516 famsiz.0123708.0657936 0.19 0.851 -.1165823.1413239 _cons 2.648235.4145694 6.39 0.000 1.835694 3.460776. test famsiz faminc ( 1) [fouryr]famsiz = 0 ( 2) [fouryr]faminc = 0 chi2( 2) = 11.79 Prob > chi2 = 0.0027

Test ilorazu wiarygodno±ci fouryr Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- grades -.3807142.0424187-8.98 0.000 -.4638533 -.2975752 faminc.0088447.0026056 3.39 0.001.0037377.0139516 famsiz.0123708.0657936 0.19 0.851 -.1165823.1413239 _cons 2.648235.4145694 6.39 0.000 1.835694 3.460776. lrtest logit1 logit2, stat Likelihood-ratio test LR chi2(2) = 118.36 (Assumption: logit2 nested in logit1) Prob > chi2 = 0.0000 ----------------------------------------------------------------------------- Model Obs ll(null) ll(model) df AIC BIC -------------+--------------------------------------------------------------- logit2 778-489.2299-489.126 2 982.2521 991.5655 logit1 778-489.2299-429.9477 4 867.8955 886.5224 ----------------------------------------------------------------------------- Note: N=Obs used in calculating BIC; see [R] BIC note

Logit/Probit - LINKTEST. linktest Iteration 0: log likelihood = -489.22986 Iteration 1: log likelihood = -432.52198 Iteration 2: log likelihood = -429.93484 Iteration 3: log likelihood = -429.89463 Iteration 4: log likelihood = -429.89463 Logistic regression Number of obs = 778 LR chi2(2) = 118.67 Prob > chi2 = 0.0000 Log likelihood = -429.89463 Pseudo R2 = 0.1213 fouryr Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- _hat.9534232.1753148 5.44 0.000.6098126 1.297034 _hatsq.0323396.099833 0.32 0.746 -.1633295.2280086 _cons -.0047345.1051499-0.05 0.964 -.2108245.2013554

Modele dla dyskretnych zmiennych zale»nych 1 Zmienna obja±niana jest binarna Logit Probit Liniowy model prawdopodobie«stwa 2 Zmienna zale»na przyjmuje wi cej ni» 2 warto± i (nieuporz dkowane) Wielomianowy logit Warunkowy logit 3 Zmienna zale»na przyjmuje wi cej ni» 2 warto± i (uporz dkowane) Uporz dkowany logit Uporz dkowany probit 4 Modele dla liczebno±ci Model Poissona Model ujemny dwumianowy

Qualitative and Limited Dependent Variable 1 Models with Binary Dependent Variable Logit Probit Linear Probability Model 2 Unoredered Choice Models Multinomial Logit Conditional Logit 3 Ordered Choice Models Ordered Logit Ordered Probit 4 Models for Count Data Poisson Regression Models Negative Binomial Models

Prawdopodobie«stwo. Binarne Zmienne Niezale»ne W modelach dla zmiennych binarnych wyja±niamy prawdopodobie«stwa stanów, za pomoc zmiennych niezale»nych. Chcemy powi za te prawdopodobie«stwa z wielko±ci zmiennych niezale»nych. Szukamy warunkowych prawdopodobie«stw stanów przy znanych wielko±ciach zmiennych niezale»nych. { 1 p(x i ), y i = 0, = [p(x p(x i ), y i = 1 i )] y i [1 p(x i )] 1 y i Czym jest p(x i )? Jest funkcj, która przyjmuje warto±ci z przedziaªu [0, 1]. p(x i ) to najcz ±ciej dystrybuanta rozkªadu ci gªego, p(x i ) = F (x i β).

Prawdopodobie«stwo. Binarne Zmienne Niezale»ne Funkcja wiarogodno±ci szacowanego modelu dla binarnych zmiennych zale»nych na próbie przekrojowej ma nast puj c posta : L(θ) = N i=1 [p(x i)] y i [1 p(x i )] 1 yi, a wi c logarytm funkcji wiarogodno±ci b dzie mo»na zapisa jako l(θ) = N i=1 y i lnp(x i ) + N i=1 (1 y i)ln[1 p(x i )] Poniewa» p(x i ) [0, 1], wi c lnp(x i ) 0 i ln[1 p(x i )] 0, a zatem tak»e l(θ) 0.

Interpretacja wspóªczynników Modele dla zmiennych binarnych nie s modelami liniowymi, poniewa» warunkowa warto± oczekiwana zmiennej zale»nej nie jest dana funkcj liniow : E(y x) = 0[1 F (xβ)] + 1F (xβ) = F (xβ) = p(xβ) Warto± oczekiwana zmiennej równa jest prawdopodobie«stwu sukcesu. Efekt cz stkowy E(y x) xk = p(xβ) xk = f (xβ)β k Efekt cz stkowy interpretujemy jako wpªyw jednostkowej zmiany zmiennej niezale»nej na wielko± prawdopodobie«stwa sukcesu.

Interpretacja wspóªczynników Wielko± efektu cz stokowego zale»y od x. Efekty cz stkowe zazwyczaj liczym dla ±rednich. Dla zerojedynkowych zmiennych obja±niaj cych efekt kra«cowy deniujemy jako F ( xβ) = F ( x 1 β) F ( x 0 β). Samych wielko±ci wspóªczynników nieinterpretuje si. Mo»na zinterpretowa proporcje mi dzy wspóªczynnikami. E(y x) / xk E(y x) = xm β k βm i s niezale»ne od wielko±ci zmiennych obja±niaj cych.