Binarne zmienne zależne
|
|
- Jerzy Wawrzyniak
- 5 lat temu
- Przeglądów:
Transkrypt
1 Binarne zmienne zależne Zmienna zależna nie jest ciagła ale przyjmuje zero lub jeden Przykład: szukanie determinant bezrobocia (próba przekrojowa) zmienna objaśniana: zerojedynkowa (pracujacy, bezrobotny) szukamy zwiazku między charakterystykami ekonomiczno-społecznymi a byciem bezrobotnym W modelach dla zmiennych binarnych staramy się wyjaśnić prawdopodobieństwa stanów za pomoca zmiennych niezależnych Prawdopodobieństwo pojedynczego zdarzenia dane jest rozkładem Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 1
2 dwumianowym Pr (y i x i ) = { 1 p (xi ) dla y i = 0 p (x i ) dla y i = 1 gdzie p (x i ) = F (x i β) i F ( ) jest zazwyczaj dystrybuanta jakiegoś rozkładu prawdopodobieństwa. Estymator parametru β liczymy za pomoca MNW. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 2
3 Interpretacja ekonomiczna Podejście indeksowe y jest użytecznościa lub zyskiem netto y jest nieobserwowalne y jest losowe y = xβ + ε gdzie ε ma symetryczna dystrybuantę z E (ε) = 0 i Var (ε) = 1 Parametry modelu szacujemy na postawie obserwowalnych wybów y, na które zdeterminowane sa nieobserwowalnym y. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 3
4 Wybór y = 1 jest podejmowany jeśli przyrost zwiazanej z nim użyteczności (zysku) jest dodatni y = 0 dla y 0 y = 1 dla y > 0 Prawdopodobieństwo, że y = 1 jest równe Pr {y = 1} = Pr {y > 0} = Pr {xβ + ε > 0} = Pr {ε > xβ} Skoro dystybuanta ε jest symetryczna, to gdzie F ( ) jest dystrybuanta ε Pr {y = 1} = Pr {ε < xβ} = F (xβ) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 4
5 W tym podejściu, wybór zależy jedynie od charakterystyk podmiotu i alternatywy wybranej Losowa użyteczność Załóżmy, że y0 i y1 sa użytecznościami z działań 0 i 1. y0 i y1 sa nieobserwowalne i dane równaniami y 0 = x 0 β + ε 0 y 1 = x 1 γ + ε 1 Załóżmy, że ε 0 ε 1 maja symetryczna dystrybuantę Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 5
6 Obserwujemy y takie że y = 0 if y 0 > y 1 y = 1 if y 0 y 1 Podmiot podejmuje działanie 0 jeśli y 0 jest lepsze niż y 1 i 1 jeśli y 1 jest lepsze niż y 0. Prawdopodobieństwo zaobserwowania 1 jest równe: Pr {y = 1} = Pr {y 0 y 1} = Pr {x 0 β + ε 0 x 1 γ + ε 1 } = Pr {ε 1 ε 0 x 0 β x 1 γ} = F (x 1 γ x 0 β) W modelu losowej użyteczności wybór zależy nie tylko od charakterystyk podmiotu, charakterystyk alternatywy wybranej, ale też od charakterystyk alternatywy niewybranej. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 6
7 Interpretacja współczynników Wartość oczekiwana zmiennej zależnej w modelu dla zmiennej binarnej jest równa: E (y i x i ) = 0 [1 F (x i β)] + 1F (x i β) = F (x i β) = p (x i β) Ponieważ przyjęta jest konwencja, że 1 oznacza sukces a 0 porażkę więc, wartość oczekiwana zmiennej zależnej w modelu dla zmiennej binarnej równa jest prawdopodobieństwu sukcesu. Efekt czastkowy jest równy: E (y x) x = p (x iβ) x = f (xβ) β Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 7
8 Efekt czastkowy w tym przypadku intepretujemy jako wpływ jednostkowej zmiany zmiennej niezależnej na prawdopodobieństwo sukcesu. Ze wzoru widać, że wielkość efektu czastkowego zależy od tego w jakim punkcie jest on liczony Zazwyczaj liczymy go dla średnich wartości zmiennych egzogenicznych. Dla zero-jedynkowych zmiennych objaśniajacych efekt krańcowy definiuje się jako F (xβ) = F (x 1 β) F (x 0 β) - a więc różnice między prawdopodobiestwem sukcesu dla zmiennej zerojedynkowej równej zeru i równej 1 przy wszystkich pozostałych zmiennych ustalonych na poziomie średnich. Ponieważ funkcja gęstości f (x i β) jest zawsze dodatnia więc znak efektu czaskowego jest równy znakowi współczynnika przy zmiennej. Wynika z Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 8
9 tego, że jakkolwiek same współczynniki nie sa zazwyczaj interpretowalne to można intepretować ich znaki. Można jednak intepretować proporcje między wspołczynnkimi ponieważ sa one równe proporcjom między efektami krańcowymi / E (y x) E (y x) x j x k = β j β k Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 9
10 Miary dopasowania Często stosowana miara dopasowania jest pseudo-r 2 = 1 ) l ( β ) l ( βr gdzie β R zawiera jedynie stała pseudo-r 2 spełnia 0 pseudo-r 2 1 pseudo-r 2 nie można jednak w pełni ściśle interpretować jako procent zmienności wyjaśnionej przez model. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 10
11 Innym sposobem mierzenia jakości dopasowania jest analiza tablicy częstości: Prognozowane Zaobserwowane 0 1 Razem 0 n 00 n 01 n 00 + n 01 1 n 10 n 11 n 10 + n 11 Razem n 00 + n 10 n 01 + n 11 Arbitralnie zakładamy, że model przewiduje y i = 1 jeśli p i = x i b > 0.5 Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 11
12 Liniowy model prawdopodobieństwa (LP M) W liniowym modelu prawdopodobieństwa LP M (Linear Probability Model) zakładmy, że dystrybuanta rozkładu ma postać funkcji liniowej: p (x i ) = F (x i β) = x i β W tym przypadku estymacja parametrów β sprawadza się do szacowania MNK równania y i = x i β+ ε i Podejście to mimo swojej prostoty zwiazane jest z dwoma poważnymi problemami: Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 12
13 1. Błędy losowe w równaniu regresji będa heteroskedastyczne. Zmienna ma rozkład dwumianowy więc: E (y i ) = F (x i β) = x i β E ( y 2 i ) = 0 2 (1 x i β) x i β = x i β Var (y i ) = E ( x 2 ) i E (x i ) 2 = x i β (x i β) 2 = x i β (1 x i β) Wariancja y i zależy od x i. 2. Nie ma gwarancji, że ŷ i = x i b [0, 1]. Ponieważ ŷ i interpretujemy jako prawdopodobieństwa stanów - ujemne lub większe od 1 wartości dopasowane będa nieinterpretowalne Mimo tych wad liniowy model prawdopodobieństwa jest dosyć często Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 13
14 używany w praktycznych zastosowaniach ze względu na łatwość estymacji. Efekty czaskowe w tym modelu równe sa poprostu β Wpływu heteroskedastyczności na wyniki wnioskowania można wyeliminować stosujac odporna macierz wariancji White a Hetroskedastyczność można też wyeliminować za pomoca UMNK: estymujemy LP M za pomoca MNK liczymy wariancje σ 2 i = x i b [1 x i b] = ŷ i (1 ŷ i ) (wór ten ma sens jedynie dla ŷ i [0, 1]) liczymy regresję y i / σ i na x 1i / σ i,..., x Ki / σ i Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 14
15 Przykład Zależność aktywności zawodowej od wieku i wykształcenia: dane BAEL - pytanie: czy w ostatnim tygodniu wykonywał Pan(i) jakakolwiek pracę? Source SS df MS Number of obs = F( 9, 47850) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = _Iworks_1 Coef. Std. Err. t P> t [95% Conf. Interval] wiek _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 15
16 _Iwyksz_ _cons Wyniki testu na heteroskedastyczność: Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of _Iworks_1 chi2(1) = Prob > chi2 = Niektóre wartości przewidywane: yhat Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 16
17 Jednak z obserwacji tylko 144 / (0, 1) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 17
18 Probit Dystrybuanta F (x i β) = Φ (x i β), z rozkładu normalnego. Funkcja prawdopodobieństwa zajścia pojedynczego zdarzenia: Pr (y i ) = { 1 Φ (xi β) dla y i = 0 Φ (x i β) dla y i = 1 = [1 Φ (x i β)] 1 y i Φ (x i β) y i Funkcja wiarygodności ma postać L (y,x,β) = n (1 Φ (x i β)) 1 y i Φ (x i β) y i i=1 Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 18
19 Logarytm funkcji wiarygodności będzie ma postać l (y,x,β) = n [(1 y i ) ln (1 Φ (x i β)) + y i ln Φ (x i β)] i=1 Często podaje się jedynie l i (β) l i (β) = (1 y i ) ln (1 Φ (x i β)) +y i ln Φ (x i β). Efekt czastkowy E (y x) x = φ (xβ) β Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 19
20 Przykład Zależność aktywności zawodowej od wieku i wykształcenia: kontynuacja Współczynniki: Probit estimates Number of obs = LR chi2(9) = Prob > chi2 = Log likelihood = Pseudo R2 = _Iworks_1 Coef. Std. Err. z P> z [95% Conf. Interval] wiek _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 20
21 _cons Efekty krańcowe: Probit estimates Number of obs = LR chi2(9) = Prob > chi2 = Log likelihood = Pseudo R2 = _Iwork~1 df/dx Std. Err. z P> z x-bar [ 95% C.I. ] wiek _Iwyks~2* _Iwyks~3* _Iwyks~4* _Iwyks~5* _Iwyk~60* _Iwyk~61* _Iwyk~70* _Iwyk~71* Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 21
22 obs. P pred. P (at x-bar) (*) df/dx is for discrete change of dummy variable from 0 to 1 z and P> z are the test of the underlying coefficient being 0 Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 22
23 Logit Model logitowy otrzymujemy dla F (x i β) = ex iβ 1 + e x iβ = Λ (x iβ) Funkcja prawdopodobieństwa dla pojedynczej obserwacji Pr (y i ) = { 1 1+e x i β dla y i = 0 e x i β 1+e x i β dla y i = 1 Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 23
24 Logarytm funkcji wiarygodności l (y,x,β) n [ ( ) ( )] 1 e x i β = (1 y i ) ln 1 + e x + y i ln iβ 1 + e x iβ = i=1 n y i x i β i=1 Efekt czastkowy: n ln ( 1 + e x iβ ) i=1 E (y x) x = Λ (x iβ) x = Λ (x i β) [1 Λ (x i β)] β W przypadku modelu logitowego można także bezośrednio intepretować same parametry. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 24
25 Zdefiniujmy szansę sukcesu jako stosunek prawdopodobieństwa sukcesu do prawdopodobieństwa porażki: Odds (x i ) = Pr (y i = 1 x i ) Pr (y i = 0 x i ) = e x i β 1+e x i β 1 1+e x i β = e xiβ Przykład Jeśli prawdopodobieństwo zdania egzaminu z ekonometri jeśli 1 się w ogóle nie uczyłem (x i = 0) wynosi 9 a szansa zdania egzaminu jest równa Odds (0) = 1 9 = Policzmy teraz iloraz, szansy dla zmiennej niezależnej równej x i i szansy dla zmiennej niezależnej równej x j : Odds (x i ) Odds (x j ) = exp [( x i x j ) β ] = exp ( xβ) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 25
26 Przykład Jeśli prawdopodobieństwo zdania egzaminu z ekonometri jeśli 1 się w ogóle nie uczyłem jeden dzień (x i = 1) wynosi 3 to szansa zdania egzaminu w tym przypadku będzie równa Odds (1) = 1 3 = a iloraz szans 3 będzie równy Odds (1) 1 Odds (0) = 2 Prawdopodbieństwo zdania egzaminu wzrosło więc 3 razy a szansa zdania egzaminu 4 razy. 1 8 = 4 Ilorazy szans równe exp (β k ) intepretuje się w sposób następujacy: Dla zmiennej ciagłej jest to współczynnik, przez który należy przemnożyć szansę sukcesu dla x ik, by otrzymać szansę sukcesu dla x ik + 1. Dla zmiennej zerojedynkowej x ik jest to współczynnik, przez który należy przemnożyć szansę sukcesu dla x ik = 0, by otrzymać szansę Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 26
27 sukcesu dla x ik = 1. Dla małych β k wielkości β k można także zintepretować, korzystajac z tego, że e xβ 1 + xβ: dla zmiennych ciagłych - ile procent zmieni się szansa sukcesu jeśli x k zmieni się o 1 dla zmiennych zero jedynkowych - ile procent zmieni się szansa sukcesu jeżeli zmienna x k przeskoczy z 0 na 1. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 27
28 Przykład Zależność aktywności zawodowej od wieku i wykształcenia: kontynuacja Współczynniki Logit estimates Number of obs = LR chi2(9) = Prob > chi2 = Log likelihood = Pseudo R2 = _Iworks_1 Coef. Std. Err. z P> z [95% Conf. Interval] wiek _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 28
29 _cons Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 29
30 Krańcowe efekty Marginal effects after logistic y = Pr(_Iworks_1) (predict) = variable dy/dx Std. Err. z P> z [ 95% C.I. ] X wiek _Iwyks~2* _Iwyks~3* _Iwyks~4* _Iwyks~5* _Iwyk~60* _Iwyk~61* _Iwyk~70* _Iwyk~71* (*) dy/dx is for discrete change of dummy variable from 0 to 1 Interpetacja efektów czastkowych: Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 30
31 wzrost wieku o 1 rok zmniejsza prawdopodobieństwo posiadania pracy o 0.4% w stosunku do prawdopodobieństwa dla średnich w próbie osby z wykształceniem policealnym maja o 11% mniejsze prawdopodbieństwo posiadania pracy niż osoby z wykształceniem wyższym (poziom bazowy). Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 31
32 Ilorazy szans Logistic regression Number of obs = LR chi2(9) = Prob > chi2 = Log likelihood = Pseudo R2 = _Iworks_1 Odds Ratio Std. Err. z P> z [95% Conf. Interval] wiek _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ _Iwyksz_ Interpetacja współczynników: Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 32
33 szansę posiadania pracy trzeba pomnożyć przez 0.98 aby uzyskać szansę posiadania pracy przy wieku większym o 1 - spadek o 2% szanse posiadania pracy dla wykształcenia wyższego (poziom bazowy) należy pomnożyć przez 0.58 aby uzyskać szansę posiadania pracy przy wykształceniu policealnym (poziom 1) - spadek o 42% Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 33
34 Sukcesy i porażki przewidywane i zaobserwowane Logistic model for _Iworks_ True Classified D ~D Total Total Classified + if predicted Pr(D) >=.5 True D defined as _Iworks_1!= Sensitivity Pr( + D) 63.56% Specificity Pr( - ~D) 74.33% Positive predictive value Pr( D +) 63.54% Negative predictive value Pr(~D -) 74.34% False + rate for true ~D Pr( + ~D) 25.67% False - rate for true D Pr( - D) 36.44% False + rate for classified + Pr(~D +) 36.46% Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 34
35 False - rate for classified - Pr( D -) 25.66% Correctly classified 69.88% To na która z tych policzonych częstości powinniśmy patrzeć zależy od zastosowania: czy szczególnie ważne jest wyeliminowanie potencjalnych porażek (np. kontrola jakości) czy szczególnie ważne jest uniknięcie fałszywej klasyfikacji (np. identyfikacja przestępców) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 35
36 Różnice między probitem a logitem Inna interpretacja ale intepretacja efektow czastkowych taka sama Oba rozkłady prawdopodobieństwa sa symetryczne jednak rozkład logistyczny ma nieco grubsze ogony. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 36
37 Density e Rozklad logitowy Rozklad normalny W zwiazku z tym istotne różnice między modelami będa powstawać dla prób, o nikłym odsetku odpowiedzi 0 albo odpowiedzi 1 i bardzo Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 37
38 zróżnicowanych zmiennych niezależnych. Dla xβ bliskiego 0 funkcja gęstości f (0).4 dla logitu, f (0).25 dla probitu, i g (0) = 1 dla LP M. Z tego powodu często zdarza się, że β logit 1.6β probit i β logit 4β LPM. Nie ma dobrej statystyki, która magłaby posłużyć do wyboru między tymi modelami. W praktyce wybieramy ten, który jest analitycznie bardziej wygodny. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 38
39 Porównanie przewidywanych prawdopodobieństw z modelu liniowego i logitowego P stwo P stwo model liniowy P stwa z logitu P stwa z modelu liniowego Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 39
40 Porównanie przewidywanych prawdopodobieństw z modelu probitowego i logitowego P stwo logit P stwo probit P stwa z probitu P stwa z logitu Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 40
41 Modele dla zmiennych uporzadkowanych Zmienna zależna przyjmuje wartości ze zbioru {0, 1, 2,..., J} i J jest z góry znane Wartości zmiennej zależnej koduja stany, które można w sposób naturalny uporzadkować (n.p. oceny z egzaminu, poziomy wykształcenia itp.). Uporzadkowany probit y = xβ + ε i dystrybuanta ε jest dana przez F (ε). Zakładamy, że istnieje J Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 41
42 nieznanych punktów przecięć α 1 < α 2 <... < α j y = 0 jeśli y α 1 y = 1. jeśli α 1 < y α 2. y = J jeśli y > α J Prawdopodobieństwa poszczególnych wyborów sa równe Pr (y = 0 x) = Pr (y α 1 x) = F (α 1 xβ) Pr (y = 1 x) = Pr (α 1 < y α 2 x) = F (α 2 xβ) F (α 1 xβ). Pr (y = J x) = Pr (y > α 1 x) = 1 F (α J xβ) Te prawdopobieństwa możemy użyć do zdefiniowania funkcji wiarygodności Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 42
43 Dla uporzadkowanego probitu F (ε) = Φ (ε) a dla uporzadkowanego logitu F (ε) = Λ (ε) Dla modelu dla zmiennych uporzadkowanych efekt czastkowy jest równy p 0 (x) x p j (x) x = β k f (α 1 xβ), p J (x) x = β k f (α J xβ) = β k [f (α j 1 xβ) f (α j xβ)], 0 < j < J Znaki efektów czaskowych sa zdeterminowane przez znaki β tylko dla j = 1 i j = J. Na przykład jeśli β k jest dodatnie to wpływ x k na prawdopodobieństwo alternatywy 0 jest ujemny a na prawdodpodobieńtwo alternatywy J dodatni. Dla pośrednich wyborów znak zależy także od znaku różnicy φ (α j 1 xβ) φ (α j xβ) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 43
44 Dla tych modeli możemy także policzyć procenty prawidłowych przewidywań (przewidywany wybór byłby tu wyborem najabrdziej prawdopodobnym według modelu) Przykład Zależność wykształcenia od wieku, wielkości miejscowości (w której respondent mieszkał majac 14 lat) i wykształcenia ojca - dane PGSS. Zmienna zelażna jest poziom wykształcenia kodowany od 0 do 9 zgodnie rosnaco wraz z poziomem wykształcenia. Tak samo rosnaco zakodowany jest wielkość miejscowości. Badane sa jedynie osoby w wiku powyżej 25 lat. Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 44
45 Wielkości parametrów: Ordered probit estimates Number of obs = 6842 LR chi2(17) = Prob > chi2 = Log likelihood = Pseudo R2 = degree Coef. Std. Err. z P> z [95% Conf. Interval] age _Ires14_ _Ires14_ _Ires14_ _Ires14_ _Ires14_ _Ires14_ _Ires14_ _Ipadeg_ _Ipadeg_ _Ipadeg_ _Ipadeg_ Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 45
46 _Ipadeg_ _Ipadeg_ _Ipadeg_ _Ipadeg_ _Ipadeg_ _cut (Ancillary parameters) _cut _cut _cut _cut _cut _cut _cut _cut Wnioski: wszystkie analizowane zmienne maja istotny wpływ na zmienna zależna ujemny wpływ na p-stwo posiadania najniższego poziomu wykształcenia Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 46
47 i dodatni na p-stwo uzyskania najwyższego wykształcenia ma zmienna res14 (wilkość miejscowości), przy czym wydaje się, że istotne znaczenia ma jedynie to, czy respondent pochodzi ze wsi, ze zwykłego miasta, czy z dużego miasta ujemny wpływ na p-stwo posiadania najniższego poziomu wykształcenia i i dodatni na p-stwo uzyskania najwyższego wykształcenia ma zmienna padeg - poziom wykształcenia wydaje się do pewnego stopnia dziedziczny Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 47
48 Wielkości efektów czastkowych dla poziomu wykształcenia 2 (podstawowe) Marginal effects after oprobit y = Pr(degree==2) (predict, outcome(2)) = variable dy/dx Std. Err. z P> z [ 95% C.I. ] X age _Ires1~2* _Ires1~3* _Ires1~4* _Ires1~5* _Ires1~6* _Ires1~7* _Ires1~8* _Ipade~1* _Ipade~2* _Ipade~3* _Ipade~4* _Ipade~5* _Ipade~6* _Ipade~7* Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 48
49 _Ipad~_8* _Ipade~9* (*) dy/dx is for discrete change of dummy variable from 0 to 1 Intepretacja parametrów: dla Ipade~9 - respondent, którego ojciec ma wykształcenie wyższe ma o 29% niższe prawdopodbieństwo uzyskania wykształcenia jedynie podstawowego niż osoba, której ojciec nie miał żadnego wykształcenia (poziom 0 - bazowy) wraz ze wzrostem wieku o 1, p-stwo uzyskania wykształcenia podstawowego rośnie o 0.6% Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 49
50 Modele dla liczebności Liczebność jest to zmienna, która przyjmuje nieujemne wartości calkowite (np. liczba dzieci, liczba strajków ciagu roku w danej firmie, liczba papierosów wypalanych dziennie itd.) Czasami liczebność może mieć jakaś (zależna od obserwacji) logiczna górna granice (np. liczba dzieci danej w rodzinie, które ukończyły wyższe studia nie może być wyższa niż ogólna liczba dzieci w tej rodzinie) W tych przypadkach zastosowanie modelu dla zmiennych uporzadkowanych jest nieuprawnione, ponieważ zbiór możliwych wartości y nie jest z góry określony (naogół wyniki estymacji uzyskane ta metoda nie będa przy tym satysfakcjonujace) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 50
51 Najprostsza metoda estymacji w przypadku zmiennych to założyć, że E (y x) = xβ i estymować model przy użyciu OLS. Wada tej metody jest fakt, że niektóre z dopasowanych ŷ = xb moga się okazać ujemne, co nie ma sensu, ponieważ liczebnosć musi być zawsze dodatnia. Inna możliwość to dokonanie na zmiennych przekształcenia logarytmicznego i założenie, że log E [y x] = xβ. Wartości dopasowane sa w tym modelu równe ŷ = exp (xb) > 0 i większe od zera. Te podejście jest jednak niemożliwe do zastosowanie jeśli dla istotnej części obserwacji y = 0 (np. liczba dzieci) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 51
52 Model Poissona Najpopularniejszym modelem dla liczebności jest model Poissona Zakładamy, że warunkowa wartość oczekiwana y jest dana przez E (y x) = µ (x) (najczęściej µ (x) = exp (xβ)) Warunkowa dystrybuanta y jest dane przez rozkład Poissona dla λ = µ (x) f (y x) = e λ λ y y! = exp [ µ (x)] [µ (x)]y y! Rzeczywiście dla rozkładu Poissona E (y x) = λ = µ (x) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 52
53 Efekty czastkowe w rozkładzie Poissona z µ (x) = exp (xβ) intepretujemy tak samo jak w modelu, w którym zmienna zależna jest jest zlogarytmowana a niezależne nie sa zlogarytmowane (semielastyczności wartości oczekiwanej) ln E (y x) x / a więc µ(x) µ(x) x j = β j. = ln µ (x) x = β Jeśli zmienne niezależne sa także zlogarytmowane to parametry będziemy intepretować jako elastyczności wartości oczekiwanej. Parametry tego modelu moga być zgodnie i efektywnie oszacowane za pomoca MNW Najważniejsze ograniczenie modelu Poissona. Dla dystrybuanty Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 53
54 rozkładu Poissona: E (y x) = Var (y x) = λ = µ (x) Założenie to bardzo często nie jest spełnione w praktyce (rzadko kiedy można na podstawie rozważań teoretycznych uzasadnić rowność wartości oczekiwanej i wariancji) Założenie o równości wartości oczekiwanej i wariancji można przetestować. Można pokazać, jeśli tylko dobrze jest wyspecyfikowany model dla warunkowej wartości oczekiwanej (E (y x) = µ (x)), to nawet dla Var (y x) µ (x), model Poissona będzie dawał zgodne oszacowania parametrów. W takim przypadku oszacowanie macierzy wariancji kowariancji będzie Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 54
55 jednak nieprawidłowe. Można jednak w tym przypadku zastosować macierz odporna wariancji kowariancji (P seudo MNW ) Czasami zdarza się, że obserwujemy zbyt wysoka liczbę zer w danych (np. przy liczbie wypalanych papierosów wiaże się ro z tym, że ludzie napierw wybieraja palenie badź nie a później, to ile będa palić). W takim przypadku powinno się stosować model ZIP (Zero Inflated Poisson - rozdęty w zerze model Poissona) Przykład Liczba telewizorów w gospodarstwie domowym a logarytm dochodu i liczba osób w rodzinie. Założono, że µ (x) = exp (xβ). Liczba telewizorów w gospodarstwie domowym (dane z budżetów gospodarstw domowych) Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 55
56 Density U2 Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 56
57 Poisson regression Number of obs = LR chi2(7) = Prob > chi2 = Log likelihood = Pseudo R2 = tv Coef. Std. Err. z P> z [95% Conf. Interval] ldochg los _Iklm_ _Iklm_ _Iklm_ _Iklm_ _Iklm_ _cons Sprawdzamy, czy liczebności pasuja do rozkładu Poissona Goodness-of-fit chi2 = Prob > chi2(36155) = Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 57
58 Dobre dopasowanie rozkładu Intepretacja parametrów: zwiększenie się dochodu o 1% powoduje zwiększenie wartości oczekiwanej liczby telewizorów w gospodarstwie o 0.15% zwiększenie się liczby osób o 1 zwiększa liczbę telewizorów o 2.9% zamieszkanie na wsi zmniejsza oczekiwana liczbę telewizorów o 8.7% Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 58
59 Liczba telewizorów w gospodarstwie domowym (liczebności rzeczywiste i dopasowane) Density Wykład z Ekonometrii nr 21-22, III rok, WNE UW, Copyright c 2005 by Jerzy Mycielski 59
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
Binarne zmienne zależne
Binarne zmienne zależne Zmienna zależna nie jest ciagła ale przyjmuje zero lub jeden Przykład: szukanie determinant bezrobocia (próba przekrojowa) zmienna objaśniana: zerojedynkowa (pracujacy, bezrobotny)
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wstęp a) Binarne zmienne zależne b) Interpretacja ekonomiczna c) Interpretacja współczynników 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników
1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.
Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.
Problem równoczesności w MNK
Problem równoczesności w MNK O problemie równoczesności mówimy, gdy występuje korelacja między wartościa oczekiwana ε i i równoczesnym x i Model liniowy y = Xβ + ε, E (u) = 0 Powiedzmy, że występuje w
Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17
Stanisław Cichocki Natalia Neherebecka Zajęcia 15-17 1 1. Binarne zmienne zależne 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników 3. Probit a) Interpretacja współczynników b) Miary
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Binarne zmienne zależne 2. Liniowy model prawdopodobieństwa a) Interpretacja współczynników 3. Probit a) Interpretacja współczynników b) Miary dopasowania 4.
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 1 1 1. Testy diagnostyczne Testowanie stabilności parametrów modelu: test Chowa. Heteroskedastyczność Konsekwencje Testowanie heteroskedastyczności 1. Testy
Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW
Modele dla zmiennej binarnej w pakiecie STATA materiały na ćwiczenia z ekonometrii 18.03.2005 r. Piotr Wójcik, KTRG WNE UW Dane Dane wykorzystane w przykładzie pochodzą z pracy McCall, B.P., 1995, The
Zawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
Ekonometria dla IiE i MSEMat Z12
Ekonometria dla IiE i MSEMat Z12 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 09-01-2017 Test RESET Ramsey a W pierwszym etapie estymujemy współczynniki regresji w modelu:
Stanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Autokorelacja Konsekwencje Testowanie autokorelacji 2. Metody radzenia sobie z heteroskedastycznością i autokorelacją Uogólniona Metoda Najmniejszych
Ekonometria Ćwiczenia 19/01/05
Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych
Egzamin z ekonometrii wersja IiE, MSEMAT
Pytania teoretyczne Egzamin z ekonometrii wersja IiE, MSEMAT 08-02-2017 1. W jaki sposób przeprowadzamy test Chowa? 2. Pokazać, że jest nieobciążonym estymatorem. 3. Udowodnić, że w modelu ze stałą TSSESS+RSS.
Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Modelowanie zmiennej jakościowej Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 1 / 25 Zmienna jakościowa Zmienna ilościowa może zostać zmierzona
Uogolnione modele liniowe
Uogolnione modele liniowe Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Uogolnione modele liniowe grudzien 2013 1 / 17 (generalized linear model - glm) Zakładamy,
Metoda najmniejszych kwadratów
Własności algebraiczne Model liniowy Zapis modelu zarobki = β 0 + β 1 plec + β 2 wiek + ε Oszacowania wartości współczynników zarobki = b 0 + b 1 plec + b 2 wiek + e Model liniowy Tabela: Oszacowania współczynników
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 0/0/0. Egzamin trwa 90 minut.. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie
Autokorelacja i heteroskedastyczność
Autokorelacja i heteroskedastyczność Założenie o braku autokorelacji Cov (ε i, ε j ) = E (ε i ε j ) = 0 dla i j Oczekiwana wielkość elementu losowego nie zależy od wielkości elementu losowego dla innych
Modele wielorównaniowe (forma strukturalna)
Modele wielorównaniowe (forma strukturalna) Formę strukturalna modelu o G równaniach AY t = BX t + u t, gdzie Y t = [y 1t,..., y Gt ] X t = [x 1t,..., x Kt ] u t = [u 1t,..., u Gt ] E (u t ) = 0 Var (u
Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 02/02/2011 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Egzamin z ekonometrii - wersja ogólna
Egzamin z ekonometrii - wersja ogólna 06-02-2019 Regulamin egzaminu 1. Egzamin trwa 90 min. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichocki Natalia Nehrebecka Wykład 10 1 1. Testy diagnostyczne Testowanie prawidłowości formy funkcyjnej: test RESET Testowanie normalności składników losowych: test Jarque-Berra Testowanie stabilności
Egzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 04-02-2016 Pytania teoretyczne 1. Za pomocą jakiego testu weryfikowana jest normalność składnika losowego? Jakiemu założeniu KMRL odpowiada w tym teście? Jakie
Stanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Współliniowość 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji Metody radzenia sobie z heteroskedastycznością
Egzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 08-02-2017 Pytania teoretyczne 1. Za pomocą którego testu testujemy stabilność parametrów? Jakiemu założeniu KMRL odpowiada H0 w tym teście? Jaka jest hipoteza alternatywna
1 Modele ADL - interpretacja współczynników
1 Modele ADL - interpretacja współczynników ZADANIE 1.1 Dany jest proces DL następującej postaci: y t = µ + β 0 x t + β 1 x t 1 + ε t. 1. Wyjaśnić, jaka jest intepretacja współczynników β 0 i β 1. 2. Pokazać
Stanisław Cichocki. Natalia Nehrebecka. Wykład 12
Stanisław Cichocki Natalia Nehrebecka Wykład 12 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne 2. Autokorelacja o Testowanie autokorelacji 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne
Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu
Część 1 Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy i ich rodzaje Statystyka NR 2 Cel testowania Testy małej próby Testy
Ekonometria egzamin 07/03/2018
imię, nazwisko, nr indeksu: Ekonometria egzamin 07/03/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu
Część 2 Test Durbina-Watsona Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε t, ε t 1 ) 0 Test Durbina-Watsona Weryfikowana hipoteza H 0 : cov(ε t, ε t 1 ) = 0 H 1 : cov(ε
Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18
Ekonometria Metodologia budowy modelu Jerzy Mycielski WNE, UW Luty, 2011 Jerzy Mycielski (WNE, UW) Ekonometria Luty, 2011 1 / 18 Sprawy organizacyjne Dyżur: środa godz. 14-15 w sali 302. Strona internetowa
Przyczynowość Kointegracja. Kointegracja. Kointegracja
korelacja a związek o charakterze przyczynowo-skutkowym korelacja a związek o charakterze przyczynowo-skutkowym Przyczynowość w sensie Grangera Zmienna x jest przyczyną w sensie Grangera zmiennej y jeżeli
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Heteroskedastyczość w szeregach czasowyh
Heteroskedastyczość w szeregach czasowyh Czesto zakłada się, że szeregi czasowe wykazuja autokorelację ae sa homoskedastyczne W rzeczywistości jednak często wariancja zmienia się w czasie Dobrym przykładem
Egzamin z Ekonometrii
Pytania teoretyczne Egzamin z Ekonometrii 18.06.2015 1. Opisać procedurę od ogólnego do szczegółowego na przykładzie doboru liczby opóźnień w modelu. 2. Na czym polega najważniejsza różnica między testowaniem
Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.
opisują kształtowanie się zjawiska w czasie opisują kształtowanie się zjawiska w czasie Najważniejszymi zastosowaniami modeli dynamicznych są opisują kształtowanie się zjawiska w czasie Najważniejszymi
Czasowy wymiar danych
Problem autokorelacji Model regresji dla szeregów czasowych Model regresji dla szeregów czasowych y t = X t β + ε t Zasadnicze różnice 1 Budowa prognoz 2 Problem stabilności parametrów 3 Problem autokorelacji
Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz
Testowanie hipotez statystycznych
Część 2 Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład statystyki testowej Hipoteza łączna H 0 : Rβ = q Hipoteza złożona Testowanie hipotez łącznych Zapis matematyczny Rozkład
Diagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:
Analizowane modele Dwa modele: y = X 1 β 1 + u (1) Będziemy analizować dwie sytuacje: y = X 1 β 1 + X 2 β 2 + ε (2) zmienne pominięte: estymujemy model (1) a w rzeczywistości β 2 0 zmienne nieistotne:
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16
Value at Risk (VaR) Jerzy Mycielski WNE 2018 Jerzy Mycielski (Institute) Value at Risk (VaR) 2018 1 / 16 Warunkowa heteroskedastyczność O warunkowej autoregresyjnej heteroskedastyczności mówimy, gdy σ
Ekonometria egzamin semestr drugi 14/06/09
imię, nazwisko, nr indeksu: Ekonometria egzamin semestr drugi 14/06/09 1. Przed przystąpieniem do pisania egzaminu należy podpisać wszystkie kartki arkusza egzaminacyjnego (na dole w przewidzianym miejscu).
Budowa modelu i testowanie hipotez
Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella
1.9 Czasowy wymiar danych
1.9 Czasowy wymiar danych Do tej pory rozpatrywaliśmy jedynie modele tworzone na podstawie danych empirycznych pochodzących z prób przekrojowych. Teraz zajmiemy się zagadnieniem budowy modeli regresji,
Natalia Nehrebecka Stanisław Cichocki. Wykład 10
Natalia Nehrebecka Stanisław Cichocki Wykład 10 1 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Analiza czynników wpływających na poziom wykształcenia.
Analiza czynników wpływających na poziom wykształcenia. Celem tej pracy jest potwierdzenie lub odrzucenie opinii, którą większość społeczeństwa uznaje za oczywistą, o tym ė w Polsce lepiej wykształceni
Ekonometria egzamin wersja ogólna 17/06/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 17/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca
1.8 Diagnostyka modelu
1.8 Diagnostyka modelu Dotychczas zajmowaliśmy się własnościami estymatorów przy spełnionych założeniach KMRL. W praktyce nie zawsze spełnione są wszystkie założenia modelu. Jeżeli któreś z nich nie jest
Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 31/01/2018 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów nieobserwowalnych
Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne
Egzamin z ekonometrii wersja IiE, MSEMat 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Wyjaśnić, jakie korzyści i niebezpieczeństwa
Egzamin z ekonometrii wersja ogólna Pytania teoretyczne
Egzamin z ekonometrii wersja ogólna 31-01-2014 Pytania teoretyczne 1. Podać postać przekształcenia Boxa-Coxa i wyjaśnić, do czego jest stosowane w ekonometrii. 2. Porównaj zastosowania znanych ci kontrastów
Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów
Formy heteroscedastyczności Własności estymatorów MNK wydatki konsumpcyjne 0 10000 20000 30000 40000 14.4 31786.08 dochód rozporz¹dzalny Zródlo: Obliczenia wlasne, dane BBGD 2004 Formy heteroscedastyczności
Diagnostyka w Pakiecie Stata
Karol Kuhl Zgodnie z twierdzeniem Gaussa-Markowa, estymator MNK w KMRL jest liniowym estymatorem efektywnym i nieobciążonym, co po angielsku opisuje się za pomocą wyrażenia BLUE Best Linear Unbiased Estimator.
Ekonometria ćwiczenia Kolokwium 2 semestr 22/05/05. / 4 pkt. / 4 pkt. / 3 pkt. / 4 pkt. /22 pkt. Regulamin i informacje dodatkowe
imię, nazwisko, nr indeksu: Ekonometria ćwiczenia Kolokwium 2 semestr 22/05/05 Zadanie 1 Zadanie 2 Zadanie 3 / 4 pkt / 4 pkt / 3 pkt Zadanie 4 / 7 pkt [1/1/1/2/2] Zadanie 5 Razem / 4 pkt /22 pkt Skala
Egzamin z ekonometrii IiE
Pytania teoretyczne Egzamin z ekonometrii IiE 22.06.2012 1. Kiedy selekcja próby jest problemem i jaki model można stosować w przypadku samoselekcji próby? 2. Jakie są konieczne założenia, by estymator
Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 06/03/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.
imię, nazwisko, nr indeksu: Ekonometria egzamin 01/02/2019 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu.
Egzamin z ekonometrii wersja IiE, MSEMAT
Egzamin z ekonometrii wersja IiE, MSEMAT 02022015 Pytania teoretyczne 1. Podać treść twierdzenia GaussaMarkowa i wyjaśnić jego znaczenie. 2. Za pomocą jakich testów testuje się autokorelację? Jakiemu założeniu
Modele warunkowej heteroscedastyczności
Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Teoria Przykład - zwroty z WIG Niskie koszty transakcyjne Racjonalne oczekiwania inwestorów P t = E(P t+1 I t ) 1 + R (1) Teoria Przykład - zwroty
1.6 Zmienne jakościowe i dyskretne w modelu regresji
1.6 Zmienne jakościowe i dyskretne w modelu regresji 1.6.1 Zmienne dyskretne i zero-jedynkowe (Dummy Variables) W badaniach ekonometrycznych bardzo często występują zjawiska, które opisujemy zmiennymi
Stanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Testowanie autokorelacji 2. Heteroskedastyczność i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji 3.Problemy z danymi Zmienne pominięte
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Modele zapisane w przestrzeni stanów
Modele zapisane w przestrzeni stanów Modele Przestrzeni Stanów (State Space Models) sa to modele, w których część parametrów jest nieobserwowalna i losowa. Zachowanie wielowymiarowej zmiennej y t zależy
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Natalia Nehrebecka Stanisław Cichocki. Wykład 6
Natalia Nehrebecka Stanisław Cichocki Wykład 6 1 1. Zmienne dyskretne Zmienne zero-jedynkowe 2. Modele z interakcjami 2 Zmienne dyskretne Zmienne nominalne Zmienne uporządkowane 3 4 1 podstawowe i 0 podstawowe
Egzamin z ekonometrii wersja ogolna
Egzamin z ekonometrii wersja ogolna 04-02-2016 Pytania teoretyczne 1. Wymienić założenia Klasycznego Modelu Regresji Liniowej (KMRL). 2. Wyprowadzić estymator MNK dla modelu z wieloma zmiennymi objaśniającymi.
Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.
Stopy zbieżności Stopę zbieżności ciagu zmiennych losowych a n, takiego, że a n oznaczamy jako a n = o p (1 p 0 a Jeśli n p n α 0, to a n = o p (n α i mówimy a n zbiega według prawdopodobieństwa szybciej
Egzamin z ekonometrii
Pytania teoretyczne Egzamin z ekonometrii 22.06.2012 1. Podaj ogólną postać modeli DL i ADL 2. Wyjaśnij jak należy rozumieć przyczynowość w sensie Grangera i jak jest testowana. 3. Jakie są wady liniowego
Zmienne Binarne w Pakiecie Stata
Karol Kuhl Zbiór (hipotetyczny) dummy.dta zawiera dane, na podstawie których prowadzono analizy opisane poniżej. Nazwy zmiennych oznaczają: doch dochód w jednostkach pieniężnych; plec płeć: kobieta (0),
Stanisław Cichocki. Natalia Nehrebecka. Wykład 14
Stanisław Cichocki Natalia Nehrebecka Wykład 14 1 1.Problemy z danymi Zmienne pominięte Zmienne nieistotne Obserwacje nietypowe i błędne Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2)
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)
Statystyka I Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) 1 Zmienne jakościowe qzmienne jakościowe niemierzalne kategorie: np. pracujący / bezrobotny qzmienna binarna Y=0,1 qczasami
Ekonometria dla IiE i MSEMat Z7
Ekonometria dla IiE i MSEMat Z7 Rafał Woźniak Faculty of Economic Sciences, University of Warsaw Warszawa, 21-11-2016 Na podstawie zbioru danych cps_small.dat z książki Principles of Econometrics oszacowany
Materiaªy do zaawans. ekon. Z10
Faculty of Economic Sciences, University of Warsaw Warsaw, 23-04-2012 Probit wiczenie 1. Moshe Ben-Akiva and Steven Lerman, Discrete Choice Analysis, Theory and Application to Travel Demand, MIT Press,
Zmienne sztuczne i jakościowe
Zmienne o ograniczonym zbiorze wartości Przykład 1. zarobki = β 0 + β 1 liczba godzin pracy + β 2 wykształcenie + ε Przykład 2. zarobki = β 0 + β 1 liczba godzin pracy + β 2 klm + ε zarobki = β 0 + β 1
(LMP-Liniowy model prawdopodobieństwa)
OGÓLNY MODEL REGRESJI BINARNEJ (LMP-Liniowy model prawdopodobieństwa) Dla k3 y α α α α + x + x + x 2 2 3 3 + α x x α x x + α x x + α x x + ε + x 4 2 5 3 6 2 3 7 2 3 Zał.: Wszystkie zmienne interakcyjne
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)
1 Metoda Najmniejszych Kwadratów (MNK) 1. Co to jest zmienna endogeniczna, a co to zmienne egzogeniczna? 2. Podaj postać macierzy obserwacji dla modelu y t = a + bt + ε t 3. Co to jest wartość dopasowana,
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja
Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana
Prawdopodobieństwo i statystyka r.
Prawdopodobieństwo i statystyka 9.06.999 r. Zadanie. Rzucamy pięcioma kośćmi do gry. Następnie rzucamy ponownie tymi kośćmi, na których nie wypadły szóstki. W trzeciej rundzie rzucamy tymi kośćmi, na których
Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA
Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Modele tej klasy są modelami ateoretycznymi Ważną klasę modeli dynamicznych stanowią
Szacowanie modeli wielowartościowych w pakiecie STATA
Szacowanie modeli wielowartościowych w pakiecie STATA Uniwersytet Warszawski Wydział Nauk Ekonomicznych 25 kwietnia 2007 W badaniach ekonomicznych i społecznych często odpowiedzi na pytania są kodowane
Uogólniona Metoda Momentów
Uogólniona Metoda Momentów Momenty z próby daż a do momentów teoretycznych (Prawo Wielkich Liczb) plim 1 n y i = E (y) n i=1 Klasyczna Metoda Momentów (M M) polega na szacowaniu momentów teoretycznych
Mikroekonometria 4. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 4 Mikołaj Czajkowski Wiktor Budziński Regresja kwantylowa W standardowej Metodzie Najmniejszych Kwadratów modelujemy warunkową średnią zmiennej objaśnianej: E( yi Xi) = μ ( Xi) Pokazaliśmy,
Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.
Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,
Modele długości trwania
Modele długości trwania Pierwotne zastosowania: przemysłowe (trwałość produktów) aktuarialne (długość trwania życia) Zastosowania ekonomiczne: długości bezrobocia długości czasu między zakupami dóbr trwałego
gdzie. Dla funkcja ma własności:
Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe Funkcja logistyczna należy do modeli ściśle nieliniowych względem parametrów. Jest to funkcja jednej zmiennej, zwykle czasu (t). Dla t>0 wartośd
Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08
imię, nazwisko, nr indeksu: Ekonometria egzamin wersja Informatyka i Ekonometria 29/0/08. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz
Stanisław Cichocki. Natalia Nehrebecka. Wykład 10
Stanisław Cichoci Natalia Nehrebeca Wyład 10 1 1. Testowanie hipotez prostych Rozład estymatora b Testowanie hipotez prostych przy użyciu statystyi t Przedziały ufności Badamy czy hipotezy teoretyczne
Natalia Nehrebecka. 18 maja 2010
Natalia Nehrebecka 18 maja 2010 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów 5. Testowanie
1.5 Problemy ze zbiorem danych
1.5 Problemy ze zbiorem danych W praktyce ekonometrycznej bardzo rzadko spełnione są wszystkie założenia klasycznego modelu regresji liniowej. Częstym przypadkiem jest, że zbiór danych którymi dysponujemy
Stanisław Cichocki. Natalia Nehrebecka. Wykład 13
Stanisław Cichocki Natalia Nehrebecka Wykład 13 1 1. Problemy z danymi Obserwacje nietypowe i błędne Współliniowość. Heteroskedastycznośd i autokorelacja Konsekwencje heteroskedastyczności i autokorelacji