Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie. Można pokazać, E (ln y t ) = β ln x t, V ar (ln y t ) = σ 2 a E (y t ) = x β t exp ( 1 2 σ2). 1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2. 2. Znajdż macierz wariancji kowariancji β. t ln xt ln yt i t (ln xt)2 jest 3. Pokaż, że jeśli y t ma rozkład logarytmiczno normalny, to ln (y t ) ma rozkład N (β ln x t, σ 2 ). Pokaż, że estymator MNK policzony dla modelu ln y t = β ln x t + η t, t = 1,..., T ma identyczną postać do estymatora β policzonego z modelu nieprzekształconego i wyjaśnij dlaczego tak jest. Zakładamy, że η t N (0, σ 2 ) ) 4. Powiedzmy, że utworzyliśmy wartości dopasowane ŷ t = exp ( β ln xt. Czy średnia z tych wartości dopasowanych jest równa średniej z wartości y t? Czy asymptotycznie średnia z tych wartości dopasowanych będzie zbiegać do wartości oczekiwanej E (y t )? 1
Zadanie 2 Dany jest model logitowy posiadania pewnego dobra trwałego. 1. Należy przetestować łączną nieistotność 9 zmiennych z 30 zawartych w tym modelu. Dla modelu z pełną liczbą zmiennych wielkość logarytmu funkcji wiarogodności wyniosła 234. Dla modelu bez 9 testowanych zmiennych wartość logarytmu funkcji wiarogodności wyniosła 281. Policzyć odpowiednią statystykę testową i podać wynik testu. 2. Dostępne są jedynie wyniki oszacowania tego modelu dla przypadku, kiedy w modelu umieszczono wszystkie 30 zmiennych. Jaką statystyką możnaby się potencjalnie posłużyć, aby przetestować hipotezę o nieistotności 9 zmiennych? 3. Dostępne są jedynie wyniki oszacowania tego modelu dla przypadku, kiedy w modelu umieszczono 21 zmiennych, a nie uwględniona 9. Jaką statystyką możnaby się posłużyć, aby przetestować hipotezę o nieistotności 9 zmiennych? 2
Zadanie 2 Dany jest model logitowy posiadania pewnego dobra trwałego. 1. Należy przetestować łączną nieistotność 9 zmiennych z 30 zawartych w tym modelu. Dla modelu z pełną liczbą zmiennych wielkość logarytmu funkcji wiarogodności wyniosła 234. Dla modelu bez 9 testowanych zmiennych wartość logarytmu funkcji wiarogodności wyniosła 281. Policzyć odpowiednią statystykę testową i podać wynik testu. 2. Dostępne są jedynie wyniki oszacowania tego modelu dla przypadku, kiedy w modelu umieszczono wszystkie 30 zmiennych. Jaką statystyką możnaby się potencjalnie posłużyć, aby przetestować hipotezę o nieistotności 9 zmiennych? 3. Dostępne są jedynie wyniki oszacowania tego modelu dla przypadku, kiedy w modelu umieszczono 21 zmiennych, a nie uwględniona 9. Jaką statystyką możnaby się posłużyć, aby przetestować hipotezę o nieistotności 9 zmiennych? Rozwiązanie 1. Statystyka testowa LR = 2(L 0 L 1 ) i ma rozkład χ 2 (k), gdzie k to liczba zmiennych o których zakładamy że są nieistotne, L 0 wartość logarytmu funkcji wiarogodności dla modelu bez ograniczeń, L 1 wartość logarytmu wiarogodności dla modelu z ograniczeniami. W tym przypadku: LR = 2( 281 ( 234)) = 94 > χ 2 (9) = 16.92 Wobec tego nalezy uznać, żę te modele różnią się. Wobec tego zmienne są łącznie istotne. 2. za pomocą statystyki Walda 3. za pomocą statystyki mnożników Lagrange a. 3
Zadanie 3 Oszacowano model probitowy wyjaśniający prawdopodobieństwo posiadania pracy w zależności od wieku lub płci i otrzymano następujące wyniki dla parametrów: Probit estimates Number of obs = 314 LR chi2(2) = 21.92 Prob > chi2 = 0.0000 Log likelihood = -204.1315 Pseudo R2 = 0.0510 ---- works Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- wiek.0082406.0042794 1.93 0.054 -.0001469.0166281 sex.5937543.145614 4.08 0.000.3083562.8791525 _cons -.4677802.1994939-2.34 0.019 -.8587811 -.0767792 ---- sex: 0 mezczyzna 1 kobieta works: 0 nie pracuje 1 pracuje 1. Zinterpretować znaki przy oszacowaniach parametrów i sprawdzić, czy poszczególne zmienne w modelu są istotne. 2. Wartość funkcji wiarygodności dla modelu probitowego ze zmiennymi objaśniającymi wiek, płeć i wykształcenie wyniosła 187.9. Zmienna wykształcenie mogła przyjmować jeden z 8 poziomów. Zweryfikować hipotezę mówiącą o tym, że wykształcenie wpływa na prawdopodobieństwo posiadania pracy. 3. Wartość funkcji gęstości obliczona dla xb jest równa.39. Policzyć krańcowy wpływ wieku na prawdopodobieństwo posiadania pracy i zinterpretować obliczoną wartość. 4
Zadanie 3 Oszacowano model probitowy wyjaśniający prawdopodobieństwo posiadania pracy w zależności od wieku lub płci i otrzymano następujące wyniki dla parametrów: Probit estimates Number of obs = 314 LR chi2(2) = 21.92 Prob > chi2 = 0.0000 Log likelihood = -204.1315 Pseudo R2 = 0.0510 ---- works Coef. Std. Err. z P> z [95% Conf. Interval] -------------+---------------------------------------------------------------- wiek.0082406.0042794 1.93 0.054 -.0001469.0166281 sex.5937543.145614 4.08 0.000.3083562.8791525 _cons -.4677802.1994939-2.34 0.019 -.8587811 -.0767792 ---- sex: 0 mezczyzna 1 kobieta works: 0 nie pracuje 1 pracuje 1. Zinterpretować znaki przy oszacowaniach parametrów i sprawdzić, czy poszczególne zmienne w modelu są istotne. 2. Wartość funkcji wiarygodności dla modelu probitowego ze zmiennymi objaśniającymi wiek, płeć i wykształcenie wyniosła 187.9. Zmienna wykształcenie mogła przyjmować jeden z 8 poziomów. Zweryfikować hipotezę mówiącą o tym, że wykształcenie wpływa na prawdopodobieństwo posiadania pracy. 3. Wartość funkcji gęstości obliczona dla xb jest równa.39. Policzyć krańcowy wpływ wieku na prawdopodobieństwo posiadania pracy i zinterpretować obliczoną wartość. Rozwiązanie 1. Wraz z wiekiem rośnie prawdopodobieństwo posiadania pracy. Jest bardziej prawdopodobne, że kobieta pracuje niż że mężczyzna pracuje. Zmienna wiek jest istotna przy poziomie istotności większym od 0,054, zmienna sex jest istotna przy każdym poziomie istotności. 2. LR 0 = 187.9, LR 1 = 204.13 Statystyka testowa jest równa: LR = 2(204.13 187.9) = 32.46 Wartości krytyczne χ 2 0.95(7) = 14.07, χ 2 0.99(7) = 18.48. Wobec tego przy poziomie istotności 5 % odrzucamy hipotezę zerową o równoważności modeli, więc wykształcenie należy uznać za zmienną istotną. 3. E(y x) = Φ(x b)β wiek = 0, 39 0, 00824 = 0, 0032136 wiek Każdy przeżyty rok zwiększa prawdopodobieństwo posiadania pracy o 0,3 % niezależnie od płci osoby. 5
Zadanie 4 Na podstawie danych GUS zbudowano model ekonometryczny tłumaczący zmienną: czy respondent mieszka we własnym domu (dom=1), czy wynajmuje dom (dom=0). Zmienne objaśniające: płeć (0 oznacza kobietę), wiek w latach, dochod - miesięczny dochód rodziny, rodzina - zmienna 0-1, gdzie 1 oznacza że respondent ma rodzinę, miasto - zmienna 0-1, gdzie 1 oznacza że respondent mieszka w mieście, wyższe i średnie - zmienne 0-1 określające poziom wykształcenia. Kategorią referencyjną jest wykształcenie podstawowe. Otrzymano następujące wyniki: Iteration 0: log likelihood = -558.84385 Iteration 4: log likelihood = -389.49835 Probit estimates Number of obs = 826 LR chi2(7) =. Prob > chi2 =. Log likelihood = -389.49835 Pseudo R2 =. dom Coef. Std. Err. z P> z [95% Conf. Interval] ---------+---------------------------------------------------------------- plec -.0427238.1179709-0.36 0.717 -.2739425.1884949 wiek.0059442.0040125 1.48 0.138 -.0019202.0138087 dochod.0000136 4.64e-06 2.93 0.003 4.49e-06.0000227 rodzina.0718535.1365671 0.53 0.599 -.195813.33952 miasto -1.742791.1093515-15.94 0.000-1.957116-1.528466 wyzsze -.232067.214483-1.08 0.279 -.6524461.188312 srednie -.0111488.1375824-0.08 0.935 -.2808052.2585077 _cons.4674857.2887998 1.62 0.106 -.0985516 1.033523 Przyjmując poziom istotności 10 % dokonaj interpretacji wyników oraz zbadaj istotność oraz łączną istotność modelu i oblicz współczynnik dopasowania. Wartość krytyczna χ 2 (7) = 12.02 6
Zadanie 4 Na podstawie danych GUS zbudowano model ekonometryczny tłumaczący zmienną: czy respondent mieszka we własnym domu (dom=1), czy wynajmuje dom (dom=0). Zmienne objaśniające: płeć (0 oznacza kobietę), wiek w latach, dochod - miesięczny dochód rodziny, rodzina - zmienna 0-1, gdzie 1 oznacza że respondent ma rodzinę, miasto - zmienna 0-1, gdzie 1 oznacza że respondent mieszka w mieście, wyższe i średnie - zmienne 0-1 określające poziom wykształcenia. Kategorią referencyjną jest wykształcenie podstawowe. Otrzymano następujące wyniki: Iteration 0: log likelihood = -558.84385 Iteration 4: log likelihood = -389.49835 Probit estimates Number of obs = 826 LR chi2(7) =. Prob > chi2 =. Log likelihood = -389.49835 Pseudo R2 =. dom Coef. Std. Err. z P> z [95% Conf. Interval] ---------+---------------------------------------------------------------- plec -.0427238.1179709-0.36 0.717 -.2739425.1884949 wiek.0059442.0040125 1.48 0.138 -.0019202.0138087 dochod.0000136 4.64e-06 2.93 0.003 4.49e-06.0000227 rodzina.0718535.1365671 0.53 0.599 -.195813.33952 miasto -1.742791.1093515-15.94 0.000-1.957116-1.528466 wyzsze -.232067.214483-1.08 0.279 -.6524461.188312 srednie -.0111488.1375824-0.08 0.935 -.2808052.2585077 _cons.4674857.2887998 1.62 0.106 -.0985516 1.033523 Przyjmując poziom istotności 10 % dokonaj interpretacji wyników oraz zbadaj istotność oraz łączną istotność modelu i oblicz współczynnik dopasowania. Wartość krytyczna χ 2 (7) = 12.02 Rozwiązanie 1. Mężczyźni mają przeciętnie niższe prawdopodobieństwo mieszkania we własnym domu, wraz z wiekiem respondenta rośnie prawdopodobieństwo mieszkania we własnym domu, wzrost dochodu zwiększa prawdopodobieństwo mieszkania we własnym domu, posiadanie rodziny zwiększa prawdopodobieństwo mieszkania we własnym domu, mieszkanie w dużym mieście zmniejsza prawdopodobieństwo mieszkania we własnym domu, ludzie z wyższym wykształceniem rzadziej mieszkają we własnym domu niż ludzie z wykształceniem podstawowym, ludzie ze średnim wykształceniem rzadziej mieszkają we własnym domu niż ludzie z wykształceniem podstawowym. 2. Zmienne istotne to dochód, miasto, ponieważ p-value statystyki t 0.1 3. Zmienne są łącznie istotne, ponieważ LR = 2(L R L 0 ) = 2( 559 ( 389)) = 2 170 = 340 > 12.02. Wobec tego odrzucamy H 0 o łącznej nieistotności zmiennych. 4. pseudo R 2 = 1 L(β) = 1 389 L(0) 559 1 0.7 = 0.3. 7