Zadanie 1. Oszacowano model ekonometryczny liczby narodzin dzieci (w tys.) w Polsce w latach 2000 2010 w zależnosci od średniego rocznego wynagrodzenia (w ujęciu realnym, PLN), stopy bezrobocia (w punktach procentowych) oraz liczby małżeństw (w tysiącach). Wiadomo, że R 2 =0,96. a) Zinterpretuj oszacowania parametrów modelu. Czy wszystkie zmienne objasniające są istotne statystycznie? Zweryfikuj odpowiednie hipotezy przy poziomie istotnosci 5%. b) Podczas weryfikacji modelu obliczono czynniki inflacji wariancji: CIW wynagrodzenie = 1,64; CIW malzenstwa = 6,092, CIW bezrobocie = 5,874 O czym swiadczą uzyskane wyniki? c) Przeprowadzono testy: Walda: F = 49,64438, P = P(F(3,7) > 49,64438) = 0,000044 RESET: F = 0,162537, P = P(F(2,5) > 0,162537) =0,854. Zinterpretuj otrzymane wyniki, przyjmując poziom istotności 5%. d) Zweryfikuj hipotezę o autokorelacji składnika losowego modelu wiedząc, że statystyka testu Durbina-Watsona wynosi d = 1,52531, a wartości krytyczne testu wynoszą odpowiednio dl = 0,59, du = 1,93. Na czym polega zjawisko autokorelacji składnika losowego i jakie są jej konsekwencje? Zadanie 2. Na podstawie danych dotyczacych rocznych wydatków na pizze oszacowano parametry poniższego modelu: Zmienna objaśniana modelu (pizza) jest wysokość rocznych wydatków na pizze wyrażona w ztotych polskich. Do grupy potencjalnych zrniennych kształtujących wysokosc wydatków na pizze zaliczono: dochod - roczny dochód jednostki wyrażony w tysiącach złotych polskich, wiek - wiek jednostki, wyrażony w latach, kobieta - zmienna zero-jedynkowa, przyjmująca wartość 1, gdy dana jednostka jest kobietą. Parametry modelu oszacowano metodą najmniejszych kwadratów. Wyniki oszacowania przedstawiono poniżej.
Test na normalności rozkładu reszt: Hipoteza zerowa: składnik losowy ma rozkład normalny Statystyka testu: Chi-kwadrat(2) =3,19442 z wartoscią p=0,20246 a) W modelu, jako potencjalną zmienną wpływająca na wysokość rocznych wydatków na pizze uwzględniono zmienną zero-jedynkową kobieta. Dlaczego w modelu nie została uwzględniona zmienna zero-jedynkowa mezczyzna, przyjmująca wartość 1 w przypadku, gdy dana jednostka jest mężczyzną? b) Czy na podstawie modelu można stwierdzić, że wraz z wiekiem wysokość rocznych wydatków na pizze ulega obniżeniu? Odpowiedź uzasadnij. c) Zweryfikuj hipotezę o normalności rozkładu reszt. W jakim celu weryfikuje się to założenie? d) Ile wynosiłyby spodziewane roczne wydatki na pizze 35-letniego mężczyzny, który osiąga dochód 35 000 zł rocznie? Zadanie 3. Na podstawie danych dotyczących cen mieszkań oszacowano parametry poniższego modelu: Zmienna objaśniana w modelu (cena) jest ceną mieszkania wyrażoną w tysiącach złotych polskich. Do grupy potencjalnych zmiennych wpływających na cenę mieszkania zaliczono: powierzchnia - powierzchnia mieszkania wyrażona w metrach kwadratowych, wiek - wiek mieszkania wyrazony w latach, basen - zmienna zero-jedynkowa, przyjmujaca wartosc 1 gdy mieszkanie posiada basen oraz 0 w przeciwnym przypadku.
Test na normalności rozkładu reszt: Hipoteza zerowa: składnik losowy ma rozkład normalny Statystyka testu: Chi-kwadrat(2) =119,84 z wartością p =9,4836e-027 a) W modelu jako potencjalną zmienną wpływającą na cenę mieszkania uwzgledniono zmienną zero-jedynkową basen. Dlaczego w modelu nie została uwzględniona zmienna zero-jedynkowa brak_basenu? b) Jaka część zmiennej objaśnianej została wyjaśniona przez model? Czy wartość współczynnika determinacji uległaby zmianie, gdyby w modelu została uwzględniona dodatkowa zmienna zero-jedynkowa kominek przyjmująca wartość 1, gdy dane mieszkanie posiada kominek oraz 0 w przeciwnym przypadku (tak/nie, dlaczego)? c) Zweryfikuj założenie dotyczące normlaności reszt. W jakim celu weryfikuje się to założenie? d) Ile wynosiłaby spodziewana cena 40-metrowego mieszkania, znajdującego się w bloku, który został wybudowany dwa lata temu, który nie posiada basenu? Zadanie 4. Na podstawie danych panelowych (11543 obserwacje) przedstawiających sprzedaż samochodów na 5 rynkach w latach 1980-1993 oszacowano metodą KMNK liniowy model ekonometryczny opisujący nominalną cenę samochodu w euro:
Gdzie: Drzwi - liczba drzwi w samochodzie, Predkosc - maksymalna osiągalna predkość pojazdu (km/h), Szerokosc - szerokość pojazdu (cm), Wysokosc - wysokość pojazdu (cm), Lokalny? - zmienna binarna oznaczająca czy samochód był wyprodukowany w kraju sprzedaży (1), T - czas (wartosci od 0 do 13 odpowiadajace kolejnym latom 1980-1993), Spalanie - zużycie paliwa przy prędkości 120 km/h (litry/l00km). a) Zinterpretuj oszacowanie parametru przy zmiennej T. Przy jakim poziomie istotności zmienna jest istotna statystycznie? b) Dana jest wartość statystyki testowej dla testu RESET dla kwadratu i sześcianu zmiennej, F = 3399,66. Jakie możesz wyciagnąć wnioski na podstawie wyniku testu wiedząc, że wartość krytyczna przy 5% poziomie istotności wynosi F 2,11533 =2,997? c) Przeprowadzono test White'a na heteroskedastyczność składnika losowego i uzyskano nastepujący wynik: Chi-kwadrat = 3127,951101, z wartością p = P(Chi-kwadrat(34) > 3127,951101) = 0,000000. Jakie wnioski można wyciągnąć na tej podstawie? Jak występowanie heteroskedastyczności może wpłynąć na właściwości modelu i jak można temu zaradzić? d) Przeprowadzono test pominiętej zmiennej dla zmiennych Drzwi i Lokalny? I uzyskano statystykę testu: F(2, 11535) = 7,18082, z wartością p=0,000764449. Jak zinterpretować wynik? e) Zinterpretuj oszacowanie parametru przy zmiennej Spalanie. Przy jakim poziomie istotności zmienna ta jest istotna statystycznie? f) Dana jest wartość statystyki testowej dla testu Jarque'a-Bery na normalność rozkładu składnika losowego, Chi-kwadrat(2) = 3248,396. Jakie możesz wyciągnąć wnioski na podstawie wyniku testu wiedząc, że wartość krytyczna przy 5% poziomie istotności wynosi 5,99146? Jaki może być wpływ niespełnienia założenia o normalności rozkładu składnika losowego? g) Przeprowadzono test Chowa na stabilność oszacowania parametrów strukturalnych modelu przy podziale zbioru danych na dwa podokresy równej długości. Uzyskano nastepujący wynik: F(8, 11527) = 22,1741 z wartoscią p=0,0000
Jakie wnioski można wyciągnąc na tej podstawie? Jaki będzie miało to wplyw na nasz model? h) Ocen łączną istotność statystyczną zmiennych objaśniających i dopasowanie modelu.