Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Podobne dokumenty
Ekonometria egzamin wersja ogólna 17/06/08

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Egzamin z ekonometrii - wersja ogólna

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

Ekonometria egzamin wersja ogólna 29/01/08

Ekonometria Ćwiczenia 19/01/05

Metoda najmniejszych kwadratów

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria dla IiE i MSEMat Z12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

1 Modele ADL - interpretacja współczynników

Czasowy wymiar danych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Egzamin z ekonometrii wersja IiE, MSEMAT

Natalia Neherbecka. 11 czerwca 2010

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Diagnostyka w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Egzamin z ekonometrii wersja ogolna

1.8 Diagnostyka modelu

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Autokorelacja i heteroskedastyczność

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Budowa modelu i testowanie hipotez

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

1.9 Czasowy wymiar danych

Diagnostyka w Pakiecie Stata

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

1.7 Ograniczenia nakładane na równanie regresji

Problem równoczesności w MNK

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Modele wielorównaniowe (forma strukturalna)

Stanisław Cichocki. Natalia Nehrebecka

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

1.1 Klasyczny Model Regresji Liniowej

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Natalia Nehrebecka. 18 maja 2010

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Rozdział 8. Regresja. Definiowanie modelu

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Zmienne sztuczne i jakościowe

1.5 Problemy ze zbiorem danych

Kolokwium ze statystyki matematycznej

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Wprowadzenie do analizy korelacji i regresji

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Analiza regresji - weryfikacja założeń

1.3 Własności statystyczne estymatorów MNK

Analiza Szeregów Czasowych. Egzamin

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Egzamin z Ekonometrii

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Weryfikacja hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Modele warunkowej heteroscedastyczności

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

Stanisław Cichocki. Natalia Nehrebecka

Zmienne Binarne w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Ćwiczenia IV

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Transkrypt:

imię, nazwisko, nr indeksu: Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie tej zasady skutkuje usunięciem z sali i unieważnieniem pracy. 3. W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. 4. Przed przystąpieniem do pisania egzaminu należy podpisać wszystkie kartki pracy (na dole w przewidzianym miejscu). Złożenie podpisu pod regulaminem oznacza jego akceptację. Do egzaminu mogą przystąpić osoby, które akceptują regulamin. 5. W razie braku podpisu lub numeru zadania na kartce, kartka nie zostanie oceniona. Nie będą też oceniane rozwiązania wpisane na kartkach innych, niż te rozdawane przez prowadzących. 6. Rozwiązanie każdego zadania należy zapisać na kartce z tymże zadaniem, ewentualnie na czystych kartkach znajdujących się na końcu arkusza egzaminacyjnego lub na dodatkowych kartkach uzyskanych od prowadzących egzamin. 7. Na jednej kartce może znajdować się rozwiązanie tylko jednego zadania. Oceniane jest rozwiązanie tylko tego zadania, którego numer widnieje na kartce. 8. Egzamin składa się z czterech pytań teoretycznych i 3 zadań. 9. Posiadanie przy sobie wszelkich materiałów drukowanych (w tym książek) oraz innych np. wykonanych własnoręcznie materiałów zostanie uznane za ściąganie. 10. Rozmowy z innymi zdającymi będą traktowane identycznie jak ściąganie. 11. Każda zauważona próba ściągania skutkuje usunięciem z egzaminu. 12. Wszystkie pytania należy kierować bezpośrednio do osób pilnujących. 13. Warunkiem uzyskania oceny pozytywnej jest zdobycie conajmniej 50 % punktów z części teoretycznej egzaminu oraz min. 40 % punktów z cześci zadaniowej. Warszawa, 26/06/2008, podpis Powodzenia :-)

Pytania teoretyczne 1 2 Pytanie 1. Pokaż, że w modelu regresji ze stałą T SS = ESS + RSS Całkowita suma kwadratów w modelu jest równa T SS = (y i ȳ) 2 = (y ȳ) (y ȳ) z kolei y = ŷ + e. Odejmując ȳ od obu stron i pamiętając, że ȳ = ŷ uzyskujemy y ȳ = ŷ ŷ + e wstawiając do wzoru na całkowitą sumę kwadratów otrzymujemy T SS = (y ȳ) (y ȳ) = [ŷ ŷ + e] [ŷ ŷ + e] T SS = [ŷ ŷ] [ŷ }{{ ŷ] + }}{{} e e +2 [ŷ ŷ] e }{{} ESS RSS 0 Zerowość ostatniego składnika wynika z własności hiperpłaszczyzny regresji. Pytanie 2. Jakie są konsekwencje występowania niedokładnej współliniowości dla precyzji oszacowań parametrów W rezultacie niedokładnej współliniowości: 1. współczynniki równania regresji będą miały duże błędy standardowe, oraz mogą być nieistotne statystycznie, nawet gdy łącznie są istotne, a współczynnik R 2 modelu jest wysoki [1] 2. niewielkie zmiany w zbiorze danych będą powodować duże zmiany w otrzymywanych oszacowaniach parametrów [0.125]. 3. współczynniki równania regresji mogą mieć złe, czyli niezgodne z teorią znaki, albo są zbyt małe lub zbyt duże [0,125]. IMIĘ I NAZWISKO 1/5

Pytania teoretyczne c.d. 3 4 Pytanie 3. Wyjaśnij różnicę między UMNK a SUMNK Aby można było zastosować UMNK musi być znana postać macierzy wariancji-kowariancji V. W rzeczywistości postać macierzy V jest znana tylko w nielicznych przypadkach. W praktyce nieznaną macierz zastępuje się jej oszacowaniem ˆV i taką metodę nazywa się SUMNK. Pytanie 4. Opisz dwa sposoby przeprowadzenia testu RESET. Przeprowadzana jest regresja oraz regresja pomocnicza y = Xβ + ε y = Xβ + Zγ + ε procedura testowa jest analogiczna do testu łącznej istotności y = f(xβ) = γ 0 + γ 1 Xβ + γ 2 (Xβ) 2 +... + γ p (Xβ) p + ε alternatywna postać testu wykorzystuje to samo rozwinięcie w szereg Taylora ale przyjmując że ŷ = X ˆβ y = f(xβ) = γ 0 + γ 1 ŷ + γ 2 ŷ 2 +... + γ p ŷ p + ε test łącznej istotności. Niech γ = [γ 1,..., γ k ] H 0 : γ = 0 H A : γ 0 LM = nr 2 a χ 2 (p) IMIĘ I NAZWISKO 2/5

1 2 3 4 5 Zadanie 1 Na podstawie 120 elementowej próby oszacowano model regresji liniowej z czterema zmiennymi objaśniającymi. Użyta macierz regresorów zawiera stałą, R 2 = 0, 5. Następnie w celu uzyskania większej precyzji oszacowania dokonano transformacji oryginalnych zmiennych odejmując od nich wartość średnią y i = y i ȳ, x ki = x ki x k i ponownie oszacowano model. (a) Jaka będzie relacja między oszacowaniami w pierwotnym i przekształconym modelu? (b) Jak transformacja wpłynie na wielkość współczynnika R 2? (c) Jak transformacja wpłynie na wielkość estymatora wariancji? Po wykonaniu tych czynności wykryto w nieprzekształconej macierzy obserwacji outlier, który usunięto. W wyniku tego działania resztowa suma kwadratów zmniejszyła się o 5 %, a całkowita suma kwadratów o 2 %. (d) Jak usunięcie obserwacji wpłynie na wielkość R 2 oraz R 2? (e) Oblicz R 2 oraz R 2 dla nowego modelu IMIĘ I NAZWISKO 3/5

1 2 3 4 5 Zadanie 2 Mamy następujący model: y i = x i β + ε i Wiemy, że E (x i ε i ) = σ xε 0, E (ε i ) = 0, V ar (ε i ) = σ 2 oraz, że próba jest losowa. Załóżmy, że mamy w próbce takie z i, że E (z i ε i ) = 0, ale E (z i x i ) = σ zx 0. Załóżmy ponadto, że średnie w próbie dla x i ε i, z i ε i, z i x i, zgodnie z prawem wielkich liczb, dążą do odpowiednich wartości oczekiwanych. 1. Proszę pokazać, że estymator MNK w tym modelu nie jest zgodny 2. Jakiego rodzaju problem pojawia się w modelu analizowanym w poprzednim punkcie? 3. Proszę pokazać, że estymator postaci: jest zgodny. β = z iy i x iz i 4. Policz wariancję estymatora analizowanego w poprzednim punkcie. IMIĘ I NAZWISKO 4/5

1 2 3 4 5 Zadanie 3 Na podstawie danych z czwartego kwartału 2006 z Badania Aktywności Ekonomicznej Ludności oszacowano parametry równania płac dla Polski, uzyskując następujące wyniki: Source SS df MS Number of obs = 9957 -------------+------------------------------ F( 5, 9951) = 359.95 Model 387.897104 5 77.5794209 Prob > F = 0.0000 Residual 2144.69627 9951.215525703 R-squared = 0.1532 -------------+------------------------------ Adj R-squared = 0.1527 Total 2532.59337 9956.254378603 Root MSE =.46425 ------------------------------------------------------------------------------ lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta -.2123398.0095637-22.20 0.000 -.2310866 -.193593 wiek.2723319.012117 22.48 0.000.2485802.2960836 wiek2 -.0190553.0009228-20.65 0.000 -.0208641 -.0172465 prywatna -.1594339.0101201-15.75 0.000 -.1792713 -.1395964 wielkosc.0609763.0039596 15.40 0.000.0532148.0687379 _cons 6.102562.0397464 153.54 0.000 6.024651 6.180473 ------------------------------------------------------------------------------ Breusch-Pagan chi2(5) = 486.85 Prob > chi2 = 0.0000 Ramsey RESET F(8, 9944) = 3.78 Prob > F = 0.3446 Jarque-Bera chi2(2) = 12567.92 Prob > chi2 = 0.0000 Zmienna zero-jedynkowa kobieta przyjmuję wartość 1 dla kobiety, wiek to wiek pracownika w latach, wiek2 to kwadrat wieku, prywatna to zmienna zero-jedynkowa, gdzie wartość 1 oznacza firmę prywatną, wielkosc oznacza wielkość firmy obliczaną jako ilość zatrudnionych pracowników. Przyjmując poziom istotności α = 0,05 odpowiedz na poniższe pytania: 1. Oceń dopasowanie danych empirycznych do modelu. Określ które zmienne można uznać za statystycznie istotne? 2. Czy forma funkcyjna oszacowanego powyżej modelu jest liniowa? 3. Czy powyższy model spełnia założenia KMRL (wymień, które spełnia, a których nie spełnia) 4. Zaproponuj sposób weryfikacji hipotezy o braku wpływu wieku pracownika na wysokość uzyskiwanych zarobków. 5. Jeżeli model nie spełnia założeń KMRL opisz jakie to ma konsekwencje dla poprawności wnioskowania statystycznego, oraz jakie są metody radzenia sobie z tym problemem. Każdą odpowiedź uzasadnij wynikiem odpowiednich testów diagnostycznych zapisując wartość statystyki testowej lub jej p-value, oraz jej interpretację. IMIĘ I NAZWISKO 5/5

Rozwiązania zadań Zadanie 1 ad. (a) y i = x i b + e i Odjęcie wartości średniej nie wpływa na wielkość, więc y i ȳ i = x i b + e i ȳ i = x i b x i b + e i y i = x i b + e i ad. (b) Ponieważ wektor współczynników się nie zmieni, to reszt się nie zmieni, suma kwadratów reszt pozostanie taka sama, więć R 2 też się nie zmieni. ad. (c) Ponieważ wektor reszt się nie zmieni, to estymator wariancji również pozostanie bez zmian. ad. (d) R 2 = 1 RSS T SS. Resztowa suma kwadratów spadnie o 5 %, całkowita suma o 2%, więc R2 zwiększy się. ad. (e) R 2 = 1 475 980 = 0.5153, R2 = 1 119 116 (1 0.5153) = 0.5028 Zadanie 2 1. Estymator MNK w tym modelu ma granicę: 2. Problem równoczesności plimb = plim x iy i x2 i = β + σ xε σx 2 3. Drugi rozważany estymator ma granicę = βplim 1 N x2 i + plim 1 N plim 1 N x2 i plim β = plim z iy i x = βplim 1 N xiz i + plim 1 N iz i plim 1 N x iz i = β x iε i z iε i 4. ( ) ) N V ar ( β = V ar z iy i x = iz i = z2 i ( ) 2 σ 2 N x iz i 1 ( ) 2 V ar N x iz i ( x i z i + ) N z i ε i Zadanie 3 1. Zmienne objaśniające wyjaśniają wariancję zarobków w 11 %, o czym świadczy wielkość statystyki R 2. Statystycznie istotne są wszystkie zmienne objaśniające, poza zmienną płeć, gdyż statystyki t są większe od 2, a ich p-value wynosi 0. IMIĘ I NAZWISKO 6/5

2. Założenie o poprawności formy funkcyjnej można weryfikować testem RESET. Do modelu dodawany jest zbiór dodatkowych zmiennych Z i sprawdzana jest statystyczna istotność współczynników przy dodatkowych zmiennych (oznaczmy je γ) H 0 : γ = 0 - forma funkcyjna jest poprawna, H A : γ 0 - forma funkcyjna jest niepoprawna. Wartość statystyki testowej wynosi 3.78, a jej p-value P rob > F = 0.3446 wobec tego należy odrzucić hipotezę o poprawności formy funkcyjnej. 3. Model spełnia założenie o liniowości (test RESET), nie są spełnione założenie o normalności (test JB), o homoscedastyczności (White,Breusch-Pagan). Założenie o nielosowości macierzy obserwacji jest nietestowalne. 4. Aby przetestować hipotezę o braku wpływu wieku na wysokość zarobków należy sprawdzić czy suma współczynników przy zmiennych wiek oraz wiek2 wynosi zero. Mając oszacowania modelu bez ograniczeń można oszacować model z narzuconymi ograniczeniami, a następnie na podstawie sumy kwadratów reszt obu modeli zbudować statystykę F = (RSS R RSS U ) RSS U wartością krytyczną z rozkładu F. / N k J i porównać z 5. Składnik losowy modelu jest heteroscedastyczny, więc uzyskane oszacowania MNK są nieobciążone ale nieefektywne. Można zastosować odporną na występowanie heteroscedastyczności metodę estymacji, np. macierz White a. Dodatkowym problemem mogę być nieprawidłowo obliczone statystyki t-studenta i błędne wnioski odnośnie istotności oszacowań. IMIĘ I NAZWISKO 7/5