Ekonometria egzamin wersja ogólna 17/06/08

Podobne dokumenty
Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 07/03/2018

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Egzamin z ekonometrii - wersja ogólna

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

Ekonometria Ćwiczenia 19/01/05

Ekonometria egzamin wersja ogólna 29/01/08

Egzamin z ekonometrii wersja IiE, MSEMAT

Metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Testowanie hipotez statystycznych

Egzamin z ekonometrii wersja ogolna

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Ekonometria dla IiE i MSEMat Z12

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Diagnostyka w Pakiecie Stata

Czasowy wymiar danych

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

1 Modele ADL - interpretacja współczynników

Budowa modelu i testowanie hipotez

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Stanisław Cichocki. Natalia Nehrebecka

Natalia Neherbecka. 11 czerwca 2010

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

1.9 Czasowy wymiar danych

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Diagnostyka w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Autokorelacja i heteroskedastyczność

1.8 Diagnostyka modelu

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Rozdział 8. Regresja. Definiowanie modelu

Stanisław Cichocki. Natalia Nehrebecka

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Kolokwium ze statystyki matematycznej

Stanisław Cichocki. Natalia Nehrebecka

Wprowadzenie do analizy korelacji i regresji

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

1.7 Ograniczenia nakładane na równanie regresji

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Analiza Szeregów Czasowych. Egzamin

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Modele wielorównaniowe (forma strukturalna)

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Zmienne sztuczne i jakościowe

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Zmienne Binarne w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada

1.1 Klasyczny Model Regresji Liniowej

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

1.5 Problemy ze zbiorem danych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Ćwiczenia IV

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Analizowane modele. Dwa modele: y = X 1 β 1 + u (1) y = X 1 β 1 + X 2 β 2 + ε (2) Będziemy analizować dwie sytuacje:

Problem równoczesności w MNK

Egzamin z Ekonometrii

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Stanisław Cichocki. Natalia Nehrebecka

Własności statystyczne regresji liniowej. Wykład 4

Analiza regresji - weryfikacja założeń

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

MODELE LINIOWE. Dr Wioleta Drobik

Ekonometria. Zajęcia

Natalia Nehrebecka. Wykład 1

t y x y'y x'x y'x x-x śr (x-x śr)^2

Stanisław Cihcocki. Natalia Nehrebecka

Transkrypt:

imię, nazwisko, nr indeksu: Ekonometria egzamin wersja ogólna 17/06/08 1. Egzamin trwa 90 minut. 2. Rozwiązywanie zadań należy rozpocząć po ogłoszeniu początku egzaminu a skończyć wraz z ogłoszeniem końca egzaminu. Złamanie tej zasady skutkuje usunięciem z sali i unieważnieniem pracy. 3. W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora. 4. Przed przystąpieniem do pisania egzaminu należy podpisać wszystkie kartki pracy (na dole w przewidzianym miejscu). Złożenie podpisu pod regulaminem oznacza jego akceptację. Do egzaminu mogą przystąpić osoby, które akceptują regulamin. 5. W razie braku podpisu lub numeru zadania na kartce, kartka nie zostanie oceniona. Nie będą też oceniane rozwiązania wpisane na kartkach innych, niż te rozdawane przez prowadzących. 6. Rozwiązanie każdego zadania należy zapisać na kartce z tymże zadaniem, ewentualnie na czystych kartkach znajdujących się na końcu arkusza egzaminacyjnego lub na dodatkowych kartkach uzyskanych od prowadzących egzamin. 7. Na jednej kartce może znajdować się rozwiązanie tylko jednego zadania. Oceniane jest rozwiązanie tylko tego zadania, którego numer widnieje na kartce. 8. Egzamin składa się z czterech pytań teoretycznych i 3 zadań. 9. Posiadanie przy sobie wszelkich materiałów drukowanych (w tym książek) oraz innych np. wykonanych własnoręcznie materiałów zostanie uznane za ściąganie. 10. Rozmowy z innymi zdającymi będą traktowane identycznie jak ściąganie. 11. Każda zauważona próba ściągania skutkuje usunięciem z egzaminu. 12. Wszystkie pytania należy kierować bezpośrednio do osób pilnujących. 13. Warunkiem uzyskania oceny pozytywnej jest zdobycie conajmniej 50 % punktów z części teoretycznej egzaminu oraz min. 40 % punktów z cześci zadaniowej. Warszawa, 17/06/2008, podpis Powodzenia :-)

Pytania teoretyczne 1 2 Pytanie 1. Pokaż, że w modelu regresji ze stałą T SS = ESS + RSS Całkowita suma kwadratów w modelu jest równa T SS = (y i ȳ) 2 = (y ȳ) (y ȳ) z kolei y = ŷ + e. Odejmując ȳ od obu stron i pamiętając, że ȳ = ŷ uzyskujemy y ȳ = ŷ ŷ + e wstawiając do wzoru na całkowitą sumę kwadratów otrzymujemy T SS = (y ȳ) (y ȳ) = [ŷ ŷ + e] [ŷ ŷ + e] T SS = [ŷ ŷ] [ŷ }{{ ŷ] + }}{{} e e +2 [ŷ ŷ] e }{{} ESS RSS 0 Zerowość ostatniego składnika wynika z własności hiperpłaszczyzny regresji. Pytanie 2. Jakie są konsekwencje występowania niedokładnej współliniowości dla precyzji oszacowań parametrów W rezultacie niedokładnej współliniowości: 1. współczynniki równania regresji będą miały duże błędy standardowe, oraz mogą być nieistotne statystycznie, nawet gdy łącznie są istotne, a współczynnik R 2 modelu jest wysoki [1] 2. niewielkie zmiany w zbiorze danych będą powodować duże zmiany w otrzymywanych oszacowaniach parametrów [0.125]. 3. współczynniki równania regresji mogą mieć złe, czyli niezgodne z teorią znaki, albo są zbyt małe lub zbyt duże [0,125]. IMIĘ I NAZWISKO 1/5

Pytania teoretyczne c.d. 3 4 Pytanie 3. Wyjaśnij różnicę między UMNK a SUMNK Aby można było zastosować UMNK musi być znana postać macierzy wariancji-kowariancji V. W rzeczywistości postać macierzy V jest znana tylko w nielicznych przypadkach. W praktyce nieznaną macierz zastępuje się jej oszacowaniem ˆV i taką metodę nazywa się SUMNK. Pytanie 4. Do czego służą testy diagnostyczne. Opisz dwa znane Tobie testy zapisując H 0, H 1, statystykę testową, oraz opisz procedury testowe. Testy diagnostyczne służą do weryfikowania poprawności założeń modelu [1/9]. IMIĘ I NAZWISKO 2/5

1 2 3 4 5 Zadanie 1 Na podstawie 120 elementowej próby oszacowano model regresji liniowej z czterema zmiennymi objaśniającymi. Użyta macierz regresorów zawiera stałą, R 2 = 0, 5. Następnie w celu uzyskania większej precyzji oszacowania dokonano transformacji oryginalnych zmiennych odejmując od nich wartość średnią y i = y i ȳ, x ki = x ki x k i ponownie oszacowano model. (a) Jaka będzie relacja między oszacowaniami w pierwotnym i przekształconym modelu? (b) Jak transformacja wpłynie na wielkość współczynnika R 2? (c) Jak transformacja wpłynie na wielkość estymatora wariancji? Po wykonaniu tych czynności wykryto w nieprzekształconej macierzy obserwacji outlier, który usunięto. W wyniku tego działania resztowa suma kwadratów zmniejszyła się o 5 %, a całkowita suma kwadratów o 2 %. (d) Jak usunięcie obserwacji wpłynie na wielkość R 2 oraz R 2? (e) Oblicz R 2 oraz R 2 dla nowego modelu IMIĘ I NAZWISKO 3/5

1 2 3 4 5 Zadanie 2 Dysponujesz następującymi informacjami o gospodarstwie domowym: D dochód gospodarstwa; Z całkowite wydatki na żywność gospodarstwa domowego; los - liczba osób w gospodarstwie; ld liczba dzieci do lat 15; m zmienna zero jedynkowa przyjmująca wartość 1 dla gospodarstw miejskich i 0 dla wiejskich. 1. Zaproponuj model dzięki któremu można porównać wydatki na żywność w gospodarstwach miejskich i wiejskich 2. Przy zakupie żywności potencjalnie mogą występować korzyści skali, związane np. z rabatami za zakup większej partii towaru. Zmodyfikuj model z poprzedniego punktu tak, aby można było zweryfikować czy korzyści skali rzeczywiście występują. 3. Prowadząc badania nad wydatkami na różnego typu dobra zauważono, że dzieci mają zazwyczaj inną strukturę konsumpcji od osób dorosłych. Zaproponuj modyfikację modelu z poprzedniego punktu uwzględniającą to rozróżnienie. 4. Jednym ze wskaźników relatywnego ubóstwa jest udział wydatków na żywność w całkowitych wydatkach(dochodach). Zaproponuj model który będzie badał wielkość tego udziału dla różnych gospodarstw, w którym będzie kontrolowana struktura demograficzna gospodarstwa. 5. Porównano dane o wydatkach gospodarstw ze statystykami PARPA dotyczącymi ilości zakupowanego alkoholu przez osoby dorosłe i stwierdzono, że respondenci zaniżyli swoje wydatki na tę grupę towarów. Wykorzystując dane nt średniego spożycia alkoholu jaki sposób skorygujesz swoje wcześniejsze oszacowania aby uwzględnić ten fakt? IMIĘ I NAZWISKO 4/5

1 2 3 4 5 Zadanie 3 Na podstawie danych z czwartego kwartału 2006 z Badania Aktywności Ekonomicznej Ludności oszacowano parametry równania płac dla Polski, uzyskując następujące wyniki: Source SS df MS Number of obs = 9957 -------------+------------------------------ F( 5, 9951) = 359.95 Model 387.897104 5 77.5794209 Prob > F = 0.0000 Residual 2144.69627 9951.215525703 R-squared = 0.1532 -------------+------------------------------ Adj R-squared = 0.1527 Total 2532.59337 9956.254378603 Root MSE =.46425 ------------------------------------------------------------------------------ lzarobki Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- kobieta -.2123398.0095637-22.20 0.000 -.2310866 -.193593 wiek.2723319.012117 22.48 0.000.2485802.2960836 wiek2 -.0190553.0009228-20.65 0.000 -.0208641 -.0172465 prywatna -.1594339.0101201-15.75 0.000 -.1792713 -.1395964 wielkosc.0609763.0039596 15.40 0.000.0532148.0687379 _cons 6.102562.0397464 153.54 0.000 6.024651 6.180473 ------------------------------------------------------------------------------ Breusch-Pagan chi2(5) = 486.85 Prob > chi2 = 0.0000 Ramsey RESET F(8, 9944) = 123.78 Prob > F = 0.0000 Jarque-Bera chi2(2) = 12567.92 Prob > chi2 = 0.0000 Zmienna zero-jedynkowa kobieta przyjmuję wartość 1 dla kobiety, wiek to wiek pracownika w latach, wiek2 to kwadrat wieku, prywatna to zmienna zero-jedynkowa, gdzie wartość 1 oznacza firmę prywatną, wielkosc oznacza wielkość firmy obliczaną jako ilość zatrudnionych pracowników. Przyjmując poziom istotności α = 0,05 odpowiedz na poniższe pytania: 1. Oceń dopasowanie danych empirycznych do modelu. Określ które zmienne można uznać za statystycznie istotne? 2. Czy forma funkcyjna oszacowanego powyżej modelu jest liniowa? 3. Czy powyższy model spełnia założenia KMRL (wymień, które spełnia, a których nie spełnia) 4. Zaproponuj sposób weryfikacji hipotezy o braku wpływu wieku pracownika na wysokość uzyskiwanych zarobków. 5. Jeżeli model nie spełnia założeń KMRL opisz jakie to ma konsekwencje dla poprawności wnioskowania statystycznego, oraz jakie są metody radzenia sobie z tym problemem. Każdą odpowiedź uzasadnij wynikiem odpowiednich testów diagnostycznych zapisując wartość statystyki testowej lub jej p-value, oraz jej interpretację. IMIĘ I NAZWISKO 5/5

Rozwiązania zadań Zadanie 1 ad. (a) y i = x i b + e i Odjęcie wartości średniej nie wpływa na wielkość, więc y i ȳ i = x i b + e i ȳ i = x i b x i b + e i y i = x i b + e i ad. (b) Ponieważ wektor współczynników się nie zmieni, to reszt się nie zmieni, suma kwadratów reszt pozostanie taka sama, więć R 2 też się nie zmieni. ad. (c) Ponieważ wektor reszt się nie zmieni, to estymator wariancji również pozostanie bez zmian. ad. (d) R 2 = 1 RSS T SS. Resztowa suma kwadratów spadnie o 5 %, całkowita suma o 2%, więc R2 zwiększy się. ad. (e) R 2 = 1 475 980 = 0.5153, R2 = 1 119 116 (1 0.5153) = 0.5028 Zadanie 2 1. Z = α 0 + α 1 m 2. Z los = α 0 + α 1 m + α 2 los. Jeśli oszacowanie parametru α 2 jest ujemne to korzyści skali występują. 3. Z los = α 0 + α 1 m + α 2 los + α 3 ld. Oszacowanie parametru α 3 informuje o różnicy w wydatkach na żywność pomiędzy osobą dorosłą a dzieckiem. Alternatywnie model na logarytmach, wtedy oszacowanie elastyczności różne od 1 wskaże na różnicę. 4. Z D = α 0 + α 1 m + α 2 los + α 3 ld 5. Należy skorygować wartość wydatków w górę o wydatki poniesione na zakup napojów alkoholowych. Niech Z oznacza skorygowaną wartość wydatków. Z = Z jeżeli w gospodarstwie są wyłącznie dzieci, Z = Z +przeciętne wydatki na alkohol na doroslą osobę (los ld). Następnie zamiast zmiennej Z użyć należy zmiennej Z, i ponownie oszacować modele z pkt. (1)-(4). Zadanie 3 1. Zmienne objaśniające wyjaśniają wariancję zarobków w 11 %, o czym świadczy wielkość statystyki R 2. Statystycznie istotne są wszystkie zmienne objaśniające, poza zmienną płeć, gdyż statystyki t są większe od 2, a ich p-value wynosi 0. 2. Założenie o poprawności formy funkcyjnej można weryfikować testem RESET. Do modelu dodawany jest zbiór dodatkowych zmiennych Z i sprawdzana jest statystyczna istotność współczynników przy dodatkowych zmiennych (oznaczmy je γ) H 0 : γ = 0 - forma funkcyjna jest poprawna, H A : γ 0 - forma funkcyjna jest niepoprawna. Wartość statystyki testowej wynosi 123.78, a jej p-value P rob > F = 0.0000 wobec tego należy odrzucić hipotezę o poprawności formy funkcyjnej. 3. Model nie spełnia założenia o liniowości (test RESET), nie są spełnione założenie o normalności (test JB), o homoscedastyczności (White,Breusch-Pagan). Założenie o nielosowości macierzy obserwacji jest nietestowalne. IMIĘ I NAZWISKO 6/5

4. Aby przetestować hipotezę o braku wpływu wieku na wysokość zarobków należy sprawdzić czy suma współczynników przy zmiennych wiek oraz wiek2 wynosi zero. Mając oszacowania modelu bez ograniczeń można oszacować model z narzuconymi ograniczeniami, a następnie na podstawie sumy kwadratów reszt obu modeli zbudować statystykę F = (RSS R RSS U ) RSS U wartością krytyczną z rozkładu F. / N k J i porównać z 5. Forma funkcyjna modelu jest niepoprawna, składnik losowy modelu jest heteroscedastyczny, więc uzyskane oszacowania MNK nie są zgodne. Należy poprawić formę funkcyjną. Można zastosować odporną metodę estymacji, np macierz White a. IMIĘ I NAZWISKO 7/5