Ekonometria Robert Pietrzykowski email: robert_pietrzykowski@sggw.pl www.ekonometria.info
Na dziś Sprawy bieżące Prowadzący Zasady zaliczenia Konsultacje Inne 2
Sprawy ogólne czyli co nas czeka Zaliczenie przedmiotu Zaliczenie części ćwiczeniowej (50%) Zaliczenie części wykładowej (50%) Obecność na zajęciach Dopuszczalna liczba nieobecność na zajęciach wynosi 20% z całości. Powyżej tej liczby student zostaje skreślony z listy studentów i jest nie klasyfikowany. (8 zjazdów czyli 20% to 1,6 zjazdu, a zatem uznajemy 1 nieobecność na zajęciach jako dopuszczalną)
Literatura G.S. Maddala Ekonometria, PWN, Warszawa 2008 Redakcja K. Kukuła, Wprowadzenie do ekonometrii, PWN, Warszawa 2009 Strahl D., Sobczak E., Markowska M., Bal-Domańska B. Modelowanie ekonometryczne z excelem, Wydawnictwo AE we Wrocławiu, Wrocław 2004 Piłatowska M. (2006): Repetytorium ze statystyki, PWN Aczel A. D. (2006): Statystyka w zarządzaniu, PWN materiały wykładowe www.ekonometria.info www.ibuk.pl
Wiedza potrzebna Statystyka Współczynnik korelacji Pearsona Rozkład normalny Metoda MNK Przedziały ufności Weryfikacja hipotez Ekonomia Podstawowe wiadomości
6
7
MODEL EKONOMICZNY (wiedza podstawowa) MODEL EKONOMETRYCZNY Badanie poprawności modelu: 1. Wyznaczenie parametrów 2. Analiza resztowa TAK Czy udało się określić poprawny model? NIE Wykorzystanie modelu do prognozowania i odpowiedzi na postawione hipotezy badawcze
Wybór modelu Oszacowanie parametrów modelu Zbadanie istnienia zależności Ocena jakości dopasowania modelu Sprawdzenie poprawności modelu Prognoza, predykcja i etc.
10
11
13
14
Cena Popyt 1 10,91 1 13,16 1 9,86 1 17,66 1 12,89 5 31,87 5 39,21 5 32,11 5 34,78 5 34,09 9 65,02 9 62,83 9 61,52 9 62,84 9 58,61 13 67,39 13 69,63 13 74,71 13 73,33 13 79,05 17 75,62 17 79,82 17 80,74 17 77,17 17 84,1 21 69,75 21 67,44 21 70,22 21 77,2 21 73,37 100 90 80 70 60 50 40 30 20 10 0 20 15 10 5 0-5 -10-15 -20-25 y = 3,1385x + 21,04 R² = 0,7894 0 5 10 15 20 25 0 5 10 15 20 25 30 35
Cena Popyt 1 10,91 1 13,16 1 9,86 1 17,66 1 12,89 5 31,87 5 39,21 5 32,11 5 34,78 5 34,09 9 65,02 9 62,83 9 61,52 9 62,84 9 58,61 13 67,39 13 69,63 13 74,71 13 73,33 13 79,05 17 75,62 17 79,82 17 80,74 17 77,17 17 84,1 21 69,75 21 67,44 21 70,22 21 77,2 21 73,37 Sumy kw. Stopnie swob. Średnie kwad. Femp Fkryt Model 13790,381 1 13790,38069 Błąd 3679,5962 28 131,4141492 Ogółem 17469,977 29 H 0 : 1 =0 104,94 > 4,196 104,94 4,196 Hipotezę o braku zależności opisywaną modelem liniowym regresji należy odrzucić
Analiza reszt Badanie normalności rozkładu reszt Badanie stabilności wariancji reszt Badanie losowości reszt Badanie autokorelacji reszt Badanie poprawności zastosowanego modelu
Test RESET (Regression Specification Error Test) Test błędu specyfikacji postaci równania regresji Ramsey a czyli jest to test niewłaściwej specyfikacji modelu TEST RESET oparty jest na regresji rozszerzonej o zbiór zmiennych powstałych z oszacowania zmiennej objaśnianej y w postaci jej potęg. Test RESET jest testem dużej mocy. Nie wykazuje jaki czynnik powoduje, że model jest niepoprawny. Inne testy: White a, test adekwatności Błędy sprawdzane tym testem: Błąd poprawnej specyfikacji matematycznej równania regresji. Oznacza to, że jedna lub wszystkie zmienne równania regresji powinny być transformowane, do postaci funkcji potegowej, logarytmiczne lub innej. Błąd pominiętych zmiennych. Występuje jeżeli w zmiennych objaśnianych pominiemy istotne zmienne. Błąd korelacji miedzy zmiennych objaśniających i błędów losowych. Powoduje to niepoprawność działania testów ze względu na uzyskanie metodą MNK estymatorów obciążonych i niezgodnych.
Test RESET (Procedura testowania.) 1. Wyznaczamy wartości ŷ rozwiązując wyjściowe równanie regresji y = 0 + 1 x + 2. Wartość ŷ podnosimy do drugiej i trzeciej potęgi ŷ 2, ŷ 3 3. Szacujemy nowe równanie regresji powiększone o sztucznie utworzone zmienne y = 0 + 1 x + 2 ŷ 2 + 3 ŷ 3 + 4. Dla obu funkcji regresji (pkt 1 i 3) wyznaczamy współczynniki determinacji D 1 i D 2 5. Stawiamy hipotezę zerową, że równanie regresji jest poprawnie wyspecyfikowane H0: 2 = 3 = 0 6. Statystyka testowa: F = [(D 2 D 1 )/2]/[(1- D 2 )/(n-k)] 7. Wartość krytyczna F( ; 2; n-k) gdzie k liczba zmiennych objaśnianych w równaniu rozszerzonym 8. Weryfikujemy hipotezę zerowa. Jeśli obliczone F jest większe od wartości krytycznej, to odrzucamy hipotezę zerowa o poprawności wyspecyfikowania równania wyjściowego.
Test Goldfelda-Quandta Test sprawdzający jednorodność wariancji reszt homoskedastyczność. Zastosowanie tego testu wymaga wyodrębnienie dwóch podgrup {A, B} takich, w których możemy podejrzewać różnic między wariancjami w tych grupach. Weryfikujemy hipotezę: H 0 : 2 A = 2 B alt. H 1 : 2 A 2 B Test Godfelda-Quandta sprawdza się w przypadku kiedy zróżnicowanie składnika losowego zależy od jednej zmiennej objaśniającej. Inne testy: Serii, Breuscha-Pagana, White a, Harveya-Godfreya Błędy sprawdzane tym testem: Heteroskedastyczność czyli brak jednorodności wariancji reszt jest często obserwowana dla danych przekrojowych np. model kosztów całkowitych w zależności od wielkości produkcji. Model opisujacy wydatki gospodarstw domowych w zależności od dochodu. Wariancja wielkości wydatków w rodzinach o niskich dochodach jest niższa niż w gospodarstwach o dochodach wyższych.
Test Goldfelda-Quandta 1. Porządkujemy reszty niemalejąco według zmiennej objaśniającej którą podejrzewamy o powodowanie heteroskedastyczności. 2. Wybieramy dwie skrajne podpróby. Pominięta liczba obserwacji nie powinna być większa niż 1/3N. 3. Dla każdej podpróby szacujemy wariancje resztowe S 2 1 i S 2 2 4. Jeżeli badana hipoteza jest prawdziwa to S 2 1/S 2 2 ma rozkład F (w liczniku umieszczamy zawsze wiekszą wariancję) 5. Hipotezę odrzucamy jeżeli F(emp) jest większe od F( ; n 1 -k-1; n 2 -k-1)
Normalność rozkładu reszt Hipoteza: reszty maja rozkład normalny Test Shapiro-Wilka Inne testy: Jarque-Bera, Kołomogorowa-Lilieforsa, 2 Hipotezę odrzucamy jeżeli:
Cena Popyt Y(X=x) ei 1 10,91 10,91-13,27 1 13,16 13,16-11,02 1 9,86 9,86-14,32 1 17,66 17,66-6,518 1 12,89 12,89-11,29 5 31,87 31,87-4,862 5 39,21 39,21 2,4778 5 32,11 32,11-4,622 5 34,78 34,78-1,952 5 34,09 34,09-2,642 9 65,02 65,02 15,734 9 62,83 62,83 13,544 9 61,52 61,52 12,234 9 62,84 62,84 13,554 9 58,61 58,61 9,3237 13 67,39 67,39 5,5496 13 69,63 69,63 7,7896 13 74,71 74,71 12,87 13 73,33 73,33 11,49 13 79,05 79,05 17,21 17 75,62 75,62 1,2256 17 79,82 79,82 5,4256 17 80,74 80,74 6,3456 17 77,17 77,17 2,7756 17 84,1 84,1 9,7056 21 69,75 69,75-17,2 21 67,44 67,44-19,51 21 70,22 70,22-16,73 21 77,2 77,2-9,748 21 73,37 73,37-13,58 i ai:n ei:n ei:n 0,41 (17,21 ( 19,51)) 1 0,41 17,21-19,51 15,0397 2 0,28 15,73-17,20 9,3330 3 0,24 13,55-16,73 7,3495 4 0,21 13,54-14,32 5,9262 5 0,19 12,87-13,58 4,9802 6 0,17 12,23-13,27 4,2665 7 0,15 11,49-11,29 3,3871 8 0,13 9,71-11,02 2,7293 9 0,12 9,32-9,75 2,2124 10 0,10 7,79-6,52 1,4494 11 0,09 6,35-4,86 0,9784 12 0,07 5,55-4,62 0,7517 13 0,06 5,43-2,64 0,4921 14 0,05 2,78-1,95 0,2288 15 0,04 2,48 1,23 0,0452 (59.1695) 2 3679,5961 = 0.9515 > 0.927 HIPOTEZY NIE ODRZUCAM
Test Durbina-Watsona Hipoteza: brak autokorelacji reszty rzędu pierwszego Statystyka d=[0, 4] ponieważ Postać testu: Hipoteza H 0 : 1 = 0; H 1 : 1 > 0; d < 2 Hipoteza H 0 : 1 = 0; H 1 : 1 < 0; d > 2 (d =4 - d) Wartości tablicowe d L (K, ); d U (K, )
Badanie autokorelacji d > d U (K, ) brak podstaw do odrzucenia hipotezy o braku autokorelacji rzędu pierwszego d < d L (K, ) hipotezę o braku autokorelacji rzędu pierwszego odrzucamy d L (K, ) d d U (K, ) nie można przesądzić o braku lub istnieniu autokorelacji rzędu pierwszego
Test Durbina-Watsona Inne testy: Breuscha-Godfrey a (test mnożników Lagrange a LM) Wady testu Durbina-Watsona: Częsta sytuacja kiedy występuje brak możliwości rozstrzygnięcia testu. Test wykrywa tylko autokorelację pierwszego rzędu. W danych kwartalnych możemy oczekiwać autokorelacji równej cyklom sezonowym. Zaufanie do testu można mieć gdy zmienne objaśniające są stałe w powtarzalnych próbach, a nie losowych. Test jest bardzo czuły gdy niespełnione jest założenie o normalności zaburzeń losowych.
ei ei-1 (ei-ei-1) (ei-ei-1)^2 ei^2-13,27 ------- ------- ------- 176,04-11,02-13,27 2,25 5,06 121,40-14,32-11,02-3,30 10,89 205,01-6,52-14,32 7,80 60,84 42,49-11,29-6,52-4,77 22,75 127,42-4,86-11,29 6,43 41,29 23,64 2,48-4,86 7,34 53,88 6,14-4,62 2,48-7,10 50,41 21,37-1,95-4,62 2,67 7,13 3,81-2,64-1,95-0,69 0,48 6,98 d = 0,5269 1 = 0,7387 d L = 1,3520; d U = 1,4894 0,5269 < 1,3520; Hipotezę o braku autokorelacji rzędu pierwszego odrzucamy, a zatem stwierdzamy istnienie autokorelację rzędu pierwszego. Współczynnik d jest mniejszy od 2 mamy autokorelację dodatnią (H 0 : 1 = 0; H 1 : 1 > 0; d < 2)
Badanie stabilności wariancji reszt Hipoteza: reszty mają stabilną wariancję (homoskedastyczność) Test Serii, Test Goldfelda-Quandta Hipotezę odrzucamy jeżeli
A Z Xi ei Serie 11 1 13,27 B 1 1 11,02 B 0 1 14,32 B 0 1 6,52 A 1 1 11,29 B 1 5 4,86 A 1 5 2,48 A 0 5 4,62 A 0 5 1,95 A 0 5 2,64 A 0 9 15,73 B 1 =JEŻELI(D40<>D39;1;0) Me 10,38 Liczba elementów A 15 Liczba elementów B 15 r(15,15, 0.025) r(15,15, 0.975) 10 11 22 brak podstaw do odrzucenia hipotezy
Badanie losowości reszt Hipoteza: reszty są losowe Test Serii Hipotezę odrzucamy jeżeli
Xi ei Serie 5 1-13,27 A 1 A 1-11,02 A 0 1-14,32 A 0 1-6,518 A 0 1-11,29 A 0 5-4,862 A 0 5 2,4778 B 1 5-4,622 A 1 =JEŻELI(D40<>D39;1;0) Liczba elementów A 14 Liczba elementów B 16 r(14,16, 0.025) r(14,16, 0.975) 10 5 22 Z 5-1,952 A 0 5-2,642 A 0 9 15,734 B 1 Hipotezę odrzucamy
Badamy model liniowy: WYNIKI ANALIZY RESZT normalność rozkładu reszt + stabilność wariancji reszt + losowość reszt autokorelacja reszt WNIOSEK warunek niespełniony warunek niespełniony Model liniowy nie powinien być stosowany do opisu tej zależności.
36
37
Inne funkcje 38
Funkcja Törnquista I 39
średnie zyski ze sprzedaży = 50,1680-0,2025 liczba reklamowanych produktów 47 46 45 44 43 42 41 15 20 25 30 35 40 45 40
41
42
Cena Popyt 1 10,91 1 13,16 1 9,86 1 17,66 1 12,89 5 31,87 5 39,21 5 32,11 5 34,78 5 34,09 9 65,02 9 62,83 9 61,52 9 62,84 9 58,61 13 67,39 13 69,63 13 74,71 13 73,33 13 79,05 17 75,62 17 79,82 17 80,74 17 77,17 17 84,1 21 69,75 21 67,44 21 70,22 21 77,2 21 73,37 100 90 80 70 60 50 40 30 20 10 0 20 15 10 5 0-5 -10-15 -20-25 y = 3,1385x + 21,04 R² = 0,7894 0 5 10 15 20 25 0 5 10 15 20 25 30 35
Cena Popyt 1 10,91 1 13,16 1 9,86 1 17,66 1 12,89 5 31,87 5 39,21 5 32,11 5 34,78 5 34,09 9 65,02 9 62,83 9 61,52 9 62,84 9 58,61 13 67,39 13 69,63 13 74,71 13 73,33 13 79,05 17 75,62 17 79,82 17 80,74 17 77,17 17 84,1 21 69,75 21 67,44 21 70,22 21 77,2 21 73,37 Sumy kw. Stopnie swob. Średnie kwad. Femp Fkryt Model 13790,381 1 13790,38069 Błąd 3679,5962 28 131,4141492 Ogółem 17469,977 29 H 0 : 1 =0 104,94 > 4,196 104,94 4,196 Hipotezę o braku zależności opisywaną modelem liniowym regresji należy odrzucić
Wykres reszt
Niepoprawny wykres reszt 20 15 10 5 0 0 5 10 15 20 25 30 35-5 -10-15 -20-25
PYTANIA 1 1. Kiedy do badania zależności można zastosować współczynnik korelacji Pearsona. 2. Podaj używane zamiennie nazwy: zmiennej zależnej, niezależnej i błędu losowego. 3. Podaj podział modeli ekonometrycznych 4. Narysuj na oddzielnych wykresach uwzględniając prostą regresji, przypadek 1 = 0, 1 > 0 i 1 < 0. 5. Podaj interpretację współczynnika regresji. 6. Wyjaśnij na czym polega metoda MNK. 7. Wyjaśnij co mierzy współczynnik determinacji. 8. Zapisz postać liniowego modelu funkcji regresji. 9. Jakim testem można zweryfikować hipotezę H 0 1 = 0. 10. Czy klasyczną teorię Keynesa dotyczącą konsumpcji można próbować przybliżyć stosując liniowe równanie regresji. Odpowiedź uzasadnij. 11. Jak zinterpretować 1 w równaniu liniowym regresji, w którym y to wydatki konsumpcyjne, a x to dochód? 47
PYTANIA 2 12. Wyjaśnij pojęcie reszta. 13. W jakim celu przeprowadza się analizę residualną. 14. Wymień znane ci testy wykorzystywane w analizie resztowej. 15. Narysuj niepoprawny wykres reszt. Opisz jego osie. 16. Wykorzystując metodę MNK, dla modelu liniowego otrzymano następujące reszty [ 1, 2, 0, 2, 1, 1]. Czy w oparciu o otrzymane reszty można stwierdzić, ze wybrany model jest poprawny? Odpowiedz uzasadnij 17. Zapisz postać hipotezy dla testu Goldfelda Quandta. 18. Wyjaśnij jaką hipotezę weryfikuje test RESET 19. Jaką hipotezę weryfikuje test Jarque-Bera 20. Narysuj wykres reszt dla modelu w którym dla małych wartości zmiennej niezależnej wartości zmiennej zależnej są systematycznie zawyżane w stosunku do wartości rzeczywistych, a dla dużych wartości zmiennej niezależnej zachodzi sytuacja odwrotna. 21. Narysuj wykres reszt na którym można zaobserwować jak wraz ze wzrostem wartości zmiennej niezależnej zwiększa się zakres zmienności reszt. 48