Konspek ekonomeria: Weryfikacja modelu ekonomerycznego Klasyfikacja modeli Modele dzielimy na: - jedno- i wielorównaniowe - liniowe i nieliniowe - sayczne i dynamiczne - sochasyczne i deerminisyczne - przyczynowo-skukowe i sympomayczne Dane wykorzysywane do esymacji modeli o: - szeregi czasowe (PKB, noowania WIG0 id.) - dane przekrojowe (liczba zakładów przemysłowych danej branży w 16 wojewódzwach; konsumpcja, dochód, liczba osób w gospodarswie domowym dla 50 ys. gospodarsw objęych badaniami ankieowymi, ip.). Regresja liniowa: Meoda najmniejszych kwadraów Oceny paramerów orzymujemy na podsawie znanych obserwacji zmiennych objaśnianej y i objaśniających x j na przykład meodą najmniejszych kwadraów:, gdzie - reszy modelu. Oceny MNK minimalizują sumę kwadraów resz. TU INTERPRETACJA GRAFICZNA
Weryfikacja c.d. Założenia klasycznej meody najmniejszych kwadraów: 1) Macierz obserwacji zmiennych objaśniających jes nielosowa, ma pełny rząd kolumnowy, a liczba obserwacji (= liczba wierszy) jes nie mniejsza niż liczba szacowanych paramerów (= liczbie kolumn). ) Składnik losowy ma sałą warość oczekiwaną równą zeru. 3) Składnik losowy ma sałą, skończoną wariancję. 4) Składnik losowy nie wykazuje auokorelacji. Te warunki można wyrazić ak: macierz wariancjikowariancji składnika losowego jes macierzą skalarną, wyraz na głównej przekąnej jes równy. Tw. Gaussa- Markowa: Jeśli warunki 1)-4) są spełnione, esymaor MNK jes najlepszym liniowym nieobciążonym esymaorem. =
Weryfikacja c.d. 3 Uwaga: składnik losowy jes nieobserwowalny, dlaego jako esymaor wariancji składnika losowego przyjmuje się wariancję reszową: Esymaor macierzy kowariancji składnika losowego: Nieobciążony i zgodny esymaor macierzy kowariancji esymaora MNK paramerów modelu: Pierwiaski kwadraowe elemenów głównej przekąnej ej macierzy o średnie błędy szacunku paramerów modelu. Średnie względne błędy szacunku wyznaczamy dzieląc błędy szacunku przez oceny odpowiednich paramerów. Średnie względne błędy nie powinny przekraczać 50%.
Weryfikacja c.d. 4 Inerpreacja ocen paramerów: Np. gdy zmienną objaśnianą jes poziom konsumpcji zagregowanej, zmienną objaśniającą jes poziom dochodu, w ys. PLN. Ocena parameru dla zmiennej dochód mówi, o ile przecięnie wzrosną wydaki na konsumpcję dla danego gospodarswa domowego, jeśli dochód wzrośnie o 1 ys. zł. Dla modelu objaśniającego liczbę kupowanych w danym roku samochodów, z ceną benzyny, kursem euro i ceną bileów PKS jako zmiennymi objaśniającymi: ocena parameru przy cenie benzyny mówi, o ile przecięnie ys. szuk zmniejszy się liczba kupowanych w kraju samochodów, jeśli cena benzyny wzrośnie o 1 zł, przy pozosałych czynnikach usalonych. W regresji konsumpcji zagregowanej względem dochodu do dyspozycji gospodarsw domowych, wyraz wolny oznacza konsumpcję auonomiczną, ocena parameru przy dochodzie oznacza krańcową skłonność do konsumpcji. Prócz ocen paramerów wyznaczamy błędu szacunku: prakyczna reguła jes aka, że błędy szacunku nie powinny przekraczać 50% warości parameru.
Weryfikacja c.d. 5 Współczynnik deerminacji : w jakim sopniu zmienność zmiennej objaśnianej jes wyjaśniana przez model. Jes inerpreowalny ylko wedy, gdy model jes liniowy, ma wyraz wolny i jes oszacowany meodą najmniejszych kwadraów. Rośnie przy wzroście liczby zmiennych objaśniających (nawe jeśli nie są zby sensowne.) Nie jes dobrym miernikiem jakości modelu. Sosowany jes skorygowany współczynnik deerminacji, a dla modeli bez wyrazu wolnego niescenrowany współczynnik deerminacji. Współliniowość zmiennych objaśniających Jeśli kolumny macierzy X są liniowo zależne, nie isnieje macierz odwrona do macierzy Grama i nie można wyznaczyć esymaora MNK. Kolumny obserwacji zmiennych mogą mieć zbliżone warości, zw. saysyczna lub przybliżona współliniowość. Skuek: wyznacznik macierzy Grama jes bliski zeru komplikacje numeryczne, wysokie błędy szacunku ip. Miernikiem współliniowości przybliżonej jes czynnik inflacji wariancji:, dla parameru, gdzie jes współczynnikiem deerminacji modelu, w kórym jako zmienna objaśniana wysępuje X j, a jako
Weryfikacja c.d. 6 zmienne objaśniające wszyskie pozosałe zmienne wyjściowego modelu. Warość >10 oznacza znaczne obniżenie jakości modelu. Weryfikacja hipoez Hipoeza saysyczna: przypuszczenie co do rozkładu populacji generalnej, kórego prawdziwość oceniana jes na podsawie wyników próby losowej Tes saysyczny: reguła rozsrzygająca, jakie wyniki próby pozwalają uznać hipoezę za prawdziwą, a jakie za fałszywą Hipoeza podlegająca weryfikacji nazywana jes hipoezą zerową (H 0 ); jej zaprzeczenie hipoezą alernaywną (H 1 ) Hipoezę H 1 uznaje się za prawdziwą w przypadku odrzucenia H 0 Błąd 1. rodzaju polega na odrzuceniu hipoezy zerowej, kóra jes prawdziwa. Błąd. rodzaju polega na nieodrzuceniu hipoezy zerowej, kóra w isocie jes fałszywa. Tesy saysyczne konsruuje się w en sposób, aby przy przyjęym poziomie błędu. rodzaju zminimalizować prawdopodobieńswo błędu 1. rodzaju.
Weryfikacja c.d. 7 Weryfikacja normalności rozkładu składnika losowego Aby możliwe było wykorzysanie esów saysycznych do badania własności modelu ekonomerycznego, rzeba przyjąć dodakowe założenie o posaci rozkładu składnika losowego. Tes Jarque-Bera-Łomnickiego jes jednym z esów normalności badanego szeregu. Warość saysyki jes wyznaczana według wzoru: n k ( 3) K S JB= 6 4 Gdzie n oznacza liczebność próby, k liczbę oszacowanych paramerów, S skośność, K kurozę badanego szeregu. Hipoeza zerowa esu zakłada normalność badanego szeregu. Idea esu polega na porównaniu empirycznych momenów rozkładu badanego szeregu z odpowiednimi momenami rozkładu normalnego. Saysyka esu przy założeniu prawdziwości hipoezy zerowej ma rozkład o dwu sopniach swobody.,
Weryfikacja c.d. 8 Weryfikacja saysycznej isoności zmiennych 1) Tes -Sudena: Hipoeza zerowa zakłada, że paramer przy zmiennej objaśniającej jes równy zeru, hipoeza alernaywna że jes różny od zera: H 0 : j 0, H1 : j 0. Saysyka Sudena jes równa ilorazowi oceny ˆ j parameru przez błąd szacunku: s Porównujemy obliczoną warość saysyki z warością kryyczną odczyaną z ablic rozkładu Sudena dla przyjęego poziomu isoności (np. 0, 05) i dla odpowiedniej liczby sopni swobody (kóra jes równa różnicy między liczbą obserwacji a liczbą szacowanych paramerów): df = n (k+1) jeśli w modelu jes wyraz wolny. Jeśli obliczona warość saysyki jes większa niż odpowiednia warość kryyczna, hipoezę zerową odrzucamy. j
Weryfikacja c.d. 9 ) Uogólniony es Walda: Tes łącznej isoności całej grupy zmiennych objaśniających. Jedna z wersji: sprawdzamy łączną isoność wszyskich zmiennych objaśniających, czyli dla modelu y x x... 0 1 1 k k (1) H 0 : 1... k 0, H 1 : niekóre z ych paramerów są niezerowe. x Saysyka esu Walda: Jes wyznaczana na podsawie warości współczynnika deerminacji dla modelu (1): R / k F (1 R ) /[ n ( k 1)] ma rozkład F-Snedecora F(k, n (k+1)). Jeśli obliczona warość saysyki F jes większa niż warość kryyczna dla przyjęego poziomu isoności i określonej liczby sopni swobody, o odrzucamy hipoezę zerową. Druga wersja wzoru: niech e oznacza wekor resz modelu pierwonego, r wekor resz modelu rozszerzonego, uzupełnionego o dodakowe zmienne (jes ich m): Jeśli obliczona warość jes większa od warości kryycznej, odrzucamy hipoezę zerową o braku isoności dodakowych zmiennych.
Weryfikacja c.d. 10 Przykład: Oszacowano model na podsawie danych z przykładu.1 (Rozdział, sr. 6-7, Ekonomeria, 008) Model wyraża zależność między inflacją a bezrobociem: uogólniona krzywa Phillipsa. SI sopa inflacji, SB sopa bezrobocia, OSI oczekiwana sopa inflacji. Wyniki esymacji: Zmienna Ocena Błąd Saysyka Poziom parameru szacunku isoności Wyraz wolny -4,1537 0,50804-8,093715 0,0000 SB 0,887353 0,07677 1,0958 0,0000 OSI 0,637081 0,036764 17,3890 0,0000 R R Odchylenie resz Suma kwadraów resz Log likelihood Saysyka Durbina- Wasona 0,953840 Średnia arymeyczna obserwacji SI 0,95089 Odchylenie sandardowe SI 0,53335 Kryerium informacyjne Akaike 7,367887 Kryerium informacyjne Schwarza 5,731379,387581 1,674609 1,816053-1,8183 Saysyka F esu 68,671 Walda,34751 Poziom isoności F 0,000000 Reszy ego modelu, warości empiryczne i eoreyczne są pokazane na wykresie, obliczono saysyki opisowe dla resz i wyznaczono hisogram rozkładu empirycznego.
Weryfikacja c.d. 11 Prócz warości saysyki Jarque-Bera podano poziom isoności ego esu niska warość prawdopodobieńswa sugeruje odrzucenie hipoezy zerowej, zn. rozbieżność rozkładu badanego szeregu od rozkładu normalnego. 8 7 7 7 6 6 5 4 4 3 1 1 1 1 0 0 0 0 0-1.0-0.5 0.0 0.5 1.0 1.5.0 Reszy modelu Srednia,87E-17 Mediana 0,040570 Maksimum 1,757648 Minimum -0,90716 Odch. s. 0,51971 Skosnosc 1,48856 Kuroza 6,084330 Tes Jarque-Bera 19,033 Prawd. 0,000074 1 10 1 0 8 6 4-1 5 10 15 0 5 R e s z y E m p i r y c z n e T e o r e y c z n e
Weryfikacja c.d. 1 Tesy specyfikacji modelu: Tes RESET Ramseya: bardzo ogólny es poprawności specyfikacji modelu. Ma dwie wersje: 1) Do równania modelu wprowadza się dodakowo kwadray oraz iloczyny wszyskich par zmiennych objaśniających. Hipoeza zerowa o poprawności posaci funkcyjnej oznacza, że paramery przy wszyskich dodakowych zmiennych są równe zeru. Hipoeza alernaywna że paramery są różne od zera, co oznacza, że posać funkcyjna modelu nie zosała dobrze dobrana. Ta wersja wymaga dużej liczby obserwacji. ) Do równania wprowadza się kwadray i rzecie poęgi zmiennej objaśniającej. Hipoeza zerowa oznacza, że paramery przy ych zmiennych są jednocześnie równe zeru. Jes sprawdzana przy użyciu esu Walda łącznej isoności zmiennych. Tes Davidsona-McKinnona: porównujemy dwa modele (A) i (B), objaśniające ę samą zmienną Y, ale różniące się zesawami zmiennych objaśniających. Po oszacowaniu modelu (A) obliczamy warość eoreyczną zmiennej Y A i dołączamy ją do zesawu zmiennych objaśniających w modelu (B). Jeśli Y A okaże się nieisona, model (B) uważamy za kompleny. Nasępnie procedurę powarzamy zamieniając kolejność modeli. Wynik esu jes jednoznaczny, jeśli jeden z modeli okaże się kompleny, a drugi nie.
Weryfikacja c.d. 13 Wybór modelu na podsawie kryeriów informacyjnych Kryeria informacyjne Akaike, Schwarza i in. polegają na minimalizacji warości pewnego wyrażenia, kóre zależy 1) od liczby paramerów modelu i liczby obserwacji oraz ) od wariancji resz. Przy zwiększeniu liczby paramerów warość kryerium rośnie, gdyż rośnie k/n, za o wariancja reszowa maleje. Przy zmniejszeniu liczby paramerów wariancja może wzrosnąć, gdyż rosną warości bezwzględne resz, za o składnik k/n maleje. Wybieramy aką liczbę paramerów, dla kórej kryerium osiąga warość minimalną.
Weryfikacja c.d. 14 Auokorelacja składnika losowego saysyka Durbina-Wasona Na podsawie resz oszacowanego modelu można wyznaczyć oszacowanie współczynnika korelacji składnika losowego, mianowicie współczynnik korelacji resz i resz opóźnionych o 1 okres: ˆ n 1 e n e 1/ e n 1 e 1 1/ Do weryfikacji hipoezy o braku auokorelacji składnika losowego sosowana jes saysyka Durbina-Wasona: d n ( e n 1 e e 1 ) (1 ˆ) sąd można wyznaczyć warości saysyki DW odpowiadające poszczególnym warościom współczynnika auokorelacji pierwszego rzędu: współczynnik en ma warości z przedziału od -1 do +1, warość 0 oznacza brak auokorelacji, podsawiamy e rzy warości do wzoru i orzymujemy odpowiednie warości DW; dla warości pośrednich współczynnika saysyka będzie również miała pośrednie warości. ˆ 1... 0... 1 d 4...... 0
Weryfikacja c.d. 15 W naszym przykładzie z esymacją modelu dla sopy inflacji, objaśnianej przez sopę bezrobocia i oczekiwania inflacyjne, obliczona warość saysyki Durbina-Wasona d =,34751 (jes podana w abelce), liczba obserwacji n =9, liczba zmiennych objaśniających=. Tablice warości kryycznych są na sronie www.kufel.orun.pl. W boczku ablicy podane są warości n, w główce liczba zmiennych objaśniających k. Tesujemy hipoezę o braku auokorelacji przeciw hipoezie alernaywnej o wysępowaniu auokorelacji dodaniej: W ablicy rozkładu podano dwie warości kryyczne, d L, d U. d d L H 0 odrzucamy, d L d d U nie podejmujemy decyzji, d U d nie ma podsaw do odrzucenia H 0. n=9, k = : d L 1,699 d, d U 1, 5631 d nie ma podsaw do odrzucenia hipoezy o braku auokorelacji. Pamięajmy jednak, że esowaliśmy ją przeciwko hipoezie o auokorelacji dodaniej! Nie można wykluczyć możliwości wysąpienia auokorelacji ujemnej. Tesujemy więc hipoezę o braku auokorelacji przeciwko hipoezie alernaywnej o wysępowaniu auokorelacji ujemnej: d 4 d L H 0 odrzucamy, 4 du d 4 d L nie podejmujemy decyzji, d 4 d U nie ma podsaw do odrzucenia H 0. d < 4 du = 4 1,5631=,43688, więc nie ma podsaw do odrzucenia H 0.
Weryfikacja c.d. 16 Heeroskedasyczność składnika losowego H 0 : wariancja składnika losowego jes sała H 1 : wariancja składnika losowego nie jes sała (składnik jes heeroskedasyczny) Esymaor MNK modelu, w kórym składnik losowy jes heeroskedasyczny, jes nieobciążony, liniowy i zgodny, ale nie jes najefekywniejszy w klasie liniowych nieobciążonych esymaorów. Tes Whie a jes esem asympoycznym. Procedura jes dwusopniowa: w drugim eapie szacujemy równanie modelu zawierające dodakowo kwadray zmiennych objaśniających oraz iloczyny par zmiennych objaśniających. Zmienną objaśnianą są kwadray resz wyjściowego modelu. Dla dosaecznie dużej liczby sopni swobody saysyka esu Whie a ma rozkład o liczbie sopni swobody równej liczbie zmiennych objaśniających równania esowego. Jeśli obliczona warość saysyki jes większa niż warość kryyczna z ablic rozkładu, o hipoezę zerową o sałości wariancji składnika losowego należy odrzucić. W grel mamy również inne wariany esów heeroskedasyczności oraz auokorelacji (es Breuscha- Pagana); może się zdarzyć, że en drugi warian esu udziela zdecydowanej odpowiedzi o wysępowaniu heeroskedasyczności lub jej braku, podczas gdy saysyka esu Whie a ma empiryczny poziom isoności np. 0,07 (czyli prakycznie zosawia decyzję do naszego uznania).
Weryfikacja c.d. 17 Co zrobić jeśli wysępuje heeroskedasyczność? 1) Można zasosować inną meodę esymacji ważoną MNK. ) Można skorygować esymaor macierzy kowariancji esymaora np. zasosować esymaor asympoycznej macierzy kowariancji, wprowadzony przez Neweya i Wesa, zw. esymaor HAC Heeroskedasiciy and Auocorrelaion Consisen Esimaor. Przykład 3.5 sr. 87 w podręczniku: saysyki Sudena wyznaczone na podsawie HAC są mniejsze co do modułu niż wyznaczone wg zwykłych wzorów. Gdybyśmy zasosowali ypowy wzór na błędy szacunku paramerów, wyciągnęlibyśmy zby opymisyczne wnioski co do isoności zmiennych! Schema weryfikacji modelu ekonomerycznego Podręcznik: sr. 90-91. Model oszacowany na podsawie szeregów czasowych: 1) Analiza graficzna zmiennych ) Tes niesacjonarności zmiennych usalenie sopnia inegracji. 3) Wsępna specyfikacja modelu: sformułowanie oczekiwań co do oszacowań paramerów, wyznaczenie saysyk opisowych. 4) Tes posaci funkcyjnej modelu i pominięych zmiennych; ewenualnie koreka posaci funkcyjnej, dodanie zmiennej czasowej, modyfikacja zesawu zmiennych objaśniających.
Weryfikacja c.d. 18 5) Tesy własności składnika losowego (auokorelacja, heeroskedasyczność; normalność). 6) Sprawdzenie sopnia współliniowości zmiennych. 7) Osaeczna decyzja co do posaci funkcyjnej modelu, zesawu zmiennych objaśniających i meody esymacji. 8) Inerpreacja współczynnika deerminacji. 9) Wyznaczenie i inerpreacja względnych błędów szacunku. 10) Tesy isoności zmiennych objaśniających. 11) Analiza dynamiki modelu: sprawdzanie równowagi długookresowej, kierunku przyczynowości między zmiennymi. 1) Wyznaczenie prognozy wewnąrz próby, ocena prognosycznej jakości modelu. 13) Podsumowanie: ogólna ocena jakości modelu. Model oszacowany na podsawie danych przekrojowych: 1) Analiza graficzna zmiennych ) Wsępna specyfikacja modelu. Sformułowanie oczekiwań n. znaków ocen paramerów, wyznaczenie i inerpreacja saysyk opisowych. 3) Tes posaci funkcyjnej i pominięych zmiennych, ewenualna koreka posaci modelu. 4) Tesy własności składnika losowego, es heeroskedasyczności, normalności. (Uwaga: Auokorelacja jes zdefiniowana dla danych przekrojowych, ale w inny sposób niż dla szeregów czasowych.) 5) Sprawdzenie sopnia współliniowości zmiennych objaśniających. 6) Osaeczna decyzja co do posaci funkcyjnej modelu, zesawu zmiennych objaśniających, meody esymacji.
Weryfikacja c.d. 19 7) Esymacja modelu i inerpreacja ocen paramerów. 8) Inerpreacja współczynnika deerminacji. 9) Tesy isoności zmiennych objaśniających, podzbioru zmiennych objaśniających. 10) Wyznaczenie i inerpreacja względnych błędów szacunku. 11) Podsumowanie, ogólna ocena jakości modelu.
Weryfikacja c.d. 0 Prognozowanie Oszacowano powórnie en sam model na podsawie 0 obserwacji, wyznaczono prognozy zmiennej SI: Liczba obserwacji: 0 Zmienna Ocena Błąd Saysyka Poziom isoności Wyraz wolny -3,948894 0,83946-4,79663 0,000 SB 0,883444 0,093933 9,40506 0,0000 OSI 0,6089 0,055037 11,0639 0,0000 R 0,919784 14 1 10 8 6 4 Prognoza zmiennej SI Prognoza dla: 1 9 R M S E 0,514787 Mean Absolue Error, MAE 0,370761 MAPE 7,41834 Wspolczynnik Theila 0,041497 - blad obciazenia 0,018359 - blad wariancji 0,057450 - kowariancji 0,94191 0 5 10 15 0 5 Prognoza Dla modelu wyznaczono nasępujące błędy prognoz i mierniki dokładności dla horyzonu prognozy h: 1) Pierwiasek błędu średniokwadraowego T h RMSE = T 1 ( y y ˆ ) / h ) Średni błąd absoluny MAE = T h y T 1 yˆ / h 3) Średni absoluny błąd procenowy
Weryfikacja c.d. 1 MAPE = T h 100 T 1 y yˆ y / h 4) Współczynnik rozbieżności Theila T h ( y T 1 T h yˆ / h T 1 yˆ ) / h T h y / h T 1 jes miernikiem unormowanym, przyjmującym warości z przedziału 0, 1. Niskie warości współczynnika oznaczają dużą dokładność prognoz. Można wyróżnić rzy składowe współczynnika rozbieżności, odpowiadające przyczynom błędów prognozy: 1) obciążenie prognozy gdy warość oczekiwana prognozy odbiega od warości zmiennej prognozowanej; ) wariancja na ile model dobrze odwzorowuje wariancję zmiennej prognozowanej; 3) kowariancja błędy prognoz spowodowane innymi przyczynami niż obciążenie i błędy wariancji.
Weryfikacja c.d. Przykładowe zadanie z weryfikacji Na podsawie obserwacji rocznych z la 1960-1979 oszacowano nasępujący jednorównaniowy model ekonomeryczny: y ˆ 18 0,4 y 0,y 1x x Gdzie 1 (9) (0,3) (0,1) () (0,9) y oznacza liczbę świń w zagrodach Węgier w 10 ys. szuk, x oznacza produkcję wieprzowiny w sekach on. Pod równaniem podane są średnie błędy szacunku odpowiednich paramerów. Składnik losowy ma rozkład normalny. Przyjąć liczebność próby równą liczbie la w badanym okresie. Kóre z podanych swierdzeń są prawdziwe, a kóre fałszywe? Odpowiedź uzasadnić. a) Przy poziomie isoności = 0,1 wpływ opóźnionej produkcji wieprzowiny na ilość świń jes isony, zaś przy poziomie isoności = 0,0 nie ma podsaw do odrzucenia hipoezy o nieisoności wpływu. b) Przy poziomie isoności =0,01 nieopóźniona produkcja wieprzowiny ma isony wpływ na zmienną objaśnianą. c) Przy poziomie isoności = 0,0 opóźniona i nieopóźniona produkcja wieprzowiny ma wpływ na liczbę świń (zweryfikować hipoezę oddzielnie dla każdego parameru). d) Przy poziomie isoności =0,05 można uznać, że w modelu nie wysępuje wyraz wolny. e) Po wyeliminowaniu z modelu opóźnionej zmiennej endogenicznej oszacowano powórnie model i obliczono saysykę Durbina-Wasona = 3,05. Można wnioskować, 1
Weryfikacja c.d. 3 że w nowym modelu (przyjmując 0,05) wysępuje auokorelacja składnika losowego.