1.9 Czasowy wymiar danych

Podobne dokumenty
Czasowy wymiar danych

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Metoda najmniejszych kwadratów

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria Ćwiczenia 19/01/05

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Ekonometria egzamin 07/03/2018

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Egzamin z ekonometrii - wersja ogólna

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

1 Modele ADL - interpretacja współczynników

Budowa modelu i testowanie hipotez

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Diagnostyka w Pakiecie Stata

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stosowana Analiza Regresji

Ekonometria egzamin wersja ogólna 17/06/08

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Ekonometria Wykład 4 Prognozowanie, sezonowość. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Modele wielorównaniowe (forma strukturalna)

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

5. Model sezonowości i autoregresji zmiennej prognozowanej

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ćwiczenia IV

Egzamin z ekonometrii wersja IiE, MSEMAT

Ekonometria dla IiE i MSEMat Z12

Stanisław Cichocki. Natalia Nehrebecka

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

Egzamin z ekonometrii wersja ogolna

1.7 Ograniczenia nakładane na równanie regresji

1.1 Klasyczny Model Regresji Liniowej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Natalia Neherbecka. 11 czerwca 2010

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Diagnostyka w Pakiecie Stata

1.8 Diagnostyka modelu

1.5 Problemy ze zbiorem danych

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 8. Regresja. Definiowanie modelu

3. Modele tendencji czasowej w prognozowaniu

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Weryfikacja hipotez statystycznych

4. Średnia i autoregresja zmiennej prognozowanej

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Autokorelacja i heteroskedastyczność

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Zmienne Binarne w Pakiecie Stata

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

1.3 Własności statystyczne estymatorów MNK

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Problem równoczesności w MNK

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Definicja danych panelowych Typy danych panelowych Modele dla danych panelowych. Dane panelowe. Część 1. Dane panelowe

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Stanisław Cichocki. Natalia Nehrebecka

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Wprowadzenie do teorii prognozowania

Testowanie hipotez statystycznych

Motto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.

Ekonometria egzamin wersja ogólna 29/01/08

1 Metoda Najmniejszych Kwadratów (MNK) 2 Interpretacja parametrów modelu. 3 Klasyczny Model Regresji Liniowej (KMRL)

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Modele warunkowej heteroscedastyczności

Testowanie hipotez statystycznych

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Transkrypt:

1.9 Czasowy wymiar danych Do tej pory rozpatrywaliśmy jedynie modele tworzone na podstawie danych empirycznych pochodzących z prób przekrojowych. Teraz zajmiemy się zagadnieniem budowy modeli regresji, gdy obserwacje pochodzą z kolejnych okresów czasu. Tego typu modele są ważne z praktycznego punktu widzenia, ponieważ mają szerokie zastosowania, między innymi w prognozowaniu gospodarczym. Dla odróżnienia danych o charakterze czasowym od danych przekrojowych, które oznaczaliśmy indeksem i porzadkującym badane jednostki, wymiar czasowy będziemy oznaczać indeksem t. Okazuje się że estymatory modelu y t = X t β + ε t posiadają takie same właściwości jak w przypadku danych przekrojowych. Jednak występują również pewne specyficzne cechy, nieobecne w danych przekrojowych. Są trzy zasadnicze różnice pomiędzy modelem utworzonym na podstawie danych przekrojowych, a takim utworzonym na podstawie danych o wymiarze czasowym. Po pierwsze, w przypadku gdy dane posiadają wymiar czasowy jest sens mówić o budowie prognoz. Po drugie parametry modelu mogą być niestabilne w czasie. Po trzecie składnik losowy może podlegać zjawisku autokorelacji. 1.9.1 Predykcja W ekonometrii predykcją nazywamy wnioskowanie przeprowadzone na podstawie Klasycznego Modelu Regresji Liniowej. Możemy tego dokonać niezależnie od tego czy wartości zmiennych objaśniających pochodzą z próby na podstawie której szacowaliśmy model, czy są to wartości spoza tej próby. Aby mieć możliwość wnioskowania na podstawie próby losowej na większą populację lub dłuższy okres czasu należy przyjąć dwa założenia: 1. prawidłowość z okresu (1..T ) również obowiązuje w okresie prognostycznym w przypadku danych czasowych, albo prawidłowość zachodząca dla próby również obowiązuje w całej populacji, 2. składnik losowy w przedziale prognozy zachowuje się tak samo jak w okresie próby. Załóżmy, że dysponujemy prostą próbą losową, którą możemy podzielić na dwie części 1 }.{{.. N} (N + 1)... (N + p) }{{} estymacja predykcja 57

Oznaczmy przez x obserwacje z próby (okresu) estymacji, a przez x 0 z próby predykcji (okresu prognozy). Na podstawie pierwszej części próby szacujemy nieznane parametry modelu. Następnie chcemy obliczyć wartość zmiennej objaśnianej y f związaną z wektorem regresorów x 0, czyli wykonać predykcję wewnątrz próby (in-sample-prediction). Wartość ta będzie wynosić: y f = x 0 β + ε 0 Z twierdzenia Gaussa-Markowa wynika, że: ŷ f = x 0 b jest najlepszym liniowym, nieobciążonym estymatorem E[y f x 0 ] o minimalnej wariancji. Błąd prognozy e 0 jest równy: e 0 = y f ŷ f = x 0 β + ε 0 x 0 b = x 0 (β b) + ε 0 Błąd prognozy ma dwa źródła. Po pierwsze b jest tylko estymatorem nieznanego parametru β. Jeżeli stosowany jest nieobciążony estymator wektora parametrów β to wynosi on zero, ponieważ E(e 0 ) = E(y f ŷ f ) = x 0 E(b) x 0 β = 0 }{{} β Po drugie zależy on od składnika losowego w okresie prognozy ε 0. O jakości prognozy świadczy jej precyzja. Wariancja prognozy wynosi: var[e 0 X, x 0 ] = σ 2 + var[(b β) x 0 X, x 0 ] = σ 2 + x 0, (X X) 1 x 0 Jest ona sumą niedokładności oszacowań parametrów oraz błędu losowego σ 2. Jak widać z powyższego wzoru wariancja prognozy nie jest stała. Zależy ona od wartości x 0. Przy wyprowadzaniu wzorów zakładaliśmy, że x 0 jest znane (prognoza ex post). Jeśli x 0 musi być prognozowane (prognoza ex ante) wtedy wyrażenie na wariancję prognozy musi być zmodyfikowane o wariancję x 0. W takim przypadku nie istnieje ogólna postać analityczna wzoru na wariancję prognozy. Przedziały ufności dla prognozy Prognoza jest szczególnym przypadkiem kombinacji liniowej parametrów i wyprowadzenie przedziałów ufności wygląda analogicznie. Wychodząc od δ b δ β δ Σ b δ t N=k 58

i kładąc δ b = x f b otrzymujemy P r(ŷ f se(ê f )t α 2 < y f < ŷ f + se(ê f )t α 2 ) uzyskany przedział ufności jest przedziałem dla wartości prognozowanej. W teorii ekonometrii zaproponowano wiele statystyk mierzących dokładność prognozy. Sprawdzają one czy poprawny model oszacowany dla mniejszego zbioru obserwacji jest również adekwatny dla większej ilości danych. Inaczej mówiąc, sprawdzane jest czy prawidłowość zachodząca w mniejszej próbie może być rozszerzona na większą próbę (całą populację). Większość z nich dotyczy prognoz ex-post, czyli prognoz dla których wartości zmiennych niezależnych nie muszą być prognozowane. Znając wartość realizacji zmiennej y możemy ocenić dokładność oszacowania za pomocą dwóch miar. Obie bazują na resztach prognozy. Pierwsza to Mean Squared Error, czyli estymator wariancji prognozy: MSE = 1 n 0 (yi ŷ i ) 2 gdzie n 0 to długość okresu lub ilość obserwacji dla których obliczana jest prognoza. MSE jest sumą kwadratów różnic między wartościami rzeczywistymi a prognozowanymi. Druga to Mean Absolute Error, czyli średni bezwzględny błąd prognozy MAE = 1 n 0 yi ŷ i Teoretycznie powinny one dawać zbliżone rezultaty. Jednak w praktyce ich wartości mogą znacznie się różnić. Przykład 1. Dysponujemy następującym zbiorem danych: x y 1 1 2 2 3 4 4 5 5 5.5 6 6 7 8 8 8.5 9 9 10 10.5 Obejrzyjmy je na wykresie Chcemy sprawdzić dokładność prognozy. Dzielimy próbę na dwie części. Standardowo parametry modelu szacuje się używając od 2/3 do 80 % obserwacji. Pierwsze osiem obserwacji użyjemy do wyznaczenia nieznanych parametrów modelu. 59

0 2 4 6 8 10 0 2 4 6 8 10 Zmienna objasniajaca Zmienna y Fitted values Source SS df MS Number of obs = 8 -------------+------------------------------ F( 1, 6) = 209.37 Model 47.1488095 1 47.1488095 Prob > F = 0.0000 Residual 1.35119048 6.225198413 R-squared = 0.9721 -------------+------------------------------ Adj R-squared = 0.9675 Total 48.5 7 6.92857143 Root MSE =.47455 ------------------------------------------------------------------------------ y Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- x 1.059524.0732248 14.47 0.000.8803493 1.238698 _cons.2321429.369767 0.63 0.553 -.6726443 1.13693 ------------------------------------------------------------------------------ Następnie generujemy wartości dopasowane. predict fit I porównujemy je z rzeczywistymi realizacjami. Obliczymy błędy prognozy. Wartości dopasowane dla 9 i 10 obserwacji wynoszą odpowiednio 9,77 oraz 10,83. MSE = 1 2[ (9 9, 77) 2 + (10, 5 10, 83) 2] = 0, 3509 MAE = 1 2[ 9 9, 77 + 10, 5 10, 83 ] = 0, 55 Teraz pomnóżmy wartości zmiennej zależnej przez 100, ponownie oszacujmy model i policzmy prognozy i ich błędy. Oczywiście wyniki oszacowań modelu regresji będą prawie takie same. Jedynie wielkości parametrów będą 100 razy większe, a całkowita suma kwadratów wzrośnie dziesięć tysięcy razy. Nowe 60

0 2 4 6 8 10 0 2 4 6 8 10 Zmienna objasniajaca Rzeczywiste Dopasowane wartości dopasowane będą wynosi odpowiednio 977 oraz 1083. Obliczmy nowe błędy prognoz MSE = 1 2[ (900 977) 2 + (1050 1083) 2] = 3509 Druga to Mean Absolute Error, czyli średni błąd prognozy MAE = 1 2[ 900 977 + 1050 1083 ] = 55 ak widać błąd średniokwadratowy wzrósł 1000 razy, podczas gdy średni błąd bezwzględny jedynie 100 razy. Jest to ogólna zasada. Dla małych wartości zmiennej zależnej, mniejszych od 1, błąd średniokwadratowy jest mniejszy od błędu absolutnego. Dla dużych liczb zależność jest odwrotna. Dlatego lepszą miarą jakości predykcji dla stosunkowo niewielkich wartości jest MAE, a dla większych od jeden MSE. W praktyce często zamiast błędu średniokwadratowego podaje się jego pierwiastek RMSE. 1 RMSE = (yi ŷ i ) n 2 0 jego wartość jest w mniejszym stopniu uzależniona od wartości prognozowanych niż MSE. 1.10 Testowanie stabilności parametrów. Test prognoz Ten test służy weryfikacji hipotezy, że model prawdziwy dla pewnego zbioru obserwacji jest również prawdziwy dla innego zbioru obserwacji dotyczących tego samego zjawiska. Ma on dwa zastosowania 61

- wykrywanie zmiany strukturalnej - sprawdzenie, czy wybrana podgrupa zachowuje się w sposób podobny do całej populacji Przeprowadzenie testu poprzedzamy podziałem zbioru na część estymacyjną (E), oraz prognozy (F). Następnie szacujemy parametry modelu na podstawie zbioru obserwacji z okresu estymacji i sprawdzamy czy one dobrze przybliżają jego kształtowanie w okresie prognozy. Dla okresu estymacji mamy model Dla okresu prognozy y E = X E β E + ε E y F = X F β F + ε F więc hipotezę można zapisać jako β E = β F. Aby ją zweryfikować szacuje się parametry na podstawie połączonej próby z okresu estymacji i prognozy y E+F = X E+F β E+F + X E+F β + ε E+F i sprawdzamy, czy β = 0. Można tego dokonać wykorzystując sposób testowania łącznych ograniczeń. Statystyka testowa ma postać (S E+F S E )/g S E /(N k) F (g, N k) 1.11 Testowanie zmiany strukturalnej. Test Chowa Zmiana strukturalna oznacza, że niektóre lub wszystkie współczynniki regresji są różne w różnych podpróbach. W celu analizy różnych możliwości zmian parametrów modelu w skutek załamania strukturalnego wykorzystamy przykład. Dane pochodzą z rynku benzyny w USA z lat 1960-1995. Rynek paliwowy był stabilny do roku 1973, a po kryzysie naftowym znacznie wzrosły ceny oraz zwiększyły się ich wahania wokół wartości średnich. Model wygląda następująco: ln(g/p c ) = β 0 + β 1 lni t + β 2 lnp G + β 3 lnp NC + β 4 lnp UC + β 5 t + ε t (1) gdzie: G/p c konsumpcja benzyny na jednego mieszkańca I t dochód do dyspozycji na osobę P G cena benzyny P NC cena nowych samochodów 62

P UC cena używanych samochodów t czas Ponieważ równanie (1) ma postać log-liniową, jego współczynniki są elastycznościami popytu na benzynę względem odpowiednio: konsumpcji benzyny, dochodu do dyspozycji, ceny benzyny, ceny nowych samochodów, ceny używanych samochodów i czasu. Załóżmy, że chcemy oszacować przeciętną wielkość inflacji w okresie 1960-1995. Ponieważ benzyna jest dobrem pośrednim używanym w procesie wytwarzania wielu towarów i usług jej cena w znacznym stopniu wpływa na poziom inflacji, szczególnie w krajach wysoko rozwiniętych. W celu oszacowania przeciętnej inflacji użyjemy naiwnego modelu P G = β 0 + β 1 t + ε t czyli będziemy tłumaczyć cenę benzyny trendem liniowym. 0 1 2 3 4 1 2 3 4 1960 1970 1980 1990 2000 rok 1960 1970 1980 1990 2000 rok Rozpocznijmy od analizy graficznej. Na lewym rysunku mamy przedstawione oszacowanie inflacji dokonane na całej próbie 36 obserwacji. Na prawym w rozbiciu na dwie podpróby - okres przed szokiem naftowym i po nim. Jak wyraźnie widać model, w którym szacowane są wspólne parametry dla całego okresu jest gorzej dopasowany do danych.. reg Pg year Source SS df MS Number of obs = 36 ----------+------------------------------ F( 1, 34) = 160.10 Model 45.2332456 1 45.2332456 Prob > F = 0.0000 Residual 9.60614026 34.282533537 R-squared = 0.8248 ----------+------------------------------ Adj R-squared = 0.8197 Total 54.8393858 35 1.56683959 Root MSE =.53154 --------------------------------------------------------------------------- 63

Pg Coef. Std. Err. t P> t [95% Conf. Interval] ----------+---------------------------------------------------------------- year.107903.0085278 12.65 0.000.0905723.1252336 _cons -211.0615 16.86405-12.52 0.000-245.3334-176.7896 --------------------------------------------------------------------------- Przeciętnie w całym okresie ceny rosły w tempie 10 %.. reg Pg year if year<=1973 Source SS df MS Number of obs = 14 ----------+------------------------------ F( 1, 12) = 89.74 Model.075011693 1.075011693 Prob > F = 0.0000 Residual.01003002 12.000835835 R-squared = 0.8821 ----------+------------------------------ Adj R-squared = 0.8722 Total.085041713 13.00654167 Root MSE =.02891 --------------------------------------------------------------------------- Pg Coef. Std. Err. t P> t [95% Conf. Interval] ----------+---------------------------------------------------------------- year.0181582.0019168 9.47 0.000.013982.0223345 _cons -34.71204 3.769332-9.21 0.000-42.92471-26.49937 --------------------------------------------------------------------------- Przed szokiem naftowym cena benzyny rosła przeciętnie o 1 % rocznie.. reg Pg year if year>1973 Source SS df MS Number of obs = 22 ----------+------------------------------ F( 1, 20) = 21.38 Model 7.65171653 1 7.65171653 Prob > F = 0.0002 Residual 7.15750201 20.357875101 R-squared = 0.5167 ----------+------------------------------ Adj R-squared = 0.4925 Total 14.8092185 21.705200883 Root MSE =.59823 --------------------------------------------------------------------------- Pg Coef. Std. Err. t P> t [95% Conf. Interval] ----------+---------------------------------------------------------------- year.0929577.0201035 4.62 0.000.0510225.1348928 _cons -181.3176 39.89558-4.54 0.000-264.5383-98.09683 --------------------------------------------------------------------------- Po szoku naftowym zanotowano przeciętny 9 % wzrost cen. Rozbijając próbę na dwie części pozwoliliśmy by zarówno stała jak i nachylenie prostej regresji uległo zmianie. W rzeczywistości może zachodzić jeden z dwóch prostszych przypadków. Jeżeli w skutek szoku zmienia się wyłącznie stała a nachylenie pozostaje bez zmian to linia wartości dopasowanych 64

w punkcie szoku zostanie równolegle przesunięta (lewy rysunek). Jeżeli zmienia się wyłącznie nachylenie, to linia wartości dopasowanych będzie załamana w punkcie szoku (prawy rysunek). 2 0 2 4 6 8 1960 1970 1980 1990 2000 rok 5 0 5 10 15 1960 1970 1980 1990 2000 rok Dokonajmy teraz formalnego wyprowadzenia modeli dla obu przypadków. Cała próba zawiera 36 obserwacji, z czego 14 z lat 1960-1973 pochodzi sprzed szoku naftowego, a 22 z lat 1974-1995 dotyczy okresu po szoku naftowym. Można więc postawić hipotezę, że mamy doczynienia z dwoma różnymi regresjami. Wobec tego dekomponujemy y, X, oraz β na: ( ) [ ] ( ) y1 X1 β1 y = X = β = y 2 gdzie y 1 oraz X 1 oznacza pierwsze 14 obserwacji, a y 2 oraz X 2 zawierają pozostałą część próby. Całe równanie możemy zapisać jako: ( ) [ ] ( ) ( ) y1 X1 0 β1 ε1 = + y 2 0 X 2 β 2 ε 2 Równanie regresji bez ograniczeń pozwala na to by współczynniki były różne w obu okresach. Nieograniczonym estymatorem metody najmniejszych kwadratów jest: b = (X X) 1 X y = X 2 [ X 1 X 1 0 0 X 2X 2 β 2 ] 1 ( X 1 y 1 X 2y 2 ) = ( b1 który jest równy estymatorom otrzymanym z dwóch mniejszych modeli. Więc całkowita suma kwadratów reszt z powyższej regresji jest równa sumie dwóch sum kwadratów reszt z oddzielnych regresji: b 2 ) e e = e 1e 1 + e 2e 2 65

Wektor współczynników dla modelu z ograniczeniami można otrzymać dwoma sposobami. Formalnie testujemy ograniczenie β 1 = β 2 można zapisać jako Rβ = q gdzie R = [I : I] oraz q = 0. Znacznie prostszym sposobem jest bezpośrednie narzucenie ograniczenia i oszacowanie jednego modelu na całej próbie. ( ) [ ] ( ) y1 X1 0 ε1 = β + 0 X 2 ε 2 y 2 Wtedy różnica między resztową sumą kwadratów modelu e R e R a całkowitą sumą kwadratów reszt podzielona przez ilość ograniczeń (J), czyli liczbę kolumn macierzy X 2. stanowi licznik statystyki F. W mianowniku jest całkowita suma kwadratów reszt modelu podzielona przez (N 1 + N 2 2k) czyli liczbę obserwacji minus liczba estymowanych parametrów. Statystyka testowa F ma rozkład F z J oraz (N 1 + N 2 2k) stopniami swobody. Inna możliwością zmiany po szoku naftowym jest, że amerykanie proporcjonalnie zmniejszyli swoją konsumpcję, ale pozostałe charakterystyki rynku takie jak elastyczność dochodowa pozostały na takim samym poziomie. Taka zmiana przesunie w dół prostą regresji pozostawiając jej współczynniki nachylenia względem poszczególnych osi układu współrzędnych bez zmian. Wobec tego równanie bez ograniczeń ma oddzielne współczynniki dla obu okresów, a równania z ograniczeniami jest pojedynczą regresją. Macierze regresorów przybierają następujące formy: [ ] i 0 Wpre73 0 (unrestricted) : X U = 0 i 0 W post73 [ ] i 0 Wpre73 (restricted) : X R = 0 i W post73 Dwie pierwsze kolumny macierzy X zawierają zmienne zero-jedynkowe wskazujące na okres z którego pochodzą obserwacje. Macierz W pre73 zawiera zmienne objaśniające dla 1 cześci próby,a macierz W post73 dla drugiej części. Po oszacowaniu dwóch regresji możemy policzyć statystykę F: F J K = (e R e R e 1e 1 e 2e 2 )/J (e 1e 1 + e 2e 2 )/n k gdzie zarówno wektor reszt e 1 jak i wektor reszt e 2 są szacowane z modelu regresji bez ograniczeń. Hipotezą zerową tego testu mówi, że obydwie regresje różnią się stałą, ale mają te same współczynniki. Testujemy ją przeciwko alternatywie, że zarówno stałe, jak i współczynniki w obu regresjach są różne. Kolejną możliwością jest, że tylko niektóre współczynniki wektora parametrów β się zmieniły, a pozostałe parametry nie uległy zmianie. Test Chowa 66

dla tego przypadku wygląda podobnie do testu na zmianę stałej. Niech Z będzie macierzą zmiennych przy których zmieniają się współczynniki, a W macierzą zmiennych, których współczynniki się nie zmieniają. Wtedy macierz regresorów X przyjmie następującą postać: [ ] ipre Z (unrestricted) : X = pre 0 0 W pre 0 0 i post Z post W post Test przeprowadza się w sposób analogiczny do poprzednich. Przykład 1. Oszacowano metodą MNK następujący model: c i = β 0 + β 1 y i + β 2 p i + ɛ gdzie: c i jest logarytmem nominalnych wydatków konsumpcyjnych gospodarstwa domowego, y i jest logarytmem jesgo nominalnego dochodu, a p i logarytmemt indeksu cen żywności. Otrzymano następujące wyniki dla 66 obserwacji: Zmienna Współczynnik Błąd standardowy stała 6.0 4.0 y 5.0 2.0 p 2.0 1.0 RSS=256, oraz macierz wariancji-kowariancji estymatorów: 16 3 5 3 4 5 5 5 1 a) Oblicz prognozę dla c t+1 jeżeli y t+1 = 2, a p t+1 = 3 b) Oblicz wariancję tej prognozy. Rozwiązanie ad a) c 0 t+1 = b 0 + b 1 y t+1 + b 2 p t+1 = 6 + 5 2 + 2 3 = 22 ad b) nieobciążony estymator wariancji jest równy: S 2 = RSS T k = 256 64 = 4 16 3 5 var(c 0 t+1) = x t+1var(b)x t+1 = [1 2 3] 3 4 5 5 5 1 1 2 3 + 4 = 147 67

Literatura [1] William H. Greene (2003) Econometric Analysis, 5th edition. 68