Wykład z Nowej ekonometrii, 7 marca 2006: Na mojej stronie internetowej podane są pliki z danymi: http://akson.sgh.waw.pl/~ewams/mills.zip http://akson.sgh.waw.pl/~ewams/mills_obligacje.xls dane z pierwszego wydania książki Terence a C. Millsa The econometric modelling of financial time series, Cambridge University Press; arkusz Excela, zawiera dane dotyczące obligacji japońskich, amerykańskich, brytyjskich oraz niemieckich. Dane: LONG, EXCH, RPI, BONDUK ze zbioru mills.zip przychody z długoterminowych obligacji rządowych w Wielkiej Brytanii, kurs wymiany dolara amerykańskiego i funta szterlinga, wskaźnik cen detalicznych, zwroty z brytyjskich obligacji, dane dzienne od 1 kwietnia 1986 do 29 grudnia 1990 r. BONDUK - zwroty z brytyjskich obligacji, dane dzienne od 1 kwietnia 1986 do 29 grudnia 1990 r. LONG: Przychód z 20-letnich obligacji rządowych, dane kwartalne, od 1952Q1 do 1988Q4 (148 obserwacji). EXCH: kurs wymiany dolara amerykańskiego i funta szterlinga, obserwacje tygodniowe, od 1 tygodnia 1980 do 2. tygodnia 1989 (470 obserwacji). RPI: wskaźnik cen detalicznych, obserwacje miesięczne od stycznia 1965 do grudnia 1990 (312 obserwacji). Przy przenoszeniu danych z plików tekstowych do Excela metodą kopiowania proszę pamiętać o zastąpieniu kropek dziesiętnych przecinkami! PcGive i GiveWin umożliwia otwieranie plików Excela. Trzeba jednak przy otwieraniu plików (w oknie GiveWina: File - Open Data File )
1. wybrać rozszerzenie Excela,.xls, 2. podać częstotliwość obserwacji (miesięczne, tygodniowe lub dzienne) oraz daty. Mills_obligacje.xls zawiera dane dla obligacji japońskich, BONDJP, amerykańskich, BONDUS, brytyjskich, BONDUK, oraz niemieckich (dla Niemiec Zachodnich, do momentu zjednoczenia): BONDWG. Pierwszy krok: analiza jakościowa zachowania zmiennych: Otwieramy w GiveWin pliki z danymi. (Najpierw arkusz w Excelu zapisujemy w starszej wersji Excela: Zapisz jako > Excel 2.1 ) Dla każdej ze zmiennych obliczamy jej przyrosty za pomocą Algebry (w Tools, okno GiveWin). Oglądamy pary wykresów: dla zmiennej i dla jej przyrostów; Stosujemy statystykę opisową z okna PcGive a do zbadania własności każdej ze zmiennych (obliczamy minima, maksima, średnie arytmetyczne, porównujemy zbiór obserwacji zmiennej z empirycznym rozkładem normalnym, itd.) Można wyznaczyć przyrosty zmiennych oraz obliczyć minimum, maksimum i średnią arytmetyczną w arkuszu Excela. Porównanie rozkładu empirycznego z rozkładem normalnym wygodniej jest przeprowadzić w pakietach statystycznych lub ekonometrycznych. Drugi krok: estymacja modelu w PcGive na przykładzie danych dla zwrotów z obligacji: 1) Uruchamiamy PcGive. 2) Otwieramy plik z danymi: w oknie GiveWin: FILE > OPEN > FILE Tu przechodzimy do odpowiedniego podkatalogu i wybieramy nazwę: Mills_obligacje.xls Plik otwieramy jako niedatowany: Annual (or undated) Automatycznie powinny się pojawić numery obserwacji: od 1 do 960.
3) W kolejnych czterech kolumnach pliku z danymi znajdują się obserwacje dla kolejnych zmiennych. Wybierając z okna PcGive a Data > Data description otrzymujemy dla każdej ze zmiennych zestaw statystyk takich, jak: minima, maksima, średnia, odchylenie standardowe, wartość statystyki testu Jarque-Bera normalności rozkładu.
4) DYGRESJA: W tym samym oknie można uruchomić test pierwiastka jednostkowego dla badanych zmiennych:
Wyniki są następujące: Unit-root tests 4 to 960 Critical values: 5%=-2.865 1%=-3.44; Constant included Uwaga! PCGIVE podaje asymptotyczne wartości krytyczne testu pierwiastka jednostkowego! t-adf BONDJP -0.41911 BONDUK -1.1274 BONDUS -1.5363 BONDWG 0.73626 Obliczone wartości statystyki testu Dickeya-Fullera są większe niż wartości krytyczne, zatem nie ma podstaw do odrzucenia hipotezy
zerowej o niestacjonarności zmiennych. Sprawdzamy teraz przyrosty zmiennych, utworzone przy użyciu polecenia Tools > Algebra z głównego okna GiveWin. dbondjp = diff(bondjp, 1); dbonduk = diff(bonduk, 1); dbondus = diff(bondus, 1); dbondwg = diff(bondwg, 1); Wyniki testu ADF dla przyrostów zmiennych są następujące: Unit-root tests 5 to 960 Critical values: 5%=-2.865 1%=-3.44; Constant included t-adf dbondjp -13.075** dbonduk -16.175** dbondus -16.174**
dbondwg -15.797** Zatem dla wszystkich czterech zmiennych hipoteza zerowa o niestacjonarności pierwszych przyrostów zostaje odrzucona na rzecz hipotezy alternatywnej o stacjonarności. Badane zmienne są zintegrowane stopnia 1. KONIEC DYGRESJI. 5) Estymacja regresji liniowej w PcGive: Szacujemy równanie zawierające wszystkie cztery zmienne (metodą najmniejszych kwadratów): PcGive > Model > Model Formulate: bez opóźnień. Zmienną objaśniającą jest BONDJP, dlatego jest oznaczona symbolem E (jak zmienna endogeniczna). Automatycznie dołączany jest wyraz wolny (Constant).
Przy wyborze metody estymacji najpierw wybieramy przycisk Options (na dole po prawej stronie). Przechodzimy do opcji dotyczących wyników estymacji (Output). Między innymi wybieramy Instability tests oraz Graphic analysis. W ten sposób otrzymujemy wyniki testów niestabilności modelu. EQ( 1) Modelling BONDJP by RLS (using Mills_obligacje.xls) The present sample is: 1 to 960 Variable Coefficient Std.Error t-value HCSE PartR^2 Instab Constant 3.7606 0.14177 26.527 0.17427 0.4240 8.22** BONDUK -0.095887 0.018525-5.176 0.019765 0.0273 8.44** BONDUS -0.31752 0.014278-22.238 0.015810 0.3409 8.19** BONDWG 0.75655 0.024059 31.446 0.022755 0.5084 9.59**
R^2 = 0.696524 F(3,956) = 731.39 [0.0000] \sigma = 0.3388 DW = 0.0222 RSS = 109.7348461 for 4 variables and 960 observations Instability tests, variance: 10.9413** joint: 40.5384** Information Criteria: SC = -2.14025 HQ = -2.15281 FPE=0.115264 AIC = -2.16053 Seasonal means of differences are 0.00131 R^2 relative to difference+seasonals = -72.78075 AR 1-2 F( 2,954) = 19860 [0.0000] ** ARCH 1 F( 1,954) = 21590 [0.0000] ** Normality Chi^2(2)= 64.33 [0.0000] ** Xi^2 F( 6,949) = 16.787 [0.0000] ** Xi*Xj F( 9,946) = 16.225 [0.0000] ** RESET F( 1,955) = 16.618 [0.0000] ** Po oszacowaniu badanego modelu przechodzimy w PcGive do menu Test > Recursive graphics i wtedy możemy miedzy innymi wybrać Beta coefficient +/- 2 SE oraz Chow tests: 4 5% 1up CHOWs 2 30 100 200 300 400 500 600 700 800 900 5% Ndn CHOWs 20 10 15 100 200 300 400 500 600 700 800 900 5% Nup CHOWs 10 5 100 200 300 400 500 600 700 800 900
Są to trzy wersje rekurencyjnego testu Chowa: dla próby zwiększanej o 1 obserwację; dla podpróby od t 0 do końca próby, dla podpróby od pierwszej obserwacji do obserwacji o numerze t 1. Niebieska linia pozioma odpowiada wartości krytycznej, zatem jeśli linia czerwona (wykres rekurencyjnych wartości testu Chowa) jest dla pewnej obserwacji powyżej linii niebieskiej, oznacza to możliwość niestabilności modelu. Konstrukcja testu Chowa: Niech T oznacza moment podziału całości zestawu obserwacji na dwie części. Niech cała próba liczy T* elementów. Hipoteza zerowa zakłada, że oceny parametrów nie zmieniają się dla pierwszej części i dla całości próby. (1) Szacujemy model (o k zmiennych objaśniających) na podstawie pierwszej części próby. Niech RSS oznacza sumę kwadratów reszt. (2) Szacujemy ponownie model na podstawie całości zbioru obserwacji. Niech RSS* oznacza sumę kwadratów reszt wyznaczonych na podstawie tak otrzymanych ocen parametrów. Wartość statystyki testu Chowa jest określona wzorem: ( RSS * RSS) /( T * T ) RSS /( T k) i przy założeniu prawdziwości hipotezy zerowej ma asymptotyczny rozkład F o (T* T) i (T k) stopniach swobody. Jeśli obliczona wartość statystyki testu Chowa jest większa niż wartość krytyczna odczytana z tablic rozkładu F dla przyjętego poziomu i odpowiednich stopni swobody, hipotezę zerową o stabilności modelu należy odrzucić. Przykład zastosowania:
Jeśli chcemy sprawdzić przydatność konstruowanego modelu do prognozowania, możemy zachować pewną część (końcową) zbioru obserwacji w celu zbadania dokładności prognozy wyznaczonej dla tych końcowych obserwacji. W tym celu można wykorzystać właśnie test Chowa. Pierwszą część próby, od 1 do T- obserwacji, traktujemy jak zestaw danych, na podstawie których oszacowano model, drugą część próby od T+1-obserwacji do końca próby, jako okres, dla którego wyznaczamy prognozę. Hipoteza zerowa zakłada, że wartości parametrów w okresie próby i w okresie prognozy są jednakowe. Jeśli obliczona wartość statystyki testu Chowa przekracza odpowiednią wartość krytyczną, odrzucamy hipotezę zerową na rzecz alternatywnej, która oznacza, że niektóre wartości parametrów mają inne wartości dla okresu prognozy niż dla okresu próby. Graficzna analiza stabilności parametrów. Inną metodą sprawdzenia stałości parametrów jest analiza wykresów rekurencyjnych oszacowań parametrów. Sporządzamy wykresy ocen dla każdego z parametrów z osobna, przy czym pierwsza wartość oceny jest wwyznaczona na podstawie pierwszych np. 15 obserwacji, druga na podstawie 16 obserwacji, itd., ostatnia na podstawie całego zbioru obserwacji. Oczywiście zwiększanie 15-elementowego zestawu danych o jedna obserwację może bardzo zmienić otrzymane wartości ocen. Parametry są jednak stabilne, jeśli widać, że przy zwiększaniu liczebności podpróby wartości ocen stabilizują się na pewnym poziomie. Na przykład, dla ocen wyrazu wolnego wyraźnie widoczna jest zmiana znaku na ujemny w okolicach 200. obserwacji i na dodatni w okolicach 600. obserwacji. Oceny parametru przy BONDUK są znacznie bardziej stabilne, podobnie jak oceny parametru przy BONDUS. Dla BONDWG widać zmianę w okolicach 200. obserwacji.
5 2.5 Constant.2 BONDUK 0 0-2.5-5 -.2 150 300 450 600 750 900 150 300 450 600 750 900 BONDUS BONDWG 0 2 -.5 1-1 150 300 450 600 750 900 150 300 450 600 750 900 Przed zakończeniem pracy proszę zapisać nowe pliki z danymi w formacie PcGive'a (w oknie GiveWin: File-Save jako plik z rozszerzeniem.in7).