Agnieszka Ora Uniersye Śląski Kaoicach e-mail: agaora@pocza.one.pl, aora@ux.mah.us.edu.pl PRZYKŁAD ZASTOSOWANIA METODY ODPORNEJ W MODELOWANIU FINANSOWYCH SZEREGÓW CZASOWYCH Sreszczenie: ZałoŜenia, na kórych opierają się parameryczne meody esymacji doyczące normalności rozkładu populacji oraz niezaleŝności zmiennych, częso nie są spełnione przypadku danych finansoych. Dlaego isoną kesią jes sosoanie meod esymacji odpornej (rous esimaion) na e załoŝenia, a ym samym na jakość oseracji. Celem pracy jes implemenacja meody odpornej do modeloania szeregu czasoego arości indeksu giełdoego WIG0 o pięnasominuoej częsoliości nooań dniu 13.0.006. Do szacoania parameró srukuralnych modelu zasosoano esymaory odporne Welscha. Słoa kluczoe: oseracje odsające, oseracje nieypoe, oseracje płyoe, esymacja odporna, esymaory Welscha. WSTĘP ZałoŜenia, na kórych opierają się parameryczne meody esymacji, doyczące normalności rozkładu populacji oraz niezaleŝności zmiennych, częso nie są spełnione przypadku danych finansoych. Dlaego isoną kesią jes sosoanie meod esymacji odpornej (rous esimaion) na e załoŝenia, a ym samym na jakość oseracji. Częso ziorze danych moŝna yróŝnić arości yraźnie róŝniące się penymi cechami od pozosałych, z. oseracje odsające. Wysępoanie akich arości moŝe yć zaróno ynikiem łędnych pomiaró jak rónieŝ pochodzenia z innej populacji. Wpły oseracji odsających na yniki szacoania parameró klasyczną meodą najmniejszych kadraó (KMNK) jes isony. Wykryanie oseracji odsających oraz zapoieganie ich płyoi poprzez sosoanie meod esymacji odpornej sanoi aŝny prolem analizy saysyczno-ekonomerycznej. Znaczna grupa meod odpornych polega na odrzuceniu oseracji uaŝanych za nieypoe, a nasępnie na esymoaniu parameró na podsaie pozosałych oseracji. Usunięcie oseracji odsającej przypadku rendu oznacza zaurzenie kolejności czasoej. Dlaego, celu szacoania parameró modelu szeregu czasoego zaierającego oseracje odsające, zasosoana zosanie meoda odporna, opara na przyporządkoyaniu ym oseracjom ag zaproponoanych przez Welscha. Konsekencją akiego
80 podejścia jes zasosoanie uogólnionej meody najmniejszych kadraó (UMNK). DIAGNOSTYKA TYPÓW OBSERWACJI RozaŜmy ogólny model posaci: y = Xβ + ε, (1.1) gdzie: y jes n ymiaroym ekorem losoym, kórego arości są niezaleŝnymi oseracjami zmiennej ojaśnianej, X jes n ( k +1) ymiaroą macierzą oseracji ędących arościami k niezaleŝnych zmiennych ojaśniających modelu, β jes (k+1) ymiaroym ekorem nieznanych parameró srukuralnych modelu. Zakłada się, Ŝe składnik losoy ε ma n-ymiaroy rozkład normalny z arością oczekianą E ( ε) = 0 oraz macierzą koariancji posaci: = Cov ( ε) = σ I, gdzie I jes macierzą jednoskoą o ymiarach n n. Wyniki zasosoania określonych meod esymacji modelu (1.1) isony sposó zaleŝą od jakości danych. Na i-ą daną z i składają się ym przypadku oseracje ędące arościami k zmiennych ojaśniających oraz zmiennej ojaśnianej y, zn: z i = [x i1,, x ik, y i ], i = 1,.., n (1.) Oseracje z i mogą róŝnić się zaróno płyem na arość ocen esymoanych parameró, jak rónieŝ połoŝeniem przesrzeni R k+1. W konsekencji, ziorze danych mogą ysępoać z. oseracje odsające, yraźnie róŝniące się penymi cechami od pozosałych. Ziór oseracji, uorzony po usunięciu oseracji odsającej nazyany jes rdzeniem. Na oseracje odsające składają się da rodzaje oseracji, mianoicie oseracje nieypoe (ouliers) oraz oseracje płyoe (influenial oseraions). Oseracje nieypoe charakeryzują się iększymi arościami resz niŝ oseracje naleŝące do rdzenia. Naomias oseracje płyoe silnie płyają na arości esymaoró parameró oraz isonie oddziałują na kszał modelu. Warości resz ych oseracji nie są duŝe sosunku do arości resz oseracji naleŝących do rdzenia. Wykryanie oseracji odsających moŝe yć częso prolemem złoŝonym, złaszcza przypadku ieloymiaroym. Zasosoanie odpoiednich narzędzi słuŝących idenyfikacji ego rodzaju oseracji sanoi punk yjścia sosoaniu meod esymacji odpornej.
81 WYKRYWANIE OBSERWACJI WPŁYWOWYCH Podsaoym narzędziem słuŝącym ykryaniu oseracji płyoych jes macierz rzuoania H (ha marix) o ymiarach n n : T 1 T H = X(X X) X (1.1.1) n H jes macierzą rzuu orogonalnego przesrzeni R na podprzesrzeń R(X) generoaną przez kolumny macierzy X. Elemeny diagonalne macierzy rzuoania, oznaczane skrócie jako h i, noszą nazę ielkości płyoych (leverage). Wielkości e określają pły poszczególnych oseracji na ocenę parameró modelu. Z faku, Ŝe macierz rzuoania jes idempoenna (H =H), ynika, Ŝe 0 h i 1 (1.1.) Wpły i-ej oseracji na zmianę eoreycznej arości zmiennej ojaśnianej zaleŝy yłącznie od ielkości reszy oraz i-ej ielkości płyoej. Warości h i liskie jedności isonie płyają na arości eoreyczne i-ej zmiennej, nae jeśli arość i-ej reszy jes mała (Osasieicz, 1998). R.E Welsch (Hoaglin i in., 1978) zaproponoał próg róny h H = ( k + 1) / n, pozalający sierdzić, czy dana oseracja jes oseracją płyoą. Przyjmuje się, Ŝe jeśli arość h i odpoiadająca i-ej oseracji spełnia arunek: h i > h H (1.1.3) óczas i-ą oserację moŝna uznać za płyoą. WYKRYWANIE OBSERWACJI NIETYPOWYCH Jednym z narzędzi słuŝących idenyfikacji oseracji nieypoych są * sandaryzoane reszy e ( i) posaci: * ei e( i) =, (1..1) s( i) 1 hi n k 1 ei gdzie s ( i) = s jes oceną ariancji σ składnika n k ( n k )(1 hi ) losoego po usunięciu i-ej oseracji. Reszy dane zorem (1..1) nazyane reszami sudenyzoanymi, mają rozkład -Sudena o (n-k-) sopniach soody [Saude i in.1990, sr. 10-11]. Fak en umoŝliia przeproadzenie esu saysycznego eryfikującego hipoezę zeroą posaci: H 0 : i-a oseracja jes elemenem rdzenia, oec hipoezy alernaynej H 1 : i-a oseracja nie jes elemenem rdzenia, czyli jes nieypoa. * i > k ( n JeŜeli zachodzi arunek e ( ) α), hipoezę zeroą H 0 odrzucamy na korzyść hipoezy alernaynej H 1 na poziomie isoności α.
8 ŁĄCZNE WYKRYWANIE OBSERWACJI WPŁYWOWYCH ORAZ NIETYPOWYCH Wskaźnikiem idenyfikującym sposó łączny nieypoość i płyoość i-ej oseracji jes sandaryzoana róŝnica między arościami eoreycznymi zmiennej ojaśnianej yznaczonymi dla modelu oszacoanego na podsaie szyskich oseracji oraz modelu oszacoanego na podsaie zioru nie zaierającego i-ej oseracji: yˆ i yˆ ( i) * hi DFITSi = = e( i) (1.3.1) s h 1 h ( i) i Przyjmuje się, Ŝe i-a oseracja jes odsająca, jeśli zachodzi nasępujący arunek: i DFITS i > ( k + 1) / n (1.3.) METODOLOGIA ESTYMACJI ODPORNEJ OPARTEJ NA WAśONYCH ESTYMATORACH WELSCHA Wśród szerokiej grupy meod esymacji odpornej znajdują się m.in. meody polegające na odrzuceniu oseracji uaŝanych za nieypoe, a nasępnie esymoaniu parameró modelu na posaie pozosałych oseracji. Orzymane ym sposoem esymaory nazyane są esymaorami ucięymi. Usunięcie oseracji odsającej przypadku rendu oznacza zaurzenie kolejności czasoej. Dlaego, celu szacoania parameró modelu szeregu czasoego na podsaie szyskich oseracji, poszczególnym oseracjom przyporządkoyane są agi i o arościach z przedziału (0,1]. Oseracjom odsającym ego szeregu przypisyane są óczas agi o mniejszych arościach, naomias elemenom rdzenia agi róne 1. ZauaŜmy, Ŝe uogólniając ą meodę na przypadek, kórym oseracjom odsającym przyporządkoyane są agi róne 0, a elemenom rdzenia agi róne 1, orzymujemy meodę oparą na odrzucaniu oseracji odsających. Konsekencją podejścia oparego na przypisyaniu poszczególnym oseracjom ag i, spełniających arunek 0 < i 1 jes zasosoanie uogólnionej meody najmniejszych kadraó do esymacji parameró srukuralnych szeregu czasoego. W meodzie ej zakłada się, Ŝe składnik losoy ε ma rozkład normalny z arością oczekianą E ( ε) = 0 oraz macierzą koariancji posaci 1 = Cov ( ε) = σ W, gdzie W jes znaną symeryczną dodanio określoną macierzą o ymiarach n n.
83 1/ Isnieje óczas symeryczna i dodanio określona macierz W aka, Ŝe 1/ 1/ W = W W. Tak określony prolem moŝna sproadzić do klasycznego przypadku MNK, proadzając nasępujące oznaczenia: 1/ y = W Y (.1) 1/ X = W X (.) 1/ ε = W ε (.3) Ogólne rónanie modelu sproadza się óczas do posaci: y = X β + ε, ε ~ (, N o σ I), (.6) Esymaor ekora parameró β ędący roziązaniem nasępującego rónania normalnego: T T X y = (XX ) (.7) jes róny: T 1 T = (X X ) X y (.8) Uzględniając poyŝszej róności zaleŝności (.1) oraz (.), łao zauaŝyć, Ŝe esymaor ekora parameró β posaci (.8) yraŝa się zorem: T 1 T = (X WX ) X Wy (.9) Jes on ięc uogólnionym esymaorem MNK. Warość oczekiana i macierz koariancji esymaora są posaci: E ( ) =β, = Cov ( T ) = σ (X X 1 T 1 ) = σ (X WX ) (.10) Esymaor ariancji σ ynosi: s = e T e /( n k 1) (.11) gdzie ekor resz jes posaci (.1) e = y X (.1) RozaŜać ędziemy macierz W diagonalną o elemenach ędących agami odpoiednio przyporządkoanymi poszczególnym oseracjom. Wóczas esymaor nazyany jes aŝonym esymaorem MNK. Jeden ze sposoó yznaczania arości ag i i-ej oseracji zosał opracoany przez R.E Welscha. Zaproponoane agi i są nasępującej posaci: ei c i = x = i, min, 1 s( i) DFITS (.13) Sała c określona jes zaleŝnością: c = p ( p +1) / n, gdzie p=1,, (.14)
84 W opisanym poyŝej procesie esymacji, oseracjom odsającym c szeregu czasoego przypisyane są agi o arościach rónych. DFITS Pozosałym oseracjom przypisyane są agi róne 1. Esymaor aŝony parameró β, uzyskany przy agach posaci (.13) nazyany jes aŝonym esymaorem Welscha. Esymaor en jes odporny zaróno na oseracje płyoe, jak i na oseracje nieypoe. Meoda esymacji odpornej opara na aŝonych esymaorach Welscha jes meodą ieracyjną. W kaŝdym kroku ieracyjnym yznaczane są arości ag, esymaory parameró srukuralnych oraz ariancji σ. Macierz rzuoania H kolejnych ieracjach ynosi: T 1 T H = X (X X ) X (.15) Uzględniając poyŝszej róności posać macierzy X danej zaleŝnością (.), orzymujemy: 1/ T 1 T 1/ H = W X(X WX) X W (.16) IMPLEMENTACJA METODY Przedmioem analizy jes szereg czasoy arości indeksu giełdoego WIG0 o pięnasominuoej częsoliości nooań dniu 13.0.006. Okres adaczy oejmuje oseracje zidenyfikoane kolejnych kadransach między momenem określenia arości kursu na oarciu (godzina 9.30) a momenem określenia arości kursu na zamknięciu (godzina 16.30). Dla szeregu czasoego ych oseracji sosoanie KMNK celem szacoania parameró srukuralnych modelu linioego nie znajduje uzasadnienia, m.in. ze zględu na fak, Ŝe nie są spełnione załoŝenia ej meody. Wyznaczone pracy arości ocen esymaoró parameró modelu linioego za pomocą KMNK oraz arości saysyk określających jakość uzyskanej funkcji rendu, słuŝą przede szyskim uzasadnieniu porzey zasosoania meod esymacji odpornych na odsępsa od meody klasycznej. Wyniki esymacji uzyskane przy uŝyciu KMNK zaiera kolumna 1 aeli 1, naomias ykres linioej funkcji rendu orzymanej ą meodą oznaczono linią ciągłą na rysunku 1. W przypadku analizoanego szeregu, na yniki szacoania parameró KMNK mają pły oseracje odsające. Z porónania arości płyoych h i i-ej oseracji, i = 1K,, 7, yliczonymi na podsaie (1.1.1) z arością progoą róną h H = 0,14, ynika, Ŝe oseracjami mogącymi oddziałyać na połoŝenie linii rendu yznaczonego KMNK oraz arości ocen szacoanych parameró są oseracje piersza i osania. PonieaŜ dla rzech osanich * oseracji szeregu czasoego zachodzi arunek e ( i ) > (0,1) = 1, 71, moŝna 4
85 nioskoać na poziomie isoności 0,1, Ŝe oseracje e sanoią grupę oseracji nieypoych adanego szeregu oec rendu linioego uzyskanego yniku zasosoania KMNK. Warości resz sudenyzoanych oraz skaźnika DFITS osanich czerech oseracji zaiera kolumna druga i rzecia aeli. PonieaŜ arunek DFITS > 0, 54 zachodzi ylko dla osanich czerech i oseracji, moŝna przyjąć, Ŝe rdzeń przypadku rendu linioego yznaczonego KMNK, składa się z szyskich pozosałych oseracji. Wykorzysując agi Welscha, yliczone oparciu o arości skaźnikó DFITS, yznaczono arości esymaoró odpornych na zidenyfikoane oseracje odsające. Wyniki zaare, kolumnie drugiej aeli 1, uzyskane pierszej ieracji meodą odporną, skazują na lepszą jakość orzymanego modelu. Sopień dopasoania arości eoreycznych do danych empirycznych orzących rdzeń, nieznacznie się polepszył. W przeciieńsie do ynikó, jakie uzyskano klasyczną meodą esymacji, arości ocen parameró uzyskane meodą odporną, są isonie róŝne od zera na poziomie isoności 0,05. Warościami odsającymi od rendu linioego yznaczonego po pierszej ieracji przez oceny esymaoró odpornych są dane oseroane czasie = 4, 5, 6. Wyniki doyczące esymacji odpornej zaare aeli 1 skazują, Ŝe raz z kaŝdą z pięciu dokonanych ieracji jakość uzyskianych modeli odpornych polepsza się. Zmiany połoŝenia linii rendu przesrzeni R zilusroane na rysunku 1, odzierciedlają zros spółczynnikó kierunkoych prosych yznaczanych kolejnych ieracjach. Tym samym zrasa arość płyoa h 1 pierszej oseracji szeregu, podczas gdy arości płyoe oseracji odsających maleją z kaŝdą ieracją. Przykładoo, yniki uzyskane pierszych dóch ieracjach doyczące arości spółczynnikó DFITS oraz resz sudenyzoanych osanich czerech oseracji zamieszczono aeli. Isonym prolemem idenyfikacji oseracji odsających oraz sosoania meod odpornych jes odpoiednia specyfikacja modeli rendu, uzględniających charaker kszałoania się arości analizoanych zmiennych. Najlepszą funkcją rendu opisującą zmiany arości indeksu giełdoego WIG0 jes ielomian szósego sopnia, gdyŝ spółczynnik deerminacji dla ego rendu przyjmuje najiększą arość klasie rendó ędących funkcjami elemenarnymi. Oceny szacoanych za pomocą KMNK nieznanych parameró srukuralnych modelu oraz arości saysyk określających jakość uzyskanej funkcji rendu zaiera kolumna 1 aeli 3. Wykres ielomianoej funkcji rendu orzymanej ą meodą oznaczono linią ciągłą na rysunku. Podonie, jak przypadku rendu linioego yznaczonego za pomocą KMNK, najyŝsze arości płyoe h i róne 0,84 posiadają oseracje piersza oraz osania. PonieaŜ arości resz sudenyzoanych odpoiadające oseracjom * momencie =,3,6,7, spełniają arunek e ( i ) > (0,1) = 1, 7, moŝna nioskoać na poziomie isoności 0,1, Ŝe oseracje e są nieypoe oec 0
86 rendu ielomianoego, kórego paramery srukuralne oszacoano KMNK. Wyznaczone arości skaźnika DFITS dla poszczególnych oseracji skazują, Ŝe oseracja piersza oraz die osanie nie są elemenami rdzenia. Wyniki jakie uzyskano na skuek esymacji parameró srukuralnych modelu ielomianoego meodą klasyczną oraz kolejnych dóch ieracjach odpornej meody Welscha, zaare są aeli 3. Wykresy orzymanych funkcji rendó ielomianoych przedsaia rysunek. Taela 1. Wyniki esymacji KMNK oraz OMW dla rendu linioego 0 KMNK (0) 781,03 (3,74) Odporna Meoda Welscha (OMW) Ieracja 1 Ieracja Ieracja 3 Ieracja 4 Ieracja 5 1 3 4 5 6 Sa. (1) Sa. () Sa. (3) Sa. (4) Sa. (5) Sa. 778,75 777,98 777,49 777,05 776,76 746,86 1013,99 111,71 11,9 1308,31 (,740) (,477) (,73) (,07) (,004) 146,04 1 0,353 (0,3) 1,4 0,5956 (0,188) 3,17 0,686 (0,17) 3,98 0,747 (0,159) 4,66 0,873 (0,15) 4,98 0,9307 (0,103) 5,03 R 0,077 0,694 0,3689 0,4389 0,599 0,6745 s e 88,4853 64,5536 55,7583 49,575 41,5339 8,7583 s e 43,6984 35,1170 9,3015,574 17,834 Źródło: oliczenia łasne 810,0 805,0 800,0 795,0 790,0 785,0 780,0 775,0 770,0 765,0 0 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 1 3 4 5 6 7 8 ieracja 1 ieracja ieracja 3 Linioy (KMNK) Rysunek 1. Wykresy linioych funkcji rendu arości indeksu WIG0 uzyskanych meodami: klasyczną i odporną
87 Taela. Charakerysyki oseracji odsających zględem rendu linioego Odporna Meoda Welscha KMNK Ieracja 1 Ieracja Nr oseracji DFITS e * (i) DFITS e * (i) DFITS e * (i) 4 0,56 1,69 0,98 3,57 0,98 4,65 5 1,01,85 1,56 7,7 3,38 19,16 6 1,03,74 1,54 6,84,93 15,48 7 0,8,0 0,5 1,91 0,49 1,75 Źródło: Oliczenia łasne 810,0 805,0 800,0 795,0 790,0 785,0 780,0 775,0 770,0 765,0 0 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 1 3 4 5 6 7 8 ieracja ieracja 1 Wielom. (KMNK) Rysunek. Wykresy funkcji rendó ielomianoych szósego sopnia arości indeksu WIG0 uzyskanych meodami: klasyczną i odporną Taela 3. Wyniki esymacji KMNK oraz OMW dla rendu ielomianoego KMNK Odporna Meoda Welscha (OMW) Ieracja 1 Ieracja 1 3 (0) Sa. (1) Sa. () Sa. 0 799,3949 (14,444) 193,81 807,53 (7,989) 351,4 810,581 (19,771) 14,15 1-3,7649 (1,91) -,54-3,6950 (7,89) -4,49-35,1736 (15,054) -,34 1,0174 (3,750) 3,0 10,587 (,156) 4,91 11,191 (4,07),79 3-1,7339 (0,485) -3,57-1,4159 (0,84) -4,97-1,4839 (0,503) -,95 4 0,1186 (0,031) 3,83 0,0919 (0,018) 4,95 0,0949 (0,03),99 5-0,0038 (0,001) -4,0-0,009 (0,0005) -4,90-0,009 (0,001) -,94 6 0,00004 (0,00001) 4,18 0,00001 (0,00001) 4,83 3,40486E-05 (0,00001),85 R 0,6541 0,4938 0,7174 s e 41,491 44,7157 4,9683 s e 17,5595 1,013 Źródło: Oliczenia łasne
88 PODSUMOWANIE Wysępoanie oseracji odsających ma szczególnie znaczenie modeloaniu arości zmiennych mających posać finansoych szeregó czasoych. PonieaŜ usunięcie oseracji odsających przypadku rendu oznacza zaurzenie kolejności czasoej, kluczoym prolemem saje się doór odpoiednich meod esymacji parameró modelu szeregu czasoego. W niniejszej pracy omóiono i zasosoano jedną z meod esymacji, kóre uzględniają oseracje odsające i jednocześnie są na nie odporne. W ym celu do szacoania parameró srukuralnych szeregu czasoego arości indeksu giełdoego WIG0 ykorzysano aŝone esymaory Welscha. Isoną zaleą ych esymaoró jes odporność na oseracje odsające, zaróno ze zględu na płyoość jak i nieypoość. Własność a ma szczególne znaczenie procesie modeloania finansoych szeregó czasoych, kórym aŝną rolę odgrya odpoiednia specyfikacja moŝliych do zasosoania funkcji rendu. Wyór posaci funkcji rendu deerminuje oiem idenyfikację oseracji odsających, kóre z kolei mają isony pły na oceny szacoanych parameró modelu. LITERATURA Hoaglin D.C., Welsch R.E. (1978), The Ha Marix in Regression and ANOVA, The American Saisician, Vol.3, Issue 1, sr. 17 Osasieicz W. (1998), Saysyczne meody analizy danych, Wyd. AE Wrocła sr: 35-74. Rousseeu P. J., Leroy A. M. (003), Rous Regression and Oulier Deecion, Jonh Wiley&Sons, Ne Jersey. Saude R.G, Sheaher S.J. (1990), Rous Esimaion and Tesing, Jonh Wiley&Sons, Ne York. Sample applicaions of he rous esimaion o financial ime series Summary: The assumpions hich consiue he asis for parameric esimaion echniques, relaing o he normaliy of disriuion of he populaion as ell as independen variales, are ofen no fulfilled in he case of financial daa. Therefore i is imporan o use rous esimaion mehods, oh in erms of hese assumpions and in erms of he qualiy of oservaions. The paper aims o implemen he rous esimaion o modelling he ime series of he WIG0 index of he 15-minue frequency on 13 Feruary 006. The srucural parameers of he model ere esimaed ih he use of he Welsch esimaors. Key ords: ouliers, influenial oservaions, rous esimaion, Welsch esimaors