WYKŁAD: Szeregi czasowe II. Zaawansowane Metody Uczenia Maszynowego

Podobne dokumenty
Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Finansowe szeregi czasowe

WYKŁAD: Szeregi czasowe I. Zaawansowane Metody Uczenia Maszynowego

3. Analiza własności szeregu czasowego i wybór typu modelu

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Analiza autokorelacji

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Stacjonarność Integracja. Integracja. Integracja

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Estymacja parametrów w modelu normalnym

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Stosowana Analiza Regresji

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Modele warunkowej heteroscedastyczności

3. Modele tendencji czasowej w prognozowaniu

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Stosowana Analiza Regresji

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka

Spis treści 3 SPIS TREŚCI

Prawdopodobieństwo i statystyka

1 Gaussowskie zmienne losowe

Heteroskedastyczość w szeregach czasowyh

Analiza regresji - weryfikacja założeń

Stacjonarne procesy gaussowskie, czyli o zwiazkach pomiędzy zwykła

Zawansowane modele wyborów dyskretnych

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Przyczynowość Kointegracja. Kointegracja. Kointegracja

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Estymacja parametrów rozkładu cechy

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Modelowanie rynków finansowych

Ćwiczenie 5 PROGNOZOWANIE

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Stopę zbieżności ciagu zmiennych losowych a n, takiego, że E (a n ) < oznaczamy jako a n = o p (1) prawdopodobieństwa szybciej niż n α.

Statystyka i eksploracja danych

Detekcja rozkładów o ciężkich ogonach

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Statystyka i eksploracja danych

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

PDF created with FinePrint pdffactory Pro trial version

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Rozkłady dwóch zmiennych losowych

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

Rozdział 8. Regresja. Definiowanie modelu

Zmienne zależne i niezależne

5. Model sezonowości i autoregresji zmiennej prognozowanej

Analiza składowych głównych. Wprowadzenie

Prawdopodobieństwo i statystyka

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Wykład 3 Momenty zmiennych losowych.

Natalia Neherbecka. 11 czerwca 2010

Wykład 3 Momenty zmiennych losowych.

Matematyka ubezpieczeń majątkowych r.

Oznacza to, że chcemy znaleźć minimum, a właściwie wartość najmniejszą funkcji

Statystyka i Analiza Danych

4. Średnia i autoregresja zmiennej prognozowanej

Statystyka matematyczna dla leśników

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Następnie przypominamy (dla części studentów wprowadzamy) podstawowe pojęcia opisujące funkcje na poziomie rysunków i objaśnień.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Regresja i Korelacja

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Modelowanie ekonometryczne

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Logarytmy. Funkcje logarytmiczna i wykładnicza. Równania i nierówności wykładnicze i logarytmiczne.

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Metody probabilistyczne

KORELACJE I REGRESJA LINIOWA

WYKŁAD 8 ANALIZA REGRESJI

Modelowanie Rynków Finansowych

Regresja linearyzowalna

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

STATYSTYKA MATEMATYCZNA WYKŁAD listopada 2009

Rachunek prawdopodobieństwa Rozdział 5. Rozkłady łączne

Prawdopodobieństwo i rozkład normalny cd.

STATYSTYKA MATEMATYCZNA

Transkrypt:

WYKŁAD: Szeregi czasowe II Zaawansowane Metody Uczenia Maszynowego

Zwroty indeksów finansowych Y t : indeks finansowy w momencie t (wartość waloru, kurs walutowy itp). Określimy zwrot indeksu finansowego jako jego relatywną zmianę. Z reguły rozpatruje się dwa rodzaje zwrotów: Zwrot prosty Y t w momencie t (simple return) jest zdefiniowany jako R t = Y t Y t 1 Y t 1 Zwrot prosty jest zmianą Y t, Y t = Y t Y t 1 względem wartości Y t 1. Znacznie częściej używanym zwrotem jest zwrot logarytmiczny Y t w momencie t (dla okresu czasu h = 1) zdefiniowany jako R t = log(y t /Y t 1 ) = (1 B) log Y t = log Y t = log(1+ Y t Y t 1 Y t 1 ) R t, gdzie przybliżona rowność zachodzi, gdy wartość R t jest mała. (BY t = Y t 1.)

Zwroty indeksów finansowych cd Analogicznie definiuje się zwrot logarytmiczny dla okresu czasu h: R t,h = log(y t /Y t h ). Kilka użytecznych własności powoduje, że zwroty logarytmiczne są częściej używane. Suma zwrotów logarytmicznych dla h kolejnych jednostek czasu daje zwrot logarytmiczny dla okresu czasu h R t +... +... R t h+1 = log(y t /Y t h ). Zwroty logarytmiczne są symetryczne: ujemna wartość zwrotu logarytmicznego równa co do wartości bezwzględnej dodatniej wartości w poprzednim momencie oznacza powrót do tej samej wartości indeksu. Np. R t = log( Y t Y t 1 ) = 0, 5 R t+1 = log( Y t+1 Y t ) = 0, 5 wtedy Y t+1 = exp( 0, 5)Y t = exp( 0, 5) exp(0, 5)Y t 1 = Y t 1.

Inaczej dla zwrotów prostych R t = (Y t Y t 1 ) Y t 1 = 0.5 R t+1 = (Y t+1 Y t ) Y t = 0.5, then Y t+1 = 0.5Y t = 0, 5 1, 5Y t 1 = 0.75Y t 1. Historycznie pierwszym modelem dla zwrotów (R t ) była hipoteza bładzenia przypadkowego: Hipoteza bładzenia przypadkowego R t jest ciągiem niezależnych zmiennych losowych o tym samym rozkładzie. Niezgodna z faktami empirycznymi, które później sformułowano w postaci praw (stylizowanych faktów) zwrotów finansowych.

Stylizowane fakty o zwrotach indeksów finansowych Analiza danych finansowych prowadzi do sformułowania trzech faktów o zwrotach: Ogony rozkładu zwrotów R t maleją wolniej niż rozkładu N(0, 1); R t są nieskorelowane, ale Rt 2 są skorelowane, Duże zmiany kolejnych wartości R t często następują po poprzednich dużych zmianach indeksu. Zauważmy, że drugi i trzeci z faktów przeczy hipotezie błądzenia przypadkowego. Zdefiniujmy zmienność (volatility) indeksu jako pewną miarę rozproszenia R t, z reguły odchylenie standardowe, ale, w zależności od kontekstu, rozumiane bezwarunkowo lub warunkowo pod warunkiem przeszłości procesu.

Pierwszy fakt stylizowany Rozpatrzmy pierwszy fakt stylizowany dla indeksu S&P500. Dla tego szeregu min R t = 23%. Przy założeniu normalności prawdopodobieństwo, że otrzymamy taką wartość lub większą wynosi 2, 23 10 97, to powinno zdarzyć się nie częściej raz na 10 96 lat (wiek ziemi oceniany jest na 10 7 lat). Przeczy to w oczywisty sposób normalności rozkładu zwrotów. Poniżej histogram indeksu S&P500 (w procentach i obciety na 4%) z nałożoną gęstością rozkładu normalnego ze średnia i wariancją takimi, jak parametry empiryczne.

Poniżej histogram indeksu S&P500 (w procentach i obciety na 4%) z nałożoną gęstościa rozkładu normalnego ze średnia i wariancją takimi, jak parametry empiryczne. Histogram of SPtrunc Density 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 SPtrunc Zauważmy, że pik rozkładu zwrotów jest wyższy niż pik referencyjnego rozkładu normalnego. Jednocześnie jego ogony są grubsze niż rozkładu normalnego. Ponadto ramiona rozkładu empirycznego są niższe niż dla rozkładu normalnego. Dwie pierwsze obserwacje oznaczają, że jest więcej dni z mniejszą i większą zmiennością indeksu w rzeczywistości niż dla dopasowanego rozkładu normalnego.

y y y y Spróbujmy dopasować inny rozkład niż rozkład normalny. Rysunki poniżej przedstawiają wykresy kwantylowe dla rozkładu normalnego vs rozkład empiryczny i analogiczne wykresy dla rozkładu z 3,4 i 5 stopniami swobody (pokazanymi zgodnie z ruchem zegara) 0.10 0.00 0.05 0.10 0.10 0.00 0.05 0.10 3 2 1 0 1 2 3 5 0 5 norm quantiles t quantiles 0.10 0.00 0.05 0.10 0.10 0.00 0.05 0.10 20 10 0 10 20 10 5 0 5 10 t quantiles t quantiles Najlepsze dopasowanie uzyskuje się dla rozkładu t z 4 st. swobody.

Rysunek poniżej pokazuje zwroty dla Y będącego indeksem S&P500 od początku wieku do 31 sierpnia 2012 roku (na podstawie cen zamknięcia). Skupiska zmienności są bardzo wyraźnie. y 0.10 0.05 0.00 0.05 0.10 2000 2002 2004 2006 2008 2010 2012 Index

Drugi fakt stylizowany stwierdza, że zwroty są nieliniowo zależne. Tak dzieje się również w następującym przykładzie. Jesli X jest symetryczną zmienna losową i rozpatrzymy parę zmiennych X i Y = X 2. T e zmienne są oczywiście zależne, ale nie liniowo zależne: ρ(x, Y ) = 0, gdyż Cov(X, Y ) = EX X 2 EXEX 2 = 0. W takich sytuacjach współczynnik korelacji nie wykryje zależności między zmiennymi. Podobne zjawisko występuje dla zwrotów indeksów finansowych. Rozpatrzmy wykresy ACF dla Y = S&P500 i jego kwadratu.

Wykres ACF sugeruje, że zwroty Y są nieskorelowane. Jednakże, powtarzająca się zależność jest widoczna na drugim rysunku. AdjClose ACF 0.0 0.4 0.8 0 5 10 15 20 Lag AdjClose ACF 0.0 0.4 0.8 0 5 10 15 20 Lag

Procesy ARCH(p) Zdefiniujemy teraz klasę procesów ARCH (Autoregressive Conditionally Heteroscedastic) wprowadzonych przez Engle a w 1982 dla modelowania inflacji w Wielkiej Brytanii. Niech p N. (X t ) jest procesem ARCH(p) jeśli X t = σ t Z t, σ 2 t = α 0 +α 1 X 2 t 1+ +α p X 2 t p, α 0, α 1,..., α p 0, gdzie Z t jest silnym WN(0, 1) (ciąg niezależnych zmiennych losowych) i Z t jest niezależne od X s, s < t. Zauważmy, że warunkując dostaniemy EX t = EE(σ t Z t X s, s < t) = Eσ t E(Z t X s, s < t) = Eσ t E(Z t )) = 0

Podobnie uzyskujemy Var(X t X s, s < t) = α 0 + α 1 X 2 t 1 + + α p X 2 t p. Tak więc Var(X t X s, s < t) jest kombinacją afiniczną poprzednich wartości X 2 s. Zatem duże wartości X 2 t 1,... X 2 t p implikują dużą wartość Var(X t X s, s < t). Odpowiada to drugiemu faktowi stylizowanemu. Własności procesu ARCH(p) Stacjonarny proces ARCH(p) istnieje gdy p j=1 α i < 1. Wtedy EX t = 0 VarX t = α 0 1 p j=1 α. i

Własności procesu ARCH(p) cd X t jest słabym białym szumem (ciągiem nieskorelowanych zmiennych losowych). Jeśli EZt 4 < to p Xt 2 = α 0 + α i Xt i 2 + ε t, i=1 ( ) gdzie ε t = (Zt 2 1)(α 0 + p i=1 α ixt i 2 ) jest słabym białym szumem. Kurtoza X t jest nie mniejsza niż kurtoza Z t : gdzie κ X = EX 4 /σ 4 X κ Xt κ Zt, (miara grubości ogona rozkładu). Własność (*) jest ważna w identyfikacji: Xt 2 zachowuje się jak proces AR(p)!

Procesy GARCH(p, q) Proces GARCH(p, q) : uogólniony ARCH(p) (X t ) t Z jest procesem GARCH(p, q) (Generalized ARCH) jeśli X t = σ t Z t, (1) σt 2 = p q α 0 + α i Xt i 2 + β j σt j, 2 (2) i=1 gdzie, jak poprzednio Z t jest niezależny od of X s, s < t, p, q N, p 1 wszystkie współczynniki α 0, α i, β j są nieujemne. j=1

Procesy GARCH(p, q) Własności procesu GARCH(p, q) Stacjonarny proces GARCH(p, q) istnieje gdy Wtedy p α i + j=1 EX t = 0 VarX t = q β j < 1. j=1 Var(X t X t s, σ 2 t s) = α 0 + α 0 1 p i=1 α i q j=1 β j p α i Xt i 2 + β j σt j 2 i=1 zależność wariancji warunkowej od σ 2 t j.

Własności procesu GARCH(p, q) cd Jeśli EZ 4 t < to p q Xt 2 = α 0 + (α i + β j )Xt j 2 + ε t i=1 q β j ε t j, j=1 gdzie α p+j = β q+j = 0, dla j 1 i p q = max(p, q). Żeby udowodnić ostatnią równość, zauważmy, że gdzie X 2 t = σ 2 t + X 2 t σ 2 t = α 0 + p α i Xt i 2 + i=1 ε t = X 2 t σ 2 t q β j σt j 2 + ε t, Tak więc podstawiając ε t j = X 2 t j σ2 t j, otrzymujemy przedstawienie. Własność ważna w identyfikacji: kwadrat procesu GARCH(p, q) jest procesem ARMA(p, q)!. j=1

Modelowanie procesów niestacjonarnych Wiele procesów jest niestacjonarnych tzn. trajektorie wykazują istnienie trendu i/lub komponent sezonowych. Jak modelować takie procesy? Klasyczny addytywny model procesu niestacjonarnego X t = m t + s t + Y t, gdzie Y t jest procesem stacjonarnym w szerszym sensie o średniej 0, m t jest deterministycznym trendem i s t jest deterministycznym komponentem sezonowym (tzn istnieje takie d N, że s t+d = s t ) Jeśli s t 0, to m t może być estymowane metodami funkcji regresji, np przy użyciu średniej ruchomej lub estymatora lokalnie liniowego. Jeśli komponent sezonowy jest niezerowy, to z reguły dokonuje się wstepnej estymacji nieparametrycznej trendu z długościa okna d (przy założeniu, że d i=1 s i = 0 i d jest znane), po odjęciu estymatora trendu estymuje sie składową sezonową, a później parametryczy model dopasowany do X t ˆm t ŝ t. (procedura pięciostopniowa).

Procedura Holta-Wintersa Inne podejście: procedura Holta-Wintersa. Opiszemy metodę najpierw dla sytuacji s t 0. Zamiast estymacji tylko trendu m t będziemy estymowali trend i jego zminę (m t, b t ), gdzie b t oznacza zmianę trendu w momencie t. Procedura jest rekurencyjna. Niech 0 α, β 1 będą parametrami metody. Zdefiniujmy (równania H-W) { m n+1 = ( m n + b n )(1 α) + αx n+1, 0 α 1, b n+1 = ( m n+1 â n )β + (1 β) b n, 0 β 1, i kładziemy m 2 = X 2, b 2 = (X 2 X 1 ),

W momencie n + 1 tend estymowany jest przez kombinację wypukła trendu w momencie n + 1 (tj. m n + b n h dla h = 1) oraz wartości obserwacji X n+1. Równania H-W są rozwiązywane rekurencyjnie dla i = 3,..., n. W przypadku ogólnym chcemy estymować (m t, b t, s t ),, gdzie s t ma okres d. Równania H-W mają postać m n+1 = ( m n + b n )(1 α) + α(x n+1 ŝ n+1 d ), 0 α 1, b n+1 = ( m n+1 m n )β + (1 β) b n, 0 β 1, ĉ n+1 = (1 γ)ŝ n+1 d + γ(x n+1 m n+1 ), 0 γ 1.

W pierwszym równaniu wykorzystaliśmy fakt, że estymator składowej sezonowej s n+1, ktory nie jest dostępny w momencie n + 1, może być zastąpiony przez estymator ŝ n+1 d. Ponadto: m d+1 = X d+1, b d+1 = (X d+1 X 1 )/d, ŝ i = Y i (Y 1 + b d+1 (i 1)), i = 1, 2,..., d. Standardowa metoda wyboruα, β i γ to: (α 0, β 0 ) := arg min α,β,γ n i=d+1 (X i X i (α, β, γ)) 2. Estymatory Holta -Wintersa dają prognozę X n+h, mianowicie X n+h = â n + b n h + ĉ n+h d ]

Wygładzanie wykładnicze W przypadku gdy β = γ = 0 i tylko α 0 mamy: m n+1 = m n (1 α) + αx n+1 Rozwiązanie explicite (wygładzanie wykładnicze) t 1 m t+1 = α(1 α) j X t+1 j + (1 α) t X 1. j=0 Zauważmy, że dla estymacji m t+1 wpływ X t+1 j dany przez współczynnik α(1 α) j maleje wykładniczo, stąd nazwa metody (często wprowadzana niezależnie od metody Holta-Wintersa).