Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Podobne dokumenty
WYKŁAD: Szeregi czasowe I. Zaawansowane Metody Uczenia Maszynowego

Finansowe szeregi czasowe

WYKŁAD: Szeregi czasowe II. Zaawansowane Metody Uczenia Maszynowego

3. Analiza własności szeregu czasowego i wybór typu modelu

Stacjonarność Integracja. Integracja. Integracja

Analiza szeregów czasowych: 7. Liniowe modele stochastyczne

Wprowadzenie do szeregów czasowych i modelu ARIMA

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Modelowanie ekonometryczne

Analiza szeregów czasowych: 6. Liniowe modele niestacjonarne

Analiza szeregów czasowych: 5. Liniowe modele stochastyczne

PROGNOZA WYSTĄPIENIA WSTRZĄSU ZA POMOCĄ SZEREGÓW CZASOWYCH. 1. Wprowadzenie. Zdzisław Iwulski* Górnictwo i Geoinżynieria Rok 31 Zeszyt 3/1 2007

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

WYKŁAD 6. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

wprowadzenie do analizy szeregów czasowych

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

1 Modele ADL - interpretacja współczynników

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Materiał dla studentów Wprowadzenie do modeli ARMA/ARIMA (na przykładzie zwrotów z instrumentów finansowych)

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Ekonometria. Modelowanie szeregów czasowych. Stacjonarność. Testy pierwiastka jednostkowego. Modele ARDL. Kointegracja. Jakub Mućk

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Stacjonarne procesy gaussowskie, czyli o zwiazkach pomiędzy zwykła

5. Model sezonowości i autoregresji zmiennej prognozowanej

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Ekonometria Wykład 5. Procesy stochastyczne, stacjonarność, integracja. Dr Michał Gradzewicz Katedra Ekonomii I KAE

Co trzeba wiedzieć korzystając z modelu ARIMA i które parametry są kluczowe?

4. Średnia i autoregresja zmiennej prognozowanej

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

MODELE AUTOREGRESYJNE W PROGNOZOWANIU CEN ZBÓŻ W POLSCE

Prawdopodobieństwo i statystyka

PDF created with FinePrint pdffactory Pro trial version

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Stosowana Analiza Regresji

STATYSTYKA MATEMATYCZNA

Ćwiczenie 5 PROGNOZOWANIE

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Wstęp do Rachunku Prawdopodobieństwa, IIr. WMS

Kolokwium ze statystyki matematycznej

Prognozowanie i Symulacje. Wykład VI. Niestacjonarne szeregi czasowe

1 Gaussowskie zmienne losowe

Test dwustronny: H 0 : p= 1 2

Modele ARIMA prognoza, specykacja

Rozdział 8. Regresja. Definiowanie modelu

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

2. P (E) = 1. β B. TSIM W3: Sygnały stochastyczne 1/27

Ekonometria. Modelowanie szeregów czasowych. Stacjonarność. Testy pierwiastka jednostkowego. Modele ARDL. Kointegracja. Jakub Mućk

0.1 Modele Dynamiczne

Statystyczna analiza danych

0.1 Modele Dynamiczne

Prawdopodobieństwo i statystyka

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

7.4 Automatyczne stawianie prognoz

Podczas zajęć będziemy zajmować się głownie procesami ergodycznymi zdefiniowanymi na przestrzeniach ciągłych.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Analiza autokorelacji

WYKŁAD 8 ANALIZA REGRESJI

Estymacja punktowa i przedziałowa

1. Stacjonarnośd i niestacjonarnośd szeregów czasowych 2. Test ADF i test KPSS 3. Budowa modeli ARMA dla zmiennych niestacjonarnych 4.

Katedra Fizyki Ciała Stałego Uniwersytetu Łódzkiego. Ćwiczenie 2 Badanie funkcji korelacji w przebiegach elektrycznych.

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka matematyczna dla leśników

Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x 1, x 2,...}, to mówimy, że jest to zmienna dyskretna.

Testowanie hipotez statystycznych.

Metoda największej wiarygodności

WYKŁAD 5 TEORIA ESTYMACJI II

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka i eksploracja danych

2. Wykaż, że moment pierwszego skoku w procesie Poissona. S 1 := inf{t : N t > 0} jest zmienną losową o rozkładzie wykładniczym z parametrem λ.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Prawdopodobieństwo i statystyka

Kwantyle. Kwantyl rzędu p rozkładu prawdopodobieństwa to taka liczba x p. , że. Możemy go obliczyć z dystrybuanty: P(X x p.

Analiza współzależności zjawisk

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Ważne rozkłady i twierdzenia c.d.

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Heteroskedastyczość w szeregach czasowyh

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

Rachunek Prawdopodobieństwa Anna Janicka

Prawdopodobieństwo i statystyka

Estymacja parametrów rozkładu cechy

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Weryfikacja hipotez statystycznych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Zawansowane modele wyborów dyskretnych

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Modele warunkowej heteroscedastyczności

Transkrypt:

Szeregi czasowe, analiza zależności krótkoi długozasięgowych Rafał Weron rweron@im.pwr.wroc.pl Definicje Mając dany proces {X t } autokowariancję definiujemy jako : γ(t, t ) = cov(x t, X t ) = = E[(X t -EX t )(X t -EX t )] Proces {X t } nazywamy stacjonarnym (w szerszym sensie), jeśli: E(X t ) = µ oraz cov (X t, X t+τ ) = γ(τ), dla każdego t, τ. (c) 5 Rafał Weron Definicje cd. Niech {X t } będzie procesem stacjonarnym, wówczas autokorelacją nazywamy funkcję ρ(τ) = γ(τ) / γ() Funkcja (opóźnionej) korelacji (AutoCorrelation Function) Dla szeregu czasowego Zt wykreślamy funkcję autokorelacji acf(z,k) jako funkcję opóźnienia k Białym szumem nazywamy proces {Z t } taki, że Z t są niezależnymi zmiennymi losowymi oraz E(Z t ) =, Var(Z t ) = σ < (c) 5 Rafał Weron 3 (c) 5 Rafał Weron 4 Funkcja acf dla 66 wartości (gaussowskiego) białego szumu. -. - Gęstość rozkładu gaussowskiego (normalnego),5% 95%,5% masy -,96,96 Dwustronny 95% przedział ufności dla białego szumu (ruchu Browna): ±,96/ L, gdzie L = 66-7 4 8 35 4 49 56 63 7 77 84 9 98 (c) 5 Rafał Weron Opóźnienie 5 Funkcja acf 66 dziennych zwrotów (% zmian cen) r t indeksu DJIA (93/7/3-99//3). -. - - 7 4 8 35 4 49 56 63 7 77 84 9 98 Opóźnienie (w dniach) (c) 5 Rafał Weron 6

Funkcja acf 66 dziennych zwrotów r t indeksu DJ Palo Verde (96/5/6-//5). -. - - 7 4 8 35 4 49 56 63 7 77 84 9 98 Opóźnienie (w dniach) (c) 5 Rafał Weron 7 Szeregi autoregresji AR (AutoRegression) Niech {Z t } będzie białym szumem, wówczas {X t } jest szeregiem AR rzędu p AR(p), jeśli: X t = α X t- + α X t- +...+ α p X t-p + Z t, gdzie α,...,α p stałe Z t traktuje się jako błąd losowy (c) 5 Rafał Weron 8 Funkcja acf dla procesu AR Funkcja częściowej korelacji (Partial AutoCorrelation Function) X t =,3 X t-,5x t- + Z t X t =,3 X t- +,5 X t- + Z t Dla opóźnienia k funkcja częściowej autokorelacji pacf(x,k) mierzy liniową zależność między X t i X t-k poprawioną o wpływ X t-,..., X t-k+.. Tzn. pacf(x,k) to współczynnik φ kk regresji liniowej w modelu: X t = φ + φ k X t- +... + φ kk X t-k + e t -. -. pacf(x,) = acf(x,) - - - 5 5 5 3 35 4 45 5-5 5 5 3 35 4 45 5 Dla procesu AR pacf wskazuje na rząd p modelu (c) 5 Rafał Weron 9 (c) 5 Rafał Weron Funkcja pacf dla procesu AR Szeregi ARMA (AutoRegressive Moving Average) X t =,3 X t-,5x t- + Z t X t =,3 X t- +,5 X t- + Z t Bazując na szeregu AR, ale uwzględniając autokorelację błędów losowych otrzymujemy szereg ARMA(p,q):.. X t = α X t- +...+ α p X t-p + Z t + β Z t- +...+ β q Z t-q -. - - -. - 5 5 5 3 35 4 45 5-5 5 5 3 35 4 45 5 AR(p) MA(q) tzw. średnia ruchoma moving average (c) 5 Rafał Weron (c) 5 Rafał Weron

Funkcja acf dla procesu MA Funkcja pacf dla procesu MA X t = Z t +,4 Z t-,5 Z t- X t =Z t +,4 Z t- +,5 Z t- X t = Z t +,4 Z t-,5 Z t- X t =Z t +,4 Z t- +,5 Z t-.... -. -. -. -. - - - - - - 5 5 5 3 35 4 45 5 5 5 5 3 35 4 45 5 - - 5 5 5 3 35 4 45 5 5 5 5 3 35 4 45 5 (c) 5 Rafał Weron 3 (c) 5 Rafał Weron 4 Własności szeregów ARMA Szeregi ARIMA Modele ARMA charakteryzują się wykładniczo (szybko) zanikającą funkcją autokorelacji Modele ARMA dobrze opisują mikrostrukturę rynku. -. - ARMA(,) - 5 5 5 3 35 4 45 5-3 5 5 5 3 35 4 45 5 (c) 5 Rafał Weron 5 - - W praktyce mamy zazwyczaj do czynienia z niestacjonarnymi szeregami czasowymi. Eliminacja niestacjonarności poprzez różnicowanie zmiennych. (c) 5 Rafał Weron 6 Różnicowanie zmiennych Polega ono na zastąpieniu zmiennej X t przez zmienną Y t = X t+ -X t oznaczenie : Y t = X t+ Zabieg ten pozwala pozbyć się niestacjonarności. Różnicowanie - przykład Niech: X t = β + β t + Z t ; t - czas, Z t -biały szum E(X t ) = E(β + β t + Z t ) = β + β t zależność od czasu Weźmy teraz Y t = X t+, wówczas: Y t = X t+ -X t = β + Z t+ -Z t E(Y t ) = β stacjonarność (c) 5 Rafał Weron 7 (c) 5 Rafał Weron 8 3

Różnicowanie wielokrotne Definicja operatora B : B k (X t ) = X t-k Różnicowanie n-krotne : Y t = n X t+ = ( - B ) n X t+ Przykład dla n = 3: Y t = ( - B ) 3 (X t+ ) = = ( - 3B + 3B -B 3 ) X t+ = = X t+ -3X t + 3X t- -X t- Szeregi ARIMA Szereg ARIMA (p, d, q): ( - α B -...- α p B p )( - B) d X t = = ( + β B +...+ β q B q )Z t gdzie α i, β j -stałe; i p, j q ; {Z t }- szum. Zauważmy, że wprowadzając Y t = d X t+ z szeregu ARIMA(p, d, q) otrzymujemy szereg ARMA(p,q): ( - α B -...- α p B p )Y t = ( + β B +...+ β q B q )Z t (c) 5 Rafał Weron 9 (c) 5 Rafał Weron Szeregi ARCH W modelu ARIMA uwzględnia się zmienność wartości oczekiwanej w czasie. Co robić, gdy zmienia się wariancja? Taki przypadek opisuje model ARCH - pierwszy szereg czasowy uwzględniający zależność wariancji procesu od jego poprzednich wartości. Szeregi ARCH Szereg {X t } jest szeregiem ARCH(p), jeśli: X t = (h t ) / Z t, gdzie : h t = α + α X t- +...+ α p X t-p - wariancja ; α, α p >, α,..., α p- ; {Z t } - biały szum Zauważmy, że szumy w modelu ARCH są mnożone, a nie dodawane. (c) 5 Rafał Weron (c) 5 Rafał Weron Szeregi GARCH Uogólnieniem modelu ARCH jest model GARCH ( generalized ARCH ) W przypadku szeregów GARCH wariancja h t zależy nie tylko od poprzednich wartości szeregu, ale także od poprzednich wariancji. Szeregi GARCH - definicja Szereg {X t } jest szeregiem GARCH(p, q), jeśli: X t = (h t ) / Z t, gdzie: h t = α + α X t- +...+ α p X t-p + β h t- +...+ β q h t-q α, α p, β q >, a pozostałe współczynniki są nieujemne (c) 5 Rafał Weron 3 (c) 5 Rafał Weron 4 4

Estymacja parametrów We wszystkich przedstawionych modelach występowały stałe, których często nie znamy. Estymacja stałych na przykładzie szeregu ARCH: niech α = (α,..., α p ), wtedy dysponując próbą X = ( X,..., X n ) możemy estymować wektor α jeśli X t N(, h t ), to stosując metodę NW wystarczy znaleźć maksimum funkcji: ln L = - (n/) ln π -(/) n t=[ln h t (α) + (Z t / h t (α))] Estymacja parametrów cd. Im większa wartość parametru p dla szeregu ARCH(p), tym lepsze dopasowanie modelu do danych. Z drugiej strony estymacja większej liczby parametrów wiąże się z większymi błędami. Kompromis - kryterium Akaikego. (c) 5 Rafał Weron 5 (c) 5 Rafał Weron 6 Kryterium Akaikego Do wyznaczania optymalnego modelu można stosować kryterium Akaikego: AIC(p) = - ln L + p Najmniejsza wartość AIC(p) wskazuje na optymalną wielkość modelu. Najczęściej dobre dopasowanie uzyskujemy dopiero dla bardzo dużych wartości p. Analiza zależności długoterminowych Analizy R/S (Hursta) oraz DFA, dają odpowiedź na pytanie czy dzisiejszy wzrost ceny spowoduje kolejny wzrost, spadek czy też nie ma wpływu na przyszłe ruchy cen (c) 5 Rafał Weron 7 (c) 5 Rafał Weron 8 Analiza R/S (Hursta) Podziel szereg danych o długości N na d podprzedziałów o długości n Dla każdego podprzedziału: - oblicz średnią i odchylenie std. (S) zwrotów - odejmij średnią od zwrotów - zbuduj szereg skumulowanych zwrotów Yi - oblicz zasięg (range) R=max{Yi}-min{Yi} - przeskaluj (rescale) zasięg: R/S (c) 5 Rafał Weron 9 Log(R/S) Analiza R/S (Hursta) dziennych zwrotów indeksu DJIA: 9-999.4..8.6.4. Teoretyczne (R/S) Empiryczne (R/S) H=.56 H=.536 Istotność =.6.5.5 3 3.5 4 (c) 5 Rafał Weron Log(n) 3 5

Analiza R/S (Hursta) 6 dziennych zwrotów indeksu DJIA.8.6 Teoretyczne (R/S) Empiryczne (R/S) 948-54 Empiryczne (R/S) 993-99 Analiza R/S (Hursta) 6 dziennych zwrotów indeksu DJ Palo Verde.8.6.4 Teoretyczne (R/S) Empiryczne (R/S) Log(R/S).4. H=.598 H=.563 Log(R/S). H=.563 H=.545 Istotność =.5..4.6.8..4.6.8 3 (c) 5 Rafał Weron Log(n) 3 H=.386 Istotność =.5..4.6.8..4.6.8 3 (c) 5 Rafał Weron Log(n) 3 Analiza DFA (Detrended Fluctuation Analysis) Podziel szereg danych (zwrotów) o długości N na d podprzedziałów o długości n Dla każdego podprzedziału: - wyznacz trend liniowy z(t)=at+b - odejmij trend liniowy i policz odchylenie std.: F ( n) = n n t = ( y( t) z( t)) Policz średnią wartość F śr funkcji F(n) Wykreśl F śr jako funkcję n (c) 5 Rafał Weron 33 log DFA. -. -. -.3 - -.5 - -.7 Analiza DFA 6 dziennych zwrotów indeksu DJ Palo Verde Teoretyczne Empiryczne H=.5 H=.49-95% przedział ufności (3.9,5.96) -.9.5.5 3 log (c) 5 Rafał Weron n 34 6