Wybrane metody parametryczne i nieparametryczne w modelowaniu finansowych szeregów czasowych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wybrane metody parametryczne i nieparametryczne w modelowaniu finansowych szeregów czasowych"

Transkrypt

1 UNIWERSYTET EKONOMICZNY WE WROCŁAWIU WYDZIAŁ ZARZĄDZANIA, INFORMATYKI I FINANSÓW Andrzej Pokładek Wybrane metody parametryczne i nieparametryczne w modelowaniu finansowych szeregów czasowych Praca magisterska Promotor: prof. dr hab. Krzysztof Jajuga Katedra Inwestycji finansowych i zarządzania ryzykiem Wrocław 2013

2 WSTĘP... 7 ROZDZIAŁ I SPECYFIKA FINANSOWYCH SZEREGÓW CZASOWYCH Pojęcie procesu stochastycznego Charakterystyka finansowych szeregów czasowych Pojęcie i miary ryzyka Funkcje autokorelacji i autokorelacji cząstkowej Stacjonarność Procesy stacjonarne i niestacjonarne Biały szum Efektywność rynku finansowego Stopnie efektywności rynku Weryfikacja hipotezy słabej efektywności rynku Dekompozycja niestacjonarnych finansowych szeregów czasowych ROZDZIAŁ II WYBRANE METODY MODELOWANIA FINANSOWYCH SZEREGÓW CZASOWYCH Modele parametryczne zmienności Równanie ARCH Jednowymiarowe modele typu GARCH Wielowymiarowe modele klasy GARCH Modele nieparametryczne Problem nadmiernego dopasowania modelu Metoda Multivariate Adaptive Regression Splines w modelowaniu szeregów czasowych ROZDZIAŁ III PODSTAWOWE CHARAKTERYSTYKI BADANYCH SZEREGÓW CZASOWYCH Charakterystyka badanych zmiennych Zależności pomiędzy badanymi zmiennymi

3 3.3. Zasadność użycia opóźnionego szeregu zmiennej zależnej WIG20 jako predyktora modelu ROZDZIAŁ IV PORÓWNANIE WYNIKÓW OTRZYMANYCH ZA POMOCĄ OMAWIANYCH METOD Wyniki zastosowania modelu DCC-GARCH Wyniki zastosowania metody MARSplines ZAKOŃCZENIE...76 BIBLIOGRAFIA...78 LITERATURA... Błąd! Nie zdefiniowano zakładki. ŹRÓDŁA INTERNETOWE... Błąd! Nie zdefiniowano zakładki. SPIS SCHEMATÓW...81 SPIS TABEL...81 SPIS WYKRESÓW

4 WROCŁAW UNIVERSITY OF ECONOMICS FACULTY OF MANAGEMENT, COMPUTER SCIENCE AND FINANCE Andrzej Pokładek Chosen parametric and nonparametric methods in financial time series modeling Master s Thesis Supervisor: prof. dr hab. Krzysztof Jajuga Department of Financial Investments and Risk Management Wrocław

5 PREFACE.. 7 CHAPTER I SPECIFIC OF FINANCIAL TIME SERIES Concept of stochastic process Financial time series characteristic Risk concept and measures Autocorelation and partial autocorrelation functions Stationarity Stationary and nonstationary processes White noise Financial market efficiency Types of market efficiency Market efficiency hypothesis verification Decomposition of nonstationary financial time series 24 CHAPTER II SELECTED METHODS FOR FINANCIAL TIME SERIES MODELING Parametric volatility models The ARCH equation The GARCH models Multivariate GARCH models Nonparametric models Overfitting problem The Multivariate Adaptive Regressoin Splines method in time series modeling. 41 CHAPTER III BASIC CHARACTERISTICS OF STUDIED TIME SERIES Characteristics of studied variables Dependences between studied variables Reasons of using legged WIG20 time series as a predictor.. 53 CHAPTER IV COMPARISON OF RESULTS OBTAINED USING SELECTED METHODS Results of application of DCC-GARCH Results of application of MARSplines method.. 66 CONCLUSION 76 REFERENCES 78 5

6 LITERATURE.. 78 INTERNET SOURCES 80 LIST OF DIAGRAMS 81 LIST OF TABLES.. 81 LIST OF CHARTS. 82 6

7 WSTĘP Postępująca globalizacja jest przyczyną powstawania nowych i umacniania istniejących już zależności gospodarczych. Sytuacja na rynkach finansowych jednych krajów, może przenosić się niemal natychmiast na rynki finansowe innych gospodarek. Tracą na znaczeniu kwestie polityczne, podczas gdy większą wagę przyjmują zależności i powiązania gospodarcze. Przedsiębiorstwa działają w skali międzynarodowej, a ogólnodostępne informacje są rozprzestrzeniane niemal natychmiast poprzez sieć WWW. Trudno jest sobie wyobrazić rozwinięte gospodarczo państwo, które jednocześnie jest niezależne od reszty świata w sposób bezpośredni lub pośredni. Badanie owych zależności jest możliwe poprzez opisywanie wskaźników jakimi są indeksy giełdowe za pomocą miar i narzędzi statystycznych, ekonometrycznych czy data mining o czym traktuje niniejsza praca. Rozdział pierwszy opisuje charakterystyki szeregów finansowych, za pomocą których możliwe jest opisanie i wyróżnienie cech danego szeregu tj. wartość oczekiwana, zmienność szeregu. Wyjaśnione zostało także zjawisko autokorelacji szeregu czasowego oraz wyjaśnione zostało pojęcie funkcji autokorelacji cząstkowej, za pomocą których zostaje zidentyfikowana pamięć szeregu czasowego. Opisane zostało pojęcie stacjonarności, stacjonarności w średniej oraz stacjonarności w wariancji, które to są cechami mogącymi istotnie wpłynąć na wybór metod modelowania szeregów czasowych, a także do spostrzeżenia zmian, którym podlegają rynki finansowe wraz z postępującą globalizacją oraz zmianami w regulacjach prawnych dotyczących rynków finansowych. Za pomocą pojęcia stacjonarności identyfikowany jest ogólny trend panujący na danym rynku. Z kolei pojęcie efektywności informacyjnej rynku poruszone w rozdziale pierwszym kategoryzuje rynki ze względu na możliwości przewidywania cen i osiągnięcia ponadprzeciętnych wyników finansowych nie będących przypadkiem, a popartych określonymi dla każdego ze stopni efektywności metodami podejmowania decyzji co do zawieranych transakcji. Zdaniem autora pracy, są to niektóre z cech, które są niezbędne w próbach zrozumienia natury rynków finansowych. Służą one też oczywiście do porównywania poszczególnych szeregów finansowych. W rozdziale drugim opisane są metody, za pomocą których możliwe jest wychwycenie zależności występujących na rynkach finansowych, a także może zostać podjęta próba przewidzenia zmian w cenach czy też ocena zmienności cen instrumentów finansowych poprzez założenie, że zależności występujące w zbiorze danych, które powinny mieć podłoże 7

8 fundamentalne, będą powtarzać się w pewnym stopniu w przyszłości. Pierwszą z przedstawionych metod jest wielowymiarowy uogólniony model autoregresyjny z warunkową heteroskedastycznością z uwzględnieniem dynamicznej korelacji warunkowej (DCC- GARCH). Równanie DCC-GARCH(p,q) zostało zaproponowane ostatecznie w 2002 roku przez R. F. Engle a jako narzędzie usprawniające modelowanie wielowymiarowych zależności na rynkach finansowych. Jest to metoda, która może zostać określona jako parametryczna. Jest to klasyczna metoda, za pomocą której określa się siłę zależności zmiennych poddanych procedurze, których wartości służą do konstrukcji równania szacującego przyszłą zmienność badanego portfela instrumentów finansowych. Druga z zastosowanych metod to wielozmienna regresja adaptacyjna z użyciem funkcji sklejanych (MARSplines) zaproponowana w 1991 roku przez J. H. Friedmana. Jest to model nieparametryczny należący do metod data mining. Oznacza to, że jest konstruowany wyłącznie na podstawie zależności występujących w zbiorze danych ze względu na efektywność modelu rozumianą jako umiejętność oszacowania przyszłych notowań zmiennej zależnej na podstawie notowań zmiennych niezależnych przy zachowaniu możliwie niskiej liczby parametrów. Z racji problemu rozważanego w pracy metoda zostanie użyta do modelowania regresji. Rozdział trzeci niniejszej pracy otwiera część empiryczną. Został on poświęcony zastosowaniu niektórych z charakterystyk opisanych w rozdziale pierwszym na zmiennych, które zostały wybrane do badania. W rozdziale zostały określone charakterystyki poszczególnych indeksów traktowanych jako całkowicie niezależnie od siebie, dzięki czemu można porównać podstawowe cechy badanych indeksów. Następnie zmierzono zależności pomiędzy badanymi indeksami w okresie podlegającym analizie za pomocą miar niezależnych od czasu. Uzasadniony został dobór zmiennych do modelu. Zostały przytoczone historyczne przykłady przyczyn wystąpienia określonych sytuacji na badanych rynkach, a także argumenty przemawiające za uwzględnienie wszystkich z wybranych indeksów w rozpatrywanych modelach. Uzasadnione zostało również użycie szeregu stóp procentowych WIG20 jako zmiennej niezależnej w modelu szacującym przyszłe stopy zwrotu z portfela WIG20. Ostatni, czwarty rozdział pracy zawiera wyniki zastosowania obu wybranych metod modelowania. Osobno zostały opisane zależności wynikające ze badanego zbioru danych, które ze względu na rodzaj metody przedstawiane są z dwóch odmiennych perspektyw, co jest nadrzędnym celem niniejszej pracy. Wskazane zostaną różnice w interpretacji danych za 8

9 pomocą obu odmiennych metod, a także ich cechy charakterystyczne tj. przydatność do określenia siły konkretnych oddziaływań pomiędzy zmiennymi i sposób w jaki modele mogą zostać użyte w praktyce Dodatkowo przedstawione zostaną wyniki hipotetycznych strategii inwestycyjnych, w których prognozy opierałyby się o omawianą metodę data mining ze względu na parametry określające złożoność modelu. Celem pracy jest wykazanie zależności pomiędzy kilkoma z głównych gospodarek światowych i europejskich a indeksem GPW w Warszawie WIG20, który jest rozumiany jako wskaźnik informujący o sytuacji gospodarki polskiej oraz porównanie zastosowanych w pracy dwóch odmiennych metod analizy danych ze względu na ich przystosowanie do wychwycenia zależności pomiędzy badanymi indeksami oraz sposób modelowania ceny odmienny ze względu na różne konstrukcje obu modeli. 9

10 ROZDZIAŁ I SPECYFIKA FINANSOWYCH SZEREGÓW CZASOWYCH Do podstawowych procesów stochastycznych występujących na rynkach finansowych można zaliczyć zmiany stóp procentowych, zmiany cen akcji, zmiany kursów walut i cen surowców, zmianę oprocentowania obligacji itp. Wyróżnić można również procesy instrumentów pochodnych od instrumentów podstawowych, a także liczne pochodne tych procesów takie jak np. proces warunkowej wariancji opisany w treści niniejszej pracy. Z pewnością procesy te różnią się swoją charakterystyką od prostych procesów występujących w przyrodzie tym, że są bardziej nieregularne i bywają trudniejsze do przewidzenia oraz opisania za pomocą metod matematycznych. Możliwe jest opisywanie ich zarówno za pomocą miar wspólnych dla danych zbiorów liczbowych wszelkiego rodzaju, jak i dla szeregów czasowych różnego typu. Ze względu na swoją charakterystyczność dane dotyczące szeregów finansowych analizuje się poprzez pryzmat specyficznych narzędzi wynikających teorii finansowych Pojęcie procesu stochastycznego Procesem stochastycznym nazywamy funkcję losową zmiennych losowych X oraz nielosowego argumentu t, oznaczającego jednostkę czasu. Procesy stochastyczne zapisuje się za pomocą następujących symboli: X t, Y t lub odpowiednio: X(t), Y(t). 1 Samo pojęcie stochastyki jest pojęciem znacznie szerszym. Stochastyka rozumiana jest jako sztuka przypuszczania i odnosi się do wszystkiego, co można zmierzyć za pomocą prawdopodobieństwa. Greckie słowo stochos (στοχος) oznacza cel, odgadywanie czegoś niepewnego, zamiar określenia, lub określenie prawdopodobieństwa wystąpienia jakiegoś zdarzenia. Pojęcie stochastyka zostało zdefiniowane w 1713 r. w dziele Jakuba Bernouliego ( ) pod tytułem: Ars conjectandi (Sztuka domniemań i przypuszczania). 2 Dla potrzeb niniejszej pracy rozpatrywane będą wartości notowań cen wybranego instrumentu finansowego następujących po sobie z definicji procesu stochastycznego w równych odstępach czasu a będące np. cenami zamknięcia notowań w przypadku finansowych procesów stochastycznych, jednakże w szczególnych przypadkach brane będą pod uwagę również ceny maksymalne i minimalne, a także ceny mediany i inne, które mogą 1 Osińska M., Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s.48 2 Ostasiewicz W., Myślenie statystyczne, Wolters Kulwer Polska Sp. z o.o., Warszawa 2012, s

11 dać bardziej efektywne wyniki badań empirycznych przeprowadzonych w dalszej części pracy. Badane dane historyczne mogą opcjonalnie zostać poddane normalizacji w celu uzyskania rozkładu prawdopodobieństwa jak najbardziej zbliżonego do rozkładu normalnego i wyeliminowania niesprzyjającego wpływu pojedynczych, relatywnie wysokich odchyleń na wyniki predykcji, a brakujące dane mogą zostać uzupełnione w celu dopasowania badanych szeregów czasowych Charakterystyka finansowych szeregów czasowych Większość prac badawczych z dziedziny finansów nie dotyczy cen rynkowych badanych aktywów, ale ich prostych lub też logarytmicznych stóp zwrotu ze względu na to, że dla przeciętnego inwestora jest to zestandaryzowana wielkość do porównania okazji inwestycyjnych i miara zysku lub straty inwestora oraz ze względu na bardziej atrakcyjne właściwości statystyczne 3. Podstawowymi charakterystykami procesów stochastycznych są: wartość średnia (oczekiwana) m = E(Y ), t = 0, ±1, ±2,, wariancja D (Y ) = E(Y m ), t = 0, ±1, ±2,, funkcja autokowariancji K(t, s) = E[(Y m )(Y m )], t = 0, ±1, ±2,, s = 0, ±1, ±2,, funkcja autokorelacji R(τ) = ( ) = ( ) ( ) ( ), gdzie τ = t s, t, s = 0, ±1, ±2, Pojęcie i miary ryzyka Ryzyko finansowe jest najczęściej kojarzone z jego podstawowym rodzajem, jakim jest ryzyko rynkowe wiążące się ze zmiana cen na rynkach finansowych. Ryzyko rynkowe można podzielić na: ryzyko zmiany stopy procentowej (interest rate risk), 3 Campbell John Y., Lo Andrew W., & MacKinlay A. Craig, The Econometrics of Financial Markets, Piłatowska Mariola, Modelowanie niestacjonarnych procesów ekonomicznych. Studium metodologiczne, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń 2003, s.24,25 11

12 ryzyko zmiany kursu walutowego (exchange rate risk), ryzyko zmiany cen akcji (stock price risk), ryzyko zmiany cen towarów (commodity price risk). 5 Przedmiotem niniejszej pracy jest ryzyko cen akcji, a dokładniej indeksu sektora energetycznego WIG20, którego zmiany są odzwierciedlaniem. Portfel indeksu składa się ze spółek z sektora energetycznego, więc z założenia powinien do pewnego stopnia odzwierciedlać sytuację w całym sektorze. Wynika z tego, że ryzyko cen akcji sprowadza się w tym wypadku do trzech pozostałych rodzajów ryzyka, które oddziałowują na sektor. Rozwinięcie tej myśli ma swoje miejsce w rozdziale III pracy. Miary ryzyka rynkowego można natomiast podzielić na trzy grupy: miary zmienności (volatility measures), miary wrażliwości (sensivity measures), miary zagrożenia (downside risk measures). 6 W dalszej części pracy, ryzyko inwestycji w papiery wartościowe tj. akcje czy kontrakty terminowe będzie mierzone za pomocą dwóch głównych grup miar ryzyka: miary zmienności, czyli miary wynikające z rozkładu stopy zwrotu, miary wrażliwości, czyli miary wynikające z funkcji zależności od ryzyka. 7 Biorąc pod uwagę pierwszą grupę miar, zmienność można badać za pomocą pierwiastka z wariancji szeregu stóp zwrotu V(X), czyli miary odchylenia standardowego σ. W ten sposób mierzy się ryzyko w rozumieniu neutralnym, czyli jako niezgodność efektu z oczekiwaniami. Owa niezgodność w przypadku finansowych szeregów czasowych to różnica pomiędzy stopą zwrotu z badanego instrumentu w przyjętym okresie a wartością oczekiwaną stóp zwrotu z badanego instrumentu finansowego. Chociaż niezbyt trudno intuicyjnie określić okresy relatywnie wysokiej, czy niskiej zmienności danego szeregu finansowego, to sam pomiar zmienności jest zadaniem nieco bardziej skomplikowanym. 5 Pod red. Krzysztofa Jajugi, Metody ekonometryczne i statystyczne w analizie rynku kapitałowego, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław 2000, podrozdz. 5.2, s Ibidem, s Jajuga Krzysztof, Jajuga Teresa, Inwestycje, Instrumenty Finansowe, Aktywa Niefinansowe, Ryzyko Finansowe, Inżynieria Finansowa, wydanie nowe, Wydawnictwo Naukowe PWN SA, Wydanie III zm. 6 dodruk, Warszawa 2006, s

13 Treść niniejszej pracy jest skupiona głównie na miarach wynikających z rozkładu stopy zwrotu, gdyż osiągnięcie zadowalającego wyniku jest tutaj rozumiane przez dobre wyniki predykcji, a nie relatywnie wysokie w stosunku do np. portfela rynkowego stopy zwrotu oraz bezpieczna inwestycja. Posiadając dane dotyczące historycznych stóp zwrotu dla okresu T jednostek czasu odchylenie standardowe można wyliczyć ze wzoru: T r t r t 1 t 1 t T σ = T 1 Jak nietrudno odczytać z powyższego wzoru miara ta jest zależna od dwóch zmiennych, którymi są: r t - stopa zwrotu dla okresu t, T- liczba prób. W tym momencie należałoby zastanowić się nad przyjęciem określonych przedziałów czasowych. Jeżeli badaniu podlegałby okres T, którego długość odpowiadałaby jednej sesji, to każde kolejne t musiałoby oznaczać np. kolejny przedział czasu równy 10 min. Wyniki takich obliczeń oznaczałyby określenie wartości zmienności danego instrumentu finansowego dla każdego z badanych dni (T n ), oraz następnie mogłoby umożliwić np. prognozowanie tak otrzymywanej wartości zmienności owego instrumentu w ciągu kolejnych dni, jednakże wyliczenia obejmowałyby jedynie dane intraday, a więc nie uwzględniałyby zmienności overnight. Zmienność wyliczana w następujący sposób mogłaby być przydatna dla handlu high-frequency, ale nie uwzględniałaby np. występowania luk cenowych pomiędzy kolejnymi sesjami na giełdzie, które wynikają ze zmian mających miejsce, gdy giełda na której handluje się instrumentem, którego stopa zwrotu z każdego z okresów t tworzy badany szereg czasowy, jest akurat zamknięta. 8 Miary wrażliwości służą natomiast do pomiaru ryzyka, jeżeli rozpatrujemy badany szereg jako wypadkową czynników ryzyka oddziałowujących na niego. Miary wrażliwości wyjaśniają przyczyny wystąpienia ryzyka rynkowego. W odróżnieniu do miar zmienności, T 2 8 Tsay Ruey S., Analysis of Financial Time Series. Second edition, Wiley series in probablity and statistics, Wiley Interscience 2006, s.25 13

14 które mierzą jedynie zmienność cen lub stóp zwrotu będące skutkiem wystąpienia ryzyka rynkowego, miary wrażliwości koncentrują się na czynnikach ryzyka. Używanie w praktyce miar wrażliwości nie opiera się na założeniu o pewnej powtarzalności zachodzących procesów jak np. utrzymanie się konkretnego poziomu lub powrót do wartości długookresowej jak w przypadku miar zmienności. W tym podejściu zakłada się, że cena lub stopa zwrotu jest funkcją czynników o znaczeniu fundamentalnym na nią wpływających Funkcje autokorelacji i autokorelacji cząstkowej Gdyby założyć, że istnieje zależność liniowa pomiędzy stopą zwrotu r a stopą zwrotu r można zastosować funkcję autokorelacji (ACF), która jest niejako funkcją korelacji liniowej Pearsona, tyle że nie liczoną dla dwóch całkowicie odrębnych szeregów czasowych, a badanego szeregu czasowego oraz szeregów czasowych utworzonych przez przesunięcie badanego szeregu o wartość opóźnienia τ = t i. Przyjmując założenie, że badany szereg czasowy wykazuje się słabą stacjonarnością, czyli że jego wariancja jest stała bez względu na opóźnienie czasowe: Funkcję autokorelacji można zapisać wzorem: ρ = Var(r ) = Var(r ), Cov(r, r ) Var(r )Var(r ) = Cov(r, r ) = γ Var(r ) γ Funkcja autokorelacji i-tego stopnia, jest estymowana jako funkcja korelacji liniowej szeregu czasowego kończącego się np. na wartości r dla T przypadków oraz tego samego szeregu czasowego, tyle ze z ostatnią wartością jest stopa zwrotu r także dla T przypadków. Funkcja autokorelacji informuje zatem o pamięci szeregu, czyli stopniu regularności powtórzeń poprzednich wartości szeregu stochastycznego. Wartość współczynników autokorelacji kolejnych rzędów określa możliwy wpływ impulsu dokonanego w czasie t na odpowiednie przyszłe wartości szeregu stochastycznego, jeżeli przyjąć, że tendencja będzie się utrzymywać. 9 Funkcja autokorelacji cząstkowej (PACF) jest drugą z funkcji przydatnych przy identyfikacji typu procesu stochastycznego. Otrzymuje się ją konstruując kolejno modele autoregresji o stopniu odpowiadającym rzędowi autokorelacji, tworząc z nich układ równań 9 Magdalena Osińska, Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s.51 14

15 oraz estymując ich współczynniki np. za pomocą metody najmniejszych kwadratów. Autokorelacja cząstkowa (τ) jest wtedy równa: (0) = 1, (τ) = ϕ, gdzie: ϕ - rozwiązanie układu równań dla elementu przy: τ = 0, 1, 2, 3,, i. Innymi słowy PACF(τ) to parametr modelu AR(τ) stojący przy zmiennej równania będącej wartością sprzed τ jednostek czasu przy pominięciu parametrów równania stojących przy zmiennych od t do τ. Podczas identyfikacji modeli ekonometrycznych za pomocą funkcji autokorelacji i autokorelacji cząstkowych bierze się pod uwagę np. to do którego opóźnienia wartości funkcji mają wartości wyraźnie większe od pozostałych, czy opóźnienie, w którym funkcja zmienia znak Stacjonarność Z punktu widzenia ekonometrii niezwykle ważne jest pojęcie stacjonarności oraz podział szeregów czasowych na procesy stacjonarne i procesy niestacjonarne. Dodatkowo procesy stacjonarne dzielą się na procesy stacjonarne w węższym i szerszym sensie. Rozróżnienie badanych danych ze względu na tą właściwość determinuje wybór narzędzi używanych na dalszych etapach analizy Procesy stacjonarne i niestacjonarne Proces stacjonarny w węższym sensie to proces, którego łączna dystrybuanta próbki y,, y nie różni się od łącznej dystrybuanty próbki y,, y dla dowolnego k, czyli: F,, y,, y = F,, y,, y 10 Warunek, aby rozkład rzeczywistego szeregu czasowego nie zmieniał się zależnie od przesunięcia w czasie porównywanych próbek jest niezwykle trudny do spełnienia dla 10 Marcinkowski Jerzy, Ryzyko, jakość prognoz a efektywność inwestowania na rynkach finansowych, Wydawnictwo Uniwersytetu Ekonomicznego w Poznaniu, Poznań 2009, s.22 15

16 procesów ekonomicznych i raczej niespotykane jest, aby finansowe szeregi czasowe wykazywały się pełną stacjonarnością. Znacznie częściej spotykane jest, że finansowy szereg czasowy rozumiany jako szereg stóp zwrotu lub pierwszych różnic badanej zmiennej jest stacjonarny w szerszym sensie. Proces jest stacjonarny w szerszym sensie, gdy średnia i wariancja procesu nie zmieniają się w czasie oraz gdy autokowariancja zmienia się wyłącznie ze względu na wartość parametru τ = t s, czyli gdy: E(y ) = constans, D (y ) = constans, cov(y, y ) = cov(τ). 11 Z powyższych warunków wynika, że wartości szeregów o podanych właściwościach oscylują wokół najbardziej prawdopodobnej wartości (wartości średniej elementów szeregu) ze stałą wariancją. Oczywiście aby warunki te zostały spełnione należy brać pod uwagę odpowiednio liczne zakresy wartości szeregu. Ze względu na rodzaj niestacjonarności charakteryzujący badane zjawiska, procesy stochastyczne identyfikuje się jako procesy niestacjonarne w średniej, czyli z trendem deterministycznym oraz procesy niestacjonarne w wariancji, czyli z trendem stochastycznym. Rozróżnienie tych własności jest niezwykle ważne w prognozowaniu przebiegu zmiennych. Dla przykładu procesy, które charakteryzuje wyłącznie niestacjonarność w wariancji, mają zdolność powrotu do średniej, co jest cechą niewątpliwie pożądaną do zidentyfikowania. Badania empiryczne na finansowych szeregach czasowych pokazują, że jest to właściwość zmienności wielu szeregów finansowych. Identyfikacja tej zależności zmienności od czasu jest niewątpliwie przydatna do prognozowania cen opcji finansowych, ponieważ zmienność instrumentu bazowego opcji jest czynnikiem niezwykle silnie wpływającym na cenę rynkową opcji. Jest to związane z okresami wzmożonego obrotu instrumentu bazowego, co generuje tzw. skupienia zmienności, których przyczyny mogą być różne ze względu na długość badanych okresów. Zmienność skupienia zmienności możliwe do wychwycenia podczas analizy danych intraday mogą być niewidoczne dla danych dziennych lub miesięcznych. 11 Magdalena Osińska, Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s

17 Biały szum Składnik stacjonarny procesów stochastycznych nazywany jest białym szumem. Pod względem opisanych wcześniej charakterystyk biały szum to proces zmiennej Y t o rozkładzie normalnym ze średnią zero i wariancją σ 2, dla którego funkcja autokorelacji dla dowolnych opóźnień są równe zero. W praktyce przyjmuje się, że szereg czasowy jest białym szumem, gdy funkcja autokorelacji dla dowolnych opóźnień jest bliska zeru Efektywność rynku finansowego Efektywność, czy też stopień efektywności rynku ma duże znaczenie przy wyborze strategii inwestycyjnej, która mogłaby potencjalnie przynosić zadowalające zysku w dłuższym okresie. Oczywiste jest, że teoria informacyjnej efektywności rynku, jak inne teorie, jest wyłącznie uproszczeniem rzeczywistości i należy ją traktować jako punkt odniesienia, który może posłużyć do oceny np. stopnia zaawansowania rynku. Aby rynek mógł zostać uznany za w pełni efektywny, musiałoby zostać spełnionych wiele założeń, z których kilka jest założeniami czysto teoretycznymi, a mianowicie: istnieje nieskończona liczba uczestników rynku, którzy niezależnie od siebie wyceniają akcje, dążąc do maksymalizacji swojego zysku, pojedynczy inwestor nie jest w stanie wpłynąć swoim działaniem na kurs akcji, informacje dotyczące firm i ich akcji są ogłaszane niezależnie od siebie, wszyscy inwestorzy otrzymują informacje w tym samym momencie, inwestorzy natychmiast wykorzystują podaną informację, wszyscy inwestorzy zgadzają się, co do wpływu danej informacji na wartość akcji, wszyscy inwestorzy są racjonalni, horyzont inwestycyjny wszystkich inwestorów jest jednakowy, nie istnieją żadne opłaty związane z prowadzeniem transakcji czy zdobywaniem informacji, poszczególne zmiany cen są od siebie niezależne, 12 Ruey S. Tsay, Analysis of Financial Time Series. Second edition, Wiley series in probablity and statistics, Wiley Interscience 2006, s.31 17

18 stopy zwrotu z inwestycji mają rozkład logarytmiczno-normalny. 13 Rynki maja generalnie tendencję do zwiększania poziomu efektywności wraz z upływem czasu 14 i na rynkach rozwiniętych niektóre założenia rynku efektywnego informacyjnie mogą zostać spełnione. Na rynku, który byłby efektywny informacyjnie cena akcji zawierałaby w sobie wszystkie informacje dostępne dla inwestorów oraz niesłychanie szybko zachodziłby proces przedstawiony na schemacie X. Jeżeli inwestorzy podejmują decyzje wyłącznie na podstawie Schemat 1. Proces przetwarzania informacji na rynku efektywnym Źródło: Opracowanie własne na podstawie: Krzysztof Jajuga, Teresa Jajuga, Inwestycje, Instrumenty Finansowe, Aktywa Niefinansowe, Ryzyko Finansowe, Inżynieria Finansowa, wydanie nowe, Wydawnictwo Naukowe PWN SA, Wydanie III zm. 6 dodruk, Warszawa 2006, s.148 Dodatkowo na rynku efektywnym decyzje inwestorów byłyby do siebie co najmniej zbliżone. Założenia te są niezwykle trudne do spełnienia. W praktyce żaden rynek nie jest efektywny całkowicie (K.Jajuga, T. Jajuga 1996 r.). Inwestorzy podejmują różne decyzje na 13 Kamiński Jarosław, Komorowski Jan, Hipoteza rynku efektywnego w chaosie rzeczywistości gospodarczej, Studia i prace Kolegium Zarządzania i Finansów, Zeszyt Naukowy 97, Szkoła Główna Handlowa w Warszawie, Warszawa 2010, s.6 14 Jajuga K., Jajuga T., Inwestycje, Instrumenty Finansowe, Aktywa Niefinansowe, Ryzyko Finansowe, Inżynieria Finansowa, wydanie nowe, Wydawnictwo Naukowe PWN SA, Wydanie III zm. 6 dodruk, Warszawa 2006, s

19 podstawie tych samych informacji, na których analizę potrzebują okresów o różnej długości, a do tego informacje nie docierają do inwestorów w tym samym momencie. 15 Na rynku efektywnym nie byłoby możliwe uzyskanie ponadprzeciętnych zysków ze względu na to, że zwyczajnie działanie wszystkich inwestorów byłyby niemal identycznie, ponieważ postrzegaliby oni skutki działania czynników zawartych w docierających do nich informacjach w ten sam sposób oraz działaliby w tym samym czasie. Chcąc podważyć hipotezę o efektywności informacyjnej rynku jako argumenty można podać występowanie licznych anomalii na rynkach kapitałowych związanych z określonymi miesiącami w roku, lub dniami tygodnia, czy zachowaniem się cen akcji podczas przeprowadzania pierwszej oferty publicznej. Anomalie te są wyjaśnione za pomocą heurystyk 16, które zostały spostrzeżone podczas badań nad uczestnikami rynku. Skoro więc finanse behawioralne opierają się na zjawiskach występujących w rzeczywistości, a nie na założeniach dotyczących rzeczywistości, to czy nie są bardziej adekwatne. Oczywiście aby wykorzystać teorię rynku efektywnego nie jest konieczne założenie występowania całkowitej efektywności rynku w rzeczywistości, a jedynie określenie stopnia efektywności, jakim cechuje się badany rynek Stopnie efektywności rynku Zgodnie z hipotezą efektywności informacyjnej, oczekiwaną cenę akcji można zapisać w następujący sposób: E(P ) = (1 + r)p + β E(d ) + β E(X ) + β E(e ), gdzie: r d - stopa procentowa - przyszłe dywidendy, X - znane badaczowi i prognozowalne czynniki niezawarte w cenach, które mają wpływ na przyszłe zyski z akcji, 15 ibidem, s Zwolennicy teorii finansów behawioralnych podzielili heurystyki na trzy grupy, które odnoszą się do kategorii tj.: dostępność, reprezentatywność, zakotwiczenie. 19

20 e - informacje poufne, czynniki, których badacz nie zna, a które mogą być znane innym, nielicznym uczestnikom rynku, β, β, β - dodatnie stałe, wagi przypisane każdemu z czynników wpływających na cenę akcji na rynku. 17 O ile w rzeczywistości nie ma rynków całkowicie efektywnych, to możliwe jest określenie stopnia efektywności rynku ze względu na rodzaj informacji docierających do inwestorów. Wg tego kryterium rozróżnia się rynki o: słabej efektywności, średniej efektywności, mocnej efektywności. Rynek jest efektywny w stopniu słabym, gdy wszystkie informacje zawarte w cenach instrumentu finansowego w przeszłości mają odzwierciedlenie w cenie obecnej, czyli nie jest możliwe uzyskanie ponad przeciętnych zysków bazując na informacjach zawartych w cenach instrumentu, czy wartości obrotu instrumentem finansowym na podstawie metod tj. analiza techniczna, czy bardziej skomplikowane modele kursów akcji. Średnia efektywność cechuje rynek, na którym niemożliwe jest uzyskanie ponadprzeciętnych wyników inwestycyjnych bazując na informacjach, które są ogólnie dostępne w tym cenach instrumentu z przeszłości. Przy efektywności rynku tego stopnia, narzędzia analizy fundamentalnej opierające się na informacjach o kondycji finansowej emitenta analizowanych papierów nie znajdują zastosowania w celu osiągnięcia ponadprzeciętnych zysków z inwestycji. Rynek można określić jako efektywny silnie, gdy zbiór informacji za pomocą których nie można osiągnąć ponadprzeciętnej stopy zwrotu z rynku, w porównaniu do adekwatnego zbioru informacji na rynku o efektywności średniej, dopełni się o specjalistyczne, niejawne informacje 18, czyli nawet stosowanie tzw. insider trading nie przynosi zamierzonych rezultatów. 17 Magdalena Osińska, Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s Jajuga K., Jajuga T., Inwestycje, Instrumenty Finansowe, Aktywa Niefinansowe, Ryzyko Finansowe, Inżynieria Finansowa, wydanie nowe, Wydawnictwo Naukowe PWN SA, Wydanie III zm. 6 dodruk, Warszawa 2006, s

21 Weryfikacja hipotezy słabej efektywności rynku Użycie przez inwestorów wielu z metod analizy w tym metod ekonometrycznych jest uzasadnione jedynie wtedy, gdy rynek jest efektywny co najwyżej w stopniu słabym. Na rynku efektywnym bowiem: nowe informacje bezzwłocznie i adekwatnie kształtują ceny na rynku, ponieważ ogół inwestorów reaguje w taki właśnie sposób, zmiany cen papierów wartościowych mają charakter losowy, są opisane przez proces błądzenia przypadkowego, a proces kształtowany przez ich stopy zwrotu ma własności białego szumu, gdy w eksperymentach symulacyjnych wykorzystuje się ustalone reguły dokonywania transakcji, które są ustalone na podstawie zachowania się zbioru uczącego, nie otrzymuje się średnio wyższych zwrotów, ogół profesjonalnych inwestorów w średnim i długim okresie nie jest w stanie osiągnąć średnio wyższych zysków ani działając pojedynczo, ani w grupie. 19 Jednym ze sposobów jest zbadanie, czy szereg cen danego instrumentu finansowego jest dobrze opisany przez proces błądzenia przypadkowego: p = p + e, gdzie: p - logarytm naturalny ceny instrumentu finansowego, e - biały szum. Innym sposobem, który w przypadku gdy rozważany jest pojedynczy szereg stóp zwrotu, można traktować równorzędnie jest: r = e, gdzie: r - stopa zwrotu z inwestycji w okresie t. Wyróżniane są trzy rodzaje białego szumu: 19 Haugen R.A., Teoria Nowoczesnego inwestowania, WIG-Press, Warszawa

22 niezależne od siebie przyrosty o takich samych rozkładach, niezależne od siebie przyrosty o różnych rozkładach, nieskorelowane przyrosty. Dwa ostatnie rodzaje określa się jako biały szum w ujęciu słabszym. Aby więc zweryfikować, czy stopy zwrotu z badanego szeregu mają postać białego szumu, należy zbadać autokorelacje, losowość oraz normalność rozkładu przyrostów. Najbardziej popularną metodą testowania autokorelacji jest statystyka Q Boxa- Ljunga (tzw. statystyka portfelowa) 20. Jest to badanie testujące hipotezę o braku autokorelacji dowolnego stopnia, a zatem: H : ρ = 0, H : ρ 0, Q = T(T + 2) ρ T j, gdzie: T - liczba obserwacji w badanej próbce, ρ - współczynnik autokorelacji rzędu j, czyli inaczej współczynnik korelacji liniowej Pearsona pomiędzy wartością szeregu samego szeregu czasowego z okresu j czasowego z okresu t, a wartością tego j - rząd autokorelacji, j = 1, 2, 3,, p. 21 Dla omawianego tutaj przypadku, do estymacji autokorelacji używana jest formuła: ρ = e e e, szeregu Jeżeli znajdą się podstawy do odrzucenia hipotezy H, co oznacza że statystyka Q czasowego ma wysoką wartość, czyli gdy autokorelacja stóp zwrotu jest 20 Osińska M., Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s Greene W.H., Econometric Analysis, Macmillan Publishing Company, New York

23 wystarczająco silna, możliwe jest prognozowanie do kilku przyszłych stóp zwrotu z dużym prawdopodobieństwem tylko na podstawie informacji o cenie instrumentu finansowego. Jest to wystarczający argument, który pozwala bez dalszej analizy odrzucić założenie o słabej efektywności informacyjnej rynku. W celu przetestowania losowości stóp zwrotu szeregu można skorzystać z testu serii Walda-Wolfowitza. Generalnie przedmiotem testu jest zbadanie kolejności wystąpienia dodatnich i ujemnych stóp zwrotu, czy też różnic kolejnych cen, badanego instrumentu bez brania pod uwagę ich dokładnej wartości. Tak jak w przypadku testowania autokorelacji szeregu dane muszą być ułożone według czasu wystąpienia. Dodatkowo należy znaleźć przypadki, gdy obok siebie w szeregu występują dodatnie i ujemne różnice (lub stopy zwrotu) Jeżeli stopu zwrotu maja charakter losowy, długość wyszczególnionych serii ma charakter przypadkowy. Hipoteza zerowa zakłada, że gdy dodatnim stopom zwrotu szeregu przyporządkuje się wartości 1, natomiast ujemnym stopom zwrotu wartości -1 (brak zmiany cen jest każdorazowo pomijany), to otrzymane w ten sposób próby pochodzą z jednej populacji. Alternatywnie przyjmuje się hipotezę, mówiącą że obie próby pochodzą z dwóch populacji o różnym rozkładzie. 22 Treść hipotezy zerowej stanowi, że zmiany cen są losowe, czyli innymi słowy są realizacją procesu białego szumu, zatem: H : r = e, H : r e. Aby zweryfikować hipotezę stosuje się statystykę Z: K E(K) 0,5 Z =, dla K E(K), V(K) K E(K) 0,5 Z =, dla K E(K), V(K) gdzie: K- liczba danych serii w szeregu, 22 Osińska M., Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s.36 23

24 E(K) = 1 +, V(K) = ( ) ( ) ( ), n, n - liczba dodatnich i ujemnych stóp zwrotu. Hipoteza zerowa jest odrzucana, gdy wartość statystyki Z jest większa, co do wartości bezwzględnej, od 1,96 przy poziomie istotności 0, Dekompozycja niestacjonarnych finansowych szeregów czasowych Przyjmując podejście składnikowe finansowe szeregi czasowe można przedstawić jako sumę (model addytywny) lub iloczyn (model multiplikatywny) poszczególnych składników. W dalszej części pracy dla celów predykcji zostaną usunięte niektóre ze składników szeregu, w celu dokonania prognozy na tak przekształconej próbie, by następnie za pomocą przekształcenia odwrotnego otrzymać prognozę dla badanego szeregu. W dalszej części pracy omawiany będzie model addytywny. Już na początku XX w., podczas badania koniunktury gospodarczej w Stanach Zjednoczonych, po I wojnie światowej zauważony został fakt, że procesy ekonomiczne, w tym finansowe szeregi czasowe, charakteryzują się niestacjonarnością. Aby wyjaśnić przyczyny powstawania niestacjonarności zaczęto wyodrębniać określone składniki z procesów ekonomicznych tj.: Y = P + S + C + η, gdzie: P trend (przejaw niestacjonarności), S wahania sezonowe, C wahania cykliczne (koniunkturalne), η nieregularne wahania przypadkowe 24. Trend P został określony przez Oskara Lange (1931) jako pewną ogólną tendencję rozwojową (ogólny kierunek rozwoju) charakteryzującą dany szereg czasowy na przestrzeni 23 Żebrowska-Suchodolska Dorota, Weryfikacja słabej formy efektywności za pomocą testów statystycznych na GWP w Warszawie, OPTIMUM STUDIA EKONOMICZNE NR 1 (41) 2009, s Piłatowska M., Modelowanie niestacjonarnych procesów ekonomicznych. Studium metodologiczne, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń 2003, s.27 24

25 dłuższego okresu (kilkunastu lub kilkudziesięciu lat). Generalnie trend rozumiany jest jako składnik procesu będący funkcją o spokojnym i gładkim przebiegu 25. Ze względu na specyficzny charakter finansowych szeregów czasowych można rozpoznać trendy trwające znacznie krócej np. kilka dni. Poprzez wyodrębnienie trendu i usunięcie go z finansowego szeregu czasowego, usuwa się niestacjonarność z szeregu. Wybór funkcji trendu nie jest ściśle określony przez kryteria matematyczno-statystyczne, a podlega raczej intuicji i doświadczeniu. Najbardziej adekwatną metoda wyodrębniania trendu ze względu na charakter tej części składowej procesów stochastycznych jest metoda krzywych wzrostu, która polega na wyznaczeniu analitycznej funkcji trendu poprzez wyznaczenie równania różniczkowego lub różnicowego, które obrazuje budowę funkcji trendu w czasie 26. Identyfikacja trendu jest niezwykle istotna w procesie analizowania szeregów czasowych. Po usunięciu trendu z procesu, czyli doprowadzeniu go do postaci stacjonarnej, wartości szeregu oscylują wokół wartości średniej, co oznacza, że w długim okresie funkcja trendu jest wyznacznikiem zmian, którym podlegają notowania badanego szeregu. Przyjmuje się, że aproksymata funkcji trendu wyznaczona jest prawidłowo, gdy odchylenia danych empirycznych od tak wyznaczonej funkcji są przypadkowe pod warunkiem, że badany szereg w swojej strukturze nie zawiera wahań sezonowych czy koniunkturalnych, których charakter nie jest przypadkowy. Należy więc uważać podczas wyodrębniania funkcji trendu, aby nie przyjąć wielomianu skomplikowanego w takim stopniu, że opisywałby także wahania nie będące wahaniami przypadkowymi, a ze względu na swa naturę niewchodzącymi w skład trendu. Biorąc pod uwagę te kwestie, przyjmuje się, że funkcja trendu powinna być możliwie nieskomplikowana oraz mieć gładki i spokojny przebieg. 27 Wahania sezonowe S są związane z występowaniem czynników zależnych od pewnych cyklicznych procesów występujących w ciągu określonego okresu. Mogą to być czynniki związane z porą roku tj. temperatura, długość dnia czy ilość opadów, ale równie dobrze mogą dotyczyć one kwartału, miesiąca, czy nawet tygodnia jak np. omawiany w pracach z zakresu finansów behawioralnych efekt poniedziałku na rynkach finansowych. Ich wystąpienie jest bardzo prawdopodobne, gdy bada się szereg złożony z danych 25 Zieliński Z., Metody analizy dynamiki i rytmiczności zjawisk gospodarczych, Polskie Wydawnictwo Naukowe, Warszawa Piłatowska M., s Kohn S., Z metodologii statystycznego badania koniunktury, Ekonomista, tom III, Warszawa 1929 r. s.9 25

26 miesięcznych lub zwłaszcza kwartalnych. O ile trend można przedstawić jako funkcję o określonym kształcie, to sezonowość nie jest już tak dokładnie zdefiniowana 28. Wahania cykliczne C związane są z występowaniem w gospodarce cykli koniunkturalnych. Ich wyodrębnienie może być utrudnione ze względu na ich nieregularność, różny czas trwania poszczególnych faz i wreszcie trudności w podzieleniu cyklu na fazy, rozróżnieniu ich i określeniu ich liczby. Wynika to z faktu, że każdy z cykli ma indywidualny, trudny do przewidzenia przebieg ze względu na mnogość czynników wpływających na gospodarkę. Nieregularne wahania przypadkowe η są relatywnie krótkotrwałe w stosunku do pozostałych składników procesu stochastycznego. Mogą być to wahania przypadkowe lub wahania katastrofalne danego procesu. Odnosząc się do finansowych szeregów czasowych ich przyczynami mogą być klęski żywiołowe lub niespodziewane decyzje polityczne, strategiczne decyzje zarządów spółek giełdowych i inne pod warunkiem, że nie mają ścisłego związku z czynnikami warunkującymi występowanie nadrzędnych składników ekonomicznych procesów stochastycznych czyli trendu i wahań sezonowych. Jak zauważył Oskar Lange (1967) trend i wahania cykliczne ekonomicznych procesów stochastycznych nie są od siebie niezależne. Zarówno jeden jak i drugi składnik determinują czynniki kształtujące ogólne tendencje rozwoju gospodarki, zatem próba oddzielenia trendu od wahań cyklicznych byłaby sztucznym i mylącym zabiegiem, stąd bardziej adekwatny w odniesieniu do finansowych szeregów czasowych jest model ukazujący trend i wahania cykliczne jako jeden spójny składnik: Y = P + S + η, Zakładając, że proces resztowy η jest procesem stacjonarnym o średniej równej zero, oraz że proces Y jest niestacjonarny w średniej to wartość oczekiwana procesu Y jest zmienna w czasie i wynosi: E(Y ) = P + S, 28 Frances Philip Hans, Time series models for bussines and economic forecasting. Cambrige University Press, Cambrige 1998 r. 26

27 Gdy przyjmie się, że składnik trendu deterministycznego jest funkcją liniową, a wahania sezonowe są regularne, powyższe równanie można przedstawić w dużym uproszczeniu jak na wykresie poniżej: Wykres 1. Dekompozycja procesy stochastycznego na trend i wahania sezonowe Źródło: Opracowanie własne Przedstawione na wykresie wahania sezonowe mają charakter deterministyczny, gdyż oscylują wokół funkcji trendu i dają się opisać przez okresową funkcję zmiennej czasowej t. 29 Jak wspomniano jest to duże uproszczenie, chociaż funkcja liniowa może być szczególnym przypadkiem trendu deterministycznego. Znacznie bardziej ogólne jest określenie trendu P jako krzywą ciągłą, która jest wyznaczone przez wartości oczekiwane procesu w dwuwymiarowym układzie współrzędnych, gdzie wartości na osi odciętych odpowiadają ciągłej zmiennej czasowej. W praktyce obliczenia przeprowadzane są na danych 29 Piłatowska M., Modelowanie niestacjonarnych procesów ekonomicznych. Studium metodologiczne, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń 2003, s.30 27

28 nieciągłych, więc trend wyznaczany jest przez punkty będące wartością oczekiwaną procesu dla wartości t w czasie dyskretnym 30. Finansowy szereg czasowy może być traktowany jako realizacja niestacjonarnego procesu stochastycznego ze zmienną wartością średnią. Wtedy trend jest nielosową funkcją zmiennej czasowej t, natomiast sezonowość jest wtedy okresową funkcją zmiennej czasowej t w okresie np. rocznym. Gdy jednak rozważymy szereg stacjonarny w szerszym sensie, czyli taki, który może być opisany jako rytmicznie oscylujący wokół pewnej wartości średniej z zachowaniem stałej wartości powtarzanych odchyleń, wtedy można zauważyć, że wahania sezonowe to odbicie struktury harmonicznej takiego procesu. Rozważając trend w ujęciu harmonicznym, nasuwa się więc wniosek, że trend musi być suma wszystkich ruchów harmonicznych o okresie równym lub dłuższym od badanego szeregu czasowego. 31 Podsumowując posługując się modelem addytywnym ekonomiczny proces stochastyczny przedstawia się jako sumę następujących składników:, Y = P + S + μ + ξ + η gdzie: μ - trend stochastyczny, ξ - sezonowość stochastyczna. Taki sposób dekompozycji przyjmuje niestacjonarność w średniej wyrażoną za pomocą składników P oraz S Istotny wpływ na proces dekompozycji finansowych szeregów czasowych mają czynniki na nie wpływające oraz zakres czasowy analizowanych danych. Jeżeli badane są notowania akcji spółek z różnych sektorów, niektóre z nich mogą np. wykazywać się słabą sezonowością, lub w ogóle nie posiadać tej cechy. Pozostając przy wahaniach sezonowych, ich przyczyny, częstotliwość oraz powtarzalność będą różne dla danych kwartalnych czy 30 Z. Zieliński, Metody analizy dynamiki i rytmiczności zjawisk gospodarczych, Polskie Wydawnictwo Naukowe, Warszawa 1979, s Piłatowska M., Modelowanie niestacjonarnych procesów ekonomicznych. Studium metodologiczne, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń 2003, s.27 28

29 miesięcznych, a różne dla dziennych, ponieważ zmiany widoczne dla krótszych odcinków czasu mogą być niewidoczne w dłuższych interwałów zwłaszcza, gdy badaniu podlegają wyłącznie dane z końca każdego okresu. Zwłaszcza cecha powtarzalności, która, jeżeli zostanie wychwycona, może być zasadniczym czynnikiem decydującym o trafności prognozy, może być trudna do wychwycenia dla danych o większych interwałach czasowych, gdy pochodzą one z rynków tak młodych jak np. Giełda Papierów Wartościowych w Warszawie. Reasumując, to jak przeprowadzony zostanie proces dekompozycji zależy od wielu czynników oddziaływujących na wartości badanego szeregu czasowego, ze względu na rodzaj i charakter analizowanej zmiennej, a także skalę w jakiej rozważane jest zjawisko. 29

30 ROZDZIAŁ II WYBRANE METODY MODELOWANIA FINANSOWYCH SZEREGÓW CZASOWYCH 2.1. Modele parametryczne zmienności Modele autoregresji z heteroskedastycznością warunkową znalazły wiele zastosowań na rynku kapitałowym. Zalicza się do nich szczególnie modelowanie kursów walut, czy notowań surowców, testowanie modelu CAPM (capital asset pricing model). Używa się ich także przy konstrukcji modeli wartości zagrożonej VaR (Value-at-Risk). Modele te mogą być jedno lub wielowymiarowe, więc możliwa jest za ich pomocą analiza pojedynczych szeregów finansowych lub portfeli akcji, czy innych instrumentów finansowych. Użycie modeli parametrycznych wymaga identyfikacji struktury, rodzaju procesu, a następnie wyboru odpowiedniej, szczególnej dla danej struktury metody, która jest w stanie możliwie efektywnie opisać badany przypadek oraz estymacji współczynników równania, które przybliża badany proces. Do oszacowania parametrów modeli używa się metod tj.: metoda najmniejszych kwadratów (MNK), czy rekurencyjna metoda najmniejszych kwadratów (RMNK), metody największej wiarygodności i innych Równanie ARCH Model ARCH został wprowadzony przez Engle a w 1982 roku. Ogólną postać tego modelu można zapisać jako: y = x ξ + ε gdzie: x wektor zmiennych objaśniających, którymi mogą być wartości zmiennej objaśnianej z opóźnieniem, ξ wektor parametrów, ε składnik stacjonarny procesu (biały szum) W praktyce model ARCH używa się do modelowania stóp zwrotu wyłącznie poprzez ich warunkową wariancję Metoda opiera się na dwóch założeniach: badany szereg nie wykazuje autokorelacji, ale jego stopy zwrotu są od siebie zależne w czasie, 30

31 zależności rządzące składnikiem resztowym można zapisać za pomocą funkcji kwadratowej jego wartości opóźnionych o postaci: r = μ + a, a = σ ε, σ = α + α a gdzie: + + α a, r - stopa zwrotu z instrumentu finansowego w okresie t, μ - wartość oczekiwana stopy zwrotu, ε - sekwencja niezależnych przypadkowych zmiennych o identycznych rozkładach, o średniej 0 i wariancji 1, σ - warunkowe odchylenie standardowe, α - wagi modelu. Dodatkowo muszą zostać spełnione warunki: α > 0, α 0 dla i > 0, współczynniki α równania muszą wykazywać się pewną regularnością tak, aby wariancja a była skończona. W praktyce zmienna ε ma rozkład normalny lub standaryzowany rozkład t-studenta lub uogólniony rozkład błędu. Samo równanie ma konstrukcję prostego modelu autoregresyjnego (AR) dla zmiennej a, która jest nazywana szokiem stopy zwrotu. Jak widać we wzorze, model jest skonstruowany tak, że wariancja warunkowa σ wynika z wartości szoków {a }, a każda kolejna wartość α wpływa na wartość wariancji warunkowej, a także na wartość prognozy. Oczywiste jest, że wysoka wartość 31

32 wariancji warunkowej nie oznacza wcale wysokiej wartości przyszłej wartości, a jedynie wyższe prawdopodobieństwo większych odchyleń. 32 Do słabych stron modelu ARCH można zaliczyć to, że zakłada identyczny wpływ ujemnych oraz dodatnich szoków stopy zwrotu na zmienność i tym samym cenę instrumentów finansowych, ponieważ do modelu używane są kwadraty szoków. Poza tym w modelu nie bierze się pod uwagę czynników, które bezpośrednio lub pośrednio wpływają na wariancję ceny i wyjaśniają wystąpienie określonych zdarzeń, a jedynie odwzorowuje za jego pomocą warunkową wariancję w sposób mechaniczny i zakładający powtarzalność. Co za tym idzie model może przewidzieć wariancję znacznie wyższą niż występuje w rzeczywistości ze względu na to, że zareaguje powoli na pojedyncze relatywnie duże szoki stopy zwrotu Jednowymiarowe modele typu GARCH Równanie GARCH(q,p), czyli uogólniony model autoregresyjny z warunkową heteroskedastycznością (generalized autoregressive conditional heteroscedascity model) zostało wprowadzone w 1986 roku przez duńskiego ekonomistę Tima Bollersleva jako rozwinięcie modelu ARCH(q). Zależność pomiędzy procesami GARCH i ARCH można porównać do zależności pomiędzy modelami autoregresji średniej ruchomej ARMA(p,q) oraz autoregresji AR(p). Równania ARCH i GARCH określają warunkową wariancję σ za pomocą zależności liniowych: ARCH (p) σ = α + α X GARCH(p, q) σ = α + α X, + β σ przy czym parametry α oraz β równania są nieujemnymi liczbami rzeczywistymi oraz: α > 0, β > 0, α + β < 1., 32 Tsay Ruey S., Analysis of Financial Time Series. Second edition, Wiley series in probablity and statistics, Wiley Interscience 2006, s Ibidem, s

33 Z powyższych wzorów wynika, że w równaniu GARCH został uwzględniony bezpośredni wpływ wariancji warunkowej z poprzednich procesów na wariancję warunkową w okresie t. 34 gdzie: Równanie GARCH(1,1), ma postać: σ = (1 α β)σ + αx + βσ, σ - wariancja bezwarunkowa (długookresowa), X - kwadrat stopy zwrotu z okresu t-1, σ - wariancja krótkookresowa dla okresu t-1, α, β - wagi, parametry równania estymowane za pomocą funkcji największej wiarygodności. Wartość wariancji estymowanej za pomocą modelu GARCH(p,q) jest więc zależna od kwadratów stopy zwrotu, wariancji krótkookresowych oraz wariancji długookresowej. Równanie GARCH zostało wprowadzone, aby efektywniej dostosować metody modelowania do własności szeregów finansowych tj. grube ogony ich rozkładów, czy długa pamięć szeregów finansowych 35. Nie znaczy to, że jest pozbawione mankamentów. Jako wady modelowania za pomocą równania GARCH wymienia się: wymagane jest, aby parametry były dodatnie dla każdego punktu w badanym czasie, model nie potrafi wyjaśnić asymetrii rynku (efekt dźwigni) polegającej na występowaniu wyższej zmienności dla ujemnych stóp zwrotu w danych empirycznych, niezwykle trudne jest mierzenie trwałości wpływu minionych szoków cenowych na zmienność Chung Steve S., A Class of Nonparametric Volatility Models: Applications to Financial Time Series, September 30, 2012, s Osińska M., Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s Nelson D.B., Conditional Heteroskedastcity in Asset Returns: A new Approach. Econometrica,(59) 1991 s

34 Aby rozwiązać te problemy i efektywniej dopasować model do rzeczywistych warunków panujących na rynkach finansowych, Nelson (1991) zaproponował równanie w układzie wykładniczym - exponential GARCH(m,δ) (EGARCH(m,δ)) zdefiniowany jako: gdzie: ln(σ ) = α β B + + β B 1 α B α B g(ε ), B operator przesunięcia wstecz (back-shift operator) W EGARCH zaproponowano rozwiązanie problemu związanego z modelowaniem asymetrii na rynkach finansowych poprzez wprowadzenie: g(ε ) = θε + γ[ ε E( ε )], co można zapisać jako: g(ε ) = (θ + γ)ε γ E( ε ) jeżeli ε 0 (θ γ)ε γ E( ε ) jeżeli ε < 0 Przy czym wartość oczekiwana zmiennej ε jest zależna od rozkładu jaki zostanie przyjęty. Jeżeli podczas modelowania przyjmie się, że zmienna ε ma Gaussowski rozkład normalny, wtedy: E( ε ) = 2 π, Jeżeli natomiast przyjmie się rozkład t-studenta, wtedy: E( ε ) = Wielowymiarowe modele klasy GARCH 2 v 2Γ[(v + 1) 2 ] (v 1)Γ(v 2) π. Wielowymiarowe modele zmienności znajdują zastosowanie przy badaniu siły zależności występujących na rynkach finansowych. Może być to rozumiane np. jako badanie wpływu zmian zachodzących na rynkach rozwiniętych na rynki wschodzące lub odwrotnie, czy też istoty interakcji pomiędzy gospodarkami będącymi strategicznymi partnerami handlowymi. Z drugiej strony modele typu multiple GARCH mogą zostać użyte w celu badania interakcji na rynku finansowym w rozumieniu wpływu na rynki kapitałowe czynników tj. stopy procentowe, ceny towarów, kursy walut. Uwzględnienie wariancji i 34

35 warunkowej kowariancji daje szerszy i bardziej wnikliwy wgląd w naturę badanych zjawisk gospodarczych. Wielowymiarowe modele GARCH są narzędziem odpowiednim do rozwiązania tego problemu. Jeżeli przyjmie się, że Y t to N-wymiarowy proces stochastyczny o warunkowej średniej μ oraz warunkowej wariancji H,wtedy: Y Ψ ~N(μ, H ), ε Ψ ~N(0, H ), co oznacza, że stopa zwrotu Y takiego wielowymiarowego procesu stochastycznego w rozważanym przypadku zależy od warunkowej wartości oczekiwanej stopy zwrotu μ oraz impulsu ε podobnie, jak w przypadku procesów jednowymiarowych. gdzie: Ogólne równanie VechGARCH ma postać: vech(h ) = W t + A vech(ε, ε ) Y, μ, ε - wektory o wymiarach (N 1), + B vech H H - symetryczna macierz warunkowych wariancji, kowariancji (N N), W - wektor o wymiarach [N(N + 1) 2 1], A, B - macierze o wymiarach [N(N + 1) 2 N(N + 1) 2], vech(m) - operacja przekształcenia macierzy M tak, aby powstał wektor: m, m, m vech(m) =, m,, m, który składa się kolejno z każdego elementu diagonalnego macierzy M oraz elementu znajdującego się bezpośrednio poniżej każdego z elementów diagonalnych za wyjątkiem m,. Gdy macierz jest symetryczna, operację można odwrócić. 35

36 Model uwzględnia zatem zarówno wariancję poszczególnych zmiennych, jak i kowariancję zmiennych wchodzących w jego skład. Dużą niedogodnością korzystania z tego modelu jest to, że macierz H powinna być określona dodatnio dla wszystkich możliwych wartości procesu, co jest niezwykle trudnym zadaniem. Z tego powodu wielowymiarowe modele GARCH pod tą właśnie postacią nie są raczej stosowane w praktyce. 37 Aby zniwelować ograniczenie dotyczące dodatnio określonej macierzy H zaproponowane zostały wielowymiarowe modele GARCH, w których konstrukcji nie jest zawarte przekształcenie vech(.). W 2002 roku Engle zaproponował model ze zmienną w czasie korelacją, który posiadał mniej założeń i przez to stał się bardziej uniwersalny - DCC-GARCH(p,q) (Dynamic Conditional Correlation GARCH) o postaci: H = D R D D = diag h, gdzie: R = (Q I ) Q (Q I ) Q = (1 α β)q + αz z R - zmienna w czasie macierz korelacji pomiędzy zmiennymi, h, - warunkowa wariancja zmiennej i w momencie t, + βq Q - macierz wariancji i kowariancji (w wariancie diagonalnym modelu jest to diagonalna macierz wariancji zmiennych) gdzie: h = a + Aε ( ) + Bh, ε, = h, z,, z - wektor standaryzowanych reszt modelu z ~ID(0, R ) 37 Osińska M, Ekonometria finansowa, Polskie Wydawnictwo Ekonomiczne, Warszawa 2006, s

37 Parametry modelu są estymowane za pomocą funkcji największej wiarygodności. Macierz warunkowych korelacji można określić wzorem: Można powiedzieć, że podstawowym zadaniem modelu DCC-GARCH jest pomiar ryzyka portfela instrumentów finansowych, jednakże jako że jest to model wielowymiarowy i estymacja jego parametrów dostarcza danych o sile zależności pomiędzy zmiennymi poddanymi modelowaniu można go wykorzystać do pomiaru zależności pomiędzy dowolnymi dwiema zmiennymi wchodzącymi w skład modelu Modele nieparametryczne Niezwykle trudnym zadaniem jest wychwycenie zależności nieliniowych pomiędzy zmiennymi objaśniającymi a zmienną objaśniającą. Nic nie stoi na przeszkodzie aby sięgnąć po jedne z bardziej zaawansowanych metod komputerowych, które korzystają z większej, w porównaniu do metod parametrycznych mocy obliczeniowej oraz nie wymagają założeń co do właściwości badanych zmiennych. Główną zasadą działania metod nieparametrycznych jest wygładzanie danych empirycznych. Można to wytłumaczyć na poniższym przykładzie zmiennej Y zależnej od zmiennej X. Dana jest funkcja: Y = m(x ) + a, gdzie: m(x t ) wygładzona, nieznana funkcja, a t biały szum. Zadaniem metod nieparametrycznych jest estymacja nieliniowej funkcji opisującej badane dane. Rozważając problem estymacji funkcji dla przypadku szczególnego, gdzie X=x i dane są wielokrotne, niezależne obserwacje y 1,,y T, badaną zbiorowość można zapisać w postaci: y = m(x) + a, t = 1,, T, 37

38 Mocne prawo wielkich liczb mówi, że wraz ze wzrostem liczby prób T, średnia różnica pomiędzy wartością historyczną a estymowaną badanej zbiorowości dąży do zera. Dlatego właśnie prosta średnia arytmetyczna: y = 1 T y, jest właściwym estymatorem dla funkcji m(x). Zatem przyjmując wartość średnią danych otrzymano: 1 T y = m(x) + 1 T a, Finansowe szeregi czasowe nie składają się z powtarzalnych obserwacji dostępnych dla X=x, a z obserwacji {(y, x )} dla t = 1,, T, czyli wartości zmiennej objaśnianej odpowiedniej dla każdej z wartości zmiennej objaśniającej w przyjętych odstępach czasu dla badanego zakresu czasu. Jeżeli jednak funkcja m(.) jest wystarczająco wygładzona, wartość Y, dla której X x nadal jest dostatecznie dobrym przybliżeniem funkcji m(x). Aby wartość estymowana m (x) była możliwie jak najbardziej zbliżona do wartości rzeczywistej, do formuły wprowadza się wagi w, które są większe dla tych y, dla których x jest w mniejszej odległości od x, a mniejsze dla tych y, dla których x jest w większej odległości od x. Wtedy estymator funkcji m(x) ma postać: m (x) = 1 T w (x)y Wagi mogą sumować się do wartości T (Tsay, 2006 r.), nie znaczy to jednak, że każda z wag nie może zostać podzielona przez wartość T tak, aby sumowały się do jedności. Reasumując, wartość m (x) to lokalna średnia ważona z wagami zdeterminowanymi dwiema zmiennymi. czyli odległością pomiędzy x oraz x. Drugim z czynników wpływającym na wartość estymowanej funkcji jest przypisanie odpowiednich wag dla tych odległości. 38

39 Należy pamiętać, że korzystanie z metod nieparametrycznych do modelowania zależności nieliniowych wiąże się z pewnymi niebezpieczeństwami Problem nadmiernego dopasowania modelu Jednym z podstawowych problemów związanych z wykorzystaniem nieparametrycznych modeli ekonometrycznych do predykcji finansowych szeregów czasowych jest kwestia nadmiernego dopasowania modelu do danych zmiennej objaśnianej, na podstawie których był konstruowany. Model statystyczny powinien być uogólnieniem rzeczywistości, jednakże gdy ma zbyt wiele parametrów, wprowadzonych podczas procesu konstruowania modelu, może się okazać podczas skonfrontowania z danymi tego samego zbioru, które nie posłużyły do konstrukcji modelu, że model nie opisuje dostatecznie dobrze tej części zbioru danych, ponieważ jest zbyt dokładnie dopasowany do konkretnych przypadków na podstawie których został zbudowany. Wynika to z tego, że model zawiera w sobie informacje o przypadkowych wahaniach w zbiorze danych użytych do jego konstrukcji, które nie mają znaczenia dla predykcji przyszłych wartości badanej zmiennej. Jeżeli model jest zbyt złożony, dla zbioru użytego do konstrukcji oraz zmiennych wygenerowanych przez model zachodzi zależność: J(θ) = 1 2T (h(x ) y ) 0 gdzie: h(x ) wartości wynikające z modelu, hipotezy weryfikowane w końcowej fazie budowy modelu, y wartości historyczne zmiennej objaśnianej. Przyczyną nadmiernego dopasowania modelu może być na przykład zbyt mała ilość przypadków w próbie użytej do budowy modelu, przez co nawet relatywnie prosty model może wykazać się niemal zerowym błędem. Rozważając jednak to zagrożenie trudno mówić o zadowalającej liczbie przypadków, która powinna być odpowiednia dla celów predykcji w zależności czy jest nim przewidzenie wartości notowań w punkcie t+1 rozważając stopę zwrotu z instrumentu, czy może aż t+260 rozważając wartość notowań analizowanej 38 Tsay R. S., Analysis of Financial Time Series. Second edition, Wiley series in probablity and statistics, Wiley Interscience 2006, s

40 zmiennej. Oczywistym jest (pomijając niezwykle nikłe prawdopodobieństwo uzyskania niskiego błędu przy próbie predykcji tak odległej wartości przyszłej, jak w drugim przypadku), że wraz ze wzrostem horyzontu prognozy, potrzebna jest większa liczba przypadków w zbiorze, na podstawie którego konstruuje się model, a także rozsądnie zmniejsza się ilość parametrów w celu wychwycenia jedynie tendencji, która cechuje zachowanie ceny instrumentu w dłuższym okresie. Wykres 2. Użyteczność a złożoność modelu Źródło: Yaser S. Abu-Mostafa, Learning From Data Lecture 4: Error and Noise, California Institute of Technology, 2012 Ryzyko zbudowania zbyt złożonego modelu jest szczególnie wysokie podczas używania oprogramowania komputerowego, za pomocą którego możliwe jest niemal natychmiastowe poddanie analizie zmiennych za pomocą wybranych metod. Aby zapobiec 40

41 złudzeniu niezwykle wysokich wyników, jakie uzyskuje się na zbiorze danych użytych do konstrukcji modelu możliwe jest podzielenie przypadków na część używaną do konstrukcji modelu oraz część używaną w celu sprawdzenia wyników modelu na danych nie użytych do konstrukcji, będących jednak oczywiście danymi historycznymi z tego samego poddanego analizie zbioru danych. Podczas rozwiązywania problemu polegającego na predykcji finansowych szeregów czasowych, model może być uznany za efektywny, gdy generuje poprawne wartości (rozumianych jako wskazanie kierunku zmiany) zaledwie w 53-60% przypadków próby uczącej, ponieważ mniejszy błąd w zbiorze uczącym najprawdopodobniej oznacza nadmierne dopasowanie modelu do danych i tym samym generowanie poprawnych wartości na nowych danych z tego samego szeregu poniżej 50%, co nawet pomijając koszty transakcyjne powinno oznaczać porażkę. Zależność pomiędzy rozbieżnością pomiędzy wartościami błędu w zbiorze uczącym i poza nim wraz ze wzrostem pojemności informacyjnej modelu została przedstawiona na Wykresie 2. Pojawia się tutaj pojęcie wymiaru Vapnika-Chervoneniksa (d ), który określa złożoność, pojemność informacyjną modelu ze względu na liczbę hipotez h(x ) będących częścią budowy modelu. Jest to zatem maksymalna liczba punktów, które mogą zostać rozdzielone przez zestaw hipotez H Metoda Multivariate Adaptive Regression Splines w modelowaniu szeregów czasowych Używanie modeli parametrycznych może być kłopotliwe dla szeregów wielowymiarowych o liczbie wymiarów powyżej dwóch, ponieważ liczba prób potrzebnych do rzetelnej analizy (aby dostatecznie gęsto zapełnić przestrzeń euklidesowską) rośnie w wykładniczo wraz z każdym nowym wymiarem. 39 Dla celów niniejszej pracy postanowiono użyć techniki nieparametrycznej wprowadzonej do użycia w roku 1991 przez Jerome H. Friedmana, a mianowicie: wielozmiennej regresji adaptacyjnej z użyciem funkcji sklejanych (Multivariate Adaptive Regression Splines - MARSplines), dostępnej w pakiecie STATISTICA. Omawiana metoda nadaje się do rozwiązywania problemów zarówno regresyjnych jak i klasyfikacyjnych. Ze 39 Friedman Jerome H., Multivariate Adaptive Regression Splines,, The Annals of Statistics, Vol. 19 Mar.1991, s.1-67, Stanford University, s.4 41

42 względu na temat pracy (w dalszej części pracy algorytm MARSplines będzie wykorzystywany do predykcji zmiennej objaśnianej będącej szeregiem czasowym) nacisk zostanie położony na rozwiązywanie problemów regresyjnych, chociaż sama metoda jest także stosowana przy rozwiązywaniu problemów klasyfikacyjnych. Metoda MARSplines uważana jest za rozszerzenie regresji liniowej, jednakże jej główną różnicą jest brak założenia o normalności rozkładu analizowanej próby. Założeniem stawianym przed użyciem metody nie jest także występowanie zależności liniowej pomiędzy zmiennymi objaśniającymi a zmienną objaśnianą, dlatego sprawdza się w sytuacjach, gdy występowanie istotnej zależności nie jest jednoznaczne, chociaż o takiej zależności mogą sugerować przesłanki fundamentalne. Algorytm może być także używany do odkrywania zależności pomiędzy zmiennymi w celu wyselekcjonowania oraz użycia wybranego zestawu predyktorów (zm. objaśniających) do budowy modelu za pomocą innej metody. MARSplines jest procedurą adaptacyjną, ponieważ funkcje bazowe wybierane są na podstawie zestawu danych i automatycznie odnoszą się do rozwiązywanego problemu. Omawiany model jest modelem sklejanym więc składa się z funkcji bazowych, jednakże nie jest to model addytywny, a multiplikatywny 40. Równanie ogólne MARSplines ma postać: gdzie: gdzie: f(x) = β + β h (X) 1, m = 1 h (X) = s x ( ) t, m 2 K - liczba interakcji dla funkcji bazowych w liczbie m, s - znak lub +, x ( ) - zmienna objaśniająca j w m-tym iloczynie, 40 Taylan Pakize, Weber Gerhard-Wilhelm, Özkurt Fatma Yerlikaya, A new approach to multivariate adaptive regression splines by using Tikhonov regularization and continius optimization, Sociedad de Estadística e Investigación Operativa

43 t - położenie zmiennej w węźle. Wykres 3. Funkcje bazowe MARSplines Źródło: Wartość bezwzględna t oznacza wartość powyżej której wartość zmiennej niezależnej wpływa na wartość zmiennej zależnej. Funkcje bazowe (x t) oraz (t x ), Są przedstawione na Wykresie 3. Jak widać na załączonym wykresie, funkcje bazowe algorytmu dla argumentów ujemnych przyjmują wartość równą zero. Procedura użycia algorytmu nie należy do nazbyt złożonych, jednakże używanie algorytmów tego typu stało się o bardziej popularne dopiero wraz z rozwojem mocy obliczeniowej komputerów ze względu na duże ilości danych i obliczeń wykonywanych podczas użycia tej metody. Poniżej została przedstawiona procedura użycia metody MARSplines z trzema funkcjami bazowymi. Pierwszym krokiem procedury jest utworzenie pierwszej hipotezy, funkcji bazowej: h (X) = 1. Zakres, do którego odnosi się funkcja h (X) obejmuje całą dziedzinę. Następnie algorytm wprowadza dwie kolejne funkcje bazowe: h (X) = h (X)(x t) = (x t), h (X) = h (X)(t x ) = (t x ). gdzie: t {x : 1 i N, 1 v p}, 43

44 Natomiast x oraz t są wybierane na poprzez minimalizację sumy kwadratów błędów (RSS - Residual sum of squares): {y β β (x t) β (t x ) }. dla v = 1, 2,, p. Procedura jest kontynuowana dla każdego t oraz v aż do wybrania pary (x t ), dla której suma kwadratów błędów jest najniższa. W wyniku tych działań otrzymuje się model: f (x) = β + β (x t ) + β (t x ), przy czym lokalizacja węzła t wybierana jest tak, aby zminimalizować sumę kwadratów błędów. Cała procedura polega na żmudnym wyszukiwaniu funkcji, które leżą najbliżej zmiennej objaśnianej. Prowadzi to do następnego kroku, którym jest rozważenie pary otrzymanych w ten sposób funkcji: B (x)(x t) oraz B (x)(t x ), gdzie dla każdego B (x) zostaje wybrana funkcja bazowa B (x) = 1, B (x) = (x t ) lub B (x) = (t x ) Funkcje są wybierane tak, aby zminimalizować sumę kwadratów. Gdy procedura zostanie powtórzona M razy otrzymanych zostaje 2M + 1 funkcji bazowych w modelu. Każda z funkcji ma postać: 44

45 1, m = 1 h (X) = s x ( ) t, m 2 Maksymalna liczba funkcji bazowych w modelu jest wybierana przed uruchomieniem całej procedury. Parametr M powinien być dobrany tak, aby otrzymany dotąd model był nadmiernie dopasowany do zbioru uczącego tak, aby po drodze znajdowało się optymalne rozwiązanie. Optymalizacja modelu zachodzi poprzez uruchomienie procedury wstecznej polegającej na zastosowaniu uogólnionego sprawdzianu krzyżowego (GCV generalized cross-validation) zaproponowanej w 1979 r. przez Petera Cravena oraz Grace Wahbę w postaci: GCV(M) = 1 N y f (x ) 1 C(M) N, gdzie C(M) to funkcja kary złożoności modelu mająca postać: C(M) = (liczba parametrów) + d(liczba funkcji bazowych) = (M + 1) + dm gdzie d to parametr wybierany przed rozpoczęciem całej procedury oznaczający wielkość kary za powiększanie złożoności modelu, który jak zasugerował Friedman (1991) powinien mieć wartość 2 < d < 4 w celu osiągnięcia jak najlepszych wyników zastosowania GCV. Został nazwany przez Friedmana jako parametr wygładzenia modelu gdyż wraz z jego wzrostem otrzymuje się mniej węzłów na końcu procedury i tym samym funkcja otrzymana na końcu ma bardziej gładki przebieg. 41 Zastosowanie uogólnionego sprawdzianu krzyżowego pozwala w sposób możliwie optymalny dopasować model do danych tak, aby funkcje bazowe, które zostaną w modelu po zastosowaniu procedury wstecznej wykazywały się niewielkim błędem średniokwadratowym, a ponadto nie wpływały negatywnie na rezultaty zastosowania modelu na zbiorze danym innym niż uczący wynikające z nadmiernego dopasowania modelu do danych Friedman J.H., Multivariate Adaptive Regression Splines, The Annals of Statistics, Vol. 19, No 1, 1991 r. s Chung Steve S., A Class of Nonparametric Volatility Models: Applications to Financial Time Series, September 30, 2012, s

46 Działa to na zasadzie tolerowania coraz to niższej wartości wzrostu wartości błędu wraz z powiększeniem złożoności modelu o jeden stopień. Próg tolerancji jest kolejnym z parametrów wybieranych przed rozpoczęciem całej procedury. Schemat 2. Algorytm MARSplines Źródło: Opracowanie własne na podstawie Podręcznik elektroniczny STATISTICA Procedurę najlepiej stosować wtedy, gdy nie jest możliwe równie efektywne rozwiązanie matematyczne polegające na estymacji określonej funkcji opisującej zmienną objaśnianą. Właściwie to MARSplines oraz inne metody data mining wyznaczają model jedynie w dziedzinie, która zawiera zbiór danych poddany analizie ponieważ nie istnieje sposób, za pomocą którego można z pewnością przewidzieć jak funkcja zachowa się poza zakresem badanej próby. 43 Jedną z istotnych cech metod data mining jest to, że nie jest brany pod uwagę typ rozkładu badanych zmiennych. Do cech charakterystycznych funkcji sklejanych należałoby zaliczyć fakt, że wartości zmiennych z jednego okresu czasu mogą występować w równaniu więcej niż raz. 43 Abu-Mostafa Yaser, Learning From Data, Californian Institute of technology, 2012, Lecture 2, Is Learning Feasible 46

47 ROZDZIAŁ III PODSTAWOWE CHARAKTERYSTYKI BADANYCH SZEREGÓW CZASOWYCH Notowania głównych indeksów giełd papierów wartościowych działających na terenie poszczególnych krajów są odzwierciedleniem aktualnej sytuacji poszczególnych państw, które to ze względu na wzajemne interakcje nierzadko są od siebie zależne w większym lub mniejszym stopniu. Bezpośrednie, czy też pośrednie powiązania rynków finansowych, gospodarek mogą być przyczyną powstawania globalnych kryzysów finansowych, gospodarczych, których ogniskiem jest tylko jedno z państw. Główny indeks giełdy Stanów Zjednoczonych tj. Standars&Poor500 w skład którego wchodzi 500 największych pod względem kapitalizacji spółek z USA jest podstawowym wskaźnikiem sytuacji gospodarczej, czy też w krótszym okresie nastroju inwestorów, który może rozlać się na inne gospodarki. Niemniej jednak niezależne czynniki wewnętrzne także wpływają na sytuację w kraju i tym samym wartość notowań głównego indeksu giełdowego. Dodatkowo ważnym atutem jest częstotliwość wyceny indeksów giełdowych. Wykres 4. Standaryzowane notowania omawianych indeksów w dniach r. Źródło: Opracowanie własne 47

48 3.1. Charakterystyka badanych zmiennych Poniżej zaprezentowane zostały podstawowe charakterystyki badanych szeregów czasowych w okresie od 5 stycznia 2004 roku do 15 kwietnia 2013 roku. Okres analizy obejmuje 2412 prób. Ze względu na różnice co do dni otwarcia sesji, brakujące dane zostały uzupełnione o wartość średnią. Analizowane są notowania indeksów na zamknięcie sesji giełdowej. Średnie badanych szeregów czasowych są dodatnie, bliskie zeru, a ich odchylenia standardowe, za wyjątkiem odchylenia standardowego indeksu giełdy Szanghaiskiej, są na podobnym poziomie i mieszczą się w granicach 1,2-1,7%. Generalnie jeżeli ogół instrumentów finansowych wchodzących w skład portfela nie jest ze sobą dodatnio skorelowany, odchylenie standardowe portfela powinno być niższe niż średnia ważona odchyleń standardowych wchodzących w jego skład, co wynika za wzoru na odchylenie standardowe portfela akcji. Tabela 1. Średnie, wariancje i odchylenia standardowe badanych szeregów czasowych WIG20 BSHARE CAC40 DAX FTSE100 HANGSENG NIKKEI225 SP500 średnia - µ(%) 0,0172 0,0387 0,0013 0,0276 0,0145 0,0233 0,0090 0,0155 wariancja - σ 2 (%) 0,0251 0,0438 0,0215 0,0201 0,0153 0,0272 0,0244 0,0176 odchylenie stand. - σ(%) 1,5866 2,0932 1,4664 1,4160 1,2365 1,6486 1,5611 1,3257 Źródło: Opracowanie własne Z założenia jeżeli główny indeks giełdy ma odzwierciedlać sytuację gospodarczą obszaru, na którym działają spółki notowane na giełdzie, której głównym indeksem jest ten właśnie indeks, to portfel indeksu powinien być zdywersyfikowany tak, żeby wyeliminować ryzyko specyficzne poszczególnych akcji wchodzących w jego skład tak, aby portfel indeksu podlegał wyłącznie ryzyku rynkowemu. Wtedy jeżeli gospodarka tego obszaru nie jest szczególnie wrażliwa na jeden lub kilka relatywnie bardziej zmiennych czynników jak np. kursy walut lub ceny surowców, czy też sytuacja geopolityczna, odchylenie standardowe 48

49 portfela powinno nie być wysokie ze względu na to, że zmiany jak to można określić zostaną rozmyte. Zadanie jest utrudnione ze względu na to, że dni zamknięcia giełd, z których pochodzą badane indeksy nie zawsze się pokrywają. Chcąc zatem porównać stopy zwrotu z notowań indeksów należy albo pominąć przypadki w których dane są niekompletne ze względu na brak obrotu na jednej lub większej ilości giełd w danym dniu należałoby albo usunąć ze zbioru przypadki, które są niekompletne, albo wypełnić luki w danych np. wartością średnią szeregów, która w badanych przypadkach jest bliska zeru. Podczas zamknięcia którejś z giełd, może nastąpić istotna zmiana na innym rynku, której wpływ będzie widoczny na następnej sesji giełdy lub giełd, które były wtedy zamknięte. Ze względu na ten fakt postanowiono nie usuwać przypadków, w których dane są niekompletne, a zamiast tego uzupełniać dane o wartości średnie danych szeregów. Jak wspomniano wyżej, dane zostały zniekształcone podczas uzupełniania brakujących wartości notowań. Różnicę widać szczególnie na histogramach stóp zwrotu. Wyraźnie zawyżona została liczebność wartości średniej stóp zwrotu badanych zmiennych, jednakże ze względu na to, że dalszej analizie podlegają uzupełnione szeregi, co jest koniecznością ze względu na to, że są to szeregi czasowe, histogramy przedstawiają uzupełnione dane. Test Kolomogrova-Smirnova dla wszystkich z badanych zmiennych wskazuje na istotną różnicę pomiędzy rozkładami zmiennych a rozkładem normalnym, jednakże wynika to z faktu znacznej ilości prób w okolicach wartości średnich szeregów. Krytyczna wartość d =, = 0, jest mniejsza niż różnice pomiędzy wartością rozkładu zmiennych oraz wartością częstości wynikającą z rozkładu normalnego po dodaniu przedziałów w okolicach wartości średniej. Rozkłady zmiennych są symetryczne, z niewielką przewagą wartości dodatnich stóp zwrotu. Poniżej przedstawione są wykresy częstości stóp zwrotu z portfeli ośmiu analizowanych indeksów. Na poszczególne histogramy zostały nałożone wykresy rozkładu normalnego w kolorze czerwonym, których parametry średniej i odchylenia standardowego są identyczne z tymi parametrami odpowiednimi dla każdego indeksu. Nad wykresami przedstawione są wyniki testów na normalność rozkładu stóp zwrotu z poszczególnych indeksów. 49

50 Wykres 5. Histogramy logarytmicznych stóp zwrotu z badanych indeksów w okresie r. z oczekiwaną wartością rozkładu normalnego Źródło: Opracowanie własne 50

51 3.2. Zależności pomiędzy badanymi zmiennymi Gdy weźmie się pod uwagę badany w pracy okres tj r. siła zależności pomiędzy gospodarkami oraz ich integralną częścią jaką są ich rynki finansowe, przybrała szczególnie widoczna formę podczas globalnego kryzysu finansowego , który miał swój początek na rynku kredytów hipotecznych w USA, czy też po klęsce żywiołowej, która w marcu 2011 roku nawiedziła trzecią co do wielkości gospodarkę świata Japonię. Można zauważyć, że wtedy to właśnie notowania indeksów wyjątkowo zgodnie zmieniały się w tym samym kierunku. Zależności wydają się być szczególnie silne podczas gdy gospodarki zmagają się z problemami, jednakże okresy wzrostów omawianych indeksów, jak można ocenić intuicyjnie na podstawie powyższego wykresu, w pewnym stopniu się także się pokrywają. Zależności pomiędzy badanymi indeksami w całym badanym okresie, bez względu na czas wystąpienia, zostały zmierzone za pomocą miar korelacji liniowej Pearsona oraz kowariancji opisanych w rozdziale pierwszym. Tabela 2. Macierz korelacji badanych szeregów czasowych Źródło: Obliczenia własne Tabela 3. Macierz wariancji i kowariancji badanych szeregów czasowych Źródło: Obliczenia własne 51

52 Wyraźnie silniejsze są zależności pomiędzy indeksami europejskimi CAC40, DAX i FTSE100. Wartość współczynnika korelacji WIG20 oraz S&P500 jest niewielka, jednakże wartości współczynników korelacji indeksu giełdy nowojorskiej z wymienionymi wcześniej trzema indeksami europejskimi są relatywnie wysokie i na poziomie porównywalnym do współczynników korelacji indeksów giełd francuskiej, niemieckiej i brytyjskiej z indeksem giełdy polskiej. Ze względu na występowanie takiego łańcucha zależności domniemuje się istotny wpływ gospodarki wymienionych krajów na gospodarkę polski. Wykres 6. Rozrzuty stóp zwrotu badanych indeksów Źródło: Opracowanie własne Inaczej sprawa ma się z rozpatrywanymi indeksami gospodarek azjatyckich. Przyjmując kryterium korelacji liniowej Pearsona indeksy giełd Pekinu, Hongkongu i Tokio wypadają znacznie gorzej, tym niemniej zostaną uwzględnione w modelu ze względu na 52

53 niepodważalny wpływ gospodarek na sytuację ekonomiczną na świecie ze szczególnym uwzględnieniem gospodarki Japonii Zasadność użycia opóźnionego szeregu zmiennej zależnej WIG20 jako predyktora modelu Stopy zwrotu finansowych szeregów czasowych mogą wykazywać istotną autokorelację co oznacza, że wartości przeszłe danego szeregu mogą zostać użyte do modelowania wartości przyszłych szeregu w celu przewidzenia jego przyszłej ceny. Dokonano obliczeń wartości funkcji autokorelacji oraz autokorelacji cząstkowej, a także wartości statystyki Ljung-Boxa oraz wartości p w celu oceny przydatności otrzymanych wyników. Szczególna uwaga zwracana jest na opóźnienie rzędu pierwszego, gdyż jest to rząd opóźnienia modeli używanych w następnym rozdziale. Wykres 7. Autokorelacje i autokorelacje cząstkowe szeregu stóp zwrotu z indeksu WIG20 Źródło: Opracowanie własne Na pierwszy rzut oka widoczny jest brak istotnej zależności ze względu na kształt funkcji autokorelacji. Wartości p są wyższe od każdego z dopuszczalnych poziomów 53

54 istotności, którego wartość najczęściej obierana jest dla porównania na.α = 0,05 lub α = 0,01. Na tej podstawie zmienna powinna być odrzucona, czyli trzeba by przyjąć, że wartości przeszłe WIG20 nie nadają się do modelowania jego wartości obecnych. Jednak rozważane są także modele zmienności, co nasuwa pewien wniosek. Jeżeli przyjmie się, że wartość zmienności stóp zwrotu mierzona za pomocą odchylenia standardowego to wartość średniej różnicy pomiędzy stopami zwrotu a stopą zwrotu oczekiwaną, czym dokładnie jest a wariancja warunkowa to różnica konkretnej stopu zwrotu, to istotna autokorelacja pomiędzy różnicami stóp zwrotu danego szeregu jest cechą, która jak najbardziej pozwala na efektywne włączenie szeregu stóp zwrotu WIG20 jako predyktora przyszłych stóp zwrotu WIG20. Poprzez odpowiednik całkowania w matematyce dyskretnej czyli sumowanie, z szeregu różnic stóp zwrotu można otrzymać stopy zwrotu. To oznacza, że zależności występujące w szeregach różnic stóp zwrotu są jak najbardziej godne uwagi, a ich poznanie może być użyteczne. Wykres 8. Autokorelacje i autokorelacje cząstkowe szeregu pierwszych różnic stóp zwrotu z indeksu WIG20 Źródło: Opracowanie własne W szeregu różnic stóp zwrotu z portfela WIG20 występuje wyraźna autokorelacja pierwszego stopnia, która ma wartość ujemną i jest istotna statystycznie, a wartość 54

55 bezwzględna funkcji autokorelacji cząstkowej maleje wykładniczo dla kilku pierwszych opóźnień. Różnicowanie usunęło zatem niestacjonarność z szeregu stóp zwrotu portfela WIG20. Zatem modelowanie warunkowej wariancji szeregu, a także jego stóp zwrotu uznano za możliwe używając stóp zwrotu z portfela WIG20 jako zmiennej niezależnej do modelowania przyszłej stopy zwrotu z portfela WIG20 ze względu na charakter wybranej metody także uznano za zasadne. 55

56 ROZDZIAŁ IV PORÓWNANIE WYNIKÓW OTRZYMANYCH ZA POMOCĄ OMAWIANYCH METOD Metody omówione w rozdziale II zostały zastosowane do modelowania warunkowej wariancji i kowariancji z innymi indeksami oraz stopy zwrotu z indeksu WIG20 na podstawie stóp zwrotu z innych światowych indeksów, czego zasadność została omówiona w poprzednim rozdziale. Analizie zostały poddane logarytmiczne stopy zwrotu pomnożone przez 100, co oznacza, że wszystkie wyniki będą wyrażone w procentach. Jako cel analizy rozumiane będzie określenie wpływu zmiennych objaśniających na zmienną objaśnianą, czy też inaczej zmiennych niezależnych na zmienną zależną poprzez zastosowanie wybranych metod modelowania finansowych szeregów czasowych. Kolejnym z celów pracy będzie określenie przydatności wybranej metody data mining do prognozowania przyszłych stóp zwrotu z portfela WIG20 lub też chociażby kierunku zmian notowań indeksu w odniesieniu do kolejnych notowań na moment zamkniecia sesji giełdowej Wyniki zastosowania modelu DCC-GARCH Oceniając model, który jest wielowymiarowym modelem zmienności, który w swojej konstrukcji zawiera zarówno część dotyczącą warunkowych wariancji oraz dynamicznej warunkowej korelacji powinno się zwrócić uwagę na obie części równania. Ostatecznie model podaje jako wynik kowariancję portfela, która wynika z parametrów określających wpływ wariancji poszczególnych zmiennych, a także wpływ korelacji pomiędzy nimi. Model zostanie oceniony szczególnie poprzez pryzmat zależności, które opisuje wyłącznie w stosunku do WIG20. Ocenione zostaną zatem bardziej dokładnie parametry dotyczące sile występujących w badanym okresie warunkowych korelacji omawianych indeksów z indeksem giełdy polskiej. Do wyznaczenia parametrów modelu użyto oprogramowanie R wzbogaconego o pakiet ccgarch. Wyznaczono modele warunkowej wariancji GARCH(1,1) dla każdej z analizowanych zmiennych. Wszystkie wyniki okazały się istotne statystycznie, więc zostaną użyte w dalszej części analizy. Wyniki przedstawiono w Tabeli

57 Tabela 4. Współczynniki modeli GARCH(1,1) analizowanych zmiennych Źródło: Opracowanie własne We wszystkich przypadkach suma parametrów α oraz β jest bliska jedności. Parametry modeli zostały wykorzystane jako dane wejściowe modelu. Parametry α posłużą do utworzenia diagonalnej macierzy A, natomiast odpowiednio parametry β zostaną użyte do utworzenia diagonalnej macierzy B, które są wagami modelu. Porównując wartości Parametru β oraz odpowiadającego mu błędu standardowego dla WIG20 oraz pozostałych indeksów można zauważyć, że polski indeks cechuje najmniejsza wartość błędu prognozy, której podstawą są przeszłe wartości zmienności warunkowej szeregu. 57

58 Wykres 9. Stopy zwrotu oraz warunkowe odchylenia standardowe wynikające z modeli GARCH (1,1) dla omawianych zmiennych Źródło: Opracowanie własne 58

MODELOWANIE POLSKIEJ GOSPODARKI Z PAKIETEM R Michał Rubaszek

MODELOWANIE POLSKIEJ GOSPODARKI Z PAKIETEM R Michał Rubaszek Tytuł: Autor: MODELOWANIE POLSKIEJ GOSPODARKI Z PAKIETEM R Michał Rubaszek Wstęp Książka "Modelowanie polskiej gospodarki z pakietem R" powstała na bazie materiałów, które wykorzystywałem przez ostatnie

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

3. Analiza własności szeregu czasowego i wybór typu modelu

3. Analiza własności szeregu czasowego i wybór typu modelu 3. Analiza własności szeregu czasowego i wybór typu modelu 1. Metody analizy własności szeregu czasowego obserwacji 1.1. Analiza wykresu szeregu czasowego 1.2. Analiza statystyk opisowych zmiennej prognozowanej

Bardziej szczegółowo

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona Sprawdzanie założeń przyjętych o modelu (etap IIIC przyjętego schematu modelowania regresyjnego) 1. Szum 2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Analiza zdarzeń Event studies

Analiza zdarzeń Event studies Analiza zdarzeń Event studies Dobromił Serwa akson.sgh.waw.pl/~dserwa/ef.htm Leratura Campbell J., Lo A., MacKinlay A.C.(997) he Econometrics of Financial Markets. Princeton Universy Press, Rozdział 4.

Bardziej szczegółowo

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Metody Ilościowe w Socjologii

Metody Ilościowe w Socjologii Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu

Bardziej szczegółowo

Analiza autokorelacji

Analiza autokorelacji Analiza autokorelacji Oblicza się wartości współczynników korelacji między y t oraz y t-i (dla i=1,2,...,k), czyli współczynniki autokorelacji różnych rzędów. Bada się statystyczną istotność tych współczynników.

Bardziej szczegółowo

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Spis treści 3 SPIS TREŚCI

Spis treści 3 SPIS TREŚCI Spis treści 3 SPIS TREŚCI PRZEDMOWA... 1. WNIOSKOWANIE STATYSTYCZNE JAKO DYSCYPLINA MATEMATYCZNA... Metody statystyczne w analizie i prognozowaniu zjawisk ekonomicznych... Badania statystyczne podstawowe

Bardziej szczegółowo

Analiza inwestycji i zarządzanie portfelem SPIS TREŚCI

Analiza inwestycji i zarządzanie portfelem SPIS TREŚCI Analiza inwestycji i zarządzanie portfelem Frank K. Reilly, Keith C. Brown SPIS TREŚCI TOM I Przedmowa do wydania polskiego Przedmowa do wydania amerykańskiego O autorach Ramy książki CZĘŚĆ I. INWESTYCJE

Bardziej szczegółowo

Ekonometria dynamiczna i finansowa Kod przedmiotu

Ekonometria dynamiczna i finansowa Kod przedmiotu Ekonometria dynamiczna i finansowa - opis przedmiotu Informacje ogólne Nazwa przedmiotu Ekonometria dynamiczna i finansowa Kod przedmiotu 11.5-WK-IiED-EDF-W-S14_pNadGenMOT56 Wydział Kierunek Wydział Matematyki,

Bardziej szczegółowo

Analiza metod prognozowania kursów akcji

Analiza metod prognozowania kursów akcji Analiza metod prognozowania kursów akcji Izabela Łabuś Wydział InŜynierii Mechanicznej i Informatyki Kierunek informatyka, Rok V Specjalność informatyka ekonomiczna Politechnika Częstochowska izulka184@o2.pl

Bardziej szczegółowo

Krzysztof Piontek MODELOWANIE I PROGNOZOWANIE ZMIENNOŚCI INSTRUMENTÓW FINANSOWYCH

Krzysztof Piontek MODELOWANIE I PROGNOZOWANIE ZMIENNOŚCI INSTRUMENTÓW FINANSOWYCH Akademia Ekonomiczna im. Oskara Langego we Wrocławiu Wydział Zarządzania i Informatyki Krzysztof Piontek MODELOWANIE I PROGNOZOWANIE ZMIENNOŚCI INSTRUMENTÓW FINANSOWYCH rozprawa doktorska Promotor: prof.

Bardziej szczegółowo

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym

Bardziej szczegółowo

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13 Stanisław Cichocki Natalia Neherbecka Zajęcia 13 1 1. Kryteria informacyjne 2. Testowanie autokorelacji 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych

Bardziej szczegółowo

Stanisław Cihcocki. Natalia Nehrebecka

Stanisław Cihcocki. Natalia Nehrebecka Stanisław Cihcocki Natalia Nehrebecka 1 1. Kryteria informacyjne 2. Testowanie autokorelacji w modelu 3. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach

Bardziej szczegółowo

Szeregi czasowe, analiza zależności krótkoi długozasięgowych

Szeregi czasowe, analiza zależności krótkoi długozasięgowych Szeregi czasowe, analiza zależności krótkoi długozasięgowych Rafał Weron rweron@im.pwr.wroc.pl Definicje Mając dany proces {X t } autokowariancję definiujemy jako : γ(t, t ) = cov(x t, X t ) = = E[(X t

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Przykład 2. Stopa bezrobocia

Przykład 2. Stopa bezrobocia Przykład 2 Stopa bezrobocia Stopa bezrobocia. Komentarz: model ekonometryczny stopy bezrobocia w Polsce jest modelem nieliniowym autoregresyjnym. Podobnie jak model podaŝy pieniądza zbudowany został w

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Ćwiczenie 5 PROGNOZOWANIE

Ćwiczenie 5 PROGNOZOWANIE Ćwiczenie 5 PROGNOZOWANIE Prognozowanie jest procesem przewidywania przyszłych zdarzeń. Obszary zastosowań prognozowania obejmują np. analizę danych giełdowych, przewidywanie zapotrzebowania na pracowników,

Bardziej szczegółowo

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje

Bardziej szczegółowo

Etapy modelowania ekonometrycznego

Etapy modelowania ekonometrycznego Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA. CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe

PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA. CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe 1. Cele i przydatność ujęcia modelowego w ekonomii 2.

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

Metody Prognozowania

Metody Prognozowania Wprowadzenie Ewa Bielińska 3 października 2007 Plan 1 Wprowadzenie Czym jest prognozowanie Historia 2 Ciągi czasowe Postępowanie prognostyczne i prognozowanie Predykcja długo- i krótko-terminowa Rodzaje

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16 Stanisław Cichocki Natalia Nehrebecka Zajęcia 15-16 1 1. Sezonowość 2. Zmienne stacjonarne 3. Zmienne zintegrowane 4. Test Dickey-Fullera 5. Rozszerzony test Dickey-Fullera 6. Test KPSS 7. Regresja pozorna

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński

Zarządzanie ryzykiem. Opracował: Dr inŝ. Tomasz Zieliński Zarządzanie ryzykiem Opracował: Dr inŝ. Tomasz Zieliński I. OGÓLNE INFORMACJE O PRZEDMIOCIE Cel przedmiotu: Celem przedmiotu jest zaprezentowanie studentom podstawowych pojęć z zakresu ryzyka w działalności

Bardziej szczegółowo

dr hab. Renata Karkowska 1

dr hab. Renata Karkowska 1 dr hab. Renata Karkowska 1 Miary zmienności: obrazują zmiany cen, stóp zwrotu instrumentów finansowych, opierają się na rozproszeniu ich rozkładu, tym samym uśredniają ryzyko: wariancja stopy zwrotu, odchylenie

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

Niestacjonarne zmienne czasowe własności i testowanie

Niestacjonarne zmienne czasowe własności i testowanie Materiał dla studentów Niestacjonarne zmienne czasowe własności i testowanie (studium przypadku) Część 3: Przykłady testowania niestacjonarności Nazwa przedmiotu: ekonometria finansowa I (22204), analiza

Bardziej szczegółowo

5. Model sezonowości i autoregresji zmiennej prognozowanej

5. Model sezonowości i autoregresji zmiennej prognozowanej 5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =

Bardziej szczegółowo

4. Średnia i autoregresja zmiennej prognozowanej

4. Średnia i autoregresja zmiennej prognozowanej 4. Średnia i autoregresja zmiennej prognozowanej 1. Średnia w próbie uczącej Własności: y = y = 1 N y = y t = 1, 2, T s = s = 1 N 1 y y R = 0 v = s 1 +, 2. Przykład. Miesięczna sprzedaż żelazek (szt.)

Bardziej szczegółowo

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego Ze względu na jakość uzyskiwanych ocen parametrów strukturalnych modelu oraz weryfikację modelu, metoda najmniejszych

Bardziej szczegółowo

7. Zastosowanie wybranych modeli nieliniowych w badaniach ekonomicznych. 14. Decyzje produkcyjne i cenowe na rynku konkurencji doskonałej i monopolu

7. Zastosowanie wybranych modeli nieliniowych w badaniach ekonomicznych. 14. Decyzje produkcyjne i cenowe na rynku konkurencji doskonałej i monopolu Zagadnienia na egzamin magisterski na kierunku Ekonomia 1. Znaczenie wnioskowania statystycznego w weryfikacji hipotez 2. Organizacja doboru próby do badań 3. Rozkłady zmiennej losowej 4. Zasady analizy

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp. Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.

Bardziej szczegółowo

Finanse behawioralne. Finanse 110630-1165

Finanse behawioralne. Finanse 110630-1165 behawioralne Plan wykładu klasyczne a behawioralne Kiedy są przydatne narzędzia finansów behawioralnych? Przykłady modeli finansów behawioralnych klasyczne a behawioralne klasyczne opierają się dwóch założeniach:

Bardziej szczegółowo

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe

Bardziej szczegółowo

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować

Bardziej szczegółowo

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Modelowanie rynków finansowych

Modelowanie rynków finansowych Modelowanie rynków finansowych Przegląd zagadnień 8 października 2012 Główna przesłanka doboru tematów Koncepcje i techniki modelowe jako priorytet: Modele empiryczne bazujące na wiedzy teoretycznej Zakres

Bardziej szczegółowo

WNIOSKOWANIE STATYSTYCZNE

WNIOSKOWANIE STATYSTYCZNE STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć: Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne

Bardziej szczegółowo

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,

Bardziej szczegółowo

Regresja i Korelacja

Regresja i Korelacja Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane

Bardziej szczegółowo

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2 STATYSTYKA Rafał Kucharski Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND Finanse i Rachunkowość rok 2 Analiza dynamiki Szereg czasowy: y 1 y 2... y n 1 y n. y t poziom (wartość) badanego zjawiska w

Bardziej szczegółowo

dr hab. Renata Karkowska 1

dr hab. Renata Karkowska 1 dr hab. Renata Karkowska 1 Czym jest ryzyko? Rodzaje ryzyka? Co oznacza zarządzanie? Dlaczego zarządzamy ryzykiem? 2 Przedmiot ryzyka Otoczenie bliższe/dalsze (czynniki ryzyka egzogeniczne vs endogeniczne)

Bardziej szczegółowo

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0 Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia

Bardziej szczegółowo

Wycena opcji. Dr inż. Bożena Mielczarek

Wycena opcji. Dr inż. Bożena Mielczarek Wycena opcji Dr inż. Bożena Mielczarek Stock Price Wahania ceny akcji Cena jednostki podlega niewielkim wahaniom dziennym (miesięcznym) wykazując jednak stały trend wznoszący. Cena może się doraźnie obniżać,

Bardziej szczegółowo

Wykład 5: Analiza dynamiki szeregów czasowych

Wykład 5: Analiza dynamiki szeregów czasowych Wykład 5: Analiza dynamiki szeregów czasowych ... poczynając od XIV wieku zegar czynił nas najpierw stróżów czasu, następnie ciułaczy czasu, i wreszcie obecnie - niewolników czasu. W trakcie tego procesu

Bardziej szczegółowo

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda

Bardziej szczegółowo

PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA. CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe

PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA. CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe PYTANIA NA EGZAMIN MAGISTERSKI KIERUNEK: EKONOMIA STUDIA DRUGIEGO STOPNIA CZĘŚĆ I dotyczy wszystkich studentów kierunku Ekonomia pytania podstawowe 1. Cele i przydatność ujęcia modelowego w ekonomii 2.

Bardziej szczegółowo

Stacjonarność Integracja. Integracja. Integracja

Stacjonarność Integracja. Integracja. Integracja Biały szum AR(1) Słaba stacjonarność Szereg czasowy nazywamy słabo (wariancyjnie) stacjonarnym jeżeli: Biały szum AR(1) Słaba stacjonarność Szereg czasowy nazywamy słabo (wariancyjnie) stacjonarnym jeżeli:

Bardziej szczegółowo

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 50 2012 ANALIZA WŁASNOŚCI OPCJI SUPERSHARE

ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 50 2012 ANALIZA WŁASNOŚCI OPCJI SUPERSHARE ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 5 212 EWA DZIAWGO ANALIZA WŁASNOŚCI OPCJI SUPERSHARE Wprowadzenie Proces globalizacji rynków finansowych stwarza

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

Cena do wartości księgowej (C/WK, P/BV)

Cena do wartości księgowej (C/WK, P/BV) Cena do wartości księgowej (C/WK, P/BV) Wskaźnik cenadowartości księgowej (ang. price to book value ratio) jest bardzo popularnym w analizie fundamentalnej. Informuje on jaką cenę trzeba zapład za 1 złotówkę

Bardziej szczegółowo

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1 Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16 Value at Risk (VaR) Jerzy Mycielski WNE 2018 Jerzy Mycielski (Institute) Value at Risk (VaR) 2018 1 / 16 Warunkowa heteroskedastyczność O warunkowej autoregresyjnej heteroskedastyczności mówimy, gdy σ

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

Modelowanie rynków finansowych

Modelowanie rynków finansowych Modelowanie rynków finansowych Jerzy Mycielski WNE UW 5 października 2017 Jerzy Mycielski (WNE UW) Modelowanie rynków finansowych 5 października 2017 1 / 12 Podstawowe elementy teorii 1 racjonalne oczekiwania

Bardziej szczegółowo

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:

Bardziej szczegółowo

Analiza zależności liniowych

Analiza zależności liniowych Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala

Bardziej szczegółowo

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA

Wprowadzenie Model ARMA Sezonowość Prognozowanie Model regresji z błędami ARMA. Modele ARMA Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Ważną klasę modeli dynamicznych stanowią modele ARMA(p, q) Modele tej klasy są modelami ateoretycznymi Ważną klasę modeli dynamicznych stanowią

Bardziej szczegółowo

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną

Bardziej szczegółowo

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu

Bardziej szczegółowo

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE ZADANIE 1 Oszacowano zależność między luką popytowa a stopą inflacji dla gospodarki niemieckiej. Wyniki estymacji są następujące: Estymacja KMNK,

Bardziej szczegółowo

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28 Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych

Bardziej szczegółowo

ZAKRES TEMATYCZNY EGZAMINU LICENCJACKIEGO

ZAKRES TEMATYCZNY EGZAMINU LICENCJACKIEGO Wydział Nauk Ekonomicznych i Zarządzania Kierunek Analityka Gospodarcza Studia stacjonarne I stopnia ZAKRES TEMATYCZNY EGZAMINU LICENCJACKIEGO Zagadnienia ogólnoekonomiczne 1. Aktualna sytuacja na europejskim

Bardziej szczegółowo

Ekonometria. Zajęcia

Ekonometria. Zajęcia Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

Materiał dla studentów Wprowadzenie do modeli ARMA/ARIMA (na przykładzie zwrotów z instrumentów finansowych)

Materiał dla studentów Wprowadzenie do modeli ARMA/ARIMA (na przykładzie zwrotów z instrumentów finansowych) Materiał dla studentów Wprowadzenie do modeli ARMA/ARIMA (na przykładzie zwrotów z instrumentów finansowych) (studium przypadku) Nazwa przedmiotu: ekonometria finansowa I (22204), analiza szeregów czasowych

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

Prace magisterskie 1. Założenia pracy 2. Budowa portfela

Prace magisterskie 1. Założenia pracy 2. Budowa portfela 1. Założenia pracy 1 Założeniem niniejszej pracy jest stworzenie portfela inwestycyjnego przy pomocy modelu W.Sharpe a spełniającego następujące warunki: - wybór akcji 8 spółek + 2 papiery dłużne, - inwestycja

Bardziej szczegółowo

Ćwiczenia IV

Ćwiczenia IV Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Inwestycje finansowe. Wycena obligacji. Stopa zwrotu z akcji. Ryzyko.

Inwestycje finansowe. Wycena obligacji. Stopa zwrotu z akcji. Ryzyko. Inwestycje finansowe Wycena obligacji. Stopa zwrotu z akcji. yzyko. Inwestycje finansowe Instrumenty rynku pieniężnego (np. bony skarbowe). Instrumenty rynku walutowego. Obligacje. Akcje. Instrumenty pochodne.

Bardziej szczegółowo

Stanisław Cichocki Natalia Neherbecka

Stanisław Cichocki Natalia Neherbecka Stanisław Cichocki Natalia Neherbecka 13 marca 2010 1 1. Kryteria informacyjne 2. Modele dynamiczne: modele o rozłożonych opóźnieniach (DL) modele autoregresyjne o rozłożonych opóźnieniach (ADL) 3. Analiza

Bardziej szczegółowo

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych dr

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

Prognozowanie na podstawie modelu ekonometrycznego

Prognozowanie na podstawie modelu ekonometrycznego Prognozowanie na podstawie modelu ekonometrycznego Przykład. Firma usługowa świadcząca usługi doradcze w ostatnich kwartałach (t) odnotowała wynik finansowy (yt - tys. zł), obsługując liczbę klientów (x1t)

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Analiza współzależności dwóch cech I

Analiza współzależności dwóch cech I Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych

Bardziej szczegółowo