Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie
Wprowadzenie Sztuczne sieci neuronowe (SSN) są modelami nieliniowymi, które pozwalają na opisanie skomplikowanych relacji zachodzących między danymi. Można je zatem wykorzystać do analizowania zjawisk ekonomicznych i finansowych. W zależności od rodzaju problemu, jaki ma zostać rozwiązany, wykorzystuje się różne rodzaje SSN.
Budowa sieci neuronowej prowadzona jest zazwyczaj w kilku etapach: określenie zmiennych będących wejściami i wyjściami z sieci; wybór rodzaju sieci oraz metody jej trenowania; określenie architektury sieci; estymacja parametrów SSN; weryfikacja SSN; wykorzystanie sieci do przyjętych celów.
Zalety SNN 1. SSN obejmują szeroką klasę modeli, dzięki czemu nie istnieje konieczność wyboru określonego modelu już na początku prowadzonych analiz. 2. nie są potrzebne żadne założenia dotyczące natury rozkładu danych. Zamiast przyjmować założenia odnośnie nieznanej populacji, sieci neuronowe z przynajmniej jedną warstwą ukrytą wykorzystają dane do określenia charakteru zależności między zmiennym; 3. szeregi czasowe mają charakter dynamiczny zatem potrzebne jest posiadanie nieliniowych narzędzi w celu rozpoznawania zależności wśród danych tej postaci. Ponadto wiele szeregów czasowych zawiera składowe chaotyczne, które są lepiej tolerowane przez sieci neuronowe niż przez większość innych metod; 4. sieci neuronowe doskonale sobie radzą z danymi niekompletnymi, podczas gdy tradycyjne metody statystyczne są w tym przypadku całkowicie bezsilne. 5. wyznaczanie prognoz za pomocą sieci neuronowych wymaga znacznie mniej czasu niż w przypadku modeli ekonometrycznych.
Wady SSN nie umiemy nadać sensownej interpretacji ekonomicznej parametrom modeli nieliniowych; skłonność SSN do nadmiernego dopasowywania się do danych treningowych w trakcie procesu uczenia sieci, co powoduje że wykorzystanie SSN do prognoz może być problematyczne. Dlatego też należy starannie je testować na podstawie danych, które nie uczestniczyły w procesie estymacji parametrów modelu, aby wykryć tego typu błędy; wpadanie przez algorytmy trenujące SSN w lokalne minima w trakcie optymalizacji funkcji kosztów. Jednakże realizowane są badania prowadzące do opracowania bardziej zaawansowanych metod uczenia sieci, bądź technik pozwalających na uniknięcie problemu minimów lokalnych.
Wyznaczenie listy zmiennych wejściowych w sieciach neuronowych, jest zadaniem równie trudnym jak specyfikacja modeli ekonometrycznych. Dobór zmiennych powinien uwzględniać: teorię ekonomii, doświadczenie konstruktora modelu oraz analizę współzależności zjawisk.
Ceny jednostek uczestnictwa Obserwacje 09-10-1997 16-02-1998 23-06-1998 20-10-1998 22-02-1999 28-06-1999 25-10-1999 29-02-2000 05-07-2000 03-11-2000 07-03-2001 11-07-2001 09-11-2001 01-03-2002 12-06-2002 19-09-2002 01-01-2003 10-04-2003 21-07-2003 29-10-2003 24-02-2004 29-06-2004 26-10-2004 24-02-2005 30-06-2005 28-10-2005 01-03-2006 05-07-2006 03-11-2006 07-03-2007 12-07-2007 12-11-2007 17-03-2008 21-07-2008 50 100 150 200 250 CenaNetto 300 350 400 Jednostki uczestnictwa 9.10.1997-7.11.2008 Wartości jednostek uczestnictwa w całym okresie trwania funduszu Skarbiec Akcja (SA)
Struktura funduszu 30.09.2008 struktura funduszu Udziały 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 85,07 9,42 1,88 3,25 0,38 gotówka i ekwiwalenry J.U., ETF, NFI pozostałe aktywa papiery dłużne akcje Instrumenty finansowe udziały
Potencjalne zmienne objaśniające: notowania indeksu WIG20 (WIG20), ponieważ większośćśrodków pieniężnych funduszu jest lokowana w akcjach spółek wchodzących w skład tego indeksu; stopa procentowa WIBID 3-miesięczny (WIBID3M), jaką banki płacą za środki przyjęte w depozyt od innych banków; średnia rentowność bonów skarbowych 13-tygodniowych (BS13).
Okres badania W badaniach uwzględniono dzienne notowania z okresu od 25.11.2002 do 30.12.2005 roku (803 obserwacje). Zbiór treningowy obejmuje 85% zbioru (682 danych), a testowy 15% próby (121 obserwacji). Prognozy wyznaczono na kolejne dwa miesiące tj. 02.01 28.02. 2006r., czyli na 35 dni. Uwzględniony w badaniach okres jest jednorodny z punktu widzenia występującego trendu wzrostowego wartości jednostek uczestnictwa.
Budowa sztucznej sieci neuronowej Do modelowania wartości jednostek uczestnictwa wykorzystano perceptron wielowarstwowy. Architekturę sieci neuronowej określano dla każdego modelu, przy czym zawsze była to sieć trójwarstwowa i zawierała opóźnione zmienne objaśniające. W badaniach uwzględniono 3 postacie modeli neuronowych. 1. SA(t) = f(wig20(t-i)) dla i=1, 2,, 5; 2. SA(t) = f(wig20(t-i), WIBID3M(t-i)) dla i=1, 2,, 5; 3. SA(t) = f(wig20(t-i), WIBID3M(t-i), SA(t-i)) dla i=1, 2.
Porównanie prognoz wyznaczonych za pomocą modeli SA rzeczywiste model1 model2 model3 260 250 240 230 220 210 200 190 180 804 809 814 819 824 829 834 839 844
Podsumowanie 1 Uzyskane rezultaty wskazują, że sztuczne sieci neuronowe mogą być przydatnym narzędziem prognostycznym finansowych szeregów czasowych. Jednakże nie można ich traktować jak czarne skrzynki i należy starannie specyfikować model, dbając zarówno o odpowiedni dobór zmiennych wejściowych, jak i o stosowną architekturę sieci.
Podsumowanie 2 Sieci neuronowe, podobnie jak inne modele konstruowane do celów prognostycznych, muszą opisywać aktualną rzeczywistość, a modelowane zjawisko spełniać założenie o zachowaniu relacji, opisywanych przez model dla całego horyzontu prognozy. Dlatego też należy starannie dobierać okres estymacji parametrów modelu, aby zachowane były tendencje rozwoju prognozowanych relacji. W analizowanym przykładzie, skonstruowana i oszacowana, sieć neuronowa (6) mogłaby jeszcze się sprawdzać jako narzędzie prognostyczne dla notowań do 1218 obserwacji tj. 9.07.2007 roku, aczkolwiek należałoby pewnie dokonać przeszacowania jej parametrów wykorzystując w tym celu świeższe dane. Natomiast SSN postaci (6) stała się zupełnie bezużyteczna dla późniejszych okresów, kiedy trend się odwrócił i na rynku pojawiła się tendencja spadkowa.