Zastosowanie sieci neuronowych do prognozowania wskaźników finansowych



Podobne dokumenty
2.Prawo zachowania masy

Objaśnienia do Wieloletniej Prognozy Finansowej na lata

Warszawska Giełda Towarowa S.A.

Ogólna charakterystyka kontraktów terminowych

System wielokryterialnej optymalizacji systemu traderskiego na rynku kontraktów terminowych

Joanna Kisielińska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie

Eksperyment,,efekt przełomu roku

Statystyka finansowa

Harmonogramowanie projektów Zarządzanie czasem

POMOC PSYCHOLOGICZNO-PEDAGOGICZNA Z OPERONEM. Vademecum doradztwa edukacyjno-zawodowego. Akademia

FORUM ZWIĄZKÓW ZAWODOWYCH

Zadania ćwiczeniowe do przedmiotu Makroekonomia I

Strategia rozwoju kariery zawodowej - Twój scenariusz (program nagrania).

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

Zarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska

7. REZONANS W OBWODACH ELEKTRYCZNYCH

PRÓG RENTOWNOŚCI i PRÓG

INSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW ZADANIA

Warunki Oferty PrOmOcyjnej usługi z ulgą

Metoda LBL (ang. Layer by Layer, pol. Warstwa Po Warstwie). Jest ona metodą najprostszą.

Twoja droga do zysku! Typy inwestycyjne Union Investment TFI

Efektywna strategia sprzedaży

Temat: Co to jest optymalizacja? Maksymalizacja objętości naczynia prostopadłościennego za pomocą arkusza kalkulacyjngo.

Motywuj świadomie. Przez kompetencje.

Edycja geometrii w Solid Edge ST

Konspekt lekcji otwartej

Smart Beta Święty Graal indeksów giełdowych?

Warunki formalne dotyczące udziału w projekcie

Paweł Selera, Prawo do odliczenia i zwrotu podatku naliczonego w VAT, Wolters Kluwer S.A., Warszawa 2014, ss. 372

AUTOR MAGDALENA LACH

Wskaźniki oparte na wolumenie

Projektowanie bazy danych

Powiatowy Urząd Pracy w Trzebnicy. w powiecie trzebnickim w 2008 roku Absolwenci w powiecie trzebnickim

Excel w logistyce - czyli jak skrócić czas przygotowywania danych i podnieść efektywność analiz logistycznych

Od redakcji. Symbolem oznaczono zadania wykraczające poza zakres materiału omówionego w podręczniku Fizyka z plusem cz. 2.

PODSTAWY METROLOGII ĆWICZENIE 4 PRZETWORNIKI AC/CA Międzywydziałowa Szkoła Inżynierii Biomedycznej 2009/2010 SEMESTR 3

Akademia Młodego Ekonomisty

Mechanizm zawarty w warunkach zamówienia podstawowego. Nie wymaga aneksu do umowy albo udzielenia nowego zamówienia. -

Przedmiotowe zasady oceniania. zgodne z Wewnątrzszkolnymi Zasadami Oceniania. obowiązującymi w XLIV Liceum Ogólnokształcącym.

Dobór nastaw PID regulatorów LB-760A i LB-762

Zamawiający potwierdza, że zapis ten należy rozumieć jako przeprowadzenie audytu z usług Inżyniera.

Możemy zapewnić pomoc z przeczytaniem lub zrozumieniem tych informacji. Numer dla telefonów tekstowych. boroughofpoole.

Zaproszenie. Ocena efektywności projektów inwestycyjnych. Modelowanie procesów EFI. Jerzy T. Skrzypek Kraków 2013 Jerzy T.

OSZACOWANIE WARTOŚCI ZAMÓWIENIA z dnia roku Dz. U. z dnia 12 marca 2004 r. Nr 40 poz.356

Umowa o pracę zawarta na czas nieokreślony

RZECZPOSPOLITA POLSKA. Prezydent Miasta na Prawach Powiatu Zarząd Powiatu. wszystkie

INFORMACJE O INSTRUMENTACH FINANSOWYCH WCHODZĄCYCH W SKŁAD ZARZADZANYCH PRZEZ BIURO MAKLERSKIE PORTFELI Z UWZGLĘDNIENIEM ZWIĄZANYCH Z NIMI RYZYK

DANE MAKROEKONOMICZNE (TraderTeam.pl: Rafa Jaworski, Marek Matuszek) Lekcja V

Szczegółowe zasady obliczania wysokości. i pobierania opłat giełdowych. (tekst jednolity)

Sytuacja na rynku kredytowym

Architektura komputerów

Bielsko-Biała, dn r. Numer zapytania: R WAWRZASZEK ISS Sp. z o.o. ul. Leszczyńska Bielsko-Biała ZAPYTANIE OFERTOWE

Zagregowany popyt i wielkość produktu

CBOS CENTRUM BADANIA OPINII SPOŁECZNEJ PRACA ZAROBKOWA EMERYTÓW I RENCISTÓW A PROBLEM BEZROBOCIA BS/80/2002 KOMUNIKAT Z BADAŃ WARSZAWA, MAJ 2002

Prezentacja dotycząca sytuacji kobiet w regionie Kalabria (Włochy)

Wiedza niepewna i wnioskowanie (c.d.)

Analiza wyników egzaminu gimnazjalnego. Test matematyczno-przyrodniczy matematyka. Test GM-M1-122,

Bazy danych. Andrzej Łachwa, UJ, /15

WYMAGANIA EDUKACYJNE SPOSOBY SPRAWDZANIA POSTĘPÓW UCZNIÓW WARUNKI I TRYB UZYSKANIA WYŻSZEJ NIŻ PRZEWIDYWANA OCENY ŚRÓDROCZNEJ I ROCZNEJ

- o zmianie o Krajowym Rejestrze Sądowym

Zadania powtórzeniowe I. Ile wynosi eksport netto w gospodarce, w której oszczędności równają się inwestycjom, a deficyt budżetowy wynosi 300?

ROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ. KORELACJA zmiennych jakościowych (niemierzalnych)

Wyznaczanie współczynnika sprężystości sprężyn i ich układów

art. 488 i n. ustawy z dnia 23 kwietnia 1964 r. Kodeks cywilny (Dz. U. Nr 16, poz. 93 ze zm.),

Od czego zależy kurs złotego?

ZAPRASZA DO SKŁADNIA OFERT

Zarząd Dróg Wojewódzkich. Wytyczne Techniczne. Zbigniew Tabor Kraków,

UMOWA PORĘCZENIA NR [***]

Krótkoterminowe planowanie finansowe na przykładzie przedsiębiorstw z branży 42

PROJEKTOWANIE PROCESÓW PRODUKCYJNYCH

KLAUZULE ARBITRAŻOWE

Procedura weryfikacji badania czasu przebiegu 1 paczek pocztowych

Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.

Szkoła Podstawowa nr 1 w Sanoku. Raport z ewaluacji wewnętrznej

Kryzys i co dalej? Tomasz Kanarkowski

ANALOGOWE UKŁADY SCALONE

ZAPYTANIE OFERTOWE z dnia r

HAŚKO I SOLIŃSKA SPÓŁKA PARTNERSKA ADWOKATÓW ul. Nowa 2a lok. 15, Wrocław tel. (71) fax (71) kancelaria@mhbs.

GŁÓWNY URZĄD STATYSTYCZNY

14.Rozwiązywanie zadań tekstowych wykorzystujących równania i nierówności kwadratowe.

Podatek przemysłowy (lokalny podatek od działalności usługowowytwórczej) :02:07

Trwałość projektu co zrobić, żeby nie stracić dotacji?

Dziedziczenie : Dziedziczenie to nic innego jak definiowanie nowych klas w oparciu o już istniejące.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

Odpowiedzi na pytania zadane do zapytania ofertowego nr EFS/2012/05/01

Maria Kościelna, Wroclaw University of Economics

Audyt SEO. Elementy oraz proces przygotowania audytu. strona

UMOWA NR w sprawie: przyznania środków Krajowego Funduszu Szkoleniowego (KFS)

Podstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych

Załącznik Nr 2 do Uchwały Nr 161/2012 Rady Miejskiej w Jastrowiu z dnia 20 grudnia 2012

Projekty uchwał Nadzwyczajnego Walnego Zgromadzenia Akcjonariuszy

Postrzeganie reklamy zewnętrznej - badania

4.3. Struktura bazy noclegowej oraz jej wykorzystanie w Bieszczadach

Projekt MES. Wykonali: Lidia Orkowska Mateusz Wróbel Adam Wysocki WBMIZ, MIBM, IMe

PAKIET MathCad - Część III

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Sieci Neuronowe Laboratorium 2

ZARZĄDZANIA. marketingowy. Wymaga on zintegrowanych strategii tj. strategii jednoczesnego

Transkrypt:

Zastosowanie sieci neuronowych do prognozowania wskaźników finansowych Grzegorz Jasiński Uniwersytet Jagielloński Akademia Ekonomiczna w Krakowie Sieci neuronowe są powszechnie stosowane w wielu dziedzinach nauki i przemysłu jako metody, które rozwiązują problemy, na które nie istnieją klasyczne metody rozwiązań. W referacie przedstawiłem przykładowe zastosowania sieci neuronowych w analizie finansowej wraz z problemami jakie pojawiają się przy próbie ich stosowania i sposobami radzenia sobie z nimi. Neural networks are used in science and industry very often especially when we have problems with no classical method of solving them. I have presented in this abstract exemplary employment of neuron networks in financial analysis connected with problems which can appear while using them and method which show how to solve that problems. Wprowadzenie Zainteresowanie rynkami finansowymi nie tylko w Polsce, ale teŝ we wszystkich krajach rozwijających się i juŝ rozwiniętych, jest naturalne. Od początku lat 70. kiedy jeszcze wydawało się Ŝe sytuacja gospodarcza ma niewiele wspólnego ze wskaźnikami finansowymi, wiele się zmieniło. Do lat 70. spotykamy się z ocena jakości gospodarki na podstawie inflacji. JuŜ pod koniec lat 70. zauwaŝono, Ŝe lepszym parametrem oceny jakości gospodarki są stopy procentowa, a ich mała zmienność czynnikiem poŝądanym. Podstawową obserwacją był fakt, Ŝe niska inflacja nie gwarantuje stabilności stóp procentowych, natomiast stabilność stóp procentowych wymusza niejako stały i niski poziom inflacji. Od końca lat 80. obserwowano wzrost znaczenia niepewności na rynkach finansowych i ten czynnik stał się jednym z podstawowych wpływających na wszelkie wskaźniki. Ostatnie lata (od roku 90) to jeszcze większy wzrost znaczenia niepewności przy równoległym rozwoju licznych metod pozwalających na prognozowanie. Dzięki temu nastąpił znaczny rozwój w dziedzinie matematyki finansowej i statystyki. Ze względu na ogromne zróŝnicowanie rynków finansowych zarówno pod kontem inwestorów (ich wiedzy, charakterów skłonności do ryzyka, reakcji na nieprzewidziane sytuacje -, róŝnych oczekiwań, czasu w jakim oczekują osiągnąć swoje cele ) jak i samej struktury rynków finansowych (zróŝnicowane sposoby inwestycji, sytuacje nieprzewidziane) trudno jest określać zaleŝności wszelkich wskaźników na podstawie prostych układów liniowych. Tworzenie złoŝonych układów nieliniowych stwarza jednak problemy: trudność poszukiwania rozwiązania lub w ogóle brak moŝliwości jego znalezienia. Układy nieliniowe są jednak częściej wykorzystywane, gdyŝ lepiej modelują rzeczywistość jaką są rynki finansowe. Dzięki rozwojowi technologii informatycznej nie jesteśmy jednak w sytuacji bez wyjścia. Liczne metody numeryczne pozwalają nam poradzić sobie z wieloma problemami obliczeniowymi i znaleźć zadowalające rozwiązania w sposób przybliŝony.

Mimo rozwoju licznych metod analizy fundamentalnej w oparciu o liniowe i nieliniowe modele, próba tworzenia skutecznych układów odzwierciedlających rzeczywistość na rynkach finansowych jest trudna lub wręcz niemoŝliwa. Trudno jest przewidzieć wszystkie czynniki mające wpływ na dane zjawisko, a dodatkowo współczynnik losowy utrudnia jeszcze to zadanie. Jeśli byłoby to nie tak trudne, to istniejące mechanizmy kaŝdy byłby w stanie zapisać za pomocą pewnych układów równań i je rozwiązać przez co skuteczne prognozowanie tych wskaźników byłoby zjawiskiem powszechnym, a co za tym idzie nie stanowiłoby przewagi konkurencyjnej i przestałoby być źródłem dochodu. Na rynkach finansowych tak nie jest, dlatego często moŝne usłyszeć o spektakularnych sukcesach lub poraŝkach. Inwestorzy chcąc osiągać jak największe zyski próbują prognozować wskaźniki takŝe innymi metodami, gdyŝ sama analiza fundamentalna jest od dawna niewystarczająca. Stąd teŝ rozwija się analiza techniczna, teoria chaosu 1 czy sztuczna inteligencja. Analiza techniczna jest metodą przewidywania cen na podstawie dotychczasowych wykresów np. na giełdzie cen, wielkości obrotów. Jej przeciwnicy uwaŝają, Ŝe nie moŝe być kompletną metoda prognostyczną, gdyŝ nie uwzględnia tego co moŝe mieć wpływ na wskaźniki w przyszłości i często analitycy korzystający z metod analizy technicznej nazywani są astrologami rynku. Teoria chaosu i sztuczna inteligencja to dziedziny obecnie najszybciej rozwijające się i wydające się dawać szczególnie dobre rezultaty w pewnych sytuacjach. Teoria chaosu mówi paradoksalnie, Ŝe im większy wpływ na dany wskaźnik finansowy ma wskaźnik losowy, tym mniej jest on przypadkowy. Z kolei metody sztucznej inteligencji z powodzeniem stosowane w innych dziedzinach niŝ ekonomia dają równieŝ ciekawe rezultaty. Podstawową zasadą ich konstrukcji jest próba implementacji inteligencji głównie ludzkiej 2. Eksperci definiują w róŝny sposób termin sztuczna inteligencja, lecz nie będziemy tego szczegółowo rozwaŝać przyjmując następującą definicję: sztuczna inteligencja to dziedzina informatyki dotycząca metod i technik wnioskowania symbolicznego przez komputer oraz symbolicznej reprezentacji wiedzy stosowanej podczas takiego wnioskowania. Na jej gruncie wyróŝnia się trzy główne dziedziny: sieci neuronowe, algorytmy ewolucyjne i systemy ekspertowe. Sieci neuronowe są na pewno najbardziej popularne w analizach finansowych dzięki równoległości obliczeń przez nie prowadzonych, braku konieczności programowania, a takŝe moŝliwości sieci do dopasowania współczynników do problemu czy samoistnym poszukiwaniu algorytmu rozwiązującego dany problem. Sieci neuronowe stanowią często podstawowe systemów hybrydowych, gdzie łączy się je razem z algorytmami genetycznymi lub systemami ekspertowymi co często pozwala uzyskać jeszcze lepsze efekty. Tutaj zajmiemy się jednak tylko sieciami neuronowymi, zobaczymy jakie problemy naleŝy rozwiązać aby sieci skutecznie działały oraz poznamy trzy przykładowe ich zastosowania na rynkach finansowych. Budowa sieci neuronowych Początki sieci neuronowych sięgają roku 1943 kiedy to W.S.McCulloch i W.Pitts opublikowali matematyczny model neuronu. W roku 1969 M.Minsky oraz S.Papert przedstawili m.in. prosty problem oparty na realizacji funkcji logicznej XOR, który był nierozwiązywalny przez ówczesne sieci, co zmniejszyło zainteresowanie sieciami na kilkanaście lat. W roku 1986 okazało się jednak, Ŝe modyfikacje prostego perceptronu do sieci wielowarstwowej pozwalają na radzenie sobie z wieloma problemami nawet bardzo złoŝonymi. 1 Ciekawe przedstawienie teorii chaosu prezentuje E.E.Peters: Teoria chaosu a rynki kapitałowe, Warszawa 1997 2 Ostatnio moŝna zauwaŝyć próby wykorzystania zwierząt m.in. mrówek

Podstawowy model neuronu przedstawia rys.1. Rysunek 1 Schemat neuronu Przedstawiony neuron posiada n wejść x 1 Kxn, jedno wyjście y oraz bias ( w 0 ) wartość stałą dla kaŝdego neuronu, niezaleŝną od danych wejściowych. Przetwarzanie sygnałów wejściowych odbywa się na podstawie obliczenia sumy waŝonej wejść (równieŝ biasu dla którego wartość wejścia wynosi zawsze 1) przez odpowiadające im wagi: y = w 0 + oraz przekształceniu otrzymanej wartości pobudzenia neuronu przez funkcję aktywacji by otrzymać sygnał wyjściowy y = ϕ(y). Funkcja aktywacji, w zaleŝności od potrzeby moŝe być zarówno liniowa jak i nieliniowa. Najczęściej stosuje się funkcję logistyczną 1 ϕ( x) = 1+ exp( βx) oraz funkcję tangens hiperboliczny n i= 1 w i x i exp( βx) exp( βx) ϕ( x) = exp( βx) + exp( βx) Czasem korzysta się są teŝ z funkcji progowych, jednak poprzez analogię do rzeczywistych neuronów, które reagują w sposób ciągły na sygnały wejściowe, ich zastosowanie wydaje się trochę sztuczne. Funkcje liniowe są o tyle nieinteresujące w tym względzie, Ŝe ich zastosowanie powoduje w zasadzie tylko przeskalowanie otrzymanej wartości pobudzenia neuronu i nawet złoŝenie takich przekształceń nie wprowadza istotnych modyfikacji w sieciach neuronowych 3. Aby stworzyć sieć neuronową naleŝy połączyć neurony w określony sposób. Najczęściej stosowane jest połączenie jednokierunkowe neuronów w warstwy, gdzie neurony pomiędzy kolejnymi warstwami oddziałują na siebie, natomiast w ramach jednej warstwy nie, 3 Liniowe funkcje aktywacji maja czasem zastosowanie przy składaniu wartości wyjść neuronów z warstwy ukrytej w niektórych architekturach sieciowych np. w sieciach typu RBF.

a połączenia między warstwami są najczęściej typu kaŝdy z kaŝdym. Struktura taka to perceptron wielowarstwowy. Liczba warstw moŝe się wahać od 2 do kilkunastu. Na podstawie licznych badań zauwaŝono, Ŝe sieć wielowarstwowa (więcej niŝ warstwa wejściowa, jedna warstwa ukryta i warstwa wyjściowa) jest równowaŝna w sensie matematycznym sieci z jedną warstwą ukryta, warstwą wejściową i wyjściową. Nie udało się jednak określić jaką liczbą neuronów powinna mieć warstwa ukryta. Samo jednak twierdzenie powoduje, Ŝe chcąc szukać rozwiązania danego problemu za pomocą perceptronów wielowarstwowych nie ma potrzeby budowania sieci z duŝą liczbą warstw ukrytych. Popularne są teŝ sieci rekurencyjne, gdzie pojawiają się połączenia dwukierunkowe między neuronami (np. sieć Hopfielda, w której wyjścia z kaŝdego neuronu łączą się z wejściami neuronów pozostałych), sieci komórkowe w których sprzęŝenia dotyczą neuronów sąsiednich, oraz sieci o radialnych funkcjach bazowych, których neurony posiadają radialne funkcje aktywacji i sieć zwykle zbudowana jest z trzech warstw: wejściowej, jednej ukrytej z radialnymi funkcjami aktywacji, oraz wyjściowej. Aby korzystać z właściwości sieci naleŝy odpowiednio ją nauczyć. Podstawowe rodzaje nauczania to nauczanie z nauczycielem (posiadamy wiedzę na temat oczekiwanych odpowiedzi sieci na dane wejściowe) lub bez nauczyciela (nie posiadamy wiedzy na temat oczekiwanych odpowiedzi sieci). W przypadku nauczania z nauczycielem najczęściej stosowany jest algorytm wstecznej propagacji błędów oparty na regule delta, natomiast w nauczaniu bez nauczyciela stosuje się regułę Hebba lub WTO (winner takes all). Przedstawione rodzaje nauczania stosuje się do innych rodzajów sieci, a co za tym idzie do rozwiązywania zupełnie innych problemów 4. Problemy w zastosowaniu sieci neuronowych Zanim przystąpimy jednak do budowy sieci neuronowej pozwalającej na rozwiązywanie konkretnego problemu naleŝy podjąć decyzje na poszczególnych etapach przygotowania i działania sieci. Po pierwsze musimy określić architekturę sieci, ilość warstw ukrytych, ilość neuronów w poszczególnych warstwach. W zastosowaniach ekonomicznych najczęściej korzystamy z sieci typu perceptron. Liczbę neuronów w warstwie wejściowej i wyjściowej mamy zwykle narzuconą jednak poprzez określoną postać danych. Pozostaje nam określenie ilości warstw ukrytych oraz ilości neuronów w poszczególnych warstwach. Wspomniane twierdzenie o wystarczającej jednej warstwie ukrytej teoretycznie ułatwia nam ten problem. W praktyce obserwując empirycznie jakość stworzonej sieci moŝemy dojść do wniosku, Ŝe czas działania dla sieci z dwoma luba trzema warstwami ukrytymi z kilkoma neuronami moŝe być znacznie krótszy niŝ dla sieci działającej podobnie z jedną warstwą ukrytą i duŝą liczba neuronów w tej warstwie, lub odwrotnie. Wówczas moŝna dokonać odpowiedniej modyfikacji sieci, w zaleŝności czy zaleŝy nam na prostocie struktury sieci, czasie jej działania czy moŝliwie najmniejszym generowanym błędom. Na tym etapie naleŝy jednak szczególnie uwaŝać na to, aby sieć nie posiadała zbyt małej ilości neuronów ukrytych (co moŝe spowodować brak moŝliwości znalezienia odpowiednich zaleŝności między danymi wyjściowymi a wejściowymi), zbyt duŝej ilości neuronów ukrytych (co moŝe spowodować uczenie się na pamięć danych wejściowych), oraz zbyt duŝej liczby warstw ukrytych (co moŝe spowodować bardzo wolne działanie sieci poprzez próbę odnalezienia nadmiaru często niepotrzebnych lub nawet fałszywych związków między wartościami wyjść i wejść). Wszystkie te elementy weryfikuje się empirycznie na reprezentatywnej próbce danych. W 4 Dokładny opis struktur, sposobów uczenia i mechanizmów działania sieci neuronowych moŝna znaleźć m.in. w [2], [4], [6], [8], [9]

literaturze często spotykamy wskazówki dotyczące podjęcia decyzji we wspomnianych kwestiach: liczba warstw ukrytych wynosząca jeden jest zwykle wystarczająca, liczba neuronów w sieci powinna być ok. 10 razy mniejsza od ilości danych wejściowych 5. W ramach pierwszego etapu określamy teŝ funkcję aktywacji. Tego dokonujemy równieŝ w sposób empiryczny. Badania wielu naukowców potwierdzają, Ŝe dobór parametrów etapu pierwszego nie ma aŝ tak duŝego znaczenia dla jakości działania sieci, mimo iŝ paradoksalnie moŝe się wydawać Ŝe ma on znaczenie kluczowe. Drugi etap to wybór metody uczącej, trenowanie sieci i jej testowanie. Trenowanie nie moŝe być zbyt długie, gdyŝ spowodować to moŝe nauczenie się przez sieć danych wejściowych na pamięć. Zbiór testujący powinien zawierać teŝ przykłady, które nie zawierał zbiór uczący, co pozwoli stwierdzić czy nasza sieć działa poprawnie. Dostępnych jest wiele metod uczenia i walidacji sieci 6, z których ciekawym sposobem jest walidacja krzyŝowa, polegająca na podziale danych do testowania na ok. 10 zbiorów, uczeniu na dziewięciu z nich a walidacji na ostatnim dziesiątym, po czym następuje zamiana zbiorów. W wyniku powstanie 10 róŝnych sieci, które mogą wszystkie wpływać na wynik końcowy z odpowiednimi wagami. Ostatni etap to wreszcie zastosowanie sieci do rozwiązania przedstawionego zadania i ocena jej jakości. Określa się m.in. błędy poszczególnych neuronów, błędy średnie dla całego zbioru testującego czy walidującego. Otrzymane wyniki stanowią zwykle podstawę do określania zakończenia procesu uczenia lub jego kontynuacji. Czasem jednak bezpieczniej jest określić stałą liczbą epok 7 w procesie uczenia, gdyŝ sieć moŝe nie być w stanie rozwiązać postawionego problemu z zadaną przez nas dokładnością. Poza problemami typowymi dla wszystkich zastosowań sieci neuronowych pojawiają się jeszcze problemy typowe dla zastosowań w analizie finansowej, gdzie w większości przypadków mamy do czynienia z próbami prognozy szeregów czasowych. Tutaj powszechną topologią, podobnie jak w większości zastosowaniach ekonomicznych, są sieci typu perceptron z jedną warstwą ukryta. Dobór ilości neuronów w warstwie ukrytej, postać funkcji aktywacji oraz sposób uczenia pozostaje nadal sprawą otwartą. Pojawia się jednak jeszcze jeden, szczególnie waŝny problem: odpowiedniego doboru danych wejściowych i wyjściowych. W przypadku wskaźników finansowych moŝna uwzględniać dane nie tylko danego wskaźnika z poprzednich okresów, ale równieŝ informacje na temat ogólnej sytuacji gospodarczej, inflacji, sytuacji na giełdach, sytuacji na rynkach pienięŝnych i walutowych, itd. Gdy juŝ nawet ustalimy jakie czynniki będą dla nas istotne pojawiają się kolejne pytania: z jakiego okresu czynniki naleŝy uwzględnić oraz na jaki okres prognozować (oczywiście im krótszy horyzont czasowy tym mamy większą szansę uzyskać lesze rezultaty). Problemem jest teŝ odpowiedź na pytanie co prognozować? Sam wskaźnik, jego zmienność, wartość max czy min w określonym czasie, wahania? Oczywiście dane wejściowe jak i wyjściowe do ucznia i testowania moŝna poddawać przekształceniom z celu eliminacji wartości nietypowych (duŝa trudność nauczenia się przez sieć), normalizacji wartości (przeskalowanie do odpowiadającego nam przedziału) czy wreszcie analizie czynnikowej tych danych (moŝe przyczynić się do eliminacji niepotrzebnych danych, co powoduje w konsekwencji korzystanie z prostszego modelu i daje moŝliwość lepszej prognozy). Na większość postawionych pytań udaje się znaleźć odpowiedzi tylko w sposób empiryczny, gdyŝ rynki finansowe zaleŝą od wielu czynników których nie da się przewidzieć. Często okazuje się, Ŝe czynniki pozornie nie mające wpływu na wskaźnik finansowy uwzględnione w danych wejściowych sieci zmniejszają błąd na wyjściu, a usunięcie z pozoru 5 Dokładnie te zaleŝności opisane są w pozycji [8] 6 Walidacja to weryfikacja wyników uczenia sieci w trakcie fazy uczenia sieci 7 Epoka to pojawienie się w ciągu uczącym wszystkich przykładów w określonej kolejności dokładnie jeden raz

istotnych danych nie powoduje pogorszenia działania sieci. Zobaczmy teraz przykłady zastosowania sieci neuronowych na rynkach finansowych oraz efekty ich działania. Zastosowanie sieci neuronowych 1) Prognoza cen akcji Do prognozowania cen akcji najczęściej uŝywana jest tradycyjna sieć typu perceptron z kilkudziesięcioma neuronami wejściowymi i od jednego do trzech wyjściowych. Łatwo zauwaŝyć, Ŝe prognoza cen na podstawie tylko ceny akcji z dnia poprzedniego będzie nieefektywna. Stąd uwzględnia się ceny akcji z kilkunastu (kilkudziesięciu) sesji wstecz, ceny akcji z okresów jednoimiennych, wartości indeksów giełdowych w tychŝe okresach, wskaźniki techniczne, wskaźniki charakteryzujące koniunkturę ekonomiczną kraju (wskaźnik cen konsumpcyjnych, cen ropy, stopa inflacji, stopa odsetek, stopa bezrobocia), sytuację polityczną oraz pewne wartości statystyk przedstawionych wskaźników. Sieć moŝe posiadać wyjście informujące o cenie akcji w okresie T, ale takŝe o cenie minimalnej, maksymalnej, róŝnicy kursu w stosunku do dnia poprzedniego. Nie jest łatwo skonstruować sieć neuronową, która w zadowalający sposób będzie prognozować ceny akcji. Prognozy z małym horyzontem czasu dają zdecydowanie lepsze rezultaty równieŝ ze względu na prostsze modele. Dla poszczególnych akcji naleŝy oczywiście tworzyć inne modele uwzględniające inne parametry danych wejściowych. RóŜnica w ilości neuronów wejściowych dla poszczególnych akcji wynika z empirycznych doświadczeń nie jest ona stała dla wszystkich akcji. Wyjaśnienie tego faktu moŝe być następujące: kaŝda spółka prowadzi działalność w inny sposób, inne jest otoczenie gospodarcze kaŝdej spółki i wreszcie inaczej reagują na poszczególne spółki inwestorzy. Trudny jest do określenia wpływ czynników na poszczególne kursy akcji, dlatego dobór danych wejściowych następuje w sposób empiryczny. W porównaniu z metodami fundamentalnymi oraz technicznymi prognozy oparte na sieciach neuronowych dają nieco lepsze rezultaty. Wynika to z fakty braku moŝliwości dokładnego opisu zmienności cen akcji w zaleŝności od podanych czynników, a w przypadku analizy technicznej zmienności zachowań inwestorów niekoniecznie podąŝających za trendami. Często korzysta się z wielu metod prognostycznych, a w przypadku ogólnej zgodności prognoz - przystępują do działania. Takie podejście wydaje się być najlepsze, gdyŝ jeśli wiele wskaźników mówi nam o określonym zachowaniu danej akcji w przyszłości to jest duŝe prawdopodobieństwo Ŝe takie zdarzenie faktycznie nastąpi. 2) Prognoza sygnałów kupna i sprzedaŝy akcji W przypadku prognozy sygnałów kupna i sprzedaŝy teŝ korzystamy z tradycyjnego modelu sieci neuronowych w postaci sieci typu perceptron. Tutaj osiągamy znacznie lepsze efekty niŝ w przypadku prognozy cen, poniewaŝ celem działania sieci nie jest określenie całej krzywej jej ceny lecz tylko wybranych jej punktów momentów kupna i sprzedaŝy. Za moment kupna czy sprzedaŝy uznajemy miejsce przecięcia z osią czasu wykresu nachylenia kursu. Najlepsze efekty daje tutaj zastosowanie sieci typu 82-4-2-1 do 142-4-2-1, gdzie na wejściu znalazły się stopy zwrotu kursów akcji dla 40 do 70 kolejnych sesji giełdowych poprzedzający notowania prognozowanej sesji, obroty w trakcie tych samych notowań, krzywą nachylenia indeksu giełdowego (znormalizowaną i uśrednioną), obroty (znormalizowane i uśrednione). Wyniki dla poszczególnych papierów wartościowych znów były bardzo zróŝnicowane dla poszczególnych spółek i nie było moŝliwości stworzenia jednej

sieci, która skutecznie prognozowałaby wspomniane momenty dla wszystkich lub nawet kilku dostępnych akcji na rynku. W efekcie testowania działania sieci dla wybranej akcji i zebrania otrzymanych wyników powstał wykres bardzo zbliŝony kształtem do wzorcowej wartości nachylenia dla danych testowych. Wykresy róŝniły się na tyle, Ŝe wartości błędów są wysokie, natomiast punkty przecięcia krzywej nachylenia prognozowanej i wzorcowej z osią czasu są do siebie bardzo zbliŝone, co świadczy o bardzo dobrym dopasowaniu modelu i jego struktury do danego problemu. Uwzględniono zatem odpowiednią liczbą danych wejściowych w odpowiednim horyzoncie czasowym. Badania przeprowadzone dla innych akcji w podobny sposób dały równie dobre rezultaty. Na tej podstawie moŝna stwierdzić, Ŝe sieci neuronowe są skutecznym narzędziem do prognozowania momentów kupna i sprzedaŝy akcji na giełdzie. 3) Prognoza wskaźnika inflacji Inflację moŝemy określić jako wzrost ogólnego poziomu cen dóbr i usług konsumpcyjnych oraz niekonsumpcyjnych. Analitycy twierdzą, Ŝe wpływ na jej wysokość ma wskaźnik cen dóbr i usług konsumpcyjnych, średnie płace nominalne brutto w przemyśle, stopa bezrobocia, wartość produkcji sprzedanej w przemyśle w cenach bieŝących, a takŝe wartość inflacji w okresach poprzedzających. Mając tak dokładnie określony zestaw czynników moŝna poza konstrukcją sieci neuronowej zbudować liniowy lub potęgowy model ekonometryczny. Okazuje się, ze nieco lepsze efekty uzyskujemy tutaj klasycznymi metodami prognostycznymi. Tendencje prognostyczne na kilka okresów w przód są podobne przy zastosowaniu obu metod, natomiast moŝne zauwaŝyć lepsze dopasowanie modelu klasycznego niŝ sieci neuronowej. Oznacza to, Ŝe przedstawione czynniki dobrze opisują prognozowane zjawisko i w tej sytuacji sieć nie znajduje dodatkowych związków między danymi wejściowymi a wyjściowymi. Nie ma więc potrzeby stosowania sieci neuronowej w tym zakresie. Podsumowanie Przedstawione powyŝej rezultaty badań dowodzą, Ŝe sieci neuronowe mogą być dobrym narzędziem do wspomagania prognozowania cen akcji, momentów kupna-sprzedaŝy, czy inflacji szczególnie w krótkich okresach czasu. Lepiej sprawdzają się na giełdzie, gorzej przy prognozie inflacji gdzie moŝna w miarę precyzyjnie określić czynniki wpływające na wielkość prognozowanej zmiennej. Istniejące modele ekonometryczne, metody analizy technicznej mogą pomóc w weryfikacji otrzymanych rezultatów. W przypadku sieci neuronowych nie ma moŝliwości interpretacji otrzymanych wag połączeń, co jest przyczyną ich częstej krytyki. Ich jakość ocenia się nie jak w przypadku metod klasycznych na podstawie analizy błędów czy wariancji, lecz na podstawie efektu ich działania. Nie znając dokładnego opisu czynników wpływających na prognozowane zjawisko lub w przypadku ich duŝej liczby moŝe się okazać, Ŝe jedyną skuteczną metodą prognozowania będą sieci neuronowe oraz analiza techniczna. Inwestorzy, którzy świadomie chcą poruszać się na rynkach finansowych doceniają wszelkie rodzaje analizy, w tym równieŝ sieci neuronowe, o czym moŝe świadczyć chociaŝby mnogość programów do analizy danych z wykorzystaniem poza metodami fundamentalnymi, technicznymi równieŝ sieci neuronowych. Warto podkreślić, Ŝe zupełnie bezcelowe jest stosowanie sieci neuronowych w sytuacjach, gdy moŝemy przedstawić poprawne modele ekonometryczne oraz je rozwiązać,

gdyŝ prawie zawsze otrzymamy w ten sposób lepsze rezultaty. Zastosowanie sieci neuronowych sprowadzałoby się do próby przybliŝania pewnych prawidłowości w danych które mamy dokładnie opisane. Literatura [1] H.White: Artifical Neural Networks. Approximation and learning Theory, Blackwell, Oxford UK and Cambrige USA, 1992 [2] R.Tadeusiewicz: Sieci neuronowe, Warszawa 1993 [3] C.M.Bishop: Neural Network in Pattern Recogniotion, Clarenton Press, Oxford 1995 [4] R.Tadeusiewicz: Elementarne wprowadzenie do techniki sieci neuronowych z przykładowymi programami, Warszawa 1998 [5] J.S.Zieliński: Inteligentne systemy w zarządzaniu, PWN, Warszawa, 1999 [6] E.Gateley: Sieci neuronowe. Prognozowanie finansowe i projektowanie systemów transakcyjnych, WIG-Press, Warszawa, 1999 [7] C.L.Dunis: Prognozowanie rynków finansowych, Oficyna Ekonomiczna, 2001 [8] R.Tadeusiewicz, P.Lula: Wprowadzenie do sieci neuronowych, StatSoft & C.H.Beck, Kraków 2001 [9] D.Witkowska: Sztuczne sieci neuronowe i metody statystyczne, C.H.Beck, Warszawa, 2002