Wybór metody preprocessingu zmiennych wejciowych do prognozowania płacenia przez przedsibiorstwo dywidendy



Podobne dokumenty
Daniel Kierepka. Kompresja obrazów za pomoc sztucznych sieci neuronowych

WYKŁAD 4 PLAN WYKŁADU. Sieci neuronowe: Algorytmy uczenia & Dalsze zastosowania. Metody uczenia sieci: Zastosowania

Ekonometria - wykªad 8

Ustalenie optymalnego układu lokalizacyjnodystrybucyjnego

PREZENTACJA DZIAŁANIA KLASYCZNEGO ALGORYTMU GENETYCZNEGO

Podstawy Sztucznej Inteligencji (PSZT)

Poprawa efektywnoci metody wstecznej propagacji bdu. Jacek Bartman

Temat: Technika zachłanna. Przykłady zastosowania. Własno wyboru zachłannego i optymalnej podstruktury.

Projekt Sieci neuronowe

Cash flow projektu zakładajcego posiadanie własnego magazynu oraz posiłkowanie si magazynem obcym w przypadku sezonowych zwyek

PROGNOZOWANIE OSIADAŃ POWIERZCHNI TERENU PRZY UŻYCIU SIECI NEURONOWYCH**

Elementy Sztucznej Inteligencji

SIECI RBF (RADIAL BASIS FUNCTIONS)

PROWIZJE Menad er Schematy rozliczeniowe

Elementy Sztucznej Inteligencji

Hanna Szczepaska Ewa Kumirek Giełda Papierów Wartociowych w Warszawie Wołomin, 3 marca 2005 r.

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Program do konwersji obrazu na cig zero-jedynkowy

Sztuczne Sieci Neuronowe. Wiktor Tracz Katedra Urządzania Lasu, Geomatyki i Ekonomiki Leśnictwa, Wydział Leśny SGGW

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

ALGORYTMY GENETYCZNE ćwiczenia

Uczenie Wielowarstwowych Sieci Neuronów o

Nadwyka operacyjna w jednostkach samorzdu terytorialnego w latach

I Powiatowy Konkurs Matematyka, Fizyka i Informatyka w Technice Etap finałowy 10 kwietnia 2013 grupa elektryczno-elektroniczna

E2 - PROBABILISTYKA - Zadania do oddania

Plan wykładu. Reguły asocjacyjne. Przykłady asocjacji. Reguły asocjacyjne. Jeli warunki to efekty. warunki efekty

Komisja Papierów Wartociowych i Giełd

Amortyzacja rodków trwałych

B. DODATKOWE NOTY OBJANIAJCE

Planowanie adresacji IP dla przedsibiorstwa.

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

IV Powiatowy Konkurs Matematyka, Fizyka i Informatyka w Technice Etap finałowy 1 kwietnia 2016

Wymierne korzyci wynikajce z analizy procesów

MODELOWANIE PROCESÓW EKSPLOATACJI MASZYN

Zastosowanie programu Microsoft Excel do analizy wyników nauczania

przewidywania zapotrzebowania na moc elektryczn

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

Temat: Problem najkrótszych cieek w grafach waonych, cz. I: Algorytmy typu label - setting.

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Modelowanie glikemii w procesie insulinoterapii

Optymalizacja optymalizacji

Program Sprzeda wersja 2011 Korekty rabatowe

Otwarta koordynacja polityki społecznej w UE. Stanisława Golinowska

PROBABILISTYKA I STATYSTYKA - Zadania do oddania

Zastosowanie optymalizacji rojem cząstek (PSO) w procesie uczenia wielowarstwowej sieci neuronowej w problemie lokalizacyjnym, kontynuacja badań

Multipro GbE. Testy RFC2544. Wszystko na jednej platformie

Metoda statystycznej oceny klasy uszkodze materiałów pracujcych w warunkach pełzania *

Metody Sztucznej Inteligencji II

Konferencja prasowa 10 maja 2007 r. Wyniki finansowe po 1 kwartale 2007 roku str. 1

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

Automatyzacja procesu badania neuronowego systemu wnioskuj¹cego opartego na programie Statistica w praktycznym zastosowaniu***

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Formularz. (kwartał/rok)

Formularz. (kwartał/rok)

Wykªad 6: Model logitowy

FAKTURA PRZEDPŁATA PODRCZNIK UYTKOWNIKA

Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora.

ALGORYTM RANDOM FOREST

Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego

Projektowanie i analiza zadaniowa interfejsu na przykładzie okna dialogowego.

Wektor o pocztku i kocu odpowiednio w punktach. Prosta zawierajca punkty p i q: pq Półprosta zaczynajca si w punkcie p i zawierajca punkt q:.

Konspekt lekcji matematyki klasa 4e Liceum Ogólnokształcce

Komputerowa Ksiga Podatkowa Wersja 11.4 ZAKOCZENIE ROKU

Argumenty na poparcie idei wydzielenia OSD w formie tzw. małego OSD bez majtku.

PROCEDURY REGULACYJNE STEROWNIKÓW PROGRAMOWALNYCH (PLC)

Projektowanie algorytmów rekurencyjnych

Aneks Nr 1 do Prospektu Emisyjnego. PCC Rokita Spółka Akcyjna. zatwierdzonego przez Komisję Nadzoru Finansowego w dniu 7 maja 2014 roku

Wykorzystanie sztucznych sieci neuronowych do prognozowania upadłoci przedsibiorstw

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Temat: Algorytmy zachłanne

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu - metodologia badań

Metody klasyfikacji danych - część 1 p.1/24

Zastosowania sieci neuronowych

Streszczenie. Słowa kluczowe: modele neuronowe, parametry ciągników rolniczych

Algorytmy kodowania predykcyjnego

Kompresja obrazu z wykorzystaniem transformaty Karhunena-Loeve

Elementy pneumatyczne

Raport kwartalny SA-Q 2 / 2007

Test wskaźnika C/Z (P/E)

Matematyka wykªad 1. Macierze (1) Andrzej Torój. 17 wrze±nia Wy»sza Szkoªa Zarz dzania i Prawa im. H. Chodkowskiej

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15

Wstęp do sieci neuronowych, wykład 03 Warstwy RBF, jednostka Adaline.

Studenckie Koło Naukowe Rynków Kapitałowych General Electric Company (GE) - spółka notowana na giełdzie nowojorskiej (NYSE).

Wstęp do sieci neuronowych laboratorium 01 Organizacja zajęć. Perceptron prosty

EKONOMICZNY PLAN PROJEKTU

Bank of America Corp.(DE) (BAC) - spółka notowana na giełdzie nowojorskiej (NYSE).

Systemy sztucznej inteligencji w zarzdzaniu przedsibiorstwem Karta (sylabus) przedmiotu

Za I kwartał roku obrotowego 2006 obejmujcy okres od do (data przekazania)

Temat: Liniowe uporzdkowane struktury danych: stos, kolejka. Specyfikacja, przykładowe implementacje i zastosowania. Struktura słownika.

Raport kwartalny SA-Q III/2005. Koszaliskie Przedsibiorstwo Przemysłu Drzewnego SA (nazwa emitenta)

ZAGADNIENIE TRANSPORTOWE

Uczenie sieci radialnych (RBF)

Opera Wykorzystanie certyfikatów niekwalifikowanych w oprogramowaniu Opera wersja 1.1 UNIZETO TECHNOLOGIES SA

ANALIZA PORÓWNAWCZA JAKOŚCI MODELI PROGNOZOWANIA KONDYCJI EKONOMICZNO- FINANSOWEJ PRZEDSIĘBIORSTW WOJ. LUBELSKIEGO I PODKARPACKIEGO

Bazy danych. Plan wykładu. Zalenoci funkcyjne. Wykład 4: Relacyjny model danych - zalenoci funkcyjne. SQL - podzapytania A B

ROZPORZDZENIE KOMISJI (WE) NR 69/2001. z dnia 12 stycznia 2001 r.

RAPORT Z PRAKTYKI. Zastosowanie Sztucznych Sieci Neuronowych do wspomagania podejmowania decyzji kupna/sprzedaży na rynku Forex.

Transkrypt:

Agata Raszka 1 Wybór metody preprocessingu zmiennych wejciowych do prognozowania płacenia przez przedsibiorstwo dywidendy 1. Wprowadzenie Termin sztuczna inteligencja został zaproponowany w 1956 roku przez profesora Massachusetts Institute of Technology Johna McCarthy, podczas konferencji w której brali udział naukowcy z rónych dziedzin, zajmujcy si ludzk wiadomoci. Uczestnicy konferencji zdefiniowali sztuczn inteligencj jako "konstruowanie maszyn, o których działaniu dałoby si powiedzie, e s podobne do ludzkich przejawów inteligencji" 2. Na znaczeniu zyskały przede wszystkim sztuczne sieci neuronowe (SSN) i algorytmy genetyczne, metody wyej wspomnianej sztucznej inteligencji. Dziedzina sieci neuronowych zaistniała dopiero w 1943 roku wraz z wydaniem historycznej pracy McCulloch'a i Pitts'a. Przedstawiono w niej po raz pierwszy matematyczny opis komórki nerwowej oraz powizanie jej z problemem przetwarzania danych, co rozwinito w kolejnych pracach tych samych autorów. Zaprezentowany model wywarł wielki wpływ na póniejszy rozwój tej dziedziny. Pierwsze sieci neuronowe zaczto budowa ju w latach 50-tych. Pomimo i postp w badaniach nad sztucznymi sieciami neuronowymi dokonywał si głównie w USA, prace były publikowane równie w innych krajach. W Polsce zajmowano si problematyk sieci neuronowych i ich uczenia od samego pocztku istnienia tej dziedziny. Wydano szereg ksiek zajmujcych si problematyk sieci neuronowych, wród których naley wymieni monografie Gawroskiego (1970), Kulikowskiego (1972) i Brodziaka (1974). Zainteresowanie sieciami neuronowymi w połowie lat 80-tych znajduje te odbicie w Polsce, gdzie wydano monografie Tadeusiewicza (1992), Korbicza, Obuchowicza i Uciskiego (1974), Kacprzaka i lota (1995). Przetłumaczono take monografi Hertza, Krogha i Palmera (1993). Sztuczne sieci neuronowe s bardzo intensywnie wykorzystywane w sferze problemów ekonomicznych, do których naley przede wszystkim prognozowanie. Artykuł ten podejmuje prób wyboru odpowiedniej metody preprocessingu danych wejciowych włanie prognozowania płacenie przez przedsibiorstwo dywidendy. Wykorzystamy do tego program Statistica 7 i program Estimatic. 1 Studentka III roku Informatyki i ekonometrii, 2 Paweł Roczak, Implementacja i wykorzystanie wielowarstwowej sieci perceptronowej w modelowaniu makroekonomicznym, http://pawelrosczak.republika.pl/mlp/ai.html

2. Opis problematyki badawczej Dywidenda to cz wypracowanego przez spółk zysku, która jest wypłacana wszystkim posiadaczom akcji. O wypłacie dywidendy decyduje walne zgromadzenie akcjonariuszy - czyli zebranie wszystkich włacicieli firmy. Zgromadzenie akcjonariuszy obraduje po sporzdzeniu sprawozdania finansowego za dany rok obrachunkowy. Dywindend mona wypłaci oczywicie tylko w roku, w którym spółka wypracowała zysk. Wszystkie akcje zwykłe uprawniaj do jednakowej dywidendy. Do uzyskania wyszej dywidendy maj jedynie prawo załoyciele spółki, którzy s posiadaczami akcji uprzywilejowanych. Dywidenda jest wypłacana wszystkim akcjonariuszom, którzy posiadaj akcje spółki w dniu przyjtym jako dzie ustalenia prawa do dywidendy. Regularne wypłacanie dywidendy przez przedsibiorstwo wiadczy o jej dobrej kondycji finansowej, a tym samym pozytywnie wpływa na wizerunek spółki wród inwestorów, gdy pozwala dzieli si zyskiem z akcjonariuszami. Praktycznie nie warto kupowa akcji tylko dla dywidendy, gdy dywidenda to wypłata jednorazowa i nie powinna by głównym czynnikiem wyboru akcji. Warto pamita, e dywidenda jest wypłacana za rok poprzedni, a kurs akcji reaguje na biec sytuacj w firmie. Moe si okaza, e rok za który jest wypłacana był dobry finansowo, ale sytuacja rynkowa uległa pogorszeniu i obecnie zyski spadaj, a wraz z nimi kurs akcji. W praktyce moe to oznacza dla inwestora poniesienie straty, jeli trzyma on akcje głównie w oczekiwaniu na dywidend. Najrozsdniejszym rozwizaniem wydaje si trzymanie akcji ze wzgldu na dobre perspektywy firmy i oczekiwany stabilny wzrost kursu akcji. Dywidenda jako uprawnienie majtkowe akcjonariusza nie posiada tak istotnego znaczenia dla akcjonariuszy polskich spółek jak to ma miejsce w krajach Europy Zachodniej oraz w Stanach Zjednoczonych. Szczególnie za Atlantykiem dywidenda stanowi dla akcjonariuszy podstawowe ródło dochodu. W Polsce zbyt mało spółek wypłaca dywidend std brak przywizania do tego typu instrumentu 3. Istnieje wiele czynników kształtujcych płacenie dywidendy. Naley do nich 28 wskaników: Zmienne rynkowe: X 1 Roczna stopa zwrotu w % X 2 Współczynnik zmiennoci 1 : X 3 Współczynnik zmiennoci 2 : Pmax P X min 2 = *100 Pmax Pmax P X 2 = koniec *100 Pmax 3 Beata Binek, Paweł Heciak, Michał Stpniewski, Dominika Waltz Komierowska, Prawa i obowizki akcjonariuszy spółek publicznych, http://www.e-msp.pl/static/msp/files/kpwig/akcjonariusz.pdf

X 4 Udział spółki w obrotach giełdy w % X 5 Wskanik obrotu w % X 6 Logarytm dziesitny wartoci obrotów w mln zł X 7 logarytm dziesitny kapitalizacji na koniec roku w tys. zł X 8 Udział w kapitalizacji giełdy w kocu roku w % Zmienne fundamentalne: X 9 Wynik finansowy netto w mld zł X 10 Aktywa ogółem w mld zł X 11 Logarytm wartoci ksigowej w kocu roku w mld zł X 12 Przychody ze sprzeday netto w mld zł X 13 Wynik finansowy netto na 1 akcj w zł X 14 Warto ksigowa na 1 akcj w zł w kocu roku X 15 Mara zysku netto w % X 16 Stopa zwrotu z kapitału własnego w % X 17 Stopa zwrotu z aktywów ogółem w % Zmienne rynkowo fundamentalne: X 18 Roczny zysk (strata) netto na 1 akcj do ceny akcji w kocu roku (zysk do ceny) X 19 Warto ksigowa do wartoci rynkowej w kocu roku X 20 zerojedynkowa: 0 ujemny wynik finansowy, 1 dodatni wynik Zmienne makroekonomiczne: Z 1 Dynamika PKB w cenach stałych Z 2 Dynamika nakładów inwestycyjnych w cenach stałych Z 3 Dynamika importu w cenach stałych Z 4 Dynamika eksportu Z 5 rednioroczny kurs dolara w zł Z 6 Dynamika indeksu WIG Z 7 Dynamika indeksu WIG20 Z 8 Udział firm z ujemn wartoci ksigow na Giełdzie Papierów Wartociowych w Warszawie Zmienne te zostały wykorzystane do budowy modelu jako zmienne objaniajce. Dodatkowo kade z 1041 przedsibiorstw zostało opisane zmienn objanian Y, tzn. zmienn grupujc populacj na dwie grupy przedsibiorstw na płacce i nie płacce dywidend w badanym okresie. 3. Opis metody Za pomoc sztucznych sieci neuronowych istnieje moliwo rozwizywania wielu problemów. Mona je podzieli na 2 kategorie: klasyfikacyjne (celem klasyfikacji jest przydzielenie rozpatrywanego przypadku do jednej ze zdefiniowanych wczeniej klas. Dla poszczególnych przypadków naley okreli na wyjciu pojedyncz zmienn nominaln) oraz

regresyjne (celem regresji jest prognozowanie wartoci okrelonej zmiennej i dla poszczególnych rozpatrywanych przypadków na wyjciu sieci naley okreli pojedyncz zmienn numeryczn) 4. Prezentowane badania wykorzystuj model regresji (Regression). Aby dokona analizy porównawczej metod preprocessingu, czyli wstpnego przygotowania danych na wejcie do SSN, musimy przede wszystkim wybra jeden rodzaj sieci. Do wyboru mamy ich kilka, m.in.: sie liniowa (Linear), probabilistyczna sie neuronowa (PNN), sie realizujca uogólnion regresj (GRNN), radialne funkcje bazowe (Radial basis function RBF) oraz perceptron trzy- i czterowarstwowy (MLP). Wybór został dokonany na podstawie analizy statystycznej (porównaniu poddano rednie błdy dla zbiorów: uczcego, walidacyjnego i testowego) próbek złoonych z 50 losowo wygenerowanych sieci kadego rodzaju (Rys.1.). 2,5 2 1,5 1 redni błd uczenia redni błd walidacji redni błd testowania 0,5 0 Linear PNN lub GRNN RBF Three layer perceptron Four layer perceptron Rys. 1. Analiza statystyczna rodzajów SSN Analiza wskazuje na celowe uycie perceptronu trójwarstwowego (z jedna warstw ukryt). Poza tym jest to najpopularniejszy rodzaj sieci. Wymaga uczenia iteracyjnego, które bywa czasochłonne, ale otrzymane sieci s niedue, szybkie i daj wyniki lepsze ni innego rodzaju sieci 5. Dynamiczny rozwój tych sieci zapocztkowany ponownie od lat osiemdziesitych owocuje niezliczon iloci zastosowa praktycznie w kadej dziedzinie. Mimo takiego rozpowszechnienia naley jednak podkreli e sie typu MLP jest jedynie pewn gałzi bada nad systemami neuronowymi w ogóle, obejmujcymi take struktury rekurencyjne, jednowarstwowe, czy uczone bez nadzoru. 4 P.Lula, R.Tadeusiewicz, STATISTICA Neural Networks PL.Wprowadzenie do sieci neuronowych, StatSoft, Kraków 2001, s. 12 5 P.Lula, R.Tadeusiewicz, STATISTICA Neural Networks PL. Przewodnik problemowy, StatSoft, Kraków 2001, s. 184

4. Program bada Badania zrealizowano w nastpujcych etapach: 1. Wyznaczono najlepsz sie zbudowan na kompletnym zestawie zmiennych wejciowych (28-elementowym). 2. Wyznaczono najlepsze sieci zbudowane na zmiennych wejciowych wskazanych przez wykorzystane metody: - selekcj krokow postpujc (22 zmienne); - selekcj krokow wsteczn (16 zmiennych); - algorytm genetyczny (3 zmienne). 3. Wyznaczono najlepsz sie dla zbioru zmiennych niezalenych wybranych za pomoc wskaników pojemnoci informacyjnej (metoda Hellwiga 4 zmienne). 4. Wyznaczono wartoci progowe klasyfikacji (granice decyzyjne) dla poszczególnych metod. 5. Wyznaczono dla poszczególnych sieci ogóln skuteczno oraz błdy I i II rodzaju. 6. Zaproponowano optymaln metod preprocessingu zmiennych objaniajcych. Program Statistica 7 domylnie podzielił przypadki w proporcjach 2:1:1, co dla naszych bada oznacza 521 przypadków do uczenia, 260 do walidacji i 260 do testowania sieci. 5. Wyniki bada 5.1. Budowa modelu bez preprocessingu zmiennych wejciowych Na pocztek zbudowano sie, która zgodnie z załoeniami bdzie zawierała komplet zmiennych wejciowych. Najlepsz sieci okazała si model (Tab.1.): Tab. 1. Sie neuronowa zbudowana na wszystkich zmiennych wejciowych 5.2. Budowa modelu z preprocessingiem zmiennych wejciowych Do najtrudniejszych decyzji, jakie musz zosta podjte przez projektanta sieci neuronowych, naley wybór właciwego zestawu zmiennych wejciowych. Due sieci s bardziej kłopotliwe ni sieci małe, co powoduje, e czasami dobrym rozwizaniem jest odrzucenie pewnych zmiennych, nawet jeli posiadaj pewn warto informacyjn. W ten sposób uda si zredukowa liczb zmiennych wejciowych, a przez to wielko sieci oraz złoono obliczeniow problemu. Jedn z metod gwarantujcych wybór najlepszego zbioru zmiennych wejciowych jest podjcie prób uczenia sieci w oparciu o kady z moliwych

zbiorów zmiennych wejciowych, sprawdzenie jakoci modelu i wybranie na tej podstawie najlepszego rozwizania. Preprocessing danych wejciowych bdziemy realizowa za pomoc algorytmów doboru cech, do których zaliczamy: selekcj krokow postpujc, selekcj krokow wsteczn i algorytmy genetyczne oraz za pomoc metody wskaników pojemnoci informacyjnej. 5.2.1 Optymalizacja zmiennych wejciowych za pomoc selekcji krokowej postpujcej Algorytm selekcji krokowej postpujcej (Forward selection) znajduje na pocztku tak zmienn, która najlepiej przewiduje warto wyjciow, a nastpnie dodaje kolejn zmienn, która najbardziej poprawia model. Proces ten jest kontynuowany do momentu wyczerpania zmiennych albo do momentu osignicia braku poprawy modelu przy dołczaniu kolejnych zmiennych. Postpujcy dobór zmiennych zaleci mona dla wikszej liczby potencjalnych zmiennych wejciowych. Algorytm ten jest o wiele szybszy, ale moe zgubi wane zmienne, których włczenie do modelu znacznie poprawia jego jako. Metod krokow postpujc wybieramy, gdy chcemy szybko otrzyma jaki wynik. W naszym przypadku metoda ta wyznaczyła nastpujce zmienne wejciowe (Tab.2.): Tab. 2. Zmienne wejciowe wygenerowane przez selekcj krokow postpujc w programie Statistica 7 Najlepsz sieci na takim podzbiorze danych okazał si model (Tab.3.): Tab. 3. Sie neuronowa zbudowana na zmiennych wskazanych przez selekcj krokow postpujc 5. 2.2 Optymalizacja zmiennych wejciowych za pomoc selekcji krokowej wstecznej Algorytm selekcji krokowej wstecznej (Backward selection) pracuje w przeciwnym kierunku. Zaczyna ze wszystkimi zmiennymi, usuwajc po jednej. Zaczyna od usuwania tych, których brak najmniej psuje jako predykcji. Wsteczny dobór zmiennych zaleci mona przy niewielkiej liczbie potencjalnych zmiennych wejciowych 6. Metod krokow wsteczn wybieramy, gdy chcemy otrzyma dokładniejsz analiz cech. Przy zastosowaniu tej metody przestrze wej zredukowano do podprzestrzeni 16-wymiarowej (Tab.4.): 6 Ibidem s. 12

Tab. 4. Zmienne wejciowe wygenerowane przez selekcj krokow wsteczn w programie Statistica 7 Najlepsz sieci na takim zestawie zmiennych wejciowych okazał si model (Tab.5.): Tab. 5. Sie neuronowa zbudowana na zmiennych wskazanych przez selekcj krokow wsteczn 5. 2.3 Optymalizacja zmiennych wejciowych za pomoc algorytmu genetycznego Algorytmy genetyczne (Genetic Algorithm) s szczególnie efektywn technika poszukiwa w zagadnieniach kombinatorycznych, gdzie trzeba podejmowa szereg zalenych od siebie decyzji binarnych. Za pomoc tej metody zbiór danych wejciowych mona zakodowa w postaci cigu binarnego 28-elementowego. Wystpienie zera na konkretnej pozycji oznacza eliminacj zmiennej przyporzdkowanej do tej pozycji. Wystpienie jedynki bdzie analogicznie oznaczało pozostawienie danej zmiennej. W programie Statistica 7 znajdujemy wiele parametrów algorytmu genetycznego, takich jak wielko populacji (Population), liczba pokole (Generations), współczynnik mutacji (Mutation rate) oraz współczynnik krzyowania (Crossover rate). Wartoci tych współczynników pozostawiono na poziomie proponowanym przez system, uznajc je za odpowiednie dla prowadzonych bada: Population = 100, Mutation rate = 0,1, Generations = 100 oraz Crossover rate = 1,0. Naley okreli take warto współczynnika wygładzania (Smoothing). Na szczcie sieci, które algorytm genetyczny wykorzystuje do swoich testów nie s zbytnio wraliwe na precyzyjn warto tego współczynnika i w przypadku naszego zadania warto domylna 0,1 bdzie odpowiednia 7. Dla danych o duej liczbie przypadków algorytm doboru cech moe potrzebowa duo czasu obliczeniowego. W takim przypadku zastosowa mona próbkowanie (Sampling). Moemy wybra pewien dodatkowy wpływ na proces eliminacji niechcianych zmiennych poprzez okrelenie wartoci kary jednostkowej (Unit penalty). Warto ta mnoona jest przez liczb neuronów w sieci i wynik dodawany jest do błdu w trakcie oceny jakoci kadej z rozwaanych sieci. Mechanizm ten powoduje karanie duych sieci i sprzyja tworzeniu sieci oszczdnych, zarówno pod wzgldem struktury, jak i liczby wykorzystywanych sygnałów wejciowych. W naszym przypadku wszystkie zmienne 7 P.Lula, R.Tadeusiewicz, Kurs uytkownika programu na przykładach, StatSoft, Kraków 2001, str. 60 i nastpna

wejciowe wnosz istotne informacje charakteryzujce zmienn objanian, dlatego definiowanie kary jednostkowej moe okaza si potrzebne. Niezerowa warto kary jednostkowej faworyzuje mniejsze sieci i zwykle zwiksza sprawno. Natomiast gdy współczynnik ten jest zbyt duy, to od jakoci sieci staje si waniejsza liczba zmiennych 8. Musimy pamita, e typowe wartoci tego współczynnika mieszcz si w przedziale [0,001;0,01] 9. Przed uruchomieniem algorytmu genetycznego przeprowadzono kilka eksperymentów, majcych na celu okrelenie jej właciwej wartoci. Warto kary jednostkowej domylnie ustawiona na 0,0001 spowodowała ograniczenie liczby wej do 19 elementów (Tab.6.): Tab. 6. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,0001 Tablice 7-14 prezentuj dobór zmiennych przy zastosowaniu rónych kar jednostkowych: Tab. 7. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,00017 Tab. 8 Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,0002 Tab. 9. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,00055 Tab. 10. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,00075 Tab. 11. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,00085 Tab. 12. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,0015 Tab. 13. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,0025 8 P.Lula, R.Tadeusiewicz, STATISTICA Neural Networks PL. Przewodnik problemowy, StatSoft, Kraków 2001, str. 126 9 P.Lula, R.Tadeusiewicz, STATISTICA Neural Networks PL. Kurs uytkownika programu w przykładach, StatSoft, Kraków 2001, str. 61

Tab. 14. Zmienne wejciowe wybrane przez algorytm genetyczny z kar jednostkow 0,0035 Jak wida, liczba zmiennych wejciowych zmienia si wraz ze wzrostem wartoci kary jednostkowej na coraz mniejsz. Dokładne kształtowanie si liczby zmiennych wejciowych wobec kary jednostkowej przedstawia poniszy wykres (Rys.2.): liczba zmiennych wejciowych 20 18 16 14 12 10 8 6 4 2 0 0,0001 0,00017 0,0002 0,00055 0,00075 0,00085 0,0015 0,0025 0,0035 kara jednostkowa Rys. 2. Genetic Algorithm Selection Sporód trzech zbiorów o najmniejszej liczbie wej najlepsz sie utworzył zbiór przy karze jednostkowej 0,0025 (pole Error w tablicach 12-14) i to on posłuył do dalszych bada. Tablica 15 przedstawia współczynniki jakociowe sieci zbudowanej na wybranych zmiennych wejciowych. Tab. 15. Sie utworzona na zbiorze zmiennych wskazanych przez algorytm genetyczny 5.2.4 Optymalizacja zmiennych wejciowych za pomoc metody Hellwiga Metoda Hellwiga pozwala na wybór zmiennych objaniajcych silnie skorelowanych ze zmienn objanian i jednoczenie słabo skorelowanych midzy sob. Tworzymy macierz R (macierz współczynników korelacji pomidzy zmiennymi objaniajcymi) oraz macierz R o (macierz współczynników korelacji pomidzy zmienn objanian a zmiennymi objaniajcymi). Nastpnie obliczamy indywidualne wskaniki pojemnoci informacyjnej: m 2 H = r /(1 + r ) l = 1,2,..., L j = 1,2,..., m lj j i= 1 i j ij

Wskaniki te oblicza si dla kadej zmiennej w obrbie kadej kombinacji zmiennych objaniajcych. Integralne wskaniki pojemnoci informacyjnej dla kadej kombinacji potencjalnych zmiennych objaniajcych oblicza si jako sum indywidualnych pojemnoci zmiennych wystpujcych w danej kombinacji. Najwiksz warto integralnych wskaników pojemnoci informacyjnej maj te kombinacje zmiennych objaniajcych, dla których wystpujce zmienne s mocno skorelowane ze zmienn objanian natomiast słabo skorelowane midzy sob 10. Program Estimatic wskazał zmienne X 2, X 9, X 13 oraz X 20 dla wartoci integralnego wskanika pojemnoci informacyjnej równego 0,20644. Najlepsz sieci utworzon dla tych zmiennych okazał si model przedstawiony w Tabeli 16. Tab. 16. Sie neuronowa utworzona na zmiennych wskazanych za pomoc metody Hellwiga 5.3.Wyznaczenie wartoci progowych Zadaniem utworzonych przez nas modeli SSN jest poprawne zaklasyfikowanie przedsibiorstw do jednej z dwóch grup firm, tj. tych, które zapłac lub nie zapłac dywidend. Std wyjcie kadej sieci zawiera tylko jeden neuron, przyjmujcy w procesie uczenia sieci wartoci 0 lub 1. Naley jednak zauway, e wartoci wyj poszczególnych testowanych sieci nie s równe wartociom zadanym w próbie uczcej, lecz przyjmuj wartoci z przedziału (0,1), któr moemy traktowa jako stopie przynalenoci do okrelonej klasy. W zwizku z tym naley ustali próg, na podstawie którego wartoci wyj utosamia si bd z odpowiedni grup przedsibiorstw do której zostanie przyporzdkowana badana firma. Warto progow wyznaczymy zgodnie z prawdopodobiestwem pojawienia si obiektów nalecych do okrelonej grupy, oszacowanych dla grupy uczcej, walidacyjnej i testowej 11 (Tab.17.): Tab. 17. Wartoci progowe dla poszczególnych metod doboru zmiennych wejciowych Metoda Zbiór Liczba zer Liczba jedynek Próg uczenie 367 154 Wszystkie zmienne walidacja 196 64 0,29 testowanie 189 71 uczenie 378 143 Selekcja krokowa walidacja 198 62 postpujca testowanie 176 84 0,32 uczenie 366 155 Selekcja krokowa walidacja 193 67 wsteczna testowanie 193 67 0,31 Algorytm genetyczny uczenie 371 150 0,35 walidacja 191 69 10 M. Gruszczyski i inni, Ekonometria, Oficyna Wydawnicza SGH, Warszawa1996, str. 15 11 T. Korol, B. Prusak, Upadło przedsibiorstw a wykorzystanie sztucznej inteligencji, CeDeWu, Warszawa 2005, str. 156

Metoda Hellwiga testowanie 190 70 uczenie 370 151 walidacja 187 73 testowanie 195 65 0,31 5.4 Wyznaczenie parametrów oceny jakoci klasyfikacji Jako klasyfikacji oceniono na podstawie błdu I i II rodzaju (B1, B2) oraz ogólnej skutecznoci sieci (S) za pomoc nastpujcych wzorów: gdzie: D1 D2 D1 + D2 B 1 = 100% B 2 = 100% S = 1 100% NPD PD NPD + PD D1 liczba przedsibiorstw nie płaccych dywidendy zaklasyfikowanych przez sie jako firmy płacce NPD liczba przedsibiorstw nie płaccych dywidendy w próbie uczcej /walidacyjnej /testowej D2 - liczba przedsibiorstw płaccych dywidend zaklasyfikowanych przez sie jako firmy nie płacce PD - liczba przedsibiorstw płaccych dywidend w próbie uczcej /walidacyjnej /testowej Ogólna skuteczno informuje nas, jaki procent stanowi ogółem prawidłowo zakwalifikowane przypadki (przedsibiorstwa płacce i nie płacce dywidend). Błd I rodzaju okrela błdn decyzj zakwalifikowania przedsibiorstwa nie płaccego dywidendy na płacce. Błd II rodzaju okrela błdn decyzj zakwalifikowania przedsibiorstwa płaccego dywidend na nie płacce. Przyjto, e bardziej szkodliwy bdzie w tym przypadku Błd I rodzaju. Wyniki uzyskanych oblicze przedstawia Tabela 18: Tab. 18. Zestawienie wyników klasyfikacji przedsibiorstw poszczególnych metod Metoda Selekcja Selekcja Skuteczno Zbiór Wszystkie Algorytm Metoda krokowa krokowa zmienne genetyczny Hellwiga postpujca wsteczna uczenie 18,3% 29,9% 27,9% 37,2% 29,2% Błd I rodzaju walidacja 17,3% 29,3% 32,6% 37,2% 26,2% testowanie 27,5% 31,8% 34,2% 31,6% 29,2% uczenie 18,8% 25,2% 13,5% 32,0% 20,5% Błd II rodzaju walidacja 23,4% 27,4% 17,9% 17,4% 26,0% testowanie 32,4% 27,4% 13,4% 31,4% 18,5% uczenie 81,6% 71,4% 76,4% 64,3% 73,3% Skuteczno walidacja 81,2% 71,2% 71,2% 68,1% 73,8% testowanie 71,2% 69,6% 71,2% 68,5% 73,5% 6.Wnioski z bada

Analiza wyników zawartych w Tabeli 18 pozwala stwierdzi, e błdy s do znaczne. Utworzone sieci charakteryzuj si zarówno duymi błdami I rodzaju, jak i II rodzaju. wiadczy to z pewnoci o tym, e problem przewidywania decyzji o wypłacie dywidendy obarczony jest bardzo du losowoci. Najlepsze efekty uzyskała sie utworzona na kompletnym zestawie zmiennych wejciowych. Oznacza to, e wród badanych zmiennych objaniajcych brak jest takich, które samodzielnie lub w kombinacji z mała liczb pozostałych, dysponowałyby duym potencjałem informacyjnym. Kade ograniczenie zmiennych tylko zmniejsza ten potencjał. W sieci utworzonej na zbiorze wskazanym przez selekcj krokow postpujc zminimalizowanie liczby cech opisujcych obiekt do 22 spowodowało zmniejszenie efektywnoci odpowiednio dla zbioru uczcego, walidacyjnego i testowego o 10,2 %, 10% oraz 1,6%. W sieci utworzonej na zbiorze tylko 3-elementowym wskazanym przez algorytm genetyczny efektywno spadła o wiele bardziej odpowiednio o 17,3%, 13,1% oraz 2,7%. Jak wida skuteczno na zbiorze testowym wykazała najmniejsze spadki. Naley take zauway, e mimo prawie identycznej ogólnej skutecznoci zarówno modelu utworzonego na zbiorze wskazanym przez selekcj krokow postpujc jak i krokow wsteczn, model pierwszy wygenerował wiksze błdy I rodzaju uznane przez nas za bardziej szkodliwe. Porównujc wszystkie cztery metody wyranie wida e najwikszymi błdami I rodzaju charakteryzuje si algorytm genetyczny, ale tylko w odniesieniu do zbiorów: uczcego i walidacyjnego. Na zbiorze testowym wida wyran popraw tego wskanika. wiadczy to moe o wikszej zdolnoci predykcyjnej tego modelu, wynikajcej prawdopodobnie z lepszego uogólnienia problemu. Zdolno generalizacji to jako działania na niedostpnych w procesie uczenia, nowo powstałych danych. Dodatkowo brak zaufania do pozostałych modeli moe budzi niewystarczajca liczba przypadków uczcych uytych w trakcie bada. Jak wynika z Tabeli 19 liczba minimalnych przypadków 12 dla poszczególnych metod znacznie przewysza liczebno dostpnego nam zbioru 521 przypadków w zbiorze uczcym, a tym samym powanie podwaa ich wiarygodno ze wzgldu na moliwo zbytniego dopasowania si do danych. Tab. 19. Zestawienie minimalnej liczebnoci przypadków dla poszczególnych metod Metoda Minimum przypadków w zbiorze uczcym 2 N Wszystkie zmienne 268435456 Selekcja krokowa postpujca 4194306 Selekcja krokowa wsteczna 65536 Algorytm genetyczny 8 12 W literaturze wiatowej przyjmuje si, e jeli na wejciu SSN pojawia si N- wymiarowy wektor, to powinnimy dysponowa 2 N przypadkami uczcymi.

Naley take zauway, e redukcja zmiennych wejciowych z wykorzystaniem AG zminimalizowała zrónicowanie jakoci klasyfikacji dla uczenia, walidacji i testowania. Zjawisko takie te przemawia za uznaniem wikszych zdolnoci predykcyjnych takiego modelu. Literatura 1) M. Gruszczyski i inni, Ekonometria, Oficyna Wydawnicza SGH, Warszawa 1996 2) T. Korol, B. Prusak, Upadło przedsibiorstw a wykorzystanie sztucznej inteligencji, CeDeWu, Warszawa 2005 3) P. Lula, R. Tadeusiewicz, STATISTICA Neural Networks PL. Kurs uytkownika programu w przykładach, StatSoft, Kraków 2001 4) P. Lula, R. Tadeusiewicz, STATISTICA Neural Networks PL. Przewodnik problemowy, StatSoft, Kraków 2001 5) P. Lula, R. Tadeusiewicz, STATISTICA Neural Networks PL. Wprowadzenie do sieci neuronowych, StatSoft, Kraków 2001 6) Paweł Roczak, Implementacja i wykorzystanie wielowarstwowej sieci perceptronowej w modelowaniu makroekonomicznym, http://pawelrosczak.republika.pl/mlp/ai.html 7) Beata Binek, Paweł Heciak, Michał Stpniewski, Dominika Waltz Komierowska, Prawa i obowizki akcjonariuszy spółek publicznych, http://www.emsp.pl/static/msp/files/kpwig/akcjonariusz.pdf