Grzegorz Zieliski 1 Wykorzystanie sztucznych sieci neuronowych do prognozowania upadłoci przedsibiorstw 1. Czym s sztuczne sieci neuronowe (SSN)? Inspiracj dla powstania dziedziny SSN było zafascynowanie ludzkim mózgiem, składajcym si z 10 miliardów komórek nerwowych (neuronów), które wzajemnie ze sob współpracujc - przetwarzaj w sposób równoległy przepływajce przez nie sygnały. Sztuczne sieci neuronowe s strukturami złoonymi ze sztucznych neuronów, bdcych uproszczonymi odpowiednikami komórek nerwowych. Poniewa pojedynczy sztuczny neuron zachowuje si tak samo, bdc równie elementem składowym sieci, to przedstawienie zasady jego działania stanowi klucz do zrozumienia, jak działa cała sztuczna sie neuronowa. Analizujc uproszczony model działania sztucznego neuronu (Rys. 1) mona wyróni nastpujce etapy: Na wejcie neuronu trafia wektor skoczonej liczby sygnałów wejciowych (X 1, X 2,, X n ). Wprowadzone na wejcia dane s przemnaana przez wartoci wag (W 1, W 2,, W n ), które okrelaj stopie wanoci informacji, stanowi te swojego rodzaju pami neuronu, zapamituj bowiem zwizki midzy danymi przepływajcymi midzy wejciem i wyjciem. Nastpuje sumowanie iloczynów wag i sygnałów wejciowych czyli obliczane jest tzw. pobudzenie neuronu, które przy zastosowaniu odpowiedniej funkcji aktywacji zamieniane jest na sygnał wyjciowy czyli warto kocow zwracan przez neuron. Rys. 1. Model działania sztucznego neuronu 1 Student III roku Informatyki i ekonometrii, Koło Naukowe Metod Sztucznej Inteligencji Wyszej Szkoły Zarzdzania i Administracji w Zamociu. Opiekun mgr in. Andrzej Burda
Działanie sztucznej sieci neuronowej opiera si na podobnych zasadach, co zostało zobrazowane na przykładowej, 3-warstwowej sieci neuronowej (Rys. 2.). Dane (sygnały wejciowe) po przemnoeniu przez współczynniki wag zostaj wprowadzone do sieci poprzez warstw wejciow (warstwa 1). Dobór odpowiednich wartoci wag tak, aby jak najlepiej odwzorowywały one istotno wprowadzanych danych, nazywany jest procesem uczenia sieci. Wartoci generowane (zwracane) przez neurony warstwy 1 po przemnoeniu przez wagi stanowi sygnały wejciowe dla warstwy 2. Analogiczna zaleno istnieje pomidzy warstw 2 i warstw 3. Warstwa 2 umieszczona pomidzy warstw wejciow i wyjciow nosi nazw warstwy ukrytej (poredniej). W zalenoci od złoonoci problemu badawczego warstw porednich moe by wicej ni jedna, aby zasymulowa skomplikowane zalenoci pomidzy przepływajcymi przez sie danymi (moe te nie by adnej przy modelowaniu banalnych zagadnie). Przetworzone dane trafiaj na wejcia ostatniej warstwy, zwanej wyjciow (warstwa 3), która zwraca kocowy wynik działania sieci. Przedstawiona na Rys. 2 warstwa wyjciowa zawiera 3 neurony, jednake ich liczba jest uzaleniona od podanych wyników działania SSN przykładowo przy problemach klasyfikacji obiektu do 8 grup liczba neuronów w warstwie wyjciowej moe wynie 8, za klasyfikacja typu tak/nie wymaga moe tylko 1 neuronu. Liczba neuronów w pozostałych warstwach take jest dobierana w zalenoci od parametrów realizowanego modelu. Rys. 2 Model 3-warstwowej sztucznej sieci neuronowej SSN dziki takim cechom jak: zdolno do uczenia si oraz uogólniania wiedzy nabytej w procesie trenowania,
odporno na uszkodzenia, równoległe i rozproszone przetwarzanie duej iloci danych (take rozmytych, niekompletnych i chaotycznych), brak koniecznoci programowania przy poszukiwaniu algorytmu rozwizania danego problemu, znajduj szerokie zastosowanie w wielu dziedzinach współczesnej nauki, m.in. w badaniu stanu finansowego przedsibiorstw czy ocenie wiarygodnoci kredytowej. 2. Istota upadłoci przedsibiorstw Z ekonomicznego punktu widzenia o upadłoci przedsibiorstw najogólniej mona powiedzie, e wie si ona z brakiem moliwoci samodzielnego kontynuowania działalnoci bez udzielania pomocy finansowej z zewntrz. W aspekcie prawnym za jest to ustalony na drodze sdowej przymus rozpoczcia procesu zaspokajania wierzycieli. Wie si to z postpowaniem prawnym obejmujcym okrelone procedury, np.: ogłoszenie upadłoci, rozpoczcie procesu upadłociowego, likwidacja bd restrukturyzacja firmy, powołanie syndyka masy upadłociowej, itp. Według polskiego prawa upadłociowego i naprawczego przesłankami do ogłoszenia upadłoci mog by: niewypłacalno przedsibiorstwa (brak moliwoci regulowania zobowiza); warto posiadanego majtku wystarczajca na pokrycie kosztów postpowania. 3. Definicja przedsibiorstwa zagroonego upadłoci z punktu widzenia prowadzonej analizy Jedn z pierwszych kwestii do rozwaenia przy budowie modelu prognozowania stanu finansowego przedsibiorstw było zdefiniowanie firmy zagroonej upadkiem z punktu widzenia prowadzanej analizy. W literaturze spotyka si róne podejcia przy definiowaniu bankrutów oprócz decyzji o upadłoci wydanej przez sd, czsto spotykan praktyk jest branie pod uwag faktu rozpoczcia procesu układowego bd naprawczego (które według polskiego prawa upadłociowego i naprawczego s take czci postpowania upadłociowego), bd te same złoenie wniosku o upadło. Takie podejcie jednak moe by obarczone błdem cz wniosków jest składana przez wierzycieli z zamiarem wywarcia presji na spółkach, aby zaczły regulowa wobec nich zobowizania. Z kolei przy ocenie moliwoci kredytowych czsto za bankruta uznaje si firmy majce stale zwikszajce si opónienia w spłatach kredytu.
Zdefiniowanie bankruta zaley wic od punktu widzenia prowadzonej analizy w przypadku moich bada decydowała ustalona na drodze sdowej decyzja o ogłoszeniu upadłoci. Na tej podstawie zbiór przedsibiorstw uytych w budowie modelu podzielono na dwie grupy: upadłe (bankruci) i niezagroone (zdrowe). 4. Dobór materiału statystycznego niezbdnego do oszacowania modelu Model oparty jest na przedsibiorstwach notowanych na Giełdzie Papierów Wartociowych w Warszawie (GPW) w latach 2001-2005. ródłem szczegółowych informacji na temat kadej z 328 spółek były ich roczne sprawozdania finansowe, zgromadzone i odpłatnie udostpnione przez serwis www.notoria.pl. Wród całej grupy spółek - zgodnie z przyjtym kryterium - wyróni mona było 18 bankrutów. Do kadego z nich dobrano od 2 do 5 przedsibiorstw zdrowych, zwaajc na ten sam sektor działalnoci, ten sam rynek notowa i najmniejsz rónic w wartoci aktywów. Łcznie dało to zbiór 76 spółek uytych do szacowania modelu. 5. Okrelenie zmiennych objaniajcych Pocztkowo korzystajc z modelu Katarzyny Szarzec i Doroty Appenzeller opracowany take dla spółek notowanych na GPW (lata 2000-2002) wybrano 5 zmiennych. Trzy sporód zmiennych zaproponowanych przez autorki, które zostały uyte w moim modelu to: mara zysku operacyjnego (wskanik zyskownoci przedsibiorstwa), wskanik płynnoci biecej (wskanik płynnoci), dług/ebitda (wskanik zadłuenia). Sporód grupy wskaników sprawnoci działania rotacja zapasów została zastpiona rotacj nalenoci, bowiem niektóre ze spółek oferowały działalno usługow, wic nie posiadały zapasów, za odrzucenie tych przypadków uszczupliłoby jeszcze prób badawcz. Pit zmienn, któr posłuyły si autorki był cykl operacyjny (rotacja zapasów + rotacja nalenoci). Poniewa składow cyklu operacyjnego jest rotacja zapasów argument odrzucenia poprzedniego miernika jest słuszny take i w tym przypadku, ponadto majc po jednej zmiennej z kadej grupy wskaników (zyskownoci, płynnoci, zadłuenia i sprawnoci działania) lepszym rozwizaniem wydało si wprowadzenie do modelu jako pitej zmiennej miernika rynkowego wartoci ksigowej na jedn akcj. Ostatecznie do modelu wybranych zostało 5 zmiennych objaniajcych:
wskanik płynnoci biecej = majtek obrotowy / zobowizania krótkoterminowe, mara zysku operacyjnego = zysk operacyjny / przychody ze sprzeday netto, rotacja nalenoci = (nalenoci krótkoterminowe / przychody netto ze sprzeday)*360, dług/ebitda = (zobowizania i rezerwy / (zysk (strata) z działalnoci operacyjnej + amortyzacja), warto ksigowa na jedn akcj. Wartoci zmiennych odnosz si do roku poprzedzajcego bankructwo. 6. Przygotowanie odpowiedniego zbioru wejciowego dla modelu sieci neuronowej Neuronowy model prognozowania upadłoci firm był budowany przy uyciu wbudowanego modułu Neural Networks (Sieci Neuronowe) pakietu STATISTICA. Wymagało to przygotowania zbioru danych wejciowych w odpowiedniej formie. Aby zbudowa efektywnie działajc sztuczn sie neuronow naley przede wszystkim najpierw nauczy j rozpoznawa charakterystyczne cechy wprowadzanych danych, podajc jej odpowiednie wzorce w tym przypadku zbudowa zbiór uczcy, zawierajcy spółki upadłe i zdrowe i podpowiedzie sieci, które z nich s tymi dobrymi, a które złymi. Jednak, aby sie nie dopasowała si zbyt dobrze do znanych sobie przypadków (problem przeuczenia sieci), co mogłoby skutkowa błdn interpretacj nowych, nieznanych spółek, naley take utworzy tzw. zbiór walidacyjny, słucy do monitorowania procesu uczenia. Z kolei zbiór testowy, zawierajcy dane nie ujte w grupie uczcej, słuy do oceny skutecznoci sieci. Uwzgldniajc wymagania właciwego procesu uczenia, wygenerowano 10 zestawów danych o losowej zawartoci spółek. Kady zestaw pod wzgldem budowy wygldał identycznie składał si z 47 spółek podzielonych na 3 zbiory: uczcy: 11 bankrutów i 22 spółki zdrowe, walidacyjny: 4 bankrutów i 4 spółki zdrowe, testowy: 3 bankrutów i 3 spółki zdrowe. Generator zestawów był napisany tak, aby spółka zdrowa była dobrana z grupy przedsibiorstw dobrych odpowiadajcych spółce-bankrutowi (pod wzgldem rynku notowa, sektora i wartoci aktywów). W zbiorze uczcym liczba zdrowych spółek była dwukrotnie wysza od upadłych. W rzeczywistoci proporcja ta jest jeszcze wiksza, lecz ze wzgldu na niedu liczebno próby nie mona było jej zamodelowa. W zbiorach
walidacyjnym i testowym spółki dobre i złe umieszczone zostały w stosunku 1:1, aby zapewni efektywn klasyfikacj firm. Tabela 1. Przykładowy zestaw danych wejciowych. Zestaw danych wejciowych (Tabela 1) opisany był nastpujcymi właciwociami: Zbiór - okrelenie przynalenoci spółki do zbioru uczcego (u), walidacyjnego (w) lub testowego (t); Nazwa spółki nie brana pod uwag w przetwarzaniu danych przez program, sygnalizujca wystpienie konkretnej spółki w danym zestawie i ułatwiajca odnalezienie konkretnego przypadku; Stan bankruci z przypisan wartoci 0, spółki zdrowe oznaczone 1; 5 zmiennych zastosowanych w modelu do opisania kondycji finansowej spółek;
7. Proces uczenia sieci dobór parametrów sieci i optymalizacja modelu W przeprowadzonych badaniach szybko okazało si po testowaniu rónych rodzajów sieci na tym samym zbiorze danych wejciowych e perceptron wielowarstwowy daje zdecydowanie lepsze rezultaty ni sieci liniowe, sieci o radialnych funkcjach bazowych (radial basis functions) czy probabilistyczne sieci neuronowe (probabilistic neural networks). Potwierdzona została, spotykana w wielu przypadkach z literatury, słuszno uycia perceptronu do budowy modelu opartego na wskanikach finansowych. Ze wzgldu na mał złoono budowanego modelu (tylko 5 zmiennych objaniajcych) wystarczyło zastosowa 1 warstw ukryt z iloci neuronów nie przewyszajc iloci zmiennych wejciowych czyli liczba neuronów w warstwie poredniej wahała si od 1 do 5. Liczba neuronów w warstwie wejciowej równa była liczbie zmiennych objaniajcych (jeden neuron na wejciu przetwarzał dane odpowiadajce jednej zmiennej wejciowej), za w warstw wyjciow stanowił jeden neuron, zwracajcy rezultat działania sieci. Sporód liniowej i logistycznej funkcji aktywacji, ta druga dawała lepsze efekty przy zamianie stanu pobudzenia neuronu na sygnał wyjciowy. Z kolei, jeli chodzi o wybór metody uczenia, najlepsz opcj okazało si zastosowanie kombinacji algorytmu wstecznej propagacji błdów (przy przebiegu 100 epok) oraz metoda gradientów sprzonych (maksymalnie 500 epok). Takie połczenie do szybko zapewniało stabilne działanie sieci, bo poniej 200. epoki w drugiej fazie uczenia metodzie gradientowej. Generujc sieci na podstawie 10 rónych zestawów spółek otrzymałem dla kadego z zestawów najwydajniejsze pod wzgldem klasyfikacji bankrut/ nie-bankrut sieci. Jednak kady zestaw miał losowe przyporzdkowanie spółek do danego zbioru (uczcego, walidacyjnego, testowego), co rónicowało wyniki zwracane przez poszczególne sieci. W celu uogólnienia (urednienia) wyników, otrzymywanych na wyjciu najlepszych sieci dla kadego zestawu danych, zbudowany został model kombinowany, co przełoyło si na lepsz wydajno przy rozpoznawaniu stanu zagroenia przedsibiorstw. Opracowane zostały 2 podejcia: Model kombinowany (dla zachowania czytelnoci toku postpowania oznaczany dalej jako MK I), w skład którego wchodziło po jednej najlepszej sieci dla kadego z 10 zestawów wejciowych spółek (czyli łcznie 10 sieci w MK I); Model kombinowany (dalej MK II) złoony z 10 modeli kombinowanych (mk1, mk2,, mk10) (zawierajcych po 5 najlepszych sieci) utworzonych dla kadego zestawu
danych wejciowych (łcznie w MK II znalazło si 47 sieci dla mk6, mk8 i mk9 wybrano po 4 najlepsze sieci, gdy pozostałe odbiegały pod wzgldem efektywnoci). Poniej przedstawiono zestawienia modeli kombinowanych (Tabela 2). Pierwsze 10 wierszy to modele kombinowane dla kadego z 10 zestawów danych wejciowych mk1,..., mk10, kolejne dwie pozycje to modele kombinowane omówione powyej dla wiersza o indeksie 281 MK I, za o indeksie 282 MK II. Jak wida modele kombinowane mk1,, mk10 tworzone na podstawie pojedynczych zestawów w wikszoci charakteryzuj si lepsz wydajnoci na kadym ze zbiorów (Train/Select/Test Performance) i mniejszymi błdami (Train/Selekt/Test Error) ni modele MK I I MK II, lecz naley wzi pod uwag, e ich wynik bdzie obarczony wikszym błdem przy analizowaniu spółek, które nie wchodziły w skład danego zestawu. Modele MK I i MK II maj lepsz zdolno do uogólniania i przy klasyfikacji typu bankrut/ nie-bankrut w odniesieniu do grupy wszystkich przedsibiorstw popełniaj mniej błdów. Tabela 2. Zestawienie grup zbiorczych wraz z ich charakterystykami. Wykresy zalenoci zmiennej objanianej (stan finansowy przedsibiorstwa, gdzie 1 bardzo dobry, 0 bardzo zły, przy skali cigłej) od poszczególnych zmiennych objaniajcych (Rys. 3 wskanik płynnoci biecej, Rys. 4 mara zysku operacyjnego) jednoznacznie pokazuj, e model MK II (oznaczona czerwonym kolorem linii na wykresie, MK I niebieski kolor linii) posiadła wiksz zdolno do generalizowania (uogólniania), bowiem wykresy s bardziej wygładzone, a wic zaleno zmiennej wejciowej od zmiennych wyjciowych jest bardziej stabilna, mniej podatna na losowe wartoci. Ostatecznie to model MK II (47 sieci) posłuył za model najbardziej optymalny i został on wykorzystana w kocowym procesie testowania.
Rys. 3. Wykres zalenoci stanu finansowego przedsibiorstwa od wskanika płynnoci biecej. Rys. 4. Wykres zalenoci stanu finansowego przedsibiorstwa od mary zysku operacyjnego. 8. Testowanie oszacowanego modelu i wyniki prognoz. Testowanie oszacowanego modelu zostało przeprowadzone na zbiorze 76 spółek tych samych, które zostały wykorzystanych do budowy poszczególnych zestawów. Niewtpliwie wynik takiego testowania jest w jakim stopniu obarczony zawyonym prawdopodobiestwem właciwej klasyfikacji bankrut/ nie-bankrut (przy dosy małej liczebnoci próby była to niemal konieczno), jednak stanowi to nieduy udział w tym, e oszacowany model ma charakteryzuje si bardzo dobrymi skłonnociami predykcji upadłoci przedsibiorstw. Wyniki działania zbudowanego modelu zaprezentowane s na Rys. 7.
Rys. 5. Zestawienie rzeczywistych i oszacowanych stanów finansowych przedsibiorstw. Za warto graniczn, rónicujc przedsibiorstwo zdrowe od bankruta przejta została warto 0,5 zmiennej objanianej. Oszacowane wartoci powyej 0,5 wskazywały na dobry stan spółki, za poniej na zagroenie upadłoci. Wród spółek zdrowych, dla 43 z nich sie zwróciła warto 1 (co mona interpretowa jako całkowita pewno dobrej kondycji finansowej), dla 14 sie wygenerowała wynik z przedziału <0,5;1> (tutaj wystpuje pewne ryzyko przy stwierdzeniu, e firma jest zdrowa), za jedna spółka została błdnie oceniona jako bankrut (warto zwrócona przez sie 0,413) W przypadku przedsibiorstw, które w rzeczywistoci upadły (brak słupków prezentujcych wartoci rzeczywiste, bowiem warto stanu finansowego dla spółek upadłych wynosi 0), dla 13 z nich model wskazywał warto 0, czyli pewno bankructwa (analogicznie brak słupków odpowiadajcych oszacowanym wartociom stanu finansowego dla tych przypadków), za dla pozostałych 5 zwrócona została warto z przedziału <0;0,5), co oznacza moliwo obarczenia pewnym ryzykiem diagnozy upadłoci firmy. Zatem adna spółka-bankrut nie została sklasyfikowana błdnie. Łcznie wic tylko w jednym na 76 przypadków neuronowy model dokonał nietrafnej oceny, przy czym warto zauway, e zaklasyfikował spółk zdrow do grupy bankrutów (błd I rodzaju), co obarczone jest mniejsz szkodliwoci, bowiem w przypadku kredytodawców pojawia si koszt utraconych korzyci, podczas gdy błd II rodzaju (wskazanie potencjalnego bankruta jako przedsibiorstwa niezagroonego upadłoci) naraa ju na strat kapitału. Wartoci obu rodzajów błdów wyniosły odpowiednio: błd I rodzaju 0% (0 błdów klasyfikacji na 18 przypadków), błd II rodzaju 1,72% (1 na 58). Łczna efektywno modelu wyniosła 98,68% (75 trafnych klasyfikacji na 76 przypadków). 9. Podsumowanie
Sztuczne sieci neuronowe dziki swoim zaletom znajduj zastosowanie w wielu dziedzinach nauki. W stosunkowo niedługim czasie powstało wiele neuronowych modeli, które sprawdziły si take w prognozowaniu stanu finansowego przedsibiorstw, dajc nawet lepsze rezultaty ni klasyczne metody ekonometryczne. Oprócz lepszej wydajnoci modeli zbudowanych w oparciu o sieci neuronowe, podejcie to jest te bardziej uniwersalne nie ma potrzeby budowania modelu od pocztku dla gospodarki krajowej kadego pastwa czy dla rónych rynków - majc gotowy model wystarczy zastosowa inne zmienne objaniajce i szybko podda sie ponownemu procesowi trenowania. Ponadto nie musz by spełnione pewne wymagania, jakie s wymagane przy metodach klasycznych prognozowania upadłoci przedsibiorstw (stosunek spółek zdrowych do upadłych 1:1). Posiadajc wiedz na temat działania SSN, metod uczenia czy te architektury łatwo mona realizowa róne modele do rozwizywania złoonych problemów czy zagadnie. Ponadto narzdzia słuce do budowy SSN, takie jak STATISTICA pozwalaj na generowanie w łatwy i przyjazny uytkownikowi sposób rónego rodzaju podsumowa i analiz ułatwiajcych zrozumienie problemu i interpretacj chociaby wyników kocowych. Cho wci trwaj dyskusje co do wikszej skutecznoci prognozowania pomidzy metodami neuronowej i klasycznymi metodami, to zbudowany modelu dowodzi słusznoci uycia sztucznych sieci neuronowych w dziedzinie predykcji bankructw, co wicej jego wysoka efektywno wydaje si stawia SSN, jeli nie na szczycie, to bynajmniej w czołówce metod prognozowania stanów zagroenia finansowego przedsibiorstw. Literatura: 1. T. Korol, B. Prusak, Upadło przedsibiorstw a wykorzystanie sztucznej inteligencji, CeDeWu Sp. z o.o., Warszawa 2005 2. Michael R. Tyran, Wskaniki finansowe, Oficyna Ekonomiczna, Kraków 2005 3. Ryszard Tadeusiewicz, Sieci neuronowe, Pastwowa Oficyna Wydawnicza RM, Warszawa 1993 4. D. Witkowska, Sztuczne sieci neuronowe i metody statystyczne. Wybrane zagadnienia finansowe, Wydawnictwo C.H. Beck, Warszawa 2002 5. J. urada, M. Barski, W. Jdruch, Sztuczne sieci neuronowe, Wydawnictwo Naukowe PWN, Warszawa 1996 6. Pomoc pakietu STATISTICA (STATISTICA Electronic Manual) 7. Strona internetowa: www.gpw.com.pl 8. Strona internetowa: www.notoria.pl