ANALIZA JAKOŚCI PREDYKCJI STANU EKONOMICZNO- FINANSOWEGO MAŁYCH I ŚREDNICH PRZEDSIĘBIORSTW PRZY POMOCY ZESPOŁÓW SZTUCZNYCH SIECI NEURONOWYCH

Podobne dokumenty
ANALIZA PORÓWNAWCZA JAKOŚCI MODELI PROGNOZOWANIA KONDYCJI EKONOMICZNO- FINANSOWEJ PRZEDSIĘBIORSTW WOJ. LUBELSKIEGO I PODKARPACKIEGO

AKADEMIA GÓRNICZO-HUTNICZA

ProfileSEEKER system informatyczny wczesnego ostrzegania małych i średnich przedsiębiorstw przed bankructwem

Tabela 1. Liczba spółek z udziałem kapitału zagranicznego zarejestrowanych w województwie łódzkim (wg REGON) w VIII r.

Zeszyty Naukowe nr 15

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

KLASYFIKACJA. Słownik języka polskiego

Bezrobotni według rodzaju działalności ostatniego miejsca pracy w województwie zachodniopomorskim w 2015 r.

Bezrobotni według rodzaju działalności ostatniego miejsca pracy w województwie zachodniopomorskim w 2017 roku

ALGORYTMY SZTUCZNEJ INTELIGENCJI

ALGORYTM RANDOM FOREST

Podmioty gospodarki narodowej w województwie małopolskim

Testowanie modeli predykcyjnych

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

Obraz regionalnego rynku pracy w świetle danych GUS oraz badań własnych pracodawców

Projekt Kapitał ludzki i społeczny jako czynniki rozwoju regionu łódzkiego"

WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH W PROGNOZOWANIU

114,6. Statystyka Warszawy Nr 5/2018. Dynamika produkcji budowlano-montażowej INFORMACJE SYGNALNE r.

ZASTOSOWANIE SZTUCZNYCH SIECI NEURONOWYCH DO OCENY ZDOLNOŚCI KREDYTOWYCH ROLNIKÓW KLIENTÓW FIRMY LEASINGOWEJ

Załącznik nr II f do Sprawozdania okresowego z realizacji RPO WSL w I półroczu 2012 roku

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Projekt Sieci neuronowe

Zastosowanie sztucznej inteligencji w testowaniu oprogramowania

Analiza finansowo-ekonomiczna przedsiębiorstw w województwie podkarpackim. Barbara Błachut Urząd Statystyczny w Rzeszowie

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

MAZOWIECKI RYNEK PRACY IV KWARTAŁ 2014 IV KWARTAŁ 2014 NAJWAŻNIEJSZE INFORMACJE

UWAGI METODYCZNE Popyt na pracę Wolne miejsca pracy Nowo utworzone miejsca pracy

DZIAŁALNOŚĆ GOSPODARCZA PODMIOTÓW Z KAPITAŁEM ZAGRANICZNYM 1 W WOJEWÓDZTWIE WIELKOPOLSKIM W 2013 R.

Działalność gospodarcza przedsiębiorstw o liczbie pracujących do 9 osób w 2015 r.

POPYT NA PRACĘ W WOJEWÓDZTWIE WIELKOPOLSKIM W 2013 R.

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

GŁÓWNY URZĄD STATYSTYCZNY Departament Pracy i Warunków Życia POPYT NA PRACĘ W I PÓŁROCZU 2008 ROKU

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

MAZOWIECKI RYNEK PRACY II KWARTAŁ 2016 II KWARTAŁ 2016 NAJWAŻNIEJSZE INFORMACJE

Rozdział 8. Profile regionalne małych i średnich przedsiębiorstw

II ETAP - FINAŁ III PODKARPACKIEGO KONKURSU EDUKACYJNEGO MISTRZOWIE STATYSTYKI

URZĄ D STATYSTYCZNY W BIAŁ YMSTOKU

GŁÓWNY URZĄD STATYSTYCZNY Departament Pracy MONITORING RYNKU PRACY

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

URZĄD STATYSTYCZNY W WARSZAWIE ul. 1 Sierpnia 21, Warszawa PRODUKT KRAJOWY BRUTTO W WOJEWÓDZTWIE MAZOWIECKIM W LATACH

Barometr Finansów Banków (BaFiB) propozycja badania koniunktury w sektorze bankowym

PODMIOTY GOSPODARKI NARODOWEJ 1 W REJESTRZE REGON W WOJEWÓDZTWIE WIELKOPOLSKIM Stan na koniec 2011 r.

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

MAZOWIECKI RYNEK PRACY IV KWARTAŁ 2015 IV KWARTAŁ 2015 NAJWAŻNIEJSZE INFORMACJE

MAZOWIECKI RYNEK PRACY I KWARTAŁ 2015 I KWARTAŁ 2015 NAJWAŻNIEJSZE INFORMACJE

ANALIZA WYDAJNOŚCI PRODUKCYJNEJ RODZINNEGO GOSPODARSTWA ROLNEGO PRZY POMOCY SIECI NEURONOWEJ

MINOX S.A. RAPORT MIESIĘCZNY PAŹDZIERNIK

Próba wykorzystania podejścia wielomodelowego w klasyfikacji jednostek samorządowych

MINISTERSTWO PRACY I POLITYKI SPOŁECZNEJ

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

MAZOWIECKI RYNEK PRACY I KWARTAŁ 2016 I KWARTAŁ 2016 NAJWAŻNIEJSZE INFORMACJE

MAZOWIECKI RYNEK PRACY I KWARTAŁ 2014 I KWARTAŁ 2014 NAJWAŻNIEJSZE INFORMACJE

Zastosowanie analizy dyskryminacyjnej i sieci neuronowych do oceny możliwości sprzedaży nieruchomości mieszkaniowych

R1. W jakim przedziale zatrudnienia znajduje się Pana(i) firma? osób osób...

Logistyka - nauka. Polski sektor TSL w latach Diagnoza stanu

SZTUCZNE SIECI NEURONOWE W MODELOWANIU ZJAWISK ZACHODZĄCYCH NA RYNKU NIERUCHOMOŚCI

DEKOMPOZYCJA HIERARCHICZNEJ STRUKTURY SZTUCZNEJ SIECI NEURONOWEJ I ALGORYTM KOORDYNACJI

Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych. Regresja logistyczna i jej zastosowanie

Zastosowanie sieci neuronowej do oceny klienta banku pod względem ryzyka kredytowego Streszczenie

Podmioty gospodarki narodowej w rejestrze REGON w województwie małopolskim Stan na koniec 2017 r.

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Politechnika Białostocka, Wydział Zarządzania, Katedra Informatyki Gospodarczej i Logistyki

IX Kongres Ekonomistów Polskich

Analiza porównawcza koniunktury gospodarczej w województwie zachodniopomorskim i w Polsce w ujęciu sektorowym

Województwo świętokrzyskie należy do grupy województw o wysokiej stopie bezrobocia plasując się na 12 lokacie.

MONITORING ZAWODÓW DEFICYTOWYCH I NADWYŻKOWYCH W WOJEWÓDZTWIE POMORSKIM W 2007 r.

METODY STATYSTYCZNE W BIOLOGII

MAZOWIECKI RYNEK PRACY II KWARTAŁ 2015 II KWARTAŁ 2015 NAJWAŻNIEJSZE INFORMACJE

Tabela nr 1. Stopa bezrobocia rejestrowanego w poszczególnych miesiącach w 2012 i 2013 r. na Mazowszu i w Polsce.

URZĄD STATYSTYCZNY W SZCZECINIE

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Sieci neuronowe w Statistica

METODY UCZENIA MASZYNOWEGO W PROGNOZOWANIU NIEWYPŁACALNOŚCI

ZAKRES AKREDYTACJI JEDNOSTKI CERTYFIKUJĄCEJ SYSTEMY ZARZĄDZANIA SCOPE OF ACCREDITATION FOR MANAGEMENT SYSTEMS CERTIFICATION BODY Nr/No AC 082

Sytuacja społeczno-ekonomiczna w Łodzi

Czy wiesz, że Pracujący emeryci XII 2018

MAZOWIECKI RYNEK PRACY I KWARTAŁ 2017 I KWARTAŁ 2017 NAJWAŻNIEJSZE INFORMACJE

ZAKRES AKREDYTACJI JEDNOSTKI CERTYFIKUJĄCEJ SYSTEMY ZARZĄDZANIA Nr AC 137

MINOX S.A. RAPORT MIESIĘCZNY GRUDZIEŃ

Metody klasyfikacji danych - część 1 p.1/24

Sierpień przyniósł kolejne zmniejszenie liczby bezrobotnych, a co za tym idzie, także obniżenie stopy bezrobocia w naszym regionie.

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

METODY STATYSTYCZNE W BIOLOGII

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Przewodnik użytkownika (instrukcja) AutoMagicTest

Badania w sieciach złożonych

Departament Prezydenta Urząd Miasta Łodzi. Biuro Strategii Miasta. Sytuacja społeczno-ekonomiczna w Łodzi. I połowa 2013 roku.

Plan wystąpienia. Przedmiot analizy i źródła informacji. Prognozowane zmiany na rynku pracy na podstawie badań i analiz własnych

Agnieszka Nowak Brzezińska Wykład III

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

PODMIOTY GOSPODARKI NARODOWEJ WPISANE DO REJESTRU REGON W WOJEWÓDZTWIE ŚLĄSKIM.

SZTUCZNA INTELIGENCJA

I Wielkość bezrobocia

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

PBS DGA Spółka z o.o.

Działalność przedsiębiorstw leasingowych w 2013 roku

PLAN STUDIÓW Wydział Elektroniki, Telekomunikacji i Informatyki, Wydział Zarządzania i Ekonomii Inżynieria danych

ROZPORZĄDZENIE MINISTRA PRACY I POLITYKI SPOŁECZNEJ 1) z dnia r.

Transkrypt:

BAROMETR REGIONALNY 109 ANALIZA JAKOŚCI PREDYKCJI STANU EKONOMICZNO FINANSOWEGO MAŁYCH I ŚREDNICH PRZEDSIĘBIORSTW PRZY POMOCY ZESPOŁÓW SZTUCZNYCH SIECI NEURONOWYCH Jednym z ważniejszych aspektów analizy finansowej przedsiębiorstwa jest przewidywanie bankructwa firmy. Nieustanne badania, trwające od końca lat 60tych [5], wprowadzone na nowe tory poprzez wykorzystanie wielowymiarowej analizy dyskryminacyjnej (MDA) [1], zaowocowały wieloma cennymi pracami, które koncentrowały się głównie na uzyskaniu optymalnego modelu bankructwa, czy też szerzej stanu ekonomicznofinansowego firmy. Badania prowadzono nie tylko metodami statystycznymi: MDA [2], przy pomocy modeli logitowych [13] czy dyskryminacji metodą knajbliższych sąsiadów [17]. Od początków lat 90tych coraz częściej sięgano po metody zaliczane do grupy metod sztucznej inteligencji obliczeniowej takich jak: drzewa decyzyjne [11], sieci przekonań Bayesa [16] i sztuczne sieci neuronowe [12]. Przewagę modeli neuronowych nad innymi modelami statystycznymi można odnotować m.in. w pracach: [9], [15], [18], [10], [20] i [4]. Należy jednak zaznaczyć, że prezentowane w nich modele budowane były na małej liczbie przypadków uczących. Jeśli dokonamy porównań modeli utworzonych na dużej liczbie obserwacji [3], to nie daje się zauważyć istotnych różnic w jakości klasyfikacji pomiędzy modelami neuronowymi a zbudowanymi przy pomocy alternatywnych metod. Zaskakująco dobre rezultaty modeli budowanych przy małej liczbie obserwacji i dużej liczbie atrybutów opisujących nie powinny dziwić, ze względu na dużą łatwość uczenia się sztucznych sieci neuronowych w takich warunkach. Niestety, dochodzi wtedy do zjawiska przeuczenia sieci, nadmiernego jej dopasowania do przypadków uczących, a przez to do utraty zdolności do generalizacji problemu. W tego typu pracach mało przekonujące lub całkowicie pomijane są testy na niezależnym zbiorze danych [19]. Andrzej Burda, Barbara Kuczmowska Wyższa Szkoła Zarządzania i Administracji 1. Wstęp 2. Opis modelu Neuronowy model oceny stanu ekonomicznofinansowego małych i średnich przedsiębiorstw, zbudowany na potrzeby projektu, składa się z zespołu 10 sztucznych sieci neuronowych. Szczegółowy opis przyjętego kryterium klasyfikacji, topologii i metod uczenia sieci zawarty jest w: [6], [7] i [8]. Model zbudowano jako model predykcyjny o horyzoncie prognozy 1 roku. W tym miejscu należy jednak zaznaczyć, że szczególną uwagę zwracano na liczebności przypadków uczących oraz ich stosunek do liczby atrybutów opisujących. Aby utworzony model nie utracił zdolności do generalizacji, liczba przypadków uczących spełniała warunek określony wzorem (1): (1) L U =2 N Dysponując określoną liczbą przypadków uczących L U, spełnienie warunku (1), wymagało starannego doboru wymiaru przestrzeni wejść N, czyli liczby atrybutów opisujących. Redukcję wymiaru prowadzono 2etapowo: z wykorzystaniem analizy korelacji rangowej Spearmana oraz analizy wrażliwości sieci. Dodatkowo, zadbano o spełnienie jeszcze jednego warunku, którego empiryczne uzasadnienie można znaleźć w literaturze przedmiotu [14], aby liczba połączeń wagowych pomiędzy neuronami w sieci nie przekraczała 10% użytych przypadków uczących. Modele budowane były osobno dla województwa lubelskiego i podkarpackiego, przy uwzględnieniu podziału na 5 wiodących, w obu regionach, 1 Polska Klasyfikacja Działalności (PKD) jest umownie przyjętym, hierarchicznie usystematyzowanym podziałem rodzajów działalności społecznogospodarczej.

110 NR 2 (12) 2008 sekcji gospodarki oraz ich podsekcji, działów i grup (zgodnie z PKD 1 ). O poziomie podziału decydowała liczebność obserwacji w grupach, ze względu na uwarunkowania opisane w punkcie 1. Razem, dla roku 2006, zbudowano 15 modeli dla woj. lubelskiego i 23 dla woj. podkarpackiego. Proces pozyskiwania wiedzy nt. przewidywanego stanu ekonomicznofinansowego firmy (Rys.1.) na koniec następnego roku, wymaga skorzystania z ostatnich sprawozdań finansowych firmy (F01 i SP) oraz sprawozdania o zatrudnieniu (Z06). Dane z tych sprawozdań wprowadzone na portal przez analityka firmy, przetwarzane są do postaci wskaźników (x1, x2,..., x32). Do danych tych dołączane są dane mezo i makroekonomiczne regionów (z1, z2,..., z15). Wprowadza je administrator portalu. Następnie system, na podstawie danych, klasyfikuje firmę zgodnie z odpowiednim PKD i wybiera właściwy dla niej model predykcyjny. Uruchomienie modelu następuje na odpowiednim podzbiorze zbioru X i Z. Model zespołu sztucznych sieci neuronowych (ENN) generuje na wyjściu, jako obraz klasyfikacji, stosunek liczby głosów S (liczba pozytywnych Rys. 1. Proces predykcji stanu ekonomicznofinansowego firmy na portalu http://ebarometr.pl odpowiedzi sieci składowych na sygnał wejściowy do liczby sieci w zespole). Gdy stosunek ten jest mniejszy od 0,5 model sygnalizuje, że stan ekonomicznofinansowy firmy w horyzoncie jednego roku będzie zły. Dobry stan sygnalizowany jest przy S>=0,5. W przypadku, gdy S=0,5 (pięć sieci klasyfikuje stan jako dobry, a 5 jako zły) przyjmuje się, że stan firmy jest nieokreślony. Oznacza to, że przy obecnych wskaźnikach firmy, jednoznaczne określenie klasy wiązałoby się z dużym prawdopodobieństwem błędu. Wynik klasyfikacji modelu ENN, odpowiednio przetworzony przez system trafia na ekran analityka w postaci graficznej (ebarometr) jak i opisowej. Wielkość wychylenia strzałki barometru w prawo lub w lewo, proporcjonalna do stosunku głosów sieci składowych ENN, wyraża stopień pewności klasyfikacji. 3. Opis warunków testowania Testowanie modelu, odbyło się wg analogicznej procedury, która opisana została w rozdziale 2. i pokazana na Rys.1. Ze względu na ograniczoną liczbę obserwacji w niezależnym zbiorze testowym za rok 2006 (do uczenia modeli wykorzystywano obserwacje z lat 19992005), szczególnie w odniesieniu do klasy firm o złym stanie ekonomicznofinansowym, testowanie ograniczono do modeli budowanych na poziomie sekcji. W związku z tym, dla każdego regionu ocenie poddano po 5 modeli dla: sekcji D Przetwórstwo przemysłowe; sekcji F Budownictwo; sekcji G Handel hurtowy i detaliczny, naprawa pojazdów samochodowych, motocykli oraz artykułów użytku osobistego i domowego; sekcji I Transport, gospodarka magazynowa i łączność; sekcji K Obsługa nieruchomości, wynajem i usługi związane z prowadzeniem działalności gospodarczej. Dla każdego zespołu sieci wyznaczono błąd klasyfikacji (liczbę przypadków błędnie sklasyfikowanych do liczby wszystkich przypadków w podzbiorze firm dla określonej sekcji) z podziałem na błędy: I rodzaju (błędna klasyfikacja firm o dobrej kondycji) i II rodzaju (błędna klasyfikacja firm o złej kondycji). Należy w tym miejscu zaznaczyć, że ze

BAROMETR REGIONALNY 111 Tablica 1. Statystyki klasyfikacyjne dla woj. lubelskiego Obserwacje Sekcja Podzbiór Liczebność Udział [%] Wszystkie Poprawne Niepoprawne Nieznane Poprawne Niepoprawne Nieznane St.1.U1* 940 611 309 20 65,0 32,9 2,1 D St.0.U 140 94 44 2 67,1 31,4 1,4 St.1.T 189 142 47 0 75,1 24,9 0,0 St.0.T 12 9 3 0 75,0 25,0 0,0 St.1.U 414 260 136 18 62,8 32,9 4,3 E St.0.U 64 43 19 2 67,2 29,7 3,1 St.1.T 78 56 21 1 71,8 26,9 1,3 St.0.T 3 1 1 1 33,3 33,3 33,3 St.1.U 2177 1562 569 46 71,8 26,1 2,1 F St.0.U 324 239 79 6 73,8 24,4 1,9 St.1.T 467 355 103 9 76,0 22,1 1,9 St.0.T 30 21 8 1 70,0 26,7 3,3 St.1.U 198 144 49 5 72,7 24,7 2,5 K St.0.U 33 25 8 0 75,8 24,2 0,0 St.1.T 50 40 9 1 80,0 18,0 2,0 St.0.T 4 3 0 1 75,0 0,0 25,0 St.1.U 475 312 135 28 65,7 28,4 5,9 I St.0.U 26 17 4 5 65,4 15,4 19,2 St.1.T 89 64 20 5 71,9 22,5 5,6 St.0.T 1 1 0 0 100,0 0,0 0,0 *Podzbiór firm o dobrym (dobry 1, zły 0) stanie (St.) ekonomicznofinansowym wykorzystany jako zbiór uczący (uczący U, testowy T). względu na koszt, groźniejszy jest drugi rodzaj błędu. czący o zachowaniu zdolności generalizacji modelu. Wielkości te, odniesione do wyników modeli 4. Wyniki testów Wyniki przeprowadzonych testów, dla obu województw, w rozbiciu na sekcje, stany ekonomicznofinansowe i sposoby ich wykorzystania w procesie budowy modelu, zebrano w tablicach 1. i 2. Tablica 3. zawiera globalne statystyki porównawcze modeli dla województw jak i dla całego połączonego obszaru poddanego badaniom. Wykresy przedstawione na Rys. 24, ukazują zależności pomiędzy błędami klasyfikacji uzyskanymi na zbiorze uczącym i niezależnym zbiorze testowym. Rys. 2. Błędy klasyfikacji dla woj. lubelskiego 5. Wnioski Ogólny błąd prognozy dla całego badanego obszaru, obliczony na zbiorze testowym 20,9% 2, przy błędzie 24,9% uzyskanym dla zbioru uczącego, należy uznać za pozytywny symptom świad Rys. 3. Błędy klasyfikacji dla woj. podkarpackiego 2 Błędy obliczone na podstawie danych z Tablicy 3.

112 NR 2 (12) 2008 Tablica 2. Statystyki klasyfikacyjne dla woj. podkarpackiego Obserwacje Liczebność Udział [%] Sekcja Podzbiór Wszystkie Poprawne Niepoprawne Nieznane Poprawne Niepoprawne Nieznane St.1.U 1057 658 344 55 62,3 32,5 5,2 D E F K I Tablica 3. Globalne statystyki klasyfikacyjne dla woj. lubelskiego i podkarpackiego Obserwacje Sekcja Podzbiór Liczebność Udział [%] Wszystkie Poprawne Niepoprawne Nieznane Poprawne Niepoprawne Nieznane St.1.U 4204 2889 1198 117 68,7 28,5 2,8 woj. St.0.U 587 418 154 15 71,2 26,2 2,6 lubelskie St.1.T 873 657 200 16 75,3 22,9 1,8 St.0.T 50 35 12 3 70,0 24,0 6,0 woj. podkarpackie Razem St.0.U 165 97 57 11 58,8 34,5 6,7 St.1.T 217 169 42 6 77,9 19,4 2,8 St.0.T 17 11 5 1 64,7 29,4 5,9 St.1.U 368 224 127 17 60,9 34,5 4,6 St.0.U 58 39 15 4 67,2 25,9 6,9 St.1.T 75 54 16 5 72,0 21,3 6,7 St.0.T 5 2 2 1 40,0 40,0 20,0 St.1.U 2093 1467 561 65 70,1 26,8 3,1 St.0.U 255 181 69 5 71,0 27,1 2,0 St.1.T 452 336 93 23 74,3 20,6 5,1 St.0.T 27 19 7 1 70,4 25,9 3,7 St.1.U 104 96 4 4 92,3 3,8 3,8 St.0.U 464 436 12 16 94,0 2,6 3,4 St.1.T 32 29 2 1 90,6 6,3 3,1 St.0.T 2 1 1 0 50,0 50,0 0,0 St.1.U 960 858 51 51 89,4 5,3 5,3 St.0.U 72 63 3 6 87,5 4,2 8,3 St.1.T 74 64 3 7 86,5 4,1 9,5 St.0.T 1 1 0 0 100,0 0,0 0,0 St.1.U 4582 3303 1087 192 72,1 23,7 4,2 St.0.U 1014 816 156 42 80,5 15,4 4,1 St.1.T 850 652 156 42 76,7 18,4 4,9 St.0.T 52 34 15 3 65,4 28,8 5,8 St.1.U 8786 6192 2285 309 70,5 26,0 3,5 St.0.U 1601 1234 310 57 77,1 19,4 3,6 St.1.T 1723 1309 356 58 76,0 20,7 3,4 St.0.T 102 69 27 6 67,6 26,5 5,9 opisanych w literaturze, nie odbiegają swoją jakością od tych, które otrzymano przy zastosowaniu podobnych rygorów o jakich mowa była w punkcie 1. i 2. Należy jednak zaznaczyć, że porównania dodatkowo utrudnia fakt, że uzyskane w ramach projektu modele, tworzono dla małych i średnich przedsiębiorstw, a jako kryterium klasyfikacji przyjęto ocenę ich stanu ekonomicznofinansowego. Znane nam modele, utworzone zarówno dla gospodarki polskiej, jak i innych krajów świata, odnoszą się do dużych przedsiębiorstw, najczęściej notowanych na giełdach papierów wartościowych, a jako kryterium klasyfikacji firm przyjmowano bankructwo lub możliwość przetrwania firmy na rynku. Niepokoić jednak może fakt, że niższy błąd II rodzaju dla zbioru uczącego (Rys.4.), wzrósł o 5%, przy analogicznym spadku błędu I rodzaju.

BAROMETR REGIONALNY 113 Rys. 4. Globalne błędy klasyfikacji dla woj. lubelskiego i podkarpackiego Rys. 5. Udział procentowy błędu klasyfikacji i przypadków nierozpoznanych (sekcja F, woj. podkarpackie) Przyczyn zapewne jest wiele, ale jedną z nich mogło być gwałtowne polepszenie kondycji małych i średnich przedsiębiorstw na badanym obszarze w okresie objętym testem. Jeśli w latach 19992005 firmy o złej kondycji stanowi 15% wszystkich badanych, to w roku 2006 (zbiór testowy) tylko 5%. Wpływ na to miały głównie wyniki uzyskane dla firm z woj. podkarpackiego, gdzie ten udział spadł jeszcze bardziej z 18% do 5%. Potwierdza to również obserwacja, że na tle woj. podkarpackiego, modele uzyskane dla woj. lubelskiego prezentują się zdecydowanie lepiej. Oba rodzaje błędów uległy bardzo korzystnemu zmniejszeniu dla zbioru testowego w odniesieniu do zbioru uczącego. Błąd klasyfikacji II rodzaju dla zbioru testowego zmalał z 26% (dla zbioru uczącego) do 24%. Ten pozytywny obraz możemy zaobserwować dla modeli zbudowanych dla wszystkich sekcji, choć doskonałe wyniki dla sekcji K i I, ze względu na niewystarczającą liczebność podzbiorów, nie można uznać za statystycznie istotne. Należy również zaznaczyć, że w przypadku, gdy wielkość błędów, a w szczególności błędu II rodzaju, nie jest akceptowalna dla potrzeb prowadzonej analizy, to kontrolując na ebarometrze stopień pewności można go zminimalizować. Zmienność błędu w zależności od stopnia pewności, dla wybranej ze względu na odpowiednią liczebność podzbioru danych sekcji F, pokazano Rys.5. Jeśli założymy akceptowalny błąd II rodzaju na poziomie 15%, to oczekiwany stopień pewności generowany przez model musi być mniejszy lub równy od 0,2. W oczywisty sposób pociąga to za sobą wzrost udziału nierozpoznanych przypadków z 3,7% do 15%. Literatura: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Altman E. I.: Financial ratios, discriminant analysis and the prediction of corporate bankruptcy, Journal of Finance 23(1968)589609. Altman E. I.: Predicting financial distress of companies: revisiting the Zscore and ZETA models (2000), http://www.stern.nyu.edu/~ealtman/zscores.pdf. Altman E. I., Marco G., Varetto F.: Corporate distress diagnosis: Comparisons using linear discriminant analysis and neural networks, Journal of Banking & Finance 18(1994)505529. Back B., Laitinen T., Sere K.: Neural networks and bankruptcy prediction: Funds flows, accrual ratios, and accounting data, Advances in Accounting 14(1996)2337. Beaver W. H.: Financial Ratios as Predictors of Failure Empirical Research in Accounting: Selected Studies, Supplement to Journal of Accounting Research 4(1966)71111. Burda A.: Prognozowanie kondycji ekonomicznofinansowej przedsiębiorstw z wykorzystaniem sztucznych sieci neuronowych, Barometr Regionalny 6(2006)6775. Burda A., Kuczmowska B., Hippe Z. S.: Ensembles of Artificial Neural Networks for Predicting Economic Situation of Small and Medium Enterprises In: Kurzynski, M.; Puchala, E.; Wozniak, M.; Zolnierek, A. (Eds.) Computer Recognition Systems 2, Springer, Berlin / Heidelberg 2007:808815. Burda A., Kuczmowska B., Hippe Z. S.: Zespoły sztucznych sieci neuronowych do przewidywania stanu ekonomicznego małych i średnich przedsiębiorstw, Zamojskie Studia i Materiały 23(2007):113126. Coats, P. K. & L. F. Fant : A neural network approach to forecasting distress, The Journal of Business Forecasting (Winter 1991), 912. Fletcher D., Goss E.: Forecasting with neural networks.

114 NR 2 (12) 2008 11. 12. 13. 14. 15. An application using bankruptcy data, Information & Management. 24(1993)159167. McKee T., Greenstein M.: Predicting Bankruptcy Using Recursive Partitioning and a Realistically Proportioned Data Set, Journal of Forecasting 19(2000)219230. Odom M., Sharda R.: A neural network model for bankruptcy prediction, International Joint Conference on Neural Networks, San Diego, cz. II(1990)163168. Ohlson J. A.: Financial Ratios and the Probabilistic Prediction of Bankruptcy, Journal of Accounting Research 18(1980)109131. Osowski S.: Sieci neuronowe, Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa 1994, s. 7579. Salchenberger, L., Cinar E., Lash N.: Neural networks: A new tool for predicting thrift failures, Decision Sciences, Vol. 23, No. 4(1992)899916. 16. 17. 18. 19. 20. Sarkar S., Sriram R. S.: Bayesian Models for Early Warning of Bank Failures, Management Science 47(2001)14571475. Tam K. Y., Kiang M.: Predicting Bank Failures A Neural Network Approach, Applied Artificial Intelligence 4(1990)265282. Tam K., KiangM.: Managerial applications of neural networks: The case of bank failure predictions, Management Science 38:7(July 1992), 926947. Trigueiros D., Taffler R.: Neural networks and empirical research in accounting, Accounting and Business Research 26:4(1996)347355. Wilson R. L., Sharda R.: Bankruptcy prediction using neural networks, Decision Support Systems 11(1994)545557.