Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 1 Jerzy Marzec 1 ZDOLNOŚCI DYSKRYMINACYJNE MODELU DWUMIANOWEGO ZE SKOŃCZONĄ MIESZANKĄ ROZKŁADÓW NORMALNYCH W OCENIE NIESPŁACALNOŚCI KREDYTÓW 1. Wprowadzenie Jednym z podsawowych obszarów działalności radycynego banku es ranser środków pieniężnych pozyskanych od deponenów, a skierowanych do kredyobiorców. W osanich laach obserwue się w Polsce gwałowany wzros warości udzielanych kredyów dealicznych. Od maa 2005 r. zadłużenie gospodarsw domowych w bankach i monearnych insyucach inansowych działaących w Polsce es wyższe od zadłużenia przedsiębiorsw 2. Towarzyszy emu relaywnie mnieszy wzros wielkości depozyów gospodarsw domowych, a w eekcie sosunek warości zaciągnięych kredyów do wielkości posiadanych przez nich środków (w ormie loka bankowych, na rachunku bieżącym) sysemaycznie rośnie. W marcu 2004 roku en iloraz wynosił prawie 0,5, zaś we wrześniu 2007 roku kszałował się na poziomie 0,98, więc można się spodziewać, że uż wkróce przekroczy warość eden. 3 Obserwuąc gwałowny rozwó ego zawiska waro posawić pyanie, czy e szerokie dosępności kredyów zgłaszane przez banki owarzyszy rzeelna konrola bieżące i przyszłe zdolności kredyobiorców do spłay zaciągnięych zobowiązań? Umowa kredyowa nakłada na kredyobiorcę obowiązek spłay w wyznaczonych momenach czasu ra kapiałowo-odsekowych. Niedorzymanie ego warunku ma skuki dla obydwu sron. Wówczas kredyobiorca ma do zapłacenia karne odseki według wyższe sopy niż oprocenowanie kredyu, zaś na banku spoczywa obowiązek worzenia rezerw celowych w związku z zaisniałym ryzykiem uray środków pieniężnych, kóre powierzył mu deponen. Wzros realnego koszu kredyu pogarsza syuacę inansową kredyobiorcy, więc będzie mu rudno uzyskać koleną pożyczkę albo orzyma ą na bardzo niekorzysnych warunkach, np. po dużo wyższe cenie. Naomias dla banku niespłacone kredyy oznaczaą obniżenie wskaźnika wypłacalności, czyli ograniczenie ego dalsze działalności kredyowe. W skranym przypadku może nasąpić niewypłacalność gospodarswa domowego, co dla banku oznacza przynamnie częściową uraę zainwesowanego kapiału. Proces odzyskiwania pełne kwoy swoich wierzyelności może być długi i koszowny. Zaem w ineresie 1 Dr Jerzy Marzec Kaedra Ekonomerii, Uniwersye Ekonomiczny w Krakowie, e-mail: marzec@uek.krakow.pl. Arykuł powsał w ramach badań sauowych (nr 2/KE/2/08/S/419) inansowanych przez Uniwersye Ekonomiczny w Krakowie. 2 Źródło: dane z NBP o należnościach i zobowiązaniach monearnych insyuci inansowych.
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 2 zarówno banku, ak i gospodarsw domowych es, aby ryzyko związane ze spłaą ra kapiałowoodsekowych było ak namniesze. Isnieą narzędzia, kóre umożliwiaą pomiar ryzyka kredyowego związanego z poedynczą umową kredyową, a nasępie ego minimalizacę. W ym celu banki sosuą scoring kredyowy [A. Janc, M. Kraska 2001]. Podsawowymi narzędziami sosowanymi przy ocenie wniosków kredyowych są modele saysyczne (logiowy, probiowy, analiza dyskryminacyna, drzewa klasyikacyne), sieci neuronowe i programowanie maemayczne; [L. Thomas 2000, L. Thomas, R. Oliver, D. Hand 2005, E. Rosenberg, A. Glei 1994]. Ideą ych modeli es wykorzysanie hisorycznych inormaci o klienach banku (o charakerze społecznodemograicznym, o sposobie doychczasowe współpracy, przebiegu spłay kredyu ip.) w celu prognozowania poziomu ryzyka w przypadku bieżących wniosków kredyowych doychczasowych lub nowych klienów. W Polsce są prowadzone badania empiryczne doyczące oceny niespłacalności kredyów. Wyniki ych badań przedsawiaą m.in.: Chrzanowska, Kompa i Wikowska [2005], Chrzanowska i Wikowska [2005], Miszal [2006], Saniec [2000, 2005], Saniec i Szmi [2004a,b, 2005], Szmi, Szmi i Kaniewski [2003], Saniec i Wikowska [2002], Wikowska i Chrzanowska [2004, 2006, 2007]. W zdecydowane większości sosue się w ych pracach sieci neuronowe, drzewa klasyikacyne bądź analizę dyskryminacyną. Z modelu logiowego korzysa się rzadko, wyłącznie w celach porównawczych, zaś model probiowy es całkowicie pomiany. Wydae się, że w lieraurze polskie zaawansowane modele danych akościowych nie znaduą zrozumienia, skoro zdarza się, ak w arykule Szmi, Szmi i Kaniewski [2003], że analizę spłacalności kredyów przeprowadza się na podsawie regresi liniowe. Powyższe prace maą charaker czyso empiryczny, główny nacisk es kładziony na porównywanie wyników klasyikaci orzymanych za pomocą wspomnianych meod. Przykładem innych badań, poświęconych dosępności kredyów dla polskich przedsiębiorsw, es praca I. Tymoczko i M. Pawłowska [2007]. Innym obszarem zasosowań w ekonomii modeli dwumianowych es prognozowanie upadłości przedsiębiorsw [E. Mączyńska M. Zawadzki 2006, D. Wędzki 2005]. Celem ninieszego arykułu es prezenaca modelu dwumianowego (dla zeroedynkowe zmienne endogeniczne) oparego na skończone mieszance rozkładów normalnych. Sanowi on uogólnienie modelu probiowego, kóry obok modelu logiowego es nabardzie znaną konsrukcą dla akościowe zmienne endogeniczne 4. W warswie empiryczne przedsawimy wykorzysanie wspomnianego modelu do oceny niespłacalności kredyów dealicznych, czyli ego zasosowanie w bankowym scoringu kredyowym. Dokonamy porównania wyników uzyskanych na podsawie 3 Jednym ze źródeł niższego empa wzrosu depozyów gospodarsw domowych es alokaca ich oszczędności w inne ormy inwesyci inansowych (np. w bony skarbowe, obligace, ednoski uczesnicwa w unduszach inwesycynych, indywidualne kono emeryalne).
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 3 próby podsawowe z rezulaami dla próby odłożone. Inencą auora es pokazanie, iż model dwumianowy opary na mieszance es lepszy wobec radycynych narzędzi saysycznych wykorzysywanych w scoringu kredyowym: modelu probiowego i logiowego. 2. Model dwumianowy z mieszanką rozkładów normalnych Jednym z możliwych kierunków uogólnienia modelu probiowego podsawowe konsrukci w przypadku modeli danych akościowych es zasosowanie skończone mieszanki rozkładów normalnych. Je wykorzysanie w celu aproksymaci nieznane posaci unkci gęsości składnika losowego pozwala uwzględnić akie własności ak: wielomodalność, asymerię oraz zachowanie się ego rozkładu w ooczeniu warości modalne w odniesieniu do rozkładu normalnego - wyosrzenie albo spłaszczenie. Mieszanki daą szeroki wachlarz możliwości, gdy klasyczne założenia nie są spełnione, np. w syuaci nieednorodne próby, wysępowania heeroscedasyczności. Ich użycie es bardzo ineresuącym podeściem, zarówno z punku widzenia meodyki, ak i badań empirycznych. Lieraura poświęcona modelom saysycznym oparym na mieszankach es bogaa, [D. Tieringon, A. Smih, U. Makov 1985], ale mimo o rzadko spoyka się ich zasosowanie w modelach zmiennych akościowych. Zaem waro wspomnieć o akich przykładach ak P. Ausin M. Escobar [2002], A. Erkanli D. Sang P. Müller [1993], S. Frühwirh-Schnaer R. Frühwirh [2006], J. Geweke M. Keane [1999], P. Qu Y. Qu [2000], Marzec [2008]. 5 Wykorzysanie skończone mieszanki rozkładów normalnych sanowi inny kierunek uogólnienia modelu probiowego, w odniesieniu do propozyci wykorzysania rozkładu Sudena [Marzec 2006]. Oba e uogólnienia sanowią ciekawą propozycę meodologiczną akże w odniesieniu do modeli służących do prognozowania upadłości przedsiębiorsw. Przedmioem rozważań es model dwumianowy y 1 0 dla z 0 gdzie = dla z < 0 z = x β + ε, (1) zaś x es wekorem k zmiennych egzogenicznych (lub ich znanych unkci) charakeryzuących obserwacę o numerze, β es wekorem k nieznanych paramerów. Kluczowe założenie mówi, że składniki losowe ε posiadaą idenyczne i niezależne rozkłady określone przez skończoną mieszankę rozkładów normalnych. Funkca gęsości i dysrybuana ednowymiarowe zmienne losowe ε es określona przez wypukłą kombinacę unkci gęsości i dysrybuan składowych mieszanki. Jeżeli przez p ( µ, τ ) 4 Przypomnimy, iż rozkłady normalny i logisyczny są ednomodalne i symeryczne. 5 We wspomnianych pracach, podobnie ak w ninieszym arykule, esymacę paramerów mieszaki przeprowadzono na gruncie wnioskowania bayesowskiego.
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 4 oznaczymy unkcę gęsości zmienne losowe o rozkładzie normalnym, o warości oczekiwane µ i precyzi τ (odwroności warianci), zaś π są wagami, zn. ( 0;1) zmienne losowe ε es określony przez gęsość p J ( ε ) = π p ( ε µ, τ ) = 1 = J π i π = 1, o rozkład 1 θ, (2) gdzie J >1 es liczbą składników mieszanki, θ o wekor kolumna zawieraący wszyskie paramery µ, τ i π dla =1,,J. Zaprezenowana srukura es mieszanką zarówno względem średnie, ak i parameru skali; zob. J. Geweke M. Keane 1999. W ninieszym arykule rozważamy model dychoomiczny, więc unkca wiarygodności ma posać p T y 1 ( θ; ) = ( 1 F( xβ θ) ) F( xβ θ) y y, (3) = 1 gdzie dysrybuana zmienne losowe ε w punkcie x β, F( x β θ) F przy czym F ( τ ) J ( a ) = Pr( ε < a) = π F ( a µ, τ ) a = 1, es określona ormułą θ, (4) µ, oznacza warość w punkcie a dysrybuany zmienne o rozkładzie normalnym, określonym przez paramery µ i τ. Zaem prawdopodobieńswo zdarzenia y =1, p, es równe F( x β θ) 1. W przypadku modeli oparych na mieszankach undamenalnym zagadnieniem es idenyikowalność paramerów. W celu e zapewnienia wymaga się, aby zosały uwzględnione resrykce µ -1 <µ, albo τ -1 <τ, albo π -1 <π dla =2,,J; zob. [ J. Diebol J. C.P. Rober 1994, J. Geweke 2007, J. Geweke M. Keane 1999, G. Koop 2003 i P. Qu Y. Qu 2000]. Resrykce e są konsekwencą własności wielomodalności unkci wiarygodności, a w lieraurze zagadnienie o nosi nazwę label swiching problem. Z uwagi na własności unkci wiarygodności sosowanie meody nawiększe wiarygodności nie es wskazane. Rozważaąc model dwumianowy musimy uwzględnić dodakowe warunki idenyikowalności. Analogicznie ak w modelu probiowym, resrykca doyczy wyrazu wolnego w równaniu regresi dla zmienne ukrye z albo warości oczekiwane zmienne ε. Naproście przyąć, iż brak es szuczne zmienne 1, gdyż w przeciwnym przypadku należałoby usalić µ =0 dla akiegokolwiek. Wymaga się akże, aby dla pewnego (dowolnego) spełniony był warunek: τ =1 [J. Geweke M. Keane 1999]. Oba wymienione warunki są niezbędne dla idenyikowalności, gdyż w przeciwnym przypadku isniałoby nieskończenie wiele kombinaci paramerów, dla kórych unkca
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 5 wiarygodności osiągałaby idenyczne maksima. W ym konekście waro przypomnieć, iż dla J=1 uzyskuemy model probiowy, w kórym zakłada się, że τ =1 i µ =0, gdy wysępue wyraz wolny. W ninieszym arykule rozważyliśmy mieszankę dwuelemenową (J=2) i przyęliśmy, że nie wysępue wyraz wolny, zaś resrykce parameryczne maą posać τ 2 >τ 1 i τ 1 =1. Druga równoważna parameryzaca o τ 1 <τ 2 =1. W celu esymaci modelu dwumianowego z mieszanką wykorzysano podeście bayesowskie, sosuąc meody Mone Carlo Markov Chain. Wnioskowanie bayesowskie es uzasadnionym narzędziem zwłaszcza w syuaci, gdy badacz posiada silną wiedzę a priori o paramerach. W ym przypadku wynika ona z resrykci koniecznych dla zapewnienia idenyikowalności paramerów rozważanego modelu. Te zaś uwzględnia się w rozkładzie a priori. Konsrukca rozkładów a priori, numeryczne meody uzyskiwania rozkładów a poseriori i esowanie modeli są prezenowane m.in. w arykułach Diebol J. C.P. Rober [1994], J. Geweke [2007], J. Geweke M. Keane [1999], G. Koop [2003], J. Marzec [2008] i K. Roeder L. Wassermann [1997]. 3. Konsrukca danych Badania empiryczne przeprowadzono o dane obemuące 39034 rachunków kredyowych osób izycznych. Zbiór danych zawierał inormace o udzielonych kredyach hipoecznych i konsumpcynych, udzielonych w okresie 01.01.2000-30.09.2001 r. Zmienna endogeniczna y zosała zdeiniowana na podsawie kaegorii należności,. y =1 w przypadku należności zagrożonych (poniże sandardu, wąpliwych i sraconych), zaś y =0 oznacza rachunek zakwaliikowany do kaegorii należności normalnych 6. Usalenie kaegorii ryzyka dla kredyów udzielonych w 2000 r. nasąpiło na podsawie inormaci na 30.09.2001 r., zaś udzielonych w 2001 r. - wg sanu na 30.09.2002 r. Przyęo, iż okres między momenem udzielenia kredyu a pobraniem inormaci o kaegorii ryzyka wynosi przynamnie 9 miesięcy, aby kredyobiorca miał czas na podęcie decyzi, czy spłacać ray kapiałowo-odsekowe zgodnie z umową czy nie. Z drugie srony okres en był nie dłuższy niż 21 miesięcy, co wynikało z dosępności danych oraz aku, iż średni okres spłay kredyu wg umowy kredyowe wynosi 30 miesięcy. Odsąpienie od umowy przez kredyobiorcę oznacza, że ray są spłacane nieregularnie (z pewnym opóźnieniem) albo wcale. Należy podkreślić, iż prezenowana analiza ma charaker sayczny, zaś sam proces spłay ra kapiałowo-odsekowych ma charaker dynamiczny. Analiza dynamiczna nie es w pełni możliwa, gdyż większość zmiennych egzogenicznych, kóre charakeryzuą kredyobiorcę lub udzielony kredy bankowy nie 6 Zob. Uchwała nr 8/1999 Komisi Nadzoru Bankowego z 22 grudnia 1999 r.
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 6 zmienia się w czasie, z wyłączeniem ego dochodów, kóre gwałownie zmieniaąc się mogą powodować zakłócenia ze spłaą ra kapiałowo-odsekowych. Esymacę paramerów modelu przeprowadzono na podsawie zbioru liczącego 35611 kredyów dealicznych, kóre udzielono w okresie 01.01.2000-30.06.2001 r. Naomias inormace o 3423 rachunkach udzielonych między 01.07.2001 a 30.09.2001 r. porakowano ako próbę odłożoną. Obie próby wykorzysano do określenia dopasowania rozważanych modeli i ich własności dyskryminacynych. Jako poencalne zmienne egzogeniczne wyaśniaące ryzyko kredyowe przyęo, ak we wcześnieszych pracach auora, płeć (x 1 ), wiek kredyobiorcy (x 2 ), wpływy na rachunki ypu ROR (x 3 ), posiadanie rachunku ROR (x 4 ), inormacę o ym, czy kredyobiorca posiada kary płanicze lub kredyowe wydane przez badany bank (x 5 ), sposób udzielenia kredyu (przez pośrednika kredyowego albo bezpośrednio w oddziałach banku, x 6 ), yp kredyu (konsumpcyny albo hipoeczny, x 7 ), okres rwania umowy kredyowe (x 8 ), kwoa przyznanego kredyu (x 9 ), walua kredyu (x 10 ) i podsawowe źródło dochodu uzyskiwanego przez kredyobiorcę. Osania zmienna ma charaker kaegorii mierzone na skali nominalne, więc rozważaąc czery przypadki przyęo, iż źródłem dochodu es umowa o pracę, gdy x 11 =x 12 =x 13 =0, rena lub emeryura, gdy x 12 =1 i x 11 =x 13 =0, własna działalność, umowa o dzieło lub umowa zlecenie - x 12 =0 i x 11 =x 13 =0 albo inne źródło (np. sypendium), gdy x 11 =x 12 =0 i x 13 =1. W abeli 1 przedsawione są podsawowe inormace o rachunkach kredyowych i ich właścicielach w przypadku próby podsawowe oraz odłożone. Udział złych kredyów (y =1) w próbie podsawowe wynosi 23%, zaś w drugie ylko 6,4%. Średnie warości akich zmiennych ak: płeć, wiek kredyobiorcy, okres i yp kredyu, są na zbliżonym poziomie. W przypadku pozosałych zmiennych obaśniaących widoczne są różnice między warościami średnich dla każde z prób. Tabela 1. Podsawowe inormace o danych Charakerysyka \ Próba Podsawowa Odłożona Liczba rachunków 35611 3423 Udział rachunków o kaegorii normalne (y =0) 77% 95,6% Srukura wg płci (udział mężczyzn) 53% 50% Wiek kredyobiorcy (w laach) 40,30 39,53 Kwaralne wpływy na rachunki ROR (w ys. zł) 7,21 12,99 Posiadaący ROR 53% 84% Posiadaący kary płanicze 31% 54% Klien/kredy pozyskany przez pośrednika 41% 7% Typ kredyu (konsumpcyny) 94% 88% Okres kredyu (w laach) 2,61 2,53 Kwoa przyznanego kredyu (w ys. zł) 10,06 12,94 Walua kredyu (udział PLN) 97% 93% Źródło: Opracowanie własne.
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 7 4. Ocena zdolności dyskryminacynych wyniki empiryczne Oceny paramerów mieszanki i probiu Na podsawie próby podsawowe przeprowadzono esymacę dwóch modeli dwumianowych: probiowego i oparego na dwuskładnikowe mieszance rozkładów normalnych. Bayesowskie oceny punkowe dla paramerów poszczególnych specyikaci przedsawia abela 2. Zaprezenowane wyniki wskazuą, iż z punku widzenia saysycznego wprowadzone uogólnienie modelu probiowego było zasadne. Warości oczekiwane a poseriori, dla kluczowych paramerów deiniuących mieszankę, charakeryzuą się sosunkowo niewielkimi odchyleniami sandardowymi. Wskazue o na ich saysyczną isoność. Waro zwrócić uwagę, że choć warość wagi π 1 wynosi zaledwie 0,018, o niepewność związana z e esymacą punkową es bardzo mała. Obserwuemy zgodność znaków ocen paramerów mieszanki i modelu probiowego, z wyłączeniem zmienne ROR. Formalne esowanie obu modeli z wykorzysaniem prawdopodobieńswa a poseriori pokazue, iż dane zdecydowanie świadczą na rzecz modelu z mieszanką, a odrzucaą model probiowy, zob. J. Marzec [2008]. Zaem en pierwszy es wysoce prawdopodobny a poseriori i charakeryzue się lepszym dopasowaniem do danych. Tabela 2. Warości oczekiwane E( y) i odchylenia sandardowe D( y) a poseriori paramerów poszczególnych modeli Model mieszanki Model probiowy Zmienna lub paramer E( y) D( y) E( y) D( y) 1 - - -1,261 0,124 Płeć (mężczyzna: x 1 =1) 0,006 0,004 0,047 0,018 Wiek (x 2 w sekach la) -0,170 0,023-0,853 0,084 Wpływy (x 3 w sekach ys. zł) -4,690 0,338-1,404 0,139 ROR (posiada: x 4 =1) 0,083 0,012-0,285 0,037 Kary (posiada: x 5 =1) -0,009 0,010-0,121 0,032 Pośrednik (x 6 =1) 0,248 0,020 1,254 0,032 Typ (konsumpcyny: x 7 =1) 0,210 0,123 0,362 0,112 Okres (x 8 w dziesiąkach la) -0,054 0,014-0,125 0,056 Kwoa (x 9 w sekach ys. zł) 0,016 0,011 0,103 0,029 Walua (PLN: x 10 =1) 0,142 0,124 0,380 0,129 Źródło dochodu (x 11 ) -0,026 0,006-0,103 0,029 Źródło dochodu (x 12 ) 0,033 0,012 0,303 0,040 Źródło dochodu (x 13 ) -0,094 0,018-0,243 0,075 µ 1 6,070 0,588 - - µ 2-0,381 0,126 - - τ 2 26,424 4,000 - - π 1 0,018 0,001 - - Źródło: obliczenia własne. Ocena raności decyzi kredyowych Z punku widzenia prakycznego - zasosowania obu modeli w sysemach scoringu kredyowego isonym zagadnieniem es określenie ich zdolności dyskryminacynych poprzez porównanie raności uzyskiwanych prognoz niespłacenia kredyów. W przypadku kliena o numerze przedmioem prognozy może być prawdopodobieńswo niespłacenia kredyu p =Pr(y =1)
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 8 lub zmienna zeroedynkowa y (1 kredy nie es spłacany, 0 w przeciwnym przypadku). Prognozę dla p uzyskuemy bezpośrednio z modelu (1). Jednakże z punku widzenia prakyki bankowe o prognoza zmienne y es kluczowa, bo decydue czy w przypadku poencalnego kredyobiorcy negaywnie ocenić wniosek kredyowy (odmówić przyznania kredyu) czy pozyywnie (udzielić go). Prognozy e zmienne uzyskue się na podsawie reguły: = 1, gdy pˆ p > oraz = 0, gdy ˆ p p, gdzie p oznacza maksymalny, akcepowalny poziom prawdopodobieńswa niespłacenia kredyu, gdy bank decydue się go udzielić. Warość p usaliliśmy na poziomie niezbilansowania próby [M. Gruszczyński 2001, s. 81], więc p =0,23. W konsekwenci przyęliśmy, iż = 1, gdy p ˆ > 0, 23 oraz = 0, gdy p ˆ 0, 23. Nie rozważaliśmy koszów błędnych decyzi: odmowy kredyu rzeelnemu klienowi oraz przyznania kredyu kredyobiorcy, kóry go nie spłaci. Koszy ych obu błędnych decyzi są różne, więc przyęcie progowe warości dla p na poziomie 0,5 uważamy za bezzasadne. Uwzględnienie koszów błędnych decyzi, w celu określenia akiego (minimalnego) poziomu prawdopodobieńswa sanu naury (wypłacalności kliena), kóry by uzasadniał przyznanie kredyu, proponue się w pracy J. Osiewalski [2007]. Przyęa w ninieszych badaniach graniczna (maksymalna) progowa warość prawdopodobieńswa niespłacenia kredyu, p =0,23, odpowiada marży kredyowe na poziomie 17,5 punków procenowych według propozyci J. Osiewalski [2007, abela 2]. Tabele 3 i 4 prezenuą oceny zdolności dyskryminacynych badanych modeli, w posaci liczebności oraz procenowe srukury przypadków poprawnego i błędnego zakwaliikowania kredyów w zależności od ego, czy klienci e spłacaą czy nie. W modelu z mieszanką, spośród 27443 spłacanych kredyów i 8168 kredyów nie spłacanych, zosało poprawnie zakwaliikowanych odpowiednio 19858, czyli 72,4% ogółu dobrych rachunków i 7101, czyli 86,9% złych kredyów. Syneyczny miernik, coun R 2, wyrażaący procenowy udział poprawnych prognoz do wszyskich prognoz es wysoki i dla obu modeli wynosi 0,76 =(19858+7101)/35611. Wyniki prognoz, kóre uzyskano na podsawie specyikaci probiowe są nieznacznie lepsze, ednakże ylko w odniesieniu do kredyów, kóre są spłacane nie zaś ych, należących do grupy należności zagrożonych. Maąc na uwadze, iż zysk wynikaący z udzielenia kredyu, kóry es spłacany, es kilkakronie mnieszy od sray ponoszone przez bank, gdy kredyobiorca go nie spłaca, o prognozy uzyskane na podsawie modelu z mieszanką są lepsze. Ponado z uwagi na ak, że poszczególne kredyy posiadaą różną warość, porównano akże raność prognozowania odnosząc się do kwoy udzielonych kredyów. Wówczas w modelu mieszanki, spośród spłacanych w erminie kredyów o łączne warości 311,4 mln zł poprawne prognozy uzyskano dla grupy rachunków kredyowych o warości 274,5 mln zł. Wśród 46,9 mln zł kredyów zagrożonych rane prognozy doyczyły kwoy 32,9 mln zł. Był o wynik łącznie o 5,2 mln zł lepszy niż w radycynym modelu probiowym. W modelu mieszanki
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 9 udział warości kredyów poprawnie zidenyikowanych sanowi 85,79% porela, zaś w probiowym es niższy i wynosi 84,34%. Jes o koleny argumen, iż prognozy uzyskiwane na podsawie modelu mieszanki niosą więce korzyści dla banku niż model probiowy. Tabela 3. Tabela raności ocen zmienne y dla próby podsawowe ( Prognoza p =0,23) Model Z mieszanką Probiowy W uęciu ilościowym (w nawiasie - wg warości udzielonych kredyów w mln zł) San akyczny Spłaca kredy: Nie spłaca: Spłaca kredy: Nie spłaca: y =0 y =1 y =0 y =1 = 0 19858 (274,5) 1067 (14,0) 19884 (269,6) 1111 (14,3) =1 7585 (36,9) 7101 (32,9) 7559 (41,8) 7057 (32,6) Razem 27443 (311,4) 8168 (46,9) 27443 (311,4) 8168 (46,9) W uęciu procenowym (w nawiasie w odniesieniu do warości udzielonych kredyów) San akyczny Spłaca kredy: Nie spłaca: Spłaca kredy: Nie spłaca: Prognoza y =0 y =1 y =0 y =1 = 0 72,4% (88,1%) 13,1% (29,9%) 72,5% (86,6%) 13,6% (30,4%) =1 27,6% (11,9%) 86,9% (70,1%) 27,5% (13,4%) 86,4% (69,6%) Źródło: obliczenia własne. Zbadano akże raności prognoz dla próby odłożone. W ym przypadku oba modele prawie idenycznie prognozuą niespłacenie kredyów. Uzyskuą one bardzo wysoką raność prognoz dla kredyów, kóre w rzeczywisości są spłacane, ale dużo niższą w odniesieniu do kredyów nie spłacanych. W przypadku aż 95,3% (dla mieszanki) i 95,7% (dla probiu) łączne liczby kredyów, kóre są spłacane, uzyskuemy poprawne prognozy, iż można było ich udzielić. Doyczy o około 98,9% warości porela dobrych (spłacanych) kredyów. W konsekwenci, z uwagi na wysoki udział dobrych kredyów, miernik coun R 2 przymue wysoką warość 0,89 dla obu modeli. Jednakże rudnie prognozowane są decyze klienów, kórym udzielono kredyy, a kórzy ich nie spłacaą. Błędną prognozę uzyskano dla co drugiego kredyobiorcy z e grupy, zn. z 200 kredyów błędnie zosało zakwaliikowanych aż 115. Warość nie spłacanych kredyów, w przypadku kórych model rekomendował ich udzielenie, sanowi 84,1% warości porela kredyów zagrożonych. Doyczy o obu modeli. W innych polskich badaniach orzymano niższe warości zliczeniowego R 2 : 56%-73% u Miszal [2006] oraz 75%-74% u Wikowskie i Chrzanowskie [2006], gdy sosowano drzewa decyzyne. W przypadku modelu logiowego odseek poprawnych decyzi wynosił 71%, zaś dla sieci neuronowych - 68%; zob. Wikowska i Chrzanowska [2004]. W przypadku innych badań - Feahersone, Roessler i Barry [2006] - uzyskano niższy wskaźnik poprawnie sklasyikowanych rachunków, bo wynoszący ylko 65,4%, gdy dla dużo liczniesze próby zasosowano model logiowy. Naomias w badaniach Lee i Liu [2002] odseek wszyskich poprawnie zakwaliikowanych kredyów hipoecznych wynosił 77,25% i 89% w zależności od przeznaczenia pożyczek: na kupno nowych czy używanych nieruchomości. W innych badaniach wielkość e
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 10 miary akości modelu kszałue się na poziomie od 76% do 80%; zob. Banasik, Cook i Thomas [2003]. Wobec przedsawionych wyników z lieraury przedmiou można zgodnie swierdzić, iż raność dyskryminaci uzyskana na podsawie badanych modeli es wysoka. Tabela 4. Tabela raności prognoz zmienne y dla próby odłożone ( p =0,23) Ocena Model Z mieszanką Probiowy W uęciu ilościowym (w nawiasie - wg warości udzielonych kredyów w mln zł) San akyczny Spłaca kredy: y =0 Nie spłaca: y =1 Spłaca kredy: y =0 Nie spłaca: y =1 = 0 3053 (42,0) 115 (1,6) 3066 (41,9) 116 (1,6) = 1 150 (0,4) 105 (0,3) 137 (0,5) 104 (0,3) Razem 3203 (42,4) 220 (1,9) 3203 (42,4) 220 (1,9) W uęciu procenowym (w nawiasie w odniesieniu do warości udzielonych kredyów) San akyczny Spłaca kredy: Nie spłaca: Spłaca kredy: Nie spłaca: Ocena y =0 y =1 y =0 y =1 = 0 95,3% (98,9%) 52,3% (84,1%) 95,7% (98,8%) 52,7% (84,2%) =1 4,7% (1,1%) 47,7% (15,9%) 4,3% (1,2%) 47,3% (15,8%) Źródło: obliczenia własne. Krzywa ROC Innym miernikiem służącym do określenia sopnia dopasowania modelu do danych es pole pod krzywą ROC (Receiver Operaing Characerisic) [D. Hosmer S. Lemeshow 2000, s. 160, Sein 2005]. Krzywa a prezenue zależność pomiędzy częsością poprawnych i błędnych prognoz w zależności od wszyskich możliwych warości p, p ( 0;1) znadue się odseek ilości kredyów spłacanych (y =0), π ˆ ( p ) usalonego ˆ = p ocena dla y es poprawna, czyli y 0 kredyów nie spłacanych (y =1), π ˆ ( p ) 01, dla kórych przy usalonym ; zob. rysunek 1. Na osi rzędnych 00, w przypadku kórych dla. Na osi odcięych odkładamy odseek p poęo błędną decyzę o udzieleniu kredyu = 0. Pole pod krzywą ROC wynosi 0,84, co świadczy o doskonałych zdolnościach dyskryminacynych modelu [D. Hossmser S. Lemeshow 2000, s. 162]. W przypadku modelu probiowego miernik dopasowania przymue bardzo zbliżoną warość 0,83. W przypadku próby odłożone ego warość w obu przypadkach es niższa i wynosi 0,78, lecz można en wynik uznać za bardzo dobry.
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 11 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Próba podsawowa Próba odłożona 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Rysunek 1. Krzywa ROC: zależność między π ˆ ( p ) a ˆ ( p ) Źródło: obliczenia własne. Inne mierniki dopasowania modelu do danych 00 π dla p ( 0;1) 01 W uzupełnieniu prezenuemy, w abeli 5, inormace o średnich ocenach prawdopodobieńswa niespłacenia kredyu p dla dwóch grup kredyów - są spłacane albo nie. W przypadku idealne klasyikaci na przekąne e abeli powinny znadować się edynki. Dla grupy rzeelnych kredyobiorców średnia prognoza spłacenia kredyu (1 p ) wynosi 0,83 w przypadku próby podsawowe i 0,94 dla próby odłożone. Są o bardzo dobre wyniki. Tabela 5. Średnie prawdopodobieńswo zakwaliikowania kredyu do edne z dwóch kaegorii (T o liczebność zbioru obserwaci y = dla (0, 1)) Próba podsawowa odłożona San akyczny Dobry kredy Zły kredy Dobry kredy Zły kredy Ocena (y =0) (y =1) (y =0) (y =1) (T ) 1 Pr(y =0) dla : y = 0,83 0,56 0,94 0,74 (T ) 1 Pr(y =1) dla : y = 0,17 0,44 0,06 0,26 Suma 1,00 1,00 1,00 1,00 Źródło: obliczenia własne. W grupie kredyobiorców, kórzy maą rudności ze spłaą, o prawdopodobieńswo kszałue się na poziomie 0,44 w próbie podsawowe i ylko 0,26 w drugie próbie. Te wyniki nie są zadawalaące i powierdzaą wcześnie uzyskane rezulay, iż omawiane modele są bardzo skueczne, gdy prognoza doyczy kredyu solidnego kredyobiorcy, naomias nie są uż ak eekywne w przypadku kliena, kóry odsępue od podpisane wcześnie umowy kredyowe. Obliczyliśmy akże klasyczne, syneyczne mierniki służące do porównań dopasowania modeli dychoomicznych,. średnią warość prawidłowe prognozy prawdopodobieńswa, czyli R 2 Ben- = 1 2 1 T Akivy i Lermana, wyrażoną ormułą R = T y p + ( 1 y )( 1 pˆ ) BL ˆ oraz skorygowaną warość ego miernika (λ Cramera), uwzględniaącą niezbilansowanie próby, daną wzorem λ = T 1 pˆ T : y = 1 0 : = 1 ˆ 1 p y 0, [M. Gruszczyński 2001, J. Cramer 2003]. Warość miernika 2 R BL, określonego przez średnią ważoną ocenę prawdopodobieńswa poprawnego zakwaliikowania
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 12 kredyu, gdzie wagami są udziały zer i edynek w próbie, wynosi 0,74 dla próby podsawowe i 0,89 dla próby odłożone. Mniesza skueczność modeli w klasyikaci złych kredyów powodue, iż λ es równe 0,27 dla pierwsze próby, zaś w drugie próbie es niższe, bo wynosi zaledwie 0,1. Dla modelu probiowego warości ych mierników są na akim poziomie ak w mieszance. Rezulay e świadczą, iż prognozowanie zdarzenia polegaącego na niespłaceniu kredyu, gdy relaywnie rzadko ma miesce w próbie, es zagadnieniem rudnym. Należy pamięać, iż do esymaci obu modeli wykorzysano dane o wnioskach kredyowych, kóre zosały pozyywie zweryikowane na eapie wsępne oceny wniosków kredyowych, przeprowadzone przez pracowników banku. Zaem urudniło o poprawne prognozowanie prawdopodobieńswa niespłacenia kredyów. 5. Podsumowanie Zaprezenowane wyniki pokazały, że zasosowanie modelu dwumianowego oparego na dwuskładnikowe mieszance rozkładów normalnych es uzasadnione w świele posiadanych danych. Ten model awi się ako skueczne narzędzie prognozowania niespłacalności kredyów. Uzyskane na ego podsawie prognozy są bardzo rane, więc mogłyby przynieść wymierne korzyści inansowe dla banku. Model mieszanki es rekomendowany zwłaszcza w syuaci, gdy udział złych kredyów es znaczący, gdyż wówczas ego użycie do prognozowania zachowania się kredyobiorcy przynosi więce korzyści niż model probiowy. Dla obu specyikaci wyniki prognoz ax ane dla kredyów, kóre nie są spłacane przez kredyobiorców, okazały się mnie zadawalaące od rezulaów uzyskanych na podsawie próby podsawowe. Jedną z przyczyn es niewielki odseek ych obserwaci w próbie. Przedmioem kolenych badań byłoby dokonanie pomiaru korzyści inansowych, akie można uzyskać, sosuąc ekonomeryczne modele danych akościowych w scoringu kredyowym. Wymaga o uwzględnienia koszów błędnych decyzi - przyznania bądź odmowy kredyu - podęych na podsawie prognozy zmienne y. 6. Lieraura Ausin P., M. Escobar, The Use o Finie Mixure Models o Esimae he Disribuion o he Healh Uiliies Index in he Presence o a Ceiling Eecs, Journal o Applied Saisics 2002, vol. 30, nr 8, s. 909-923, Banasik J., J. Crook, L.C. Thomas, Sample Selecion Bias in Credi Scoring Models, Journal o he Operaional Research Sociey 2003, vol. 54, s. 822-832. Chrzanowska M., D. Wikowska, Zasosowanie szucznych sieci neuronowych do klasyikaci ryzyka kredyowego podmioów gospodarczych, Meody ilościowe w badaniach ekonomicznych V 2005, Wydawnicwo SGGW, Warszawa, s. 80-89. Chrzanowska M., K. Kompa, D. Wikowska, Analiza spła pewnego kredyu okolicznościowego. Modele logiowe i sieci neuronowe, Meody ilościowe w badaniach ekonomicznych V 2005, Wydawnicwo SGGW, Warszawa, s.67-79. Cramer J.S, Logi Models From Economics and Oher Fields, Cambridge Universiy Press, Cambridge 2003. Diebol J., C.P. Rober, Esimaion o Finie Mixure Disribuions hough Bayesian Sampling, Journal o he Royal Saisical Sociey B 1994, vol. 56, nr 2, s. 363-375. Erkanli A., D. Sangl, P. Müller, A Bayesian Analysis o Ordinal Daa Using Mixures, Technical Repor 93-01 Insiue o Saisics and Decision Sciences, Duke Universiy 1993. Feahersone A.M., L.M. Roessler, P.J. Barry, Deermining he Probabiliy o Deaul and Risk Raing Class or Loans in he Sevenh Farm Credi Disric Porolio, Review o Agriculural Economics 2006, 28, s. 4-23.
Jerzy Marzec, Kaedra Ekonomerii i Badań Operacynych, Uniwersye Ekonomiczny w Krakowie 13 Frühwirh-Schnaer S., R. Frühwirh, Auxiliary Mixure Sampling wih Applicaions o Logisics Models, Compuaional Saisics and Daa Analysis 2006, vol. 51, nr 7. Geweke J., Inerpreaion and Inerence in Mixure Models: Simple MCMC Works, Compuaional Saisics and Daa Analysis 2007, vol. 51, nr 7, s. 3529-3550. Geweke J., M. Keane, Mixure o Normals Probi Models, [w:] Analysis o Panel and Limied Dependen Variables: A Volume in Honor o G.S. Maddala, red. Hsiao C., Lahiri K., Lee L.F., Pesaran M.H., Cambridge Universiy Press, Cambridge 1999. Gruszczyński M., Modele i prognozy zmiennych akościowych w inansach i bankowości, Monograie i Opracowania SGH nr 6, Warszawa 2001. Hosmer D., S. Lemeshow, Applied Logisic Regression, Wiley, New York 2000. Koop G., Bayesian Economerics, Wiley, Chicheser 2003. Lee S.P., D.Y. Liu, The Deerminaions o Deauls in Residenial Morgage Paymens: A Saisical Analysis, Inernaional Journal o Managemen 2002, vol. 19, nr 2, s. 377-389. Mączyńska E., M. Zawadzki, Dyskryminacyne modele predykci upadłości przedsiębiorsw, Ekonomisa 2006, nr 2, s. 205-235. Marzec J., Bayesowski model dwumianowy z mieszanką rozkładów normalnych, [w:] Meody ilościowe w naukach ekonomicznych, red. A. Wele, Wydawnicwo SGH w Warszawie, Warszawa 2008, w druku. Marzec J., Bayesowski model wielomianowy z rozkładem Sudena dla kaegorii uporządkowanych, [w:] Meody ilościowe w naukach ekonomicznych, red. A. Wele, Wydawnicwo SGH w Warszawie. Warszawa 2006, s. 123-144. Miszal M., O zasosowaniu meody rekurencynego podziału w analizie ryzyka kredyowego, Modelowanie preerenci a ryzyko'05 2006, Wydawnicwo AE w Kaowicach, s. 453-468. Osiewalski J., Bayesowska saysyka i eoria decyzi w analizie ryzyka kredyu dealicznego, [w:] Finansowe warunkowania decyzi ekonomicznych, red. D. Fauła, Wydawnicwo Krakowskie Szkoły Wyższe w Krakowie, Kraków 2007. Qu P., Y. Qu, A Bayesian Approach o Finie Mixure models in Bioassay via Daa Augmenaion and Gibbs Sampling and Is Applicaion o Insecicide Resisance, Biomerics 2000, 56, s. 1249-1255. Roeder K., L. Wasserman, Pracical Bayesian Densiy Esimaion Using Mixures o Normals, Journal o he American Saisical Associaion 1997, vol. 92, nr. 439; s. 894-902. Rosenberg E., A. Glei, Quaniaive Mehods in Credi Managemen: A Survey, Operaions Research 1994, vol. 42, nr 4, s.589-613. Saniec I., Badanie zdolności kredyowe przy użyciu szucznych sieci, Zeszyy Naukowe Poliechniki Łódzkie 2000, Organizaca i Zarządzanie, zeszy 35, nr 876, Łódź, s. 129-139. Saniec I., D. Wikowska, Dychoomiczna klasyikaca kredyobiorców przy użyciu wielowymiarowe analizy dyskryminacyne, Aca Universiais Lodziensis. Folia Oeconomica 156 2002, s. 221-233. Saniec I., Drzewa klasyikacyne w ocenie wiarygodności kredyobiorców, Taksonomia 12. Klasyikaca i analiza danych eoria i zasosowania 2005, Prace Naukowe Akademii Ekonomiczne we Wrocławiu, s.547-555. Saniec I., M. Szmi, Ocena wiarygodności kredyobiorców przy użyciu sieci LTF-C, Zeszyy Naukowe Wydziału Mechanicznego nr 35 2004a, Poliechnika Koszalińska, s. 216-223. Saniec I., M. Szmi, Ocena wiarygodności kredyobiorców przy użyciu analizy dyskryminacyne oraz drzew klasyikacynych, Zeszyy Naukowe Poliechniki Łódzkie, Organizaca i Zarządzanie nr 40 2005, Łódź, s. 79-90. Saniec I., M. Szmi, Szuczne sieci neuronowe w ocenie wiarygodności kredyowe kliena, Zeszyy Naukowe Akademii Górniczo-Hunicze w Krakowie 2004b, zeszy 3 om 8, s. 449-457. Sein R. M., The Relaionship Beween Deaul Predicion and Lending Prois: Inegraing ROC Analysis and Loan Pricing, Journal o Banking and Finance 2005, 29, s. 1213-1236. Szmi A., M. Szmi, M. Kaniewski, Analiza ryzyka kredyowego na porzeby pośrednika inansowego, Taksonomia 10. Klasyikaca i analiza danych eoria i zasosowania 2003, Prace Naukowe Akademii Ekonomiczne we Wrocławiu, s. 163-172. Thomas L.C., A Survey o Credi and Behavioural Scoring: Forecasing Financial Risk o Lending o Consumers, Inernaional Journal o Forecasing 2000, vol. 16, s. 149-172. Thomas L.C., R.W. Oliver, D.J. Hand, A survey o he issues in consumer credi modelling research, The Journal o he Operaional Research Sociey 2005, vol. 56, nr 9, s.1006-1015. Tieringon D.M., A.F.M. Smih, U.E. Makov, Saisical Analysis o Finie Mixure Disribuions, John Wiley, New York 1985. Tymoczko I., M. Pawłowska, Uwarunkowania dosępności kredyu bankowego analiza polskiego rynku, Bank i Kredy 2007, nr 6, s. 47-68. Wędzki D, Zasosowanie logiowego modelu upadłości przedsiębiorsw, Ekonomisa 2005, nr 5, s. 691-705. Wikowska D., M. Chrzanowska, Drzewa klasyikacyne ako meoda grupowania klienów banku, Modelowanie preerenci a ryzyko'05 2006, Wydawnicwo AE w Kaowicach, s. 485-496. Wikowska D., M. Chrzanowska, Drzewa klasyikacyne w rozpoznawaniu kredyobiorców, Meody ilościowe w badaniach ekonomicznych VII 2007, Wydawnicwo SGGW, Warszawa, s. 291-301. Wikowska D., M. Chrzanowska, Wybrane meody klasyikaci kredyobiorców: modele logiowe i sieci neuronowe, Modelowanie preerenci a ryzyko'04 2004, Wydawnicwo AE w Kaowicach, s.531-540.