2. Model wielomianowowy dla kategorii uporządkowanych

Podobne dokumenty
Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Prawdopodobieństwo i statystyka

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Matematyka ubezpieczeń majątkowych r.

Uogolnione modele liniowe

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Porównanie opłacalności kredytu w PLN i kredytu denominowanego w EUR Przykładowa analiza

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Zawansowane modele wyborów dyskretnych

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Matematyka ubezpieczeń majątkowych r.

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Weryfikacja hipotez statystycznych

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka i eksploracja danych

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Agata Boratyńska Statystyka aktuarialna... 1

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Matematyka ubezpieczeń majątkowych r.

ANALIZA EFEKTÓW SKALI

Matematyka ubezpieczeń majątkowych r.

METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych

STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010

Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Testy zgodności 9 113

Statystyka matematyczna i ekonometria

Wnioskowanie bayesowskie

5 Błąd średniokwadratowy i obciążenie

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

BAYESOWSKA ANALIZA KRAŃCOWEJ SKŁONNOŚCI DO KONSUMPCJI

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Testowanie hipotez statystycznych.

Prawdopodobieństwo i rozkład normalny cd.

Analiza niepewności pomiarów

6. ANALIZA POST-OPTYMALIZACYJNA analiza wrażliwości rozwiązania optymalnego

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

gdzie. Dla funkcja ma własności:

166 Wstęp do statystyki matematycznej

Zadania ze statystyki, cz.6

POMIAR KORZYŚCI Z ZASTOSOWANIA MODELU WIELOMIANOWEGO W OGRANICZANIU RYZYKA KREDYTOWEGO. Wprowadzenie

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

STATYSTYKA

Poszukiwanie optymalnego wyrównania harmonogramu zatrudnienia metodą analityczną

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Wykład 5. Skręcanie nieskrępowane prętów o przekroju prostokątnym.

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Testowanie hipotez statystycznych

Metoda największej wiarogodności

Rozkład Gaussa i test χ2

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

3. Modele tendencji czasowej w prognozowaniu

Ekonometria. Zajęcia

Wybrane rozkłady zmiennych losowych. Statystyka

Wybrane rozkłady zmiennych losowych. Statystyka

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Testowanie hipotez statystycznych. Wprowadzenie

Ćwiczenia IV

Estymacja punktowa i przedziałowa

STATYSTYKA wykład 5-6

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Kwantowa wariacyjna metoda Monte Carlo. Problem własny dla stanu podstawowego układu N cząstek

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

(Dantzig G. B. (1963))

Wnioskowanie statystyczne. Statystyka w 5

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

WYKORZYSTANIE MODELU LOGITOWEGO DO ANALIZY BEZROBOCIA WŚRÓD OSÓB NIEPEŁNOSPRAWNYCH W POLSCE W 2010 ROKU

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Własności statystyczne regresji liniowej. Wykład 4

System bonus-malus z mechanizmem korekty składki

Transkrypt:

Jerzy Marzec BAYESOWSKI MODEL WIELOMIANOWY Z ROZKŁADEM t STUDENTA DLA KATEGORII UPORZĄDKOWANYCH. Wprowadzenie W literaturze ekonometryczne modele akościowych zmiennych endogenicznych określa się terminem: modele dyskretnego wyboru (ang. quantal response or discrete choice models). Jeżeli zmienna obaśniana przymue skończoną liczbę wartości i mierzona est na skali porządkowe, wówczas otrzymuemy wielomianowy model dla kategorii uporządkowanych. Powyższy model est oryginalną propozycą Aitchisona i Silveya z 957 roku i (ak wiele innych modeli dla zmiennych akościowych) zastosowano go po raz pierwszy w biostatystyce. Dopiero w 975 roku został przeniesiony na grunt nauk społecznych przez McKelveya i Zavoina. Wykorzystali go do analizy zachowań kongresmenów amerykańskich podczas głosowania nad ustawą z 965 roku, dotyczącą rządowego programu pomagaącego osobom o niskich dochodach pokryć koszty leczenia. W tym przypadku, ako zmienne obaśniaące wykorzystano: przynależność partyną (demokraci, republikanie), region (południe, północ), poziom bezrobocia, odsetek ludności powyże 65 roku życia i gęstość zaludnienia w regionie, który reprezentował kongresmen. Autorzy rozważali trzy stanowiska: głosuących za przyęciem nabardzie socalne wersi ustawy, głosuących za wersą z poprawkami zgłoszonymi przez umiarkowanych przeciwników tego programu oraz głosuących za odrzuceniem ustawy w całości. Postawy kongresmanów są podobne do skali odpowiedzi respondentów w badaniach ankietowych, tzw. skali Likerta: zdecydowanie tak, racze tak, nie mam zdania, racze nie i zdecydowanie nie. Innym przykładem zmiennych mierzonych na skali porządkowe est np. informaca o zatrudnieniu (bezrobotny, zatrudniony w niepełnym wymiarze godzin, na pełny etat). Klasyfikacę modeli dyskretnych ze względu na rodza wartości, akie przymue zmienna endogeniczna wraz z zastosowaniami w ekonomii, prezentue m.in. Maddala [983]. Głównym celem ninieszego artykułu est prezentaca i wykorzystanie modelu wielomianowego z rozkładem t Studenta w analizie niespłacalności kredytów detalicznych. W szczególności przedstawiona zostanie bayesowska specyfikaca i estymaca tego modelu. Przedstawione w artykule wyniki stanowią kontynuacę podęte problematyki, zaprezentowane wcześnie w pracach Marzec [003b,c].. Model wielomianowowy dla kategorii uporządkowanych W ninieszym artykule przedmiotem analizy est wyłącznie wielomianowy model dla kategorii uporządkowanych przy założeniu ednakowe liczby alternatyw i posiadaniu danych charakteryzuących edynie podmiot dokonuący wybór. Wprowadzaąc ciągłe, nieobserwowalne (ukryte) zmienne z t, których wartości determinuą obserwowaną kategorię zmienne y t, model ma następuącą postać (zob. McKelvey i Zavoina [975]) Artykuł powstał w ramach badań statutowych finansowanych przez Akademię Ekonomiczną w Krakowie w 005 r.

zt = x t β + ε t () yt = I[ α ( z ) t = T = J, ) t dla, K,, K, α gdzie I Ω (ω) est funkcą charakterystyczną zbioru, zaś α są tzw. punktami granicznymi Ponadto x t est wektorem zmiennych egzogenicznych (lub ich znanych funkci) charakteryzuących ednostkę podemuącą wybór. Zmienna y t est zmienną skalarną przymuącą wartości odpowiadaące numerom kategorii, czyli,,,j, zatem zmienna pomocnicza y t przymue wartość eden, gdy y t = albo zero w pozostałych przypadkach. O składnikach losowych ε t zakłada się, że posiadaą identyczne i niezależne rozkłady o wartości oczekiwane równe zero i nieznanym parametrze skali. Z uwagi na identyfikowalność parametrów przymue się, analogicznie ak w modelu dychotomicznym, że parametr skali rozkładu zmienne ε t est równy edności. Ponadto identyfikowalność wymaga, aby α 0 = i α J =+ oraz α = 0, eżeli w równaniu dla zmienne z t występue wyraz wolny, co zakładamy w te pracy. Zatem wymiar wektora α wynosi J. W dalsze części zakładamy, że zmienna ε t posiada rozkład t Studenta z nieznaną liczbą stopni swobody (ν), z zerową modalną (µ = 0) i ednostkową precyzą (τ =), o funkci gęstości 0.5 0.5( ν + ) ν τ τ f S ( ε t µ, ν, τ ) = B, + ( ε t µ ) () gdzie ( ν, ) ν ν B est funkcą beta. Wówczas funkca wiarygodności modelu () ma postać ( ) = T J α, β, ν ( p ) yt p y t, (3) t= = gdzie prawdopodobieństwo zaobserwowania kategorii wynosi pt Pr( yt = ) = Pr( α < zt < α ) = FS ( α x tβ) FS ( α x tβ), (4) J przy czym = p =, zaś F S (a) est wartością dystrybuanty zmienne losowe ε t o rozkładzie t Studenta z ν t stopniami swobody w punkcie a. Uzyskaliśmy przez to uogólnienie standardowego modelu probitowego (z rozkładem normalnym). Wprowadzenie dodatkowego parametru ν umożliwia naturalne uwzględnienie modelu standardowego ako przypadku granicznego, gdy ν +. Zastosowanie rodziny rozkładów t Studenta est tym bardzie uzasadnione, że ak zauważyli Mudholkar i George [978], kształt dystrybuanty rozkładu logistycznego est zbliżony racze do gęstości rozkładu t Studenta niż rozkładu normalnego. Rozkład t Studenta i logistyczny charakteryzuą się grubszymi ogonami niż rozkład normalny, dla którego kurtoza (moment centralny czwartego rzędu podzielony przez kwadrat warianci) wynosi 3. Współczynnik ekscesu (kurtoza pomnieszona o 3), mierzący grubość ogonów w stosunku do rozkładu normalnego, dla rozkładu logistycznego wynosi 6/5, zaś w przypadku t Studenta 6/(ν 4). Zatem dla ν = 9 współczynnik ekscesu dla obu rozkładów przymue identyczną wartość. Mudholkar i George pokazuą graficznie, że dla rozkładu logistycznego zmienne standaryzowane mniesze różnice między dystrybuantami obserwue się w stosunku do rozkładu t Studenta (o ν = 9 i ednostkowe warianci) niż rozkładu normalnego. Albert i Chib [993] przedstawiaą wyniki własnych badań, które to potwierdzaą. W uzupełnieniu dołączamy Rysunek przedstawiaący różnice między funkcą gęstości standaryzowanego rozkładu logistycznego, a standaryzowanym rozkładem normalnym oraz t Studenta o ednostkowe warianci i różne liczbie stopni swobody. Zauważmy, że namniesze różnice dla wartości zmienne z przedziału od 4 do 4 występuą w stosunku do rozkładu t Studenta o ν = 7. Wartość ν = 7,3 minimalizue miarę podobieństwa między rozkładami, opartą na metryce odległości Kulbacka-Leiblera, zdefiniowaną ako f ( x) ln [ f ( x) f ( x; ν )] + dx L L ST. Zatem przymimy, że rozkład logistyczny można aproksymować rozkładem t Studenta o około 7 9 stopniach swobody. W ramach modelu t Studenta istniee prosta możliwość testowania empiryczne adekwatności dwóch specyfikaci, które naczęście stosue się w przypadku danych akościowych, t. modelu probitowego i logitowego. Dla tych modeli podstawową metodą estymaci est metoda nawiększe wiarygodności (MNW); zob. Aitchison i Silvey [957] oraz McKelvey i Zavoina [975]. Natomiast zastosowanie rozkładu t Studenta zmusza do korzystania z inne metody estymaci niż MNW, ponieważ e własności, nawet w modelu regresi

liniowe ze składnikiem losowym o rozkładzie t Studenta z nieznanym parametrem stopni swobody, nie są poznane. Stanowi to motywacę do wykorzystania małopróbkowego podeścia bayesowskiego. Rysunek. Różnice między funkcą gęstości rozkładu logistycznego f L (x) a rozkładu normalnego f N (x) i t Studenta f ST (x; ν) o ν stopniach swobody (rozkłady o ednostkowe warianci) 0,06 0,05 0,04 0,03 0,0 0,0 0-0,0-0,0 f L (x) f N (x) f L (x) f ST (x;ν=9) f L (x) f ST (x;ν=7) -0,03 0 0,5,5,5 3 3,5 4 W przypadku modelu () zakładamy, że równanie regresi z t est liniowe względem β. W literaturze naczęście zakłada się, że to równanie est także liniowe względem oryginalnych zmiennych egzogenicznych. W artykule wykorzystuemy zależność w formie wielomianu stopnia drugiego względem oryginalnych zmiennych egzogenicznych w th x t β = β + β hwth + β hiwthwti = G( w t, β). (5) h h i h Osiewalski i Marzec [004] proponuą więc nazywać taki przypadek modelem II rzędu, ako proste uogólnienie przypadku liniowego x = β + β w t β h h th, czyli modelu I rzędu. Z punktu widzenia estymaci, modele I i II rzędu różnią się edynie liczbą parametrów, czyli wymiarem wektora β. W pierwszym modelu liczba parametrów wynosi k = m+, zaś w modelu II rzędu wymiar wektora β est nie większy niż (+m)(+m/) uwzględniaąc wyraz wolny, gdzie m oznacza liczbę oryginalnych zmiennych egzogenicznych. Zasadnicza przewaga drugiego modelu nad pierwszym przeawia się w charakterze efektów krańcowych, co było główną motywacą zastosowania modelu II rzędu w pracy Marzec [003a]. Wnioskowanie o sile i kierunku wpływu zmiennych egzogenicznych w t może opierać się na efektach krańcowych zdefiniowanych dla zmiennych ciągłych ako pt G ( ( ) ( ) ( w t, β) η th = = f S α x tβ f S α x tβ, (6) w w th gdzie f S (a) est wartością funkci gęstości zmienne losowe ε t w punkcie a. W przypadku modelu I rzędu G w t, β = β. Natomiast dla zmiennych zero-edynkowych efekt krańcowy oblicza się otrzymuemy ( ) w th h ako różnicę prawdopodobieństw η Pr y = ; w = Pr y = ; w = 0. (7) ( ) ( ) th = t th t th Własności efektów krańcowych w obu modelach są istotnie różne. W modelu I rzędu znak efektu krańcowego dla prawdopodobieństwa zaobserwowania edne ze skranych kategorii względem ustalone zmienne w th est identyczny dla wszystkich obserwaci i zależy od znaku parametru β h. Ponadto iloraz th 3

efektów krańcowych względem pary zmiennych w th i w ti dla ustalone kategorii i obserwaci est równy ilorazowi parametrów, t. β h /β i. Zatem nie zależy on od wartości tych zmiennych i est identyczny dla wszystkich obserwaci. Możemy uwolnić się od tych dwóch ograniczeń przymuąc, że z t związane est ze zmiennymi egzogenicznymi w t poprzez funkcę G(w t, β), daną wzorem (5). Ponadto niezależną od postaci G(w t, β) własnością efektów krańcowych est to, że dla ustalone obserwaci i zmienne obaśniaące w th suma efektów krańcowych η th po wynosi zero. W konsekwenci efekty krańcowe dla dwóch skranych alternatyw, t. η th i η tjh, charakteryzuą się przeciwnymi znakami; zob. Greene [003]. O pozostałych możemy powiedzieć tylko tyle, że istniee taka kategoria (>), że efekty krańcowe dla poprzedzaących ą kategorii posiadaą znak identyczny ak η th i ednocześnie znak efektów dla pozostałych kategorii +, + itd. est zgodny ze znakiem efektu krańcowego dla Pr(y tj = ), czyli η tjh. Ta własność zachodzi, eżeli zmienna ε t ma rozkład ednomodalny, a takim est rozkład t Studenta o funkci gęstości określone przez wzór (). 3. Bayesowska specyfikaca i estymaca modelu Na gruncie bayesowskim model statystyczny est zdefiniowany poprzez łączny rozkład prawdopodobieństwa dla obserwaci i parametrów lub innych wielkości nieobserwowalnych. W tym przypadku est on określony przez uogólnioną łączną funkcę gęstości T J yt (, α, β, ν) = p( yα, β, ν) p( α, β, ν) = ( p ) p( α) p( β) p( ν) p y t, (8) t = = ako iloczyn brzegowego rozkładu a priori ( α,β,ν) p i funkci wiarygodności (3). Niezależność rozkładu a priori dla poszczególnych parametrów est naturalnym założeniem. Ponadto wielkość p t, dana wzorem (4) est funkcą α, β i ν. Podstawą estymaci bayesowskie modelu parametrycznego est wyznaczenie z gęstości (8) dla interesuące wielkości (np. dla wybranego parametru bądź znane funkci parametru) gęstości rozkładu warunkowego względem obserwaci y i ednocześnie brzegowego względem pozostałych składowych, czyli tzw. funkci gęstości rozkładu a posteriori. Zagadnieniu wnioskowania bayesowskiego są poświęcone takie fundamentalne prace ak np. Zellner [97] i O Hagan [994], zaś w ęzyku polskim monografie Osiewalski [99] i [00]. Podeście bayesowskie wymaga od badacza specyfikaci rozkładu a priori na przestrzeni nieznanych parametrów. Analizowany model est zbyt skomplikowany, aby próbować wyznaczyć analitycznie wzorcowe rozkłady a priori w sensie Jeffreysa. W modelu z rozkładem t Studenta, w przypadku parametru ν przymue się wyłącznie właściwe rozkłady a priori, określone na dziedzinie (0,+ ). Jest to konieczne, aby istniał rozkład a posteriori. Ponadto, w praktyce rozkład t Studenta o ν>30 może być przybliżany rozkładem p c I ν, gdzie c est dowolną normalnym. Przymuąc zatem niewłaściwy rozkład o priori postaci ( ) ( )( ) dodatnią stałą, otrzymuemy, iż Pr ( ν 30) Pr( ν > 30) = 0 ν 0; +. Oznacza to, że taki rozkład est tylko na pozór nieinformacyny. W rzeczywistości est rozkładem silnie informacynym, gdyż z prawdopodobieństwem równym eden dopuszcza wyłącznie normalność. Właściwy rozkład a priori należy przyąć także dla pozostałych parametrów. Albert i Chib [993] proponuąc model z rozkładem t Studenta dla binarne zmienne endogeniczne zastosowali nieinformacyny rozkład a priori dla β. Przeprowadzone własne badania symulacyne wskazały na problemy numeryczne z istnieniem właściwych rozkładów a posteriori, gdy stosue się nieinformacyne rozkłady a priori dla α lub β w modelu wielomianowym z rozkładem t Studenta. O problemach z istnieniem rozkład a posteriori dla β w modelu regresi pisał Geweke [993]. Rozważał on liniowy model regresi, przy założeniu, że składniki losowe maą niezależne rozkłady t Studenta o ustalone 4

liczbie stopni swobody. Pokazał on, że eżeli przymue się nieinformacyny rozkład a priori dla β, to wartość oczekiwana a posteriori dla β istniee i est skończona, gdy ν> oraz odchylenie standardowe a posteriori istniee i est skończone, gdy ν>4. Zatem, w celu zapewnienia istnienia rozkładów a posteriori i dogodne symulaci w modelu t Studenta stosuemy informacyną strukturę a priori postaci J k (, β, ν ) = f ( β β, H ) f ( ν r) f ( α α ) I ( )( α ) N EXP = pα. (9) EXP α, α + Dla β przymuemy a priori k-wymiarowy rozkład normalny o wartości oczekiwane kowarianci postaci H = s odchyleniu standardowym czyli α, dobieramy tak, aby β i macierzy I, zaś dla α (=,,J ) rozkłady wykładnicze o wartości oczekiwane i α. Z uwagi na restrykcę α < α < α + < α < α +, stałe definiuące rozkład a priori, α, przy czym α 0 Alternatywą dla α est rozkład normalny ucięty na lewo od zera. W przypadku parametru ν przyęto, ak często czyni się to w literaturze, rozkład wykładniczy o wartości oczekiwane i odchyleniu standardowym r. Stałe = β, s i α powinny być tak dobrane, aby implikowane rozkłady a priori efektów krańcowych (η tk ) i prawdopodobieństw (p t ), będących nieliniowymi funkcami α, β i ν, były zgodne z posiadaną wiedzą ekonomiczną bądź odzwierciedlały e brak. W artykule przyęliśmy r = 0 i β = 0, zaś dla α i α 3 różne zestawy wartości np. i, i 4 oraz 4 i 0. Dla s ustaliliśmy wartość 4, ednocześnie badaąc wrażliwość uzyskanych wyników a posteriori na inne wartości, np., 9 oraz 6. Przyęte założenia o tych stałych uczyniły rozkłady a priori dla α i ν rozkładami słabo informacynymi. Porównanie rozkładów a priori i a posteriori dla η tk i p t prezentuemy w dalsze części tego artykułu. W celu wyznaczenia rozkładów a posteriori lub ich charakterystyk całkowanie analityczne stosue się tylko w naprostszych przypadkach; zob. Zellner [97], Osiewalski [99]. Skomplikowana postać funkci wiarygodności (3) nie pozwala na to. W omawianym modelu konieczne est całkowanie numeryczne, które realizue się wykorzystuąc metody Monte Carlo. Pierwotnie Albert i Chib [993] zaproponowali losowanie Gibbsa. Natomiast w ninieszym artykule zastosowano algorytm Metropolisa i Hastingsa, który okazał się efektywną, a w stosunku do próbnika Gibbsa także szybszą metodą uzyskiwania próbek z rozkładu a posteriori. Zastosowanie algorytmu Gibbsa wymagało niesłychanie długiego czasu obliczeń, ponieważ w tym schemacie korzysta się ze zmiennych ukrytych z t, których ilość est równa liczbie obserwaci, a tych w prezentowanych badaniach est ich ponad 39 tys. Stosowanie algorytmu Metropolisa i Hastingsa opiera się na ądrze uogólnione funkci gęstości (8). Wygodnie est przyąć taką parametryzacę, aby zbiory dopuszczalnych wartości wszystkich parametrów były zbiorami liczb rzeczywistych, np. θ = [β θ k+ θ k+ θ k+j ], gdzie θ k+ = ln(ν/r), θ = ln( α α ) k + h h h dla h =,,J, podobnie ak w pracy Osiewalski i Marzec [004]. Wówczas ądro funkci gęstości rozkładu a posteriori ma postać p k ( θ y) f ( β β, H ) exp θ exp( θ ) J exp h= N ( ) k + T J yt ( θ k + h exp( θ k + h )) I( θ k + h ) ( pt ), t = = gdzie funkca I(θ) uwzględnia te restrykce ak I(α) we wzorze (9), tzn. I ( ( )) ( ) θ ; θ + + + ln / k k 3 α3 α I ( ( ) ( )) ( ) θ θ + + ( ) = ( ( ) ( )) ( + + ln / ; + ln / k 3 k α α3 θk 4 α 4 α3 I θ I ) θ θ + + + 4 + 3 ln 3 / 4 ; + 5 ln 5 / k k α α θk α α 4 K I ( ( ) ) ( ) θ θ + + + + ln / ; k J k J α J α J Otrzymywanie próbekθ, θ,, θ k + K n z rozkładu a posteriori ( θ y) (0) p uzyskue się za pomocą mechanizmu losowania opisanego m.in. w pracy Osiewalski i Marzec [004]. Szczegółowe omówienie 5

zastosowanych procedur Monte Carlo można znaleźć m.in. w pracach: O Hagan [994], Tierney [994], Geweke [996], Gamerman [997] lub Koop [003]. 6

4. Wyniki empiryczne 4.. Definica zmiennych Omówiony powyże bayesowski model wielomianowy z rozkładem t Studenta wykorzystano do badania spłacalności kredytów detalicznych udzielonych przez polski bank komercyny. Wcześnie te dane, pochodzące z lat 000-00, zostały wykorzystane w pracach Marzec [003a,b,c], [005] i Osiewalski, Marzec [004]. Zbiór danych obemował 39034 rachunków kredytowych. Konstrukca zmienne wielomianowe opiera się na klasyfikaci należności pozostaących do spłaty przez kredytobiorcę, określone przez Komisę Nadzoru Bankowego. Wobec powyższego przyęliśmy, iż zmienna obaśniana y t przymue cztery wartości (J=4), które ednocześnie oznaczaą kategorie należności lub równoważnie okres opóźnienia ze spłatą przez kredytobiorcę rat kapitałowo-odsetkowych: J Kategoria należności Okres opóźnienia w spłacie Obserwowany udział w próbie Normalne Do miesiąca 80,3% Poniże standardu Od do 3 miesięcy 6,0% 3 Wątpliwe Od 3 do 6 miesięcy 6,3% 4 Stracone Powyże 6 miesięcy 7,4% Jako potencalne zmienne wyaśniaące ryzyko poedyncze umowy kredytowe wprowadziliśmy (ak we wcześnieszych pracach): płeć (zmienna przymue wartość, eżeli klientem est mężczyzna, 0 w przypadku kobiety), wiek kredytobiorcy (w setkach lat), wpływy, tzn. wielkość kwartalnych wpływów w latach 000-00 (w setkach tys. zł) na rachunki typu ROR kredytobiorcy w badanym banku, posiadanie rachunku ROR w analizowanym banku ( posiada, 0 nie posiada), informacę o tym, czy kredytobiorca posiada karty płatnicze lub kredytowe wydane przez ten bank ( posiada choć edną kartę płatniczą, 0 nie posiada), sposób udzielenia kredytu ( poprzez pośrednika kredytowego, 0 bezpośrednio przez rozważany bank), typ kredytu ( kredyt konsumpcyny, 0 kredyt hipoteczny), okres trwania umowy kredytowe (w dziesiątkach lat), kwota przyznanego kredytu (w setkach tys. zł), waluta kredytu ( EUR, DEM lub USD, 0 PLN), podstawowe źródło dochodu uzyskiwanego przez kredytobiorcę (zmienne zrdoch), t. umowa o pracę, albo renta lub emerytura, albo własna działalność, umowa o dzieło lub umowa zlecenie, albo inne źródło (np. stypendium). Ostatnia zmienna może przymować cztery różne wartości. Chcąc ą uwzględnić w równaniu regresi z wyrazem wolnym, wprowadziliśmy trzy zmienne zeroedynkowe, przy czym za kategorię referencyną przyęliśmy umowę o pracę (zrdoch = zrdoch = zrdoch3 = 0); w pozostałych przypadkach: zrdoch =, gdy źródłem dochodu kredytobiorcy est renta lub emerytura, zrdoch =, gdy źródłem dochodu kredytobiorcy est własna działalność, umowa o dzieło lub umowa zlecenie, zrdoch3 = w przypadku innego źródła dochodu, np. stypendium. 7

4.. Porównywanie mocy wyaśniaące modeli W ninieszym artykule wykorzystano uogólnienie probitowego modelu wielomianowego. Zatem rodzi się pytanie: czy w świetle posiadanego materiału empirycznego to uogólnienie est potrzebne? Który z modeli lepie opisue badane zawisko? Rozważyliśmy cztery specyfikace, t. model naogólnieszy z rozkładem t Studenta z nieznaną liczbą stopni swobody (ν) i z częścią regresyną postaci wielomianu II stopnia (M ), następnie model I rzędu z rozkładem t Studenta (M ), model probitowy ze specyfikacą II rzędu (M 3 ) oraz standardowy model probitowy (M 4 ). Modele M, M 3 i M 4 uzyskuemy poprzez warunkowanie względem β lub ν. Narzucenie odpowiednich restrykci na parametry ν lub β w rozkładzie a priori implikue rozkłady a priori dla poszczególnych modeli. W bayesowskim porównywaniu modeli wymaga się, aby rozkłady a priori dla parametrów swoistych w każdym modelu (a takimi są β i ν) były rozkładami właściwymi. Jest to dodatkowy argument za stosowaniem właściwych rozkładów a priori. Bayesowskie porównywanie modeli opiera się na obliczeniu prawdopodobieństw a posteriori każdego modelu wg wzoru p ( M ) gdzie ( ) M i i = 4 h= ( y M i ) p( M i ) p( y M ) p( M ) p y dla i {,,3,4}, () p y i ( ) M i h h p są odpowiednio brzegową gęstością wektora obserwaci i określonym przez badacza prawdopodobieństwem a priori modelu M i ; zob. np. Zellner 97], O Hagan A. [994], Osiewalski [00], Koop[003]. Wyniki wskazały, iż model naogólnieszy (M ) est nabardzie prawdopodobny a posteriori, bez względu czy przymiemy ednakowe szanse a priori każdego modelu czy faworyzuemy te naprostsze, czyli naoszczędnie sparametryzowane. Prawdopodobieństwo a posteriori pozostałych modeli (M, M 3 i M 4 ) w odniesieniu do M wynosi praktycznie zero. Ponadto warto wspomnieć, że spośród dwóch możliwych rozszerzeń standardowego modelu probitowego (M 4 ), dane liczbowe zdecydowanie wskazuą na aproksymacę II rzędu (M 3 ) niż na wprowadzenie rozkładu t Studenta (M ). Szczegółowe wyniki prezentue Tabela. Wszystkie prezentowane dale wyniki dotyczą modelu naogólnieszego, tzn. modelu II rzędu z rozkładem t Studenta. Tabela. Brzegowe gęstości wektora obserwaci i prawdopodobieństwa a posteriori badanych modeli Model M M M 3 M 4 Liczba parametrów (k ) 8 7 8 6 Ln p(y M i ) 776 4 883 60 p(m i ) 0,5 0,5 0,5 0,5 P(M i y) 4 0 5.6 0 47 4 0 ' i k p(m i ) 9 0 0,3333,8 0 0 0.6666 P(M i y),5 0 3 5, 0 47,7 0 9 4.3. Wnioskowanie o wybranych parametrach modelu Rysunek przedstawia histogramy rozkładu a priori i a posteriori dla ν oraz α. Rozkłady a priori, w przeciwieństwie do rozkładów a posteriori, są bardzo rozproszone, zaś dane wnoszą nową informacę w stosunku do te zawarte w rozkładzie a priori. Rozkład a posteriori dla ν est skupiony w wąskim paśmie 4,5-7, przy czym prawdopodobieństwo a priori, że ν (4,5; 7) wynosi edynie 0,4 dla r = 0. Wartość oczekiwana a posteriori dla stopni swobody ν wynosi 5,7, zaś odchylnie standardowe 0,44 i te wyniki nie są wrażliwe na zmiany stałe r. Jeśliby przyąć, że dla ν > 30 rozkład t Studenta można przybliżać rozkładem 8

normalnym, to zaproponowana struktura a priori dopuszcza taki przypadek z prawdopodobieństwem Pr[ν > 30] = 0,05. Prawdopodobieństwo a posteriori takiego modelu wynosi praktycznie zero. Wyniki zdecydowanie odrzucaą model probitowy, a nawet logitowy, gdyby przyąć, że rozkład logistyczny może być aproksymowany przez rozkład logistyczny dla 7-9 stopni swobody. Z drugie strony wartości ν (0; ] są mało prawdopodobne a posteriori, więc rozkład składnika losowego ε t w () posiada momenty pierwszego i drugiego rzędu, a nawet wyższych rzędów. Wyniki dotyczące parametru ν potwierdzaą, w przypadku analizowanych danych, zasadność wprowadzonego rozkładu t Studenta. W przypadku parametrów α i α 3 prawie cała masa prawdopodobieństwa a posteriori znadue się w przedziałach (0,35; 0,4) i (0,87;,0). Wartości oczekiwane rozkładu a posteriori dla α i α 3 wynoszą odpowiednio 0,377 i 0,94, zaś odchylenia standardowe 0,008 i 0,06. Tymczasem przymuąc np. α 4 i α 0 prawdopodobieństwo a priori, że = α (0,35; 0,4) wynosi 0,0 zaś Pr[α 3 (0,87;,0)] = 0,0. Wyniki a posteriori nie były wrażliwe na dobór stałych definiuących rozkłady a priori badanych wielkości. 3 = Rysunek. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) parametru ν modelu M 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 0,0 3, 6,4 9,6 p(ν y, M ),8 6,0 9,,4 5,6 8,8 3,0 35, 38,4 0,0 0,9 0,37 p (α y, M ) i p (α 3 y, M ) Rozkład a priori 0,54 0,73 0,9,09,7,45,63,8,99 4.4. Wnioskowanie o niespłacalności kredytów O niespłacalności kredytów detalicznych wnioskuemy w oparciu o efekty krańcowe (η tk ) i prawdopodobieństwa zakwalifikowania danego kredytu do edne z czterech kategorii należności (p t ). Zagadnienie to omówimy na przykładzie dwóch wybranych klientów. Typowy kredytobiorca ma ponad 40 lat, est mężczyzną zatrudnionym na umowę o pracę, ego wpływy na rachunek ROR wynoszą 8,5 tys. zł na kwartał, posiada karty płatnicze lub kredytowe, w banku udzielono mu złotowego kredytu konsumpcynego o wartości tys. zł na okres 3 miesięcy. Natomiast drugi, hipotetyczny kredytobiorca biznesmen - ma 0 lat i w odróżnieniu od typowego klienta nie posiada rachunku ROR i nie korzysta z kart płatniczych tego banku, prowadzi własną działalność gospodarczą, zaś kredyt został mu udzielony poprzez pośrednika, nie zaś bezpośrednio w banku. Rysunki 4 i 5 przedstawiaą rozkłady a priori i a posteriori efektów krańcowych w przypadku tych kredytobiorców. Porównanie obu rozkładów niesie informacę o tym ak dane modyfikuą wiedzę a priori o badanych wielkościach η tk. Zauważmy, że dla dwóch diametralnie różnych kredytobiorców kształt i położenie rozkładów a priori są prawie identyczne. Rozkłady a priori dla η tk są silnie skupione w otoczeniu zera, lecz charakteryzuą się grubymi ogonami. Wraz ze wzrostem stałe s rozkład a priori dla efektów krańcowych ma charakter coraz bardzie leptokurtyczny, por. Rysunek 3. Identyczne rezultaty otrzymamy przymuąc dla każdego β h rozkład ednostany na ustalonym przedziale, np. ( 0; 0), co skłania nas do przypuszczeń, że rozkład niewłaściwy indukue trzypunktowy rozkład a priori dla efektów krańcowych, t. o nawiększe masie prawdopodobieństwa wokół zera, a następnie w ogonach rozkładu. Dla zeroedynkowych zmiennych obaśniaących prawdopodobieństwo a priori, że η tk ( 0,5; 0,5) wynosi od 0, do 0,5 i nie zależy od s. W przypadku zmiennych ciągłych prawdopodobieństwo, że η tk ( 0,75; 0,75) 9

est niższe i waha się między 0,03 a 0,05. Natomiast rozkłady a posteriori, w zależności od informaci zawarte w danych, mogą istotnie różnić się co do kształtu i położenia w stosunku do rozkładów a priori. Przykładowo, w przypadku typowego klienta położenie rozkładu a posteriori efektu krańcowego względem okresu kredytowania wskazue, że dane nie wnoszą inne informaci niż rozkład a priori. Oznacza to brak wpływu a posteriori te zmienne na prawdopodobieństwo zakwalifikowania kredytu tego klienta do pierwsze kategorii należności (p t ). Natomiast zmienne wpływy i pośrednik silnie modyfikuą informacę a priori, więc rozkłady a posteriori są zlokalizowane kilka odchyleń standardowych na lewo lub prawo od zera. Następnie, zgodnie z intuicą wnioskowanie o typowym kredytobiorcy est precyzyniesze niż o hipotetycznym (młodym biznesmenie), co przeawia się dużym rozproszeniem rozkładów a posteriori tego ostatniego klienta. Rysunek 3. Rozkłady a priori efektu krańcowego względem zmienne pośrednik w zależności od s Pośrednik - -0,75-0,5-0,5 0 0,5 0,5 0,75 Rysunek 4. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) efektów krańcowych η dla = względem wybranych zmiennych dla typowego klienta 0

Rysunek 5. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) efektów krańcowych η dla = względem wybranych zmiennych dla młodego biznesmena Szczegółowe charakterystyki rozkładów a posteriori efektów krańcowych w badanym modelu przedstawiaą tabele, 3 i 4. Udzielenie kredytu konsumpcynego bezpośrednio przez bank (Pośrednik = 0) powodue u typowego klienta wzrost o 0,7 (z błędem ±0,04) prawdopodobieństwa zakwalifikowania kredytu do pierwsze kategorii (p t ) oraz spadek prawdopodobieństwa średnio o 0,06 w przypadku pozostałych kategorii należności ceteris paribus. Wzrost ego wpływów o tys. zł na kwartał powodue wzrost p t o 0,006. Udzielenie kredytu konsumpcynego (typ = ) zamiast hipotecznego zmniesza p t o prawie 0,03. Rola pozostałych zmiennych, z wyłączeniem wieku, posiadania kart, okresu i waluty kredytu, est istotna, ale niewielka z punktu widzenia ryzyka kredytowego. W przypadku młodego biznesmena wpływ zmiennych pośrednik i wpływy na p t est silnieszy niż u typowego klienta. Przyznanie kredytu przez pośrednika zmniesza p t o 0,30 (±0,05) i ednocześnie zwiększa o 0,6 (±0,03) prawdopodobieństwo zakwalifikowania go do należności straconych (p t4 ). Szanse przynależności kredytu od pośrednika do drugie i trzecie kategorii wzrastaą o 0,05 i 0,09. Wzrost kwartalnych wpływów o tys. zł zwiększa p t o 0,05 (±0,006) i ednocześnie zmniesza p t4 o 0,0 (±0,005). Dla 0-letniego klienta wiek est dodatkowym czynnikiem ryzyka. Z roku na rok szanse uznania ego kredytu ako należności normalnych rosną o 0,006, zaś ako należności stracone maleą o 0,004. Wysoka wartość efektu względem zmienne karty odzwierciedla brak zaufania banku do klienta, któremu nie udzielono kart płatniczych i kredytowych (karty=0) z powodu zbyt niskich lub nieregularnych wpływów bądź braku rachunku ROR. Duże znaczenie ma też waluta kredytu, tzn. kredyt w walucie obce zwiększa p t o 0,44 (±0,6), zaś zmniesza p t o 0,0 (±0,04) i p t3 o 0,4 (±0,05) oraz p t4 o 0,0 (±0,08). Wpływ zmienne typ kredytu est nieistotny, ale wskazue, iż udzielnie pożyczki bądź kredytu hipotecznego, które są naczęście w walucie obce, racze zwiększa prawdopodobieństwo regularne spłaty rat i odsetek. W uzupełnieniu Tabela 4 zawiera uśrednione po wszystkich obserwacach wartości efektów krańcowych. Zauważmy, że eżeli kwartalne wpływy na rachunek ROR wzrosną o tys. zł (ceteris paribus), to prawdopodobieństwo terminowe spłaty kredytu konsumpcynego (p t ) wzrośnie średnio o prawie 0,03 (±0,003), a prawdopodobieństwo opóźnienia w spłacie od do 3 miesięcy (p t ) obniży się o 0,004, opóźnienia od 3 do 6 miesięcy (p t3 ) spadnie prawie o 0,007, zaś prawdopodobieństwo opóźnienia dłuższego niż 6 miesięcy (p t4 ) obniży się o 0,0 (±0,00). Ponadto wraz z wydłużeniem o eden rok okresu kredytowania prawdopodobieństwo terminowe spłaty rat wzrośnie o 0,0 (±0,0), zaś szansa całkowitego

zaniechania spłaty spadnie o 0,0. Wraz ze wzrostem o tys. zł kwoty udzielnego kredytu szanse zakwalifikowania go do należności normalnych maleą o 0,004 (±0,00), zaś do należności straconych rosną o prawie 0,00 (±0,00). Korzystanie przez kredytobiorcę z kart płatniczych i kredytowych est przeawem większego zaufania banku, p t wzrasta o 0, i ednocześnie p t4 malee o 0,05. Udzielenie kredytu poprzez pośrednika także istotnie zwiększa ryzyko kredytowe, tzn. p t malee o 0,7 (±0,0), zaś p t4 rośnie o 0, (±0,0). Przyznanie kredytu konsumpcynego zamiast hipotecznego zmniesza p t o 0,8 (±0,0) oraz zwiększa p t i p t o około 0,05, zaś p t o 0,07. Studenci korzystaący z kredytu studenckiego (zrdoch3) oraz emeryci i renciści (zrdoch) są mnie ryzykownymi kredytobiorcami niż klienci zatrudnieni na umowę o pracę. Natomiast klienci prowadzący własną działalność gospodarczą (zrdoch) charakteryzuą się nawiększym ryzykiem kredytowym spośród typów klientów rozważanych ze względu na źródło ich dochodów. Efekty krańcowe względem zmiennych ROR i waluta kredytu charakteryzuą się relatywnie dużymi odchyleniami standardowymi a posteriori szacunku, co wskazue na brak wpływu tych zmiennych na wielkość p t. Reasumuąc, w analizowanych trzech przypadkach efekty krańcowe względem te same zmienne posiadaą identyczne znaki (z wyłączeniem nieistotne zmienne ROR dla biznesmena). Znaki efektów krańcowych względem ustalone zmienne dla p t, p t3 i p t4 są identyczne. Głównymi czynnikami determinuącymi spłatę kredytu są typ, kwota, waluta i sposób ego przyznania oraz wpływy na rachunek ROR klienta. Tabela. Wartości oczekiwane i odchylenia standardowe a posteriori efektów krańcowych w przypadku typowego klienta Kategoria = normalne = poniże standardu = 3 wątpliwe = 4 stracone Zmienna E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) Płeć -0,007 (0,003) 0,003 (0,00) 0,00 (0,00) 0,00 (0,00) Wiek 0,03 (0,03) -0,005 (0,006) -0,004 (0,004) -0,004 (0,004) Wpływy 0,55 (0,06) -0,6 (0,06) -0,7 (0,0) -0,54 (0,06) ROR -0,00 (0,003) 0,004 (0,00) 0,003 (0,00) 0,003 (0,00) Karty 0,007 (0,004) -0,003 (0,00) -0,00 (0,00) -0,00 (0,00) Pośrednik -0,73 (0,038) 0,064 (0,0) 0,056 (0,03) 0,05 (0,03) Typ kredytu -0,030 (0,004) 0,0 (0,00) 0,009 (0,00) 0,009 (0,00) Okres kredytu 0,047 (0,09) -0,09 (0,0) -0,05 (0,009) -0,03 (0,008) Kwota -0,089 (0,040) 0,036 (0,06) 0,08 (0,03) 0,05 (0,0) Waluta -0,087 (0,0) 0,03 (0,035) 0,08 (0,036) 0,08 (0,04) Tabela 3. Wartości oczekiwane i odchylenia standardowe a posteriori efektów krańcowych w przypadku biznesmena Kategoria = normalne = poniże standardu = 3 wątpliwe = 4 stracone Zmienna E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) Płeć 0,09 (0,040) 0,00 (0,00) -0,004 (0,00) -0,05 (0,03) Wiek 0,557 (0,0) 0,00 (0,08) -0,35 (0,045) -0,43 (0,79) Wpływy,478 (0,633) -0,0 (0,076) -0,368 (0,69) -,099 (0,486) ROR 0,0 (0,077) -0,003 (0,005) -0,005 (0,0) -0,004 (0,057) Karty 0,34 (0,70) -0,070 (0,043) -0,09 (0,053) -0,63 (0,08) Pośrednik -0,303 (0,05) 0,048 (0,04) 0,095 (0,06) 0,59 (0,09) Typ kredytu -0,88 (0,93) 0,037 (0,035) 0,06 (0,056) 0,088 (0,6) Okres kredytu 0,57 (0,65) -0,005 (0,08) -0,9 (0,070) -0,384 (0,0) Kwota -0,353 (0,335) 0,003 (0,03) 0,088 (0,086) 0,6 (0,50) Waluta 0,440 (0,63) -0,0 (0,04) -0,4 (0,049) -0,97 (0,08)

Tabela 4. Wartości oczekiwane i odchylenia standardowe a posteriori uśrednionych efektów krańcowych, T t η tk Kategoria = normalne = poniże standardu = 3 wątpliwe = 4 stracone Zmienna E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) Płeć -0,005 (0,003) 0,00 (0,00) 0,00 (0,00) 0,003 (0,00) Wiek 0,35 (0,05) -0,00 (0,005) -0,040 (0,008) -0,075 (0,04) Wpływy,9 (0,53) -0,36 (0,036) -0,685 (0,077) -,44 (0,45) ROR -0,008 (0,04) 0,00 (0,00) 0,00 (0,004) 0,006 (0,009) Karty 0,08 (0,055) -0,08 (0,05) -0,035 (0,08) -0,045 (0,03) Pośrednik -0,73 (0,0) 0,074 (0,003) 0,088 (0,004) 0,0 (0,006) Typ kredytu -0,78 (0,09) 0,049 (0,007) 0,056 (0,006) 0,073 (0,006) Okres kredytu 0,05 (0,3) -0,03 (0,08) -0,059 (0,034) -0,5 (0,06) Kwota -0,45 (0,46) 0,07 (0,04) 0,8 (0,044) 0,6 (0,079) Waluta 0,077 (0,085) -0,04 (0,09) -0,07 (0,04) -0,06 (0,044) Zrdoch 0,05 (0,0) -0,007 (0,00) -0,008 (0,003) -0,00 (0,005) Zrdoch -0,0 (0,006) 0,0 (0,00) 0,007 (0,00) 0,003 (0,003) Zrdoch3 0,9 (0,0) -0,039 (0,004) -0,039 (0,006) -0,04 (0,0) Oszacowany model możemy wykorzystać do celów prognostycznych, czyli prognozowania kategorii należności kredytu udzielonego wybranemu klientowi. Rysunki 6 i 7 przedstawiaą rozkłady a priori i a posteriori prawdopodobieństw zakwalifikowania kredytu konsumpcynego wybranych klientów do edne z czterech kategorii (p t ). Rozkłady a priori p t dla poszczególnych klientów są do siebie bardzo zbliżone. Przymuąc s = 4 (lub większe) otrzymuemy równe szanse a priori, że prawdopodobieństwo zakwalifikowania kredytu do pierwsze kategorii należności est większe niż 0,5 albo mniesze niż 0,5. Mediany a priori dla pozostałych p t są rzędu 0,0 lub mnie i wskazuą, że pozostałe kategorie należności są mało prawdopodobne a priori. Może to pozornie wskazywać na silnie informacyny charakter rozkładu a priori dla p t, gdy =, 3, 4. Z drugie strony, te rozkłady są l-kształtne, więc mediany tych rozkładów są mniesze niż wartości oczekiwane. Rozkłady te są ednak rozproszone, na co wskazuą wartości oczekiwane i odchylenia standardowe (w nawiasie): E[p t ]=0,50 (±0,44), E[p t ]=0, (±0,3), E[p t3 )]=0, (±0,4), E[p t4 ]=0,7 (±0,3). Zatem rozkłady a priori dla p t (=,3,4) mogą być akceptowalne z punktu widzenia posiadane wiedzy o niespłacalności kredytów. Mediana rozkładu a posteriori dla p t typowego klienta wynosi 0,97. W przypadku biznesmena mediany a posteriori p t wynoszą odpowiednio 0,44, 0,4, 0,8 i 0,4 dla =,,4. Dla obu kredytobiorców dane empiryczne silnie zmodyfikowały informacę a priori o p t. Precyza rozkładów a posteriori w stosunku do rozkładów a priori est większa u typowego klienta niż u hipotetycznego biznesmena. 3

Rysunek 6. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) prawdopodobieństwa zakwalifikowania kredytu typowego klienta do poszczególnych kategorii należności Rysunek 7. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) prawdopodobieństwa zakwalifikowania kredytu młodego biznesmena do poszczególnych kategorii należności Spośród czterech rozważanych poniże kredytobiorców namniesze ryzyko kredytowe związane est ze 60-letnią klientką utrzymuącą się z emerytury w kwocie tysiąca złotych netto, które udzielono kredytu hipotecznego. Prawdopodobieństwo terminowe spłaty przez nią rat kapitałowo-odsetkowych est praktycznie równe edności, zob. Tabela 5. Nawiększe ryzyko kredytowe związane est z kredytem konsumpcynym, który został udzielony poprzez pośrednika młodemu biznesmenowi. Prawdopodobieństwo, że będzie on terminowo spłacał kredyt wynosi tylko 0,44 (±0,04), a prawdopodobieństwo opóźnienia spłaty od ednego do 3 miesięcy wynosi 0,4, zaś opóźnienia od 3 do 6 miesięcy 0,8 (±0,0). Natomiast prawdopodobieństwo opóźnienia dłuższego niż 6 miesięcy (czwarta kategoria należności), które powodue obowiązek tworzenia 00% rezerw celowych, wynosi aż 0,4 (±0,03). Istotny, negatywny wpływ korzystania przez bank z usług pośredników kredytowych na ryzyko kredytowe potwierdza analiza 4

typowego klienta. Jeżeli udzielono mu kredytu bezpośrednio przez bank, a zatem ego zdolność kredytowa została szczegółowo zweryfikowana przez pracownika banku, wówczas prawdopodobieństwo dotrzymania przez niego umowy est bardzo wysokie i wynosi ponad 0,97, natomiast prawdopodobieństwo opóźnienia w spłacie dłuższego niż 6 miesięcy est znikome 0,0. Gdyby udzielono mu kredytu poprzez pośrednika, wówczas prawdopodobieństwo zakwalifikowania tego kredytu do pierwsze kategorii obniżyłoby się do poziomu 0,80 (±0,04), zakwalifikowania do drugie wynosiłoby 0,08 (±0,0), do trzecie prawie 0,07 (±0,0), a prawdopodobieństwo całkowitego zaniechania spłaty kształtowałoby się na poziomie 0.06 (±0,0). Zauważmy, że oszacowane wielkości p t dla typowego kredytobiorcy odpowiadaą w przybliżeniu empirycznym udziałom ilości poszczególnych kategorii należności w badanym portfelu kredytów detalicznych. Tabela 5. Prognozy prawdopodobieństwa zakwalifikowania kredytu (p t ) wybranego klienta do poszczególnych kategorii ryzyka Klient Kategoria = = = 3 = 4 Typowy E( y) 0,795 0,077 0,066 0,06 (pośrednik=) D( y) (0,039) (0,03) (0,03) (0,03) Typowy E( y) 0,967 0,03 0,00 0,00 (pośrednik=0) D( y) (0,004) (0,00) (0,00) (0,00) Młody E( y) 0,437 0,4 0,80 0,4 Biznesmen D( y) (0,04) (0,003) (0,0) (0,03) Starsza E( y) 0,99 0,003 0,00 0,003 Pani D( y) (0,006) (0,003) (0,00) (0,00) 5. Podsumowanie Celem artykułu było przedstawienie wielomianowego modelu z rozkładem t Studenta dla kategorii uporządkowanych. W szczególność zaprezentowano bayesowską specyfikacę modelu i ego estymacę przy użyciu metod typu Monte Carlo. W artykule wykorzystano pewne uogólnienie modeli naczęście stosowanych w praktyce, t. modelu probitowego i logitowego. Uogólnienie polegało na wprowadzeniu rozkładu z szersze klasy, t. rozkładu t Studenta z nieznaną liczbą stopni swobody, a także na zastosowaniu w równaniu dla zmienne ukryte z t wielomianu stopnia drugiego względem zmiennych egzogenicznych zamiast zależności liniowe. W przypadku posiadanego materiału empirycznego uzyskane wyniki preferuą model naogólnieszy t Studenta z około 6 stopniami swobody i uzasadniaą potrzebę wprowadzonego uogólnienia. Dokonana analiza wrażliwości wskazue, iż dane empiryczne niosą dużo informaci, które modyfikuą wiedzę a priori zarówno o parametrach, ak efektach krańcowych, a dobór stałych definiuących rozkłady a priori nie ma wpływu na wyniki a posteriori. Z punktu widzenia zarządzania ryzykiem poedynczego kredytu detalicznego wyróżniono determinanty kształtuące prawdopodobieństwo zakwalifikowania kredytu do edne z czterech kategorii należności. Głównymi czynnikami determinuącymi spłatę kredytu były typ, kwota i waluta kredytu oraz sposób ego przyznania (przez pośrednika albo bezpośrednio przez bank) i wpływy klienta. Bibliografia Aitchison J., S. Silvey [957], The Generalization of Probit Analysis to the Case of Multiple Responses, Biometrika, 44, s. 3-40 Albert J., S. Chib [993], Bayesian Analysis of Binary and Polychotomous Response Data, Journal of the American Statistical Association, 88, s. 669-679 5

Gamerman D. [997], Markov Chain Monte Carlo. Stochastic Simulation for Bayesian Inference, Chapman and Hall, London Geweke J. [993], Bayesian Treatment of the Independent Student t Linear Model, Journal of Applied Econometrics, vol. 8, s. 9-40 Geweke J. [996], Monte Carlo Simulation and Numerical Integration: in H. Amman, D. Kendrick and J. Rust (eds.), Handbook of Computational Economics, North-Holland, Amsterdam Koop G. [003], Bayesian Econometrics, Wiley, Chichester. Maddala G.S. [983], Limited Dependent and Qualitative Variables in Econometrics, Cambrigde University Press, Cambrigde McKelvey R.D., W. Zavoina [975], A Statistical Model for the Analysis of Ordinary Level Dependent Variables, Journal of Mathematical Sociology, nr 4, s. 03-0 Marzec J. [003a], Bayesowska analiza modeli dyskretnego wyboru (dwumianowych), Przegląd Statystyczny, t. 50, s. 9-46 Marzec J. [003b], Modele wielomianowe dla kategorii uporządkowanych w badaniu niespłacalności kredytów konsumpcynych, w: Prognozowanie w zarządzaniu firmą (red. P. Dittmann), Prace Naukowe AE we Wrocławiu nr 00, s.43-5 Marzec J. [003c], Bayesowska analiza wielomianowego modelu probitowego dla kategorii uporządkowanych, Folia Oeconomica Cracoviensia, vol. 43-44. s. 63-80 Marzec J. [005], Bayesowski model tobitowy z rozkładem t Studenta w analizie niespłacalności kredytów, Metody ilościowe w naukach ekonomicznych (red. A. Welfe), Wydawnictwo SGH w Warszawie, s. 47-64 Mudholkar G., E. George [978], A Remark on the shape of the logistic distribution, Biometrika, nr 65, s. 667-668. O Hagan A. [994], Bayesian Inference, J. Wiley, New York Osiewalski J. [99], Bayesowska estymaca i predykca dla ednorównaniowych modeli ekonometrycznych, Zeszyty Naukowe Akademii Ekonomiczne w Krakowie, Seria specalna: Monografie, Kraków, nr 00 Osiewalski J. [00], Ekonometria bayesowska w zastosowaniach, Wydawnictwo Akademii Ekonomiczne w Krakowie, Kraków Osiewalski J., J. Marzec [004], Model dwumianowy II rzędu i skośny rozkład Studenta w analizie ryzyka kredytowego, Folia Oeconomica Cracoviensia, vol. 45, s. 63-84 Tierney L. [994], Markov Chains for Exploring Posterior Distributions (with discussion), Annals of Statistics,, s. 70-76 Zellner A. [97], An Introduction to Bayesian Inference in Econometrics, J.Wiley, New York 6