Uogólnienie dychotomicznego modelu probitowego z wykorzystaniem skośnego rozkładu Studenta *

Podobne dokumenty
Pobieranie próby. Rozkład χ 2

Matematyka ubezpieczeń majątkowych r. ma złożony rozkład Poissona. W tabeli poniżej podano rozkład prawdopodobieństwa ( )

BAYESOWSKA ANALIZA WIELOMIANOWEGO MODELU

WNIOSKOWANIE STATYSTYCZNE

DYNAMICZNE MODELE EKONOMETRYCZNE

EKONOMETRIA wykład 2. Prof. dr hab. Eugeniusz Gatnar.

specyfikacji i estymacji modelu regresji progowej (ang. threshold regression).

DYNAMIKA KONSTRUKCJI

BAYESOWSKA ANALIZA MODELI DYSKRETNEGO WYBORU (DWUMIANOWYCH) 1

BADANIE NIESPŁACALNOŚCI KREDYTÓW ZA POMOCĄ BAYESOWSKICH MODELI DYCHOTOMICZNYCH - ZAŁOŻENIA I WYNIKI Wprowadzenie.

DYNAMICZNE MODELE EKONOMETRYCZNE

DYNAMICZNE MODELE EKONOMETRYCZNE

Kombinowanie prognoz. - dlaczego należy kombinować prognozy? - obejmowanie prognoz. - podstawowe metody kombinowania prognoz

MODELOWANIE WŁASNOŚCI SZEREGÓW STÓP ZWROTU SKOŚNOŚĆ ROZKŁADÓW

PROGRAMOWY GENERATOR PROCESÓW STOCHASTYCZNYCH LEVY EGO

BAYESOWSKI MODEL TOBITOWY Z ROZKŁADEM t STUDENTA W ANALIZIE NIESPŁACALNOŚCI KREDYTÓW 1

BAYESOWSKI MODEL DWUMIANOWY OPARTY NA MIESZANCE ROZKŁADÓW NORMALNYCH

Krzysztof Piontek Akademia Ekonomiczna we Wrocławiu. Modelowanie warunkowej kurtozy oraz skośności w finansowych szeregach czasowych

Jacek Kwiatkowski Magdalena Osińska. Procesy zawierające stochastyczne pierwiastki jednostkowe identyfikacja i zastosowanie.

CHEMIA KWANTOWA Jacek Korchowiec Wydział Chemii UJ Zakład Chemii Teoretycznej Zespół Chemii Kwantowej Grupa Teorii Reaktywności Chemicznej

Studia Ekonomiczne. Zeszyty Naukowe Uniwersytetu Ekonomicznego w Katowicach ISSN Nr

DYNAMICZNE MODELE EKONOMETRYCZNE

DYNAMICZNE MODELE EKONOMETRYCZNE

2.1 Zagadnienie Cauchy ego dla równania jednorodnego. = f(x, t) dla x R, t > 0, (2.1)

KURS EKONOMETRIA. Lekcja 1 Wprowadzenie do modelowania ekonometrycznego ZADANIE DOMOWE. Strona 1

Wykład 5 Elementy teorii układów liniowych stacjonarnych odpowiedź na dowolne wymuszenie

METODY STATYSTYCZNE W FINANSACH

Wykład 6. Badanie dynamiki zjawisk

ESTYMACJA KRZYWEJ DOCHODOWOŚCI STÓP PROCENTOWYCH DLA POLSKI

Wyzwania praktyczne w modelowaniu wielowymiarowych procesów GARCH

TESTOWANIE EGZOGENICZNOŚCI ZMIENNYCH W MODELACH EKONOMETRYCZNYCH

Bayesowskie porównanie modeli STUR i GARCH w finansowych szeregach czasowych 1

Ocena efektywności procedury Congruent Specyfication dla małych prób

Wybrane dwuwymiarowe modele dla zmiennych licznikowych w ekonomii 1

2. Wprowadzenie. Obiekt

Politechnika Częstochowska Wydział Inżynierii Mechanicznej i Informatyki. Sprawozdanie #2 z przedmiotu: Prognozowanie w systemach multimedialnych

A C T A U N I V E R S I T A T I S N I C O L A I C O P E R N I C I EKONOMIA XLIII nr 2 (2012)

Metody badania wpływu zmian kursu walutowego na wskaźnik inflacji

Parytet stóp procentowych a premia za ryzyko na przykładzie kursu EURUSD

WYKORZYSTANIE STATISTICA DATA MINER DO PROGNOZOWANIA W KRAJOWYM DEPOZYCIE PAPIERÓW WARTOŚCIOWYCH

WPŁYW WARTOŚCI EKSTREMALNYCH NA ZMIENNOŚĆ STOCHASTYCZNĄ

Anna Pajor Akademia Ekonomiczna w Krakowie

PROGNOZOWANIE I SYMULACJE EXCEL 2 PROGNOZOWANIE I SYMULACJE EXCEL AUTOR: ŻANETA PRUSKA

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

MODELOWANIE EFEKTU DŹWIGNI W FINANSOWYCH SZEREGACH CZASOWYCH

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania. Podstawy Automatyki

Wykład 6. Badanie dynamiki zjawisk

PROGNOZOWANIE I SYMULACJE EXCEL 2 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 2 AUTOR: MARTYNA MALAK

EFEKT DŹWIGNI NA GPW W WARSZAWIE WPROWADZENIE

licencjat Pytania teoretyczne:

Różnica bilansowa dla Operatorów Systemów Dystrybucyjnych na lata (którzy dokonali z dniem 1 lipca 2007 r. rozdzielenia działalności)

Prognozowanie średniego miesięcznego kursu kupna USD

Niezawodność elementu nienaprawialnego. nienaprawialnego. 1. Model niezawodnościowy elementu. 1. Model niezawodnościowy elementu

Sformułowanie Schrödingera mechaniki kwantowej. Fizyka II, lato

Witold Orzeszko Uniwersytet Mikołaja Kopernika w Toruniu

Ewa Dziawgo Uniwersytet Mikołaja Kopernika w Toruniu. Analiza wrażliwości modelu wyceny opcji złożonych

Metody prognozowania: Szeregi czasowe. Dr inż. Sebastian Skoczypiec. ver Co to jest szereg czasowy?

Rys.1. Podstawowa klasyfikacja sygnałów

PROGNOZOWANIE. Ćwiczenia 2. mgr Dawid Doliński

PROGNOZOWANIE I SYMULACJE. mgr Żaneta Pruska. Ćwiczenia 2 Zadanie 1

Ocena płynności wybranymi metodami szacowania osadu 1

Matematyka ubezpieczeń majątkowych r.

KRZYSZTOF JAJUGA Katedra Inwestycji Finansowych i Zarządzania Ryzykiem Akademia Ekonomiczna we Wrocławiu 25 LAT EKONOMETRII FINANSOWEJ

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Matematyka finansowa r. Komisja Egzaminacyjna dla Aktuariuszy. XXXVIII Egzamin dla Aktuariuszy z 20 marca 2006 r.

Daniel Papla Akademia Ekonomiczna we Wrocławiu. Wykorzystanie modelu DCC-MGARCH w analizie zmian zależności wybranych akcji GPW w Warszawie

Elżbieta Szulc Uniwersytet Mikołaja Kopernika w Toruniu. Modelowanie zależności między przestrzennoczasowymi procesami ekonomicznymi

ROCZNIKI INŻYNIERII BUDOWLANEJ ZESZYT 7/2007 Komisja Inżynierii Budowlanej Oddział Polskiej Akademii Nauk w Katowicach

( ) ( ) ( τ) ( t) = 0

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 1. Wojciech Waloszek. Teresa Zawadzka.

Klasyfikacja modeli. Metoda najmniejszych kwadratów

E k o n o m e t r i a S t r o n a 1. Nieliniowy model ekonometryczny

ψ przedstawia zależność

Magdalena Sokalska Szkoła Główna Handlowa. Modelowanie zmienności stóp zwrotu danych finansowych o wysokiej częstotliwości

Silniki cieplne i rekurencje

Zarządzanie Projektami. Wykład 3 Techniki sieciowe (część 1)

MODEL DWUMIANOWY II RZĘDU I SKOŚNY ROZKŁAD STUDENTA W ANALIZIE RYZYKA KREDYTOWEGO *

VII. ZAGADNIENIA DYNAMIKI

Niestacjonarne zmienne czasowe własności i testowanie

Witold Orzeszko Uniwersytet Mikołaja Kopernika w Toruniu. Własności procesów STUR w świetle metod z teorii chaosu 1

Matematyka ubezpieczeń majątkowych r. Zadanie 1. Rozważamy proces nadwyżki ubezpieczyciela z czasem dyskretnym postaci: n

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

OBLICZANIE TERMINU REALIZACJI PRZEDSIĘWZIĘĆ BUDOWLANYCH METODĄ CCPM NA PODSTAWIE MULTIPLIKATYWNEGO MODELU CZASU TRWANIA CZYNNOŚCI

4.2. Obliczanie przewodów grzejnych metodą dopuszczalnego obciążenia powierzchniowego

POMIAR PARAMETRÓW SYGNAŁOW NAPIĘCIOWYCH METODĄ PRÓKOWANIA I CYFROWEGO PRZETWARZANIA SYGNAŁU

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Metody rachunku kosztów Metoda rachunku kosztu działań Podstawowe pojęcia metody ABC Kalkulacja obiektów kosztowych metodą ABC Zasobowy rachunek

Analiza i Zarządzanie Portfelem cz. 6 R = Ocena wyników zarządzania portfelem. Pomiar wyników zarządzania portfelem. Dr Katarzyna Kuziak

Statystyka od podstaw z systemem SAS Dr hab. E. Frątczak, ZAHZiAW, ISiD, KAE. Część VII. Analiza szeregu czasowego

Przemysław Klęsk. Słowa kluczowe: analiza składowych głównych, rozmaitości algebraiczne

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Estymacja stopy NAIRU dla Polski *

UMK w Toruniu ANALIZA ZALEŻNOŚCI MIĘDZY INDEKSEM WIG A WYBRANYMI INDEKSAMI RYNKÓW AKCJI NA ŚWIECIE

KONCEPCJA WARTOŚCI ZAGROŻONEJ VaR (VALUE AT RISK)

WYBRANE TESTY NIEOBCIĄŻONOŚCI MIAR RYZYKA NA PRZYKŁADZIE VALUE AT RISK

DYNAMICZNE MODELE EKONOMETRYCZNE

MAKROEKONOMIA 2. Wykład 3. Dynamiczny model DAD/DAS, część 2. Dagmara Mycielska Joanna Siwińska - Gorzelak

ANALIZA, PROGNOZOWANIE I SYMULACJA / Ćwiczenia 1

1. Szereg niesezonowy 1.1. Opis szeregu

PODSTAWY CHEMII KWANTOWEJ. Jacek Korchowiec Wydział Chemii UJ Zakład Chemii Teoretycznej Zespół Chemii Kwantowej Grupa Teorii Reaktywności Chemicznej

Transkrypt:

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie Jacek Osiewalski, Jerzy Marzec Uogólnienie dychoomicznego modelu probiowego z wykorzysaniem skośnego rozkładu Sudena * 1. Wprowadzenie Najprosszym przypadkiem modelu dla jakościowej zmiennej endogenicznej jes model dwumianowy (dychoomiczny). Opisuje on zależność między prawdopodobieńswem wyboru jednej z dwóch możliwości (oznaczanych umownie jako 0 i 1) a egzogenicznymi zmiennymi objaśniającymi, kóre opisują cechy możliwych alernayw lub indywidualne charakerysyki podmioów podejmujących decyzję. Posać ego modelu jes nasępująca: ( y = 1) = G( x β ) = F( x β ) p Pr 1 dla =1,,T, (1) gdzie β jes wekorem k 1 nieznanych paramerów (β R k ), x =(x 1 x k ) oznacza wekor usalonych warości k zmiennych egzogenicznych (lub ich znanych funkcji), zaś G( ) i F( ) są znanymi funkcjami wiążącymi p, czyli prawdopodobieńswo zaobserwowania sukcesu, z x i β. Funkcja F( ) ma wszyskie własności dysrybuany rozkładu prawdopodobieńswa i określa klasę modelu. Równoważną specyfikację orzymujemy przez wprowadzenie modelu regresji liniowej (ze względu na β) dla ukryych (nieobserwowalnych) zmiennych ciągłych z 1,,z T, kórych znaki deerminują zaobserwowane warości zmiennych y (0 lub 1): z = x y = I β + ε, 1, ) ( z ) = 0, [0, gdy gdy z 0, (2) z < 0, czyli I A (.) jes funkcją charakerysyczną zbioru A. O składnikach losowych ε zakłada się zwykle, że są niezależne i posiadają en sam rozkład o warości oczekiwanej równej zero i jednoskowej wariancji. Jeśli rozkład jes symeryczny, o zapis (1) upraszcza się do bardziej znanego ( y = ) = F( x β ) p Pr 1. Szczegóły doyczące niebayesowskiej esymacji modeli dla danych jakościowych oraz wiele ich zasosowań empirycznych z zakresu ekonomii prezenują m.in. Amemiya (1981, 1985), Maddala (1983) lub Greene (1993). Najbardziej znanymi i powszechnie sosowanymi modelami dwumianowymi są modele probiowy i logiowy, kóre odpowiadają przyjęciu dla ε odpowiednio rozkładu normalnego lub * Praca przygoowana w ramach badań sauowych Akademii Ekonomicznej w Krakowie w roku 2004. 1

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie logisycznego. Innymi, rzadziej sosowanymi, są np. modele krzywej Gomperza, Urbana i rozkładu Burra. Do esymacji ych modeli wykorzysywana jes zwykle meoda największej wiarygodności (MNW). W modelu probiowym i logiowym pokazano, że esymaor MNW dla β jes jednoznacznie określony; wyprowadzono również posać asympoycznej macierzy kowariancji esymaora MNW. Jednym z kierunków uogólnienia modelu probiowego jes przyjęcie dla ε rozkładu Sudena o nieznanej liczbie sopni swobody ν >0, co dopuszcza brak wariancji ( ν 2 ) a nawe warości oczekiwanej zmiennej ε ( ν 1) Klasa rozkładów Sudena zawiera rozkład normalny jako przypadek graniczny ( ν = + ), zaś jak podają Alber i Chib (1993) rozkład logisyczny może być przybliżany przez rozkład Sudena o ok. 7 9 sopniach swobody. A zaem uogólnienie o pozwala esować (choćby w przybliżeniu) empiryczną adekwaność dwóch podsawowych modeli dwumianowych. Jednak zasosowanie MNW w ym przypadku jes niewskazane, ponieważ nie są znane własności esymaora MNW nawe w przypadku klasycznego modelu regresji liniowej ze składnikiem losowym o rozkładzie Sudena z nieznanym paramerem ν. Alber i Chib (1993) zaproponowali specyfikację i esymację bayesowskiego modelu dychoomicznego z rozkładem Sudena. W celu numerycznej aproksymacji brzegowych rozkładów a poseriori ineresujących wielkości wykorzysali algorym Gibbsa, meodę Mone Carlo ypu łańcuchów Markowa (ang. Markov Chain Mone Carlo, MCMC). Marzec (2003a,b,c) wykorzysał o podejście dla zbadania ryzyka pojedynczych umów kredyowych klienów dealicznych dużego banku komercyjnego; wyniki empiryczne wskazywały na zasadność zasosowania ego uogólnienia modelu probiowego, gdyż rozkład a poseriori parameru ν skupiony był w przedziale (1, probiowego czy logisycznego. 3) świadcząc o relaywnie małej adekwaności modelu Wszyskie rzy rozważane rozkłady prawdopodobieńswa (normalny, logisyczny, Sudena) charakeryzują się symerią, różnią się naomias grubością ogonów (szybkością zbieżności dysrybuany do warości granicznych 0 i 1). Proponujemy więc w ej pracy dalsze uogólnienie modelu probiowego, kóre polega na przyjęciu dla ε klasy skośnych rozkładów Sudena. Klasa a ma dwa swobodne dodanie paramery: sopnie swobody ν i współczynnik asymerii γ, kórego kwadra jes równy ilorazowi mas prawdopodobieńswa na prawo i lewo od modalnej. Esymacja paramerów β, ν, γ i ich funkcji możliwa jes na gruncie bayesowskim przy wykorzysaniu meod Mone Carlo ypu łańcuchów Markowa. Asymeryczne rozkłady wielowymiarowe (w ym ypu Sudena) rozważali Fernández, Osiewalski i Seel (1995), naomias szczegółową definicję i formalne własności skośnego rozkładu w przypadku jednowymiarowym podali Fernández i Seel (1998). Auorzy ci zasosowali en rozkład dla składnika losowego w modelu klasycznej regresji liniowej. Z kolei Osiewalski i Pipień 2

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie (1999, 2000) wykorzysali en rozkład w modelach GARCH dla finansowych szeregów czasowych, wykazując jego użyeczność w badaniach empirycznych. W niniejszej pracy pokażemy, jak zasosować dysrybuanę skośnego rozkładu w modelu dychoomicznym (część 2), jak przeprowadzić jego analizę bayesowską (część 3) oraz jak e propozycje meodologiczne wykorzysać w badaniu spłacalności kredyów (część 4). Część 5 zawiera uwagi końcowe. 2. Dysrybuana skośnego rozkładu w konsrukcji modelu dwumianowego Przyjmijmy, że składnik losowy ε w równaniu (2) ma skośny rozkładu Sudena o modalnej równej 0, jednoskowej precyzji, ν sopniach swobody (ν >0) i paramerze asymerii γ > 0; jego funkcja gęsości ma posać: 2 p ( θ )= f ( ε ν γ ) { f ( γε ) I ( )( ε ) + f ( ε γ ) I [ )( ε )} ε sks, = ν,0 ν 0, +, (3) 1 γ + γ gdzie θ = (β ν γ ), zaś fν ( ε ) jes funkcją gęsości symerycznego rozkładu Sudena o zerowej modalnej, precyzji równej jeden i ν sopniach swobody. Sopień asymerii określony jes przez kwadra parameru γ : Pr Pr ( ε 0γ ) ( ε < 0γ ) 2 = γ. (4) Wielkość γ 2 informuje o ilorazie mas prawdopodobieńswa skupionych na prawo i na lewo od modalnej. Jeżeli paramer asymerii γ równy jes jedności, o rozkład jes symeryczny. Pr Ze specyfikacji (2) wynika, że prawdopodobieńswo zaobserwowania y =1 wynosi ( y = 1θ ) = Pr( z 0θ ) = Pr( ε x β θ ) = 1 Pr( ε < x β θ ) = 1 F ( x β ν, γ ) gdzie dysrybuana skośnego rozkładu Sudena o modalnej 0, precyzji 1, ν sopniach swobody i paramerze asymerii γ (obliczona w punkcie a) wyraża się formułą F sks 2 γ γ ( aν, γ ) γ F ( aγ ) I ( ) ( a) + + γf ( aγ ) I [ )( a) = + γ + γ sks, (5) ν,0 ν 0, (6) 2 przy czym F ν ( a) jes dysrybuaną symerycznego rozkładu Sudena o modalnej 0, precyzji 1 i ν sopniach swobody. Rysunek 1 przedsawia przebieg dysrybuan skośnych rozkładów Sudena w zależności od różnych warości paramerów ν i γ (na le dysrybuany rozkładu normalnego, odpowiadającej ν = + i γ =1). Warość dysrybuany w zerze jes funkcją parameru γ i wynosi 0.5 ylko dla γ =1. Rysunek 1 3

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie Wzór (5) określa rozkład pojedynczej obserwacji (przy danych paramerach) jako rozkład dwupunkowy o funkcji prawdopodobieńswa: ( y θ ) F ( x β ν, γ ) I { } ( y ) + [ 1 F ( x β ν γ )] I { } ( y ) p sks 0 sks, 1 =. W przypadku T niezależnych obserwacji ich łączne prawdopodobieńswo można zapisać jako: p = 1 T sks sks = 1 : y = 0 : y = 1 T ( yθ ) p( y, K, y θ ) = p( y θ ) = F ( x β ν, γ ) ( 1 F ( x β ν, γ ). Przy usalonych obserwacjach, powyższa formuła określa funkcję wiarygodności dla modelu dychoomicznego proponowanego w ej pracy. Funkcja a ma ważną własność rakowana jako funkcja argumenu ν (przy pozosałych usalonych) bardzo szybko zmierza do dodaniej sałej równej warości wiarygodności przy (skośnym) rozkładzie normalnym ( ν = + ). Ta prakyczna sałość wiarygodności dla dużych ν może być poważną przeszkodą w klasycznej esymacji paramerów modelu dwumianowego. Oczywiście, ę samą własność ma już funkcja wiarygodności w modelach z symerycznym rozkładem Sudena. Auorzy nie znają żadnej pracy określającej własności esymaora MNW w akich przypadkach. Własne, wsępne badania symulacyjne ukazują jego znaczne, sysemayczne obciążenie. 3. Elemeny analizy bayesowskiej Podsawowym elemenem analizy bayesowskiej jes saysyczny model bayesowski, czyli łączny rozkład obserwacji i paramerów, określony przez dyskreny warunkowy rozkład wekora obserwacji y, p ( yθ ), i ciągły brzegowy rozkład wekora paramerów (zw. rozkład a priori). Częso wykorzysuje się uogólniony model bayesowski, w kórym rozkład a priori jes miarą σ skończoną, ale nie jes miarą probabilisyczną. Podobnie w ej pracy zakładamy, że brzegowy rozkład a priori wekora β jes niewłaściwy jednosajny na całej przesrzeni R k. Dla ν i γ przyjmujemy rozkłady właściwe: dla ν wykładniczy o warości oczekiwanej r (r=10), zaś dla γ sandardowy rozkład logarymiczno-normalny. Z uwagi na o, że zbiory dopuszczalnych warości paramerów ν i γ są równe R +, waro dokonać reparameryzacji θ k+1 = ln(ν /r), θ k+2 = ln(γ) i redefiniować wekor wszyskich paramerów jako θ = [β θ k+1 θ k+2 ]. Wówczas przesrzeń paramerów jes całym zbiorem R k+2, co bardzo upraszcza sronę numeryczną analizy bayesowskiej. Dla ak określonego θ mamy nasępującą srukurę a priori: p( θ ) = p( β ) p( θk + 1 ) p( θk +2 ), gdzie k ( ) c β R, p( θ ) = exp( θ ) exp( exp( θ )), p( θ ) f ( θ 0, 1). p β = dla k + 1 k + 1 k + 1 k+ 2 = N k + 2 (7) 4

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie W szczególności wykładniczy rozkład a priori dla ν (o warości oczekiwanej r) prowadzi do rozkładu warości eksremalnych (rozkładu Gumbela) dla θ k+1 = ln (ν / r), zaś informacja o paramerze skośności jes reprezenowana przez sandaryzowany rozkład normalny dla ln(γ ). Określona powyżej srukura a priori reprezenuje bardzo słabą wsępną wiedzę obserwaora o paramerach. Prowadzi ona, wraz z modelem próbkowym zdefiniowanym w poprzedniej części, do pełnego modelu bayesowskiego określonego przez uogólnioną gęsość posaci p( y, θ ) = p( yθ ) p( θ ) = p( θ ) F (, ) sks x β ν γ ( 1 FskS ( x β ν, γ )). (8) : y = 0 : y = 1 Wnioskowanie bayesowskie wykorzysuje fakoryzację ego modelu na rozkład a poseriori, j. rozkład ciągły o funkcji gęsości: ( θ ) FskS ( x β ν, γ ) ( 1 FskS ( x β ν, γ )) p( yθ ) p( θ ) p( θ y) = p, p( y) : y = 0 : y = 1 oraz brzegowy rozkład obserwacji (dyskreny): Θ p( y) = p( yθ ) p( θ ) dθ. Aby fakoryzacja a była możliwa (i ym samym isniał rozkład a poseriori), powyższa całka musi być skończona. Dlaego przyjęo właściwy rozkład a priori parameru sopni swobody. Zbieżność funkcji wiarygodności przy ν + do dodaniej sałej oznacza bowiem, że całka ej funkcji (po całej przesrzeni paramerów) jes nieskończona, więc niewłaściwy jednosajny rozkład a priori dla ν prowadziłby do braku rozkładu a poseriori. Rozkład a poseriori paramerów proponowanego (jak i każdego innego) modelu dwumianowego jes niesandardowym rozkładem wielowymiarowym. Ponado, przedmioem wnioskowania są nie ylko oryginalne paramery, ale przede wszyskim ich skomplikowane funkcje nieliniowe akie jak: prawdopodobieńswo Pr( y = 1) = F( x β ) p określonego zachowania (wyboru) w * * 1 * przypadku nie obserwowanego obieku o usalonych charakerysykach, efek krańcowy wzrosu h-ej charakerysyki o małą jednoskę; w przypadku ciągłej zmiennej objaśniającej (nie powiązanej z pozosałymi) jes o p x = β f x ), gdzie f jes * * h h ( * β gęsością odpowiadającą dysrybuancie F, definiującej model dychoomiczny u nas jes o gęsość (3); wielkość β h f ( x*β ) szacujemy również dla dyskrenych zmiennych objaśniających, choć raci ona wedy swą pierwoną inerpreację. Uzyskanie brzegowej funkcji gęsości a poseriori dla wielkości będącej przedmioem analizy jes złożonym problemem całkowania w przesrzeni (k+2)-wymiarowej. Proponujemy w ym celu 5

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie zasosowanie meod Mone Carlo ypu łańcuchów Markowa (MCMC), a w szczególności losowania Meropolisa i Hasingsa. Meody MCMC polegają na ym, że ciąg kolejnych losowań w przesrzeni paramerów ( 1) ( n) ( θ,..., θ,...) worzy łańcuch Markowa (o nieprzeliczalnej liczbie sanów) z rozkładem sacjonarnym równym rozkładowi a poseriori p(θ y). W efekcie, po osiągnięciu zbieżności łańcucha do rozkładu sacjonarnego, generujemy realizacje (orzymujemy próbę) z rozkładu a poseriori; zob. np. O Hagan (1994), Gamerman (1997). Algorym Meropolisa i Hasingsa buduje łańcuch Markowa poprzez zadanie θ (0) arbiralnego punku sarowego oraz gęsości q( θ ; θ ) rozkładu losowań kandydackich θ * (m=1,2,...); dla danego θ (m-1) przyjmujemy θ (m) = θ z prawdopodobieńswem P(θ,θ (m-1) ), θ (m) = θ (m-1) z prawdopodobieńswem 1 P(θ,θ (m-1) ), przy czym prawdopodobieńswo akcepacji wylosowanego wsępnie θ * dane jes wzorem * f ( θ ) q( θ ; θ ) P( θ, θ ) = min, 1 ( m), f ( θ ) q( θ ; θ ) gdzie f(θ ) o jądro gęsości rozkładu a poseriori. Dogodny mechanizm losowań wsępnych wykorzysuje q( θ ; θ ) = f ( θ 3, θ,3c ), wielowymiarowy rozkład Sudena o 3 S sopniach swobody, modalnej równej poprzedniemu sanowi łańcucha oraz macierzy precyzji akiej, że C jes macierzą kowariancji (równą wsępnej ocenie macierzy kowariancji rozkładu a poseriori). W ym przypadku gęsość rozkładu losowań kandydackich q( θ ; θ ) jes symeryczna względem obu argumenów, więc prawdopodobieńswo akcepacji zależy ylko od ilorazu gęsości a poseriori: * f ( θ ) P( θ, θ ) = min,1 ( m). f ( θ ) W prakyce począkowe S sanów łańcucha Markowa służy uzyskaniu zbieżności (cykle spalone), a nasępne M sanów generowaniu próby z rozkładu sacjonarnego i aproksymacji jego charakerysyk zgodnie z ogólnym wzorem: E S M 1 ( q) [ g( ) y] g( θ ) + q= S + 1 θ. M Wyniki badań empirycznych prezenowanych w nasępnej części uzyskano na podsawie S=10000 cykli spalonych i M=500000 realizacji worzących próbę z rozkładu a poseriori. Kilka krókich łańcuchów wsępnych pozwoliło wcześniej wykalibrować macierz C. 6

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie 4. Badanie spłacalności kredyów Zaprezenowany powyżej bayesowski modelu dwumianowy ze skośnym rozkładem Sudena zasosowano do badania spłacalności kredyów dealicznych w oparciu o dane, kóre wykorzysał wcześniej Marzec (2003a,b,c). Przyjęo, iż zmienna objaśniana y przyjmuje dwie warości, zn. y =1, gdy kredyobiorca na dzień 30.09.2001 miał zaległości w spłacie ra kapiałowo-odsekowych (opóźnienie w spłacie osaniej ray wynosiło więcej niż miesiąc), naomias y =0 w przeciwnym przypadku. Jako poencjalne zmienne wyjaśniające ryzyko pojedynczej umowy kredyowej wprowadziliśmy (jak we wcześniejszych pracach): płeć (zmienna przyjmuje warość 1, jeżeli klienem jes mężczyzna, 0 w przypadku kobiey), wiek kredyobiorcy (w sekach la), wpływy, zn. wielkość kwaralnych wpływów w laach 2000-2001 (w sekach ys. zł) na rachunki ypu ROR kredyobiorcy w badanym banku, posiadanie ROR w analizowanym banku (1 posiada, 0 nie posiada), informację o ym, czy kredyobiorca posiada kary płanicze lub kredyowe wydane przez en bank (1 posiada choć jedną karę płaniczą, 0 nie posiada), sposób udzielenia kredyu (1 poprzez pośrednika kredyowego, 0 bezpośrednio przez rozważany bank), yp kredyu (1 kredy konsumpcyjny, 0 kredy hipoeczny), okres rwania umowy kredyowej (w dziesiąkach la), podsawowe źródło dochodu uzyskiwanego przez kredyobiorcę (zmienne zrdoch), j. umowa o pracę, albo rena lub emeryura, albo własna działalność, umowa o dzieło lub umowa zlecenie, albo inne źródło (np. sypendium). Osania zmienna może przyjmować czery różne warości. Chcąc ją uwzględnić w równaniu regresji z wyrazem wolnym, wprowadziliśmy rzy zmienne zerojedynkowe, a za punk odniesienia przyjęliśmy umowę o pracę (zrdoch1 = zrdoch2 = zrdoch3 = 0); w pozosałych przypadkach: zrdoch1 = 1, gdy źródłem dochodu kredyobiorcy jes rena lub emeryura, zrdoch2 = 1, gdy źródłem dochodu kredyobiorcy jes własna działalność, umowa o dzieło lub umowa zlecenie, zrdoch3 = 1 w przypadku innego źródła dochodu, np. sypendium. Poniżej przedsawiamy wyniki bayesowskiej esymacji modelu dwumianowego I ze skośnym rozkładem Sudena dla zmiennej ukryej na le modelu II (z symerycznym rozkładem Sudena) oraz modelu III (probiowego), kóry jes najczęściej wykorzysywany w prakyce. Tabela 1 zawiera warości oczekiwane i odchylenia sandardowe a poseriori dla paramerów ych modeli. Wszyskie wyniki uzyskano za pomocą algorymu Meropolisa i Hasingsa, przy czym 7

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie wyniki bayesowskie dla modelu III są prawie idenyczne z wynikami uzyskanymi za pomocą MNW. Spodziewaliśmy się akiego rezulau, ponieważ (zgodnie z eorią) w modelu probiowym oceny MNW w przypadku dużej liczby obserwacji można inerpreować jako warości oczekiwane rozkładu a poseriori (przy dość dowolnym ciągłym rozkładzie a priori). Alernaywnym do algorymu Meropolisa i Hasingsa podejściem numerycznym w esymacji modelu II jes wykorzysanie próbnika Gibbsa, co zaproponowali Alber i Chib (1993). Łańcuch Markowa generowany przez algorym Gibbsa wydaje się jednak wolno zbieżny do rozkładu a poseriori w modelu II, prawdopodobnie na skuek bardzo silnej auokorelacji. Wyniki uzyskane przez losowanie Gibbsa w modelu II prezenuje (dla ego samego zbioru danych) Marzec (2003c). Tabela 1 Wyniki uzyskane w modelu I świadczą o dużej asymerii rozkładu ε ; γ 2 0.117 1/9; niespełna 12% masy prawdopodobieńswa rozkładu próbkowego zmiennej ε znajduje się na prawo od zera. Małe odchylenie sandardowe a poseriori dla γ wskazuje, że korzysając z prosego bayesowskiego esu na redukcję modelu (esu Lindleya) musimy dojść do wniosku o pełnej zasadności uogólnienia modelu II (symerycznego Sudena) do modelu I poprzez wprowadzenie asymerii. Warość oczekiwana a poseriori dla sopni swobody ν wynosi około 0.5 w modelu I i 1.4 w modelu II, przy czym małe odchylenia sandardowe wskazują na precyzyjny szacunek parameru ν. Dysrybuany odpowiadające modelom I i II przedsawiono na omawianym już wcześniej Rysunku 1; przyjęe warości swobodnych paramerów o ich warości oczekiwane a poseriori. Uzyskane wyniki oznaczają, iż zakładanie normalności składnika losowego i sosowanie modelu probiowego jes nieuzasadnione w przypadku naszych danych. Również przyjęcie symerycznego rozkładu Sudena nie jes w pełni adekwane, gdyż ważne są nie ylko ogony rozkładu zmiennej ukryej, ale również możliwość jego asymerii. Warości paramerów β i nie są bezpośrednio inerpreowalne, zaś informacje o sile i kierunku wpływu zmiennych egzogenicznych na p (prawdopodobieńswo niespłacalności) uzyskujemy na podsawie efeków krańcowych, kórych warości przedsawia Tabela 2. Tabela 2 Spośród rozważanych jakościowych zmiennych egzogenicznych największy wpływ na prawdopodobieńswo niepłacenia kredyu ma sposób udzielenia ego kredyu; udzielenie go przez pośrednika, zamias bezpośrednio przez bank, powoduje najbardziej znaczący wzros p. Posiadanie ROR oraz uzyskanie kredyu konsumpcyjnego (a nie hipoecznego) również zwiększa p, ale 8

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie znacznie słabiej. Posiadanie kar płaniczych lub kredyowych, jako przejaw akywnego korzysanie z usług badanego banku, zmniejsza ryzyko złego kredyu. Wzros wpływów kwaralnych kredyobiorcy o 1 ys. zł zmniejsza warość p o 0.033 (±0.003). Prawdopodobieńswo niepłacenia kredyu przez osobę sarszą o rok jes mniejsze o prawie 0.001. Wraz ze wzrosem o 1 rok okresu na jaki zosał udzielony kredy, p maleje o ok. 0.003 0.004. Spośród czerech źródeł dochodu największe ryzyko kredyowe związane jes z kredyobiorcą prowadzącym własną działalność gospodarczą. Kredyobiorcami o niższym ryzyku są osoby pobierające emeryurę lub renę, a akże sudenci spłacający kredyy sudenckie, przy czym udział (ilościowy i warościowy) ej osaniej grupy kredyów jes znikomy. Głównym sposobem wykorzysania modeli jes prognozowanie prawdopodobieńswa nieerminowej spłay ra kapiałowo-odsekowych bądź całkowiego zaniechania ich spła. W ym celu rozważamy czery hipoeyczne sylweki kredyobiorców, kórych charakerysykę zawiera Tabela 3. Zauważmy, że rozkłady a poseriori uzyskane dla p w modelach I i II są dość zbliżone (z wyjąkiem sarszej pani ) i różnią się znacznie od wyników z modelu III (probiowego). Jeśli redukcje modelu I do modeli II i (zwłaszcza) III nie są zasadne (jak w przypadku naszych danych), o sosowanie w ocenie ryzyka kredyowego ylko modelu probiowego może prowadzić do błędnych wniosków. Przydaność modelu dwumianowego zależy nie ylko od zachowania sosowanej dysrybuany w ogonach rozkładu, ale również od jej kszału w cenralnej części ego rozkładu. Tabela 3 5. Uwagi końcowe Proponowane uogólnienie modelu probiowego uzależnia kszał dysrybuany F( ) od dwóch dodakowych swobodnych paramerów, odpowiedzialnych za szybkość jej zbieżności do warości granicznych 0 i 1 (czyli za grubość ogonów) oraz za jej warość w punkcie 0. Uogólnienie o, a w szczególności parameryzacja F(0) poprzez wprowadzenie swobodnego parameru asymerii, wydaje się isone z punku widzenia wnioskowania saysycznego, co pokazał przykład empiryczny w poprzedniej części pracy. Problemem owarym pozosaje ocena poprawy dopasowania modelu do danych binarnych i jego własności prognosycznych. Sanowi o przedmio dalszych badań auorów. Skośne rozkłady mogą sanowić podsawę budowy nie ylko modeli dwumianowych, ale akże modeli wielomianowych dla kaegorii uporządkowanych czy modeli dla zmiennych ucięych 9

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie lub cenzurowanych. To prose dwuparamerowe uogólnienie daje możliwość badania empirycznej adekwaności modeli oparych na założeniach symerii i normalności rozkładu zmiennej ukryej, w prakyce najczęściej przyjmowanych. Akademia Ekonomiczna w Krakowie LITERATURA [1] Alber J. Chib S., 1993, Bayesian analysis of binary and polychoomous response daa, JASA (Journal of he American Saisical Associaion) vol. 88, 669-679. [2] Amemiya T., 1981, Qualiaive response models: A survey, Journal of Economic Lieraure vol.19, 1483-1536. [3] Amemiya T., 1985, Advanced Economerics, Harvard Universiy Press, Cambridge (Massachuses). [4] Fernández C., Osiewalski J., Seel M., 1995, Modeling and inference wih υ-spherical disribuions, JASA (Journal of he American Saisical Associaion) vol. 90, 1331-1340. [5] Fernández C., Seel M., 1998, On Bayesian modeling of fa ails and skewness, JASA (Journal of he American Saisical Associaion) vol. 93, 359-371. [6] Gamerman D., 1997, Markov Chain Mone Carlo. Sochasic Simulaion for Bayesian Inference, Chapman and Hall, London. [7] Greene W.H., 1993, Economeric Analysis, Macmillan, New York. [8] Maddala G.S., 1983, Limied Dependen and Qualiaive Variables in Economerics, Cambridge Universiy Press, Cambridge. [9] Marzec J., 2003a, Badanie niewypłacalności kredyobiorcy na podsawie modeli logiowych i probiowych, Zeszyy Naukowe Akademii Ekonomicznej w Krakowie nr 628, 103-117. [10] Marzec J., 2003b, Badanie niespłacalności kredyów za pomocą bayesowskich modeli dychoomicznych - założenia i wyniki, Meody ilościowe w naukach ekonomicznych (red. A. Welfe), Wydawnicwo SGH w Warszawie, 73-86. [11] Marzec J., 2003c, Bayesowska analiza modeli dyskrenego wyboru (dwumianowych), Przegląd Saysyczny. 50, 129-146. [12] O Hagan A., 1994, Bayesian Inference, Edward Arnold, London. [13] Osiewalski J., Pipień M., 1999, Bayesian forecasing of foreign exchange raes using GARCH models wih skewed condiional disribuions, MACROMODELS'98 - Conference Proceedings (red. W. Welfe), Vol. 2, Absolwen, Łódź, 195-218. [14] Osiewalski J., Pipień M., 2000, GARCH-In-Mean hrough skewed condiional disribuions: Bayesian inference for exchange raes, MACROMODELS'99 Conference Proceedings (red. W. Welfe, P. Wdowiński), Absolwen, Łódź, 354 369. 10

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie Rysunek 1. Dysrybuany wybranych rozkładów ypu Sudena. 1 0.8 0.6 0.4 0.2 0 -Suden γ=0.34 ν=0.53 -Suden γ=1 ν=0.53 -Suden γ=1 ν=1.37 normalny -10-5 0 5 10 Źródło: obliczenia własne. Tabela 1. Warości oczekiwane i odchylenia sandardowe a poseriori paramerów. Model I Model II Model III ε ~ S(0, 1, ν, γ) ε ~ S(0, 1, ν, γ=1) ε ~S(0,1,ν=, γ=1) Zmienna (paramer) E( y) D( y) E( y) D( y) E( y) D( y) Sała -0.272 0.550-3.363 0.860-1.006 0.097 Płeć 0.152 0.067 0.003 0.027 0.041 0.018 Wiek -1.992 0.358-1.200 0.129-0.865 0.085 Wpływy -70.261 7.422-94.050 11.314-1.757 0.186 ROR 1.409 0.189 1.446 0.189-0.290 0.038 Kary -0.272 0.110-0.391 0.147-0.175 0.034 Pośrednik 3.197 0.370 2.196 0.134 1.290 0.032 Typ Kredyu 1.084 0.513 1.773 0.826 0.022 0.080 Okres kredyu -0.733 0.256-0.719 0.096-0.185 0.054 Zrdoch1-0.752 0.203-0.135 0.040-0.092 0.029 Zrdoch2 0.734 0.192 0.010 0.082 0.319 0.040 Zrdoch3-1.334 0.263-0.470 0.156-0.187 0.077 ν 0.530 0.051 1.372 0.088 - - γ 0.342 0.021 - - - - Źródło: obliczenia własne. 11

Jacek Osiewalski Jerzy Marzec, Kaedra Ekonomerii i Badań Operacyjnych, Uniwersye Ekonomiczny w Krakowie Tabela 2. Warości oczekiwane i odchylenia sandardowe a poseriori uśrednionych efeków krańcowych T β h f ( x β ). Model I Model II Model III ε ~ S(0, 1, ν, γ) ε ~ S(0, 1, ν, γ = 1) ε ~S(0,1,ν =, γ =1) Zmienna (x h ) E( y) D( y) E( y) D( y) E( y) D( y) Płeć 0.007 0.003 0.0004 0.0035 0.008 0.003 Wiek -0.094 0.020-0.155 0.016-0.171 0.017 Wpływy -3.297 0.314-12.140 1.240-0.347 0.037 ROR 0.066 0.008 0.187 0.022-0.057 0.008 Kary -0.013 0.005-0.050 0.019-0.035 0.007 Pośrednik 0.149 0.004 0.284 0.013 0.255 0.006 Typ Kredyu 0.050 0.022 0.229 0.105 0.004 0.016 Okres kredyu -0.035 0.014-0.093 0.012-0.037 0.011 Zrdoch1-0.035 0.006-0.017 0.005-0.018 0.006 Zrdoch2 0.034 0.008 0.001 0.011 0.063 0.008 Zrdoch3-0.062 0.009-0.061 0.020-0.037 0.015 Źródło: obliczenia własne. Tabela 3.Warości oczekiwane i odchylenia sandardowe a poseriori prawdopodobieńswa niespłacenia kredyu p =Pr(y =1)=1 F( x β). najczęsszy klien młody sarsza Zmienna pośrednik=1 pośrednik=0 biznesmen pani 1 (wyraz wolny) 1 1 1 1 Płeć 1 1 1 0 Wiek (w laach) 40.2 40.2 21 60 Wpływy (w ys. zł) 10.2 10.2 0 1 ROR 1 1 0 1 Kary płanicze 0 0 0 1 Pośrednik 1 0 1 0 Typ kredyu: konsumpcyjny 1 1 1 0 Okres kredyu (w laach) 2.61 2.61 2.61 2.61 Zrdoch1 0 0 0 1 Zrdoch2 0 0 1 0 Zrdoch3 0 0 0 0 Model I E(p y) 0.023 0.015 0.547 0.027 D(p y) (0.002) (0.001) (0.013) (0.004) Model II E(p y) 0.020 0.015 0.559 0.049 D(p y) (0.001) (0.001) (0.028) (0.011) Model III E(p y) 0.303 0.036 0.668 0.017 D(p y) (0.014) (0.002) (0.015) (0.003) Źródło: obliczenia własne. 12