erzy Marzec BAYESOWSKI MODEL DWUMIANOWY OPARTY NA MIESZANCE ROZKŁADÓW NORMALNYCH. Wprowadzenie Spośród ekonomerycznych modeli danych akościowych nabardzie znanymi są model logiowy i probiowy. W lieraurze proponue się specyfikace z innymi ypami rozkładów (zob. Maddala [983]), ale w badaniach empirycznych e pierwsze są powszechnie sosowane. Modele logiowy i probiowy, zarówno w przypadku dychoomiczne zmienne endogeniczne, ak i zmienne wielomianowe, są bardzo dobrze opisane w lieraurze, ich własności są zbadane, a esymaca meodą nawiększe wiarygodności (MNW) es dosępna w wielu programach saysycznych. Geweke i Keane [999] zwracaą uwagę, że podsawowym modelem danych akościowych es model probiowy, gdyż w przypadku kaegorii nieuporządkowanych umożliwia uwzględnienie korelaci między parami alernayw (wyborów). Naomias wielomianowy model logiowy zosał poddany kryyce przez McFaddena [984], gdyż zakłada niezależność ilorazu szans dwóch alernayw od pozosałych wyborów (ang. independence from irrelevan alernaives) zob. akże Amemiya [985], Maddala [983]. ednym z możliwym kierunków uogólnienia modeli danych akościowych es sosowanie szersze klasy rozkładów dla składnika losowego, np. w formie mieszanek rozkładów. Błędy specyfikaci na eapie założeń odnośnie srukury sochasyczne prowadzą do niezgodnych esymaorów paramerów srukuralnych. Wykorzysywanie modelu probiowego czy logiowego, gdy prawdziwy rozkład es inny niż przyęo, może prowadzić do błędnego wnioskowania m.in. o prawdopodobieńswach zaobserwowania poszczególnych wyborów i efekach krańcowych. Modele saysyczne opare na mieszankach rozkładów saysycznych znane są od końca XIX wieku, dzięki pracy Karla Pearsona [894]. Naczęście sosue się skończone mieszanki rozkładów normalnych. Ich zasosowanie, ako aproksymaci nieznane posaci rozkładu dla składnika losowego, pozwala uwzględnić akie własności ak: wielomodalność, asymerię oraz zachowanie się rozkładu w ooczeniu warości modalne (wyosrzenie albo spłaszczenie w odniesieniu do rozkładu normalnego). Sąd cieszą się one dużym zaineresowaniem. Roeder i Wassermann [997] prezenuą 0 możliwych ypów kszałów rozkładów, kóre można uzyskać z ych mieszanek. Diebol i Rober [994] uważaą, że e modele sanowią ineresuącą alernaywę dla modeli nieparamerycznych, gdyż w ramach swe klasy przymuą słabe założenia doyczące składnika losowego. Zaem mieszanki daą szeroki wachlarz możliwości, gdy klasyczne założenia nie są spełnione, np. w syuaci nieednorodne próby, wysępowania heeroscedasyczności ip. Maą one szczególne znaczenie wówczas, gdy isony es dobór odpowiednie posaci rozkładu dla składnika losowego. Z drugie srony, choć mieszanki są arakcyne z punku widzenia własności, o ich parameryczna analiza saysyczna nie es ława, zwłaszcza od srony obliczeniowe. Problemy wynikaą ze skomplikowane posaci funkci wiarygodności i konieczności uwzględnienia resrykci na paramery zapewniaących idenyfikowalność. Aikin [00] zwraca uwagę, że przy specyficzne konsrukci danych funkca wiarygodności mieszanki może być nawe nieograniczona. Ten problem (infinie spike) może mieć
miesce szczególnie, gdy liczba obserwaci es niewiele większa od liczby składników mieszanki. Wówczas isniee niezerowe prawdopodobieńswo, że próba nie niesie informaci o ednym ze składników mieszanki; zob. akże Marin, Mengersen i Rober [005]. W celu parameryczne esymaci modeli mieszanek proponue się rzy podsawowe meody: MNW, algorym EM (Expecaion Maximizaion) (Dempser, Laird i Rubin 977] oraz Mone Carlo opare na łańcuchach Markowa (MCMC Mone Carlo Markov Chain). Ta osania odgrywa isoną rolę we wnioskowaniu bayesowskim, gdyż es skuecznym narzędziem numerycznego całkowania, zob. Tierney [994]. Bayesowska esymaca modeli regresi z mieszanką es omawiana m.in. w pracach: Diebol i Rober [994], Richardson i Green [997], Roeder i Wassermann [997], Celeux, Hurn i Rober [000], Aikin [00], Frühwirh-Schnaer [00], asra, Holmes i Sephens [005], Marin, Mengersen i Rober [005], Geweke [007]. Wielu z ych auorów podkreśla, że powórne i szerokie zaineresowanie modelami mieszanek, znanymi przecież od wielu dziesiąek la, es spowodowane rozwoem i upowszechnianiem się meod MCMC, kóre (dzięki rozwoowi informayki) czynią wnioskowanie bayesowskie użyecznym i elasycznym podeściem w przypadku nawe bardzo skomplikowanych modeli. W naukach przyrodniczych i inżynierskich mieszanki maą szerokie zasosowanie, a obszerną lisę aplikaci można znaleźć w monografii Tieringon, Schmid i Makov [985]. W ekonomii wykorzysue się e w akich dziedzinach ak np.: markeing (edidi [997], Allenby, Leone i en [999]), makroekonomia (Hamilon [989], Lesage [99], So, Lan i Li [998], Frühwirh-Schnaer [00]), finanse (Dueker [999], Liesefeld [00]). Bardzo częso znaduą one zasosowanie w badaniach empirycznych, kóre opieraą się na ekonomerycznych modelach regresi przełącznikowe; zob. Quand i Ramsey [978] oraz wykaz lieraury w pracy Geweke [007]. Naomias niewiele es opracowań, w kórych rozważano by modele zmiennych akościowych wykorzysuąc skończone mieszanki rozkładów normalnych. Erkanli, Sang i Müller [993] oraz Frühwirh-Schnaer i Frühwirh [007] wykorzysali mieszanki w analizie modeli wielomianowych, Geweke i Keane [999] oraz Qu i Qu [000] w modelu dwumianowym, zaś Ausin i Escobar [003] w modelu obiowym. Na uwagę zasługue fak, że w ych pracach sosue się wyłącznie wnioskowanie bayesowskie, kóre umożliwia pełną analizę saysyczną modeli z nieobserwowalnymi zmiennymi ukryymi. Celem ninieszego arykułu es prezenaca modelu dwumianowego (dla binarne zmienne endogeniczne) oparego na skończone mieszance rozkładów normalnych. Rozważamy przypadek mieszanek dwuskładnikowych, kórych esymaca zosanie zrealizowana w ramach podeścia bayesowskiego. To podeście es szczególnie uzasadnione zwłaszcza w syuaci, gdy badacz posiada silną wiedzę a priori o paramerach. W ym przypadku wynika ona z konieczności narzucenia resrykci zapewniaących idenyfikowalność paramerów rozważanych modeli. Ponado na gruncie bayesowskim możliwa es pełna prezenaca i porównanie niepewności doyczące badane wielkości, zarówno przed zaobserwowaniem zawiska w formie rozkładu a priori, ak po wglądzie w dane poprzez rozkład a poseriori. Zaem omówimy dobór rozkładów a priori, kóry es ważnym i rudnym zagadnieniem w e klasie modeli. W lieraurze, w przypadku modeli regresi oparych na mieszankach, ako numeryczną meodę uzyskiwania rozkładów a poseriori proponue się przede wszyskim schema Gibbsa; zob. Geweke [007]. Naomias Celeux, Hurn i Rober [000] poddaą kryyce ego sosowanie. W przypadku modelu dwumianowego, gdy próba es dużo, sosowanie próbnika Gibbsa es czasochłonne. Z ego eż powodu wykorzysaliśmy algorym Meropolisa i Hasingsa. Wprowadzone uogólnienie w posaci mieszanki zosanie poddane esowaniu, przy czym alernaywnymi specyfikacami będą: sandardowy model probiowy, model Sudena o nieznane liczbie sopni swobody oraz model opary na modyfikaci rozkładu Sudena o nieznane liczbie sopni swobody, kóry dopuszcza asymerię; zob. Marzec [006], Osiewalski i Marzec [004]. Zasosowanie mieszanki rozkładów zilusruemy przykładem z bankowości. Model dwumianowy zosanie oszacowany na podsawie informaci o decyzach kredyobiorców odnośnie spłay kredyów dealicznych. Inencą auora es zaprezenowanie możliwości wykorzysania e klasy modeli dychoomicznych w scoringu kredyowym. Wydae się o być ineresuąca, z punku widzenia meodycznego, alernaywa dla akich radycynych podeść ak model probiowy czy logiowy.
. Definica modelu i własności Rozważany w arykule model dwumianowy ma posać z = x β + ε () y = I[ 0, ) ( z ), gdzie I ( ω) es funkcą charakerysyczną zbioru, zn. ( ) = Ω I, gdy Ω Ω ω I, eżeli ω Ω, x ω i ( ) = 0 es wekorem k zmiennych egzogenicznych (lub ich znanych funkci) charakeryzuących obserwacę o numerze. Kluczowe założenie polega na przyęciu niezależności idenycznych rozkładów dla składników losowych ε, określonych przez skończoną mieszankę rozkładów normalnych. Rozkład nieobserwowalne zmienne z, kóra reprezenue użyeczność podęe decyzi, es zdeerminowany przez rozkład zmienne ε. W sandardowym modelu probiowym czy logiowym zakłada się, że es o rozkład symeryczny i ednomodalny. Naomias w ym przypadku ego kszał może być całkowicie odmienny, np. wielomodalny lub asymeryczny. Dla skończonych mieszanek funkca gęsości i dysrybuana ednowymiarowe zmienne losowe ε es określona przez wypukłą kombinacę funkci gęsości i dysrybuan składowych. W omawianym przypadku funkca gęsości zmienne losowe ε ma posać gdzie > ( ) = π p ( ε, ) p ε θ, () = es liczbą składników mieszanki, p (, ) Ω ω es funkcą gęsości zmienne losowe o rozkładzie normalnym, o warości oczekiwane i precyzi (odwroności warianci), π są wagami, zn. ( 0;) π i = π =, θ o wekor kolumna zawieraący wszyskie powyższe paramery. Analogicznie, warość dysrybuany zmienne ε w punkcie a wyraża formuła F( a ) = Pr( ε < a) = π F ( a, ) = gdzie F (, ) paramery θ, (3) oznacza warość dysrybuany zmienne o rozkładzie normalnym, określonym przez i. Badaąc własności ych rozkładów można wykorzysać fak, że ak zauważył Pearson [894], momeny zwykłe rzędu r zmienne ε są liniową kombinacą momenów liczonych według rozkładów określonych przez funkce gęsości poszczególnych składników mieszanki,. r [ ] = p r π E [ ε ] E ε. (4) = W konsekwenci zmienną losową określoną przez mieszankę rozkładów normalnych charakeryzue o, że wszyskie e momeny przymuą skończone warości, przy czym nieparzyse momeny cenralne są równe zero. W szczególności warość oczekiwana zmienne ( + ) = = π ε es równa = = π, zaś warianca. Na podsawie formuły (4) można wyprowadzić kurozę i miarę asymerii oparą na momencie cenralnym rzeciego rzędu. Arakcyność e klasy rozkładów polega na ym, że można e sosować w zagadnieniach, w kórych es porzeba uwzględnienia rozkładów wielomodalnych, asymerycznych lub wyosrzonych (eksces>0) albo spłaszczonych (eksces<0) w sosunku do rozkładu normalnego. Naomias nie są one użyeczne przy modelowaniu zawisk, kórych rozkłady charakeryzuą się zw. grubymi ogonami. W ym osanim przypadku zasosowanie ma rozkład Sudena, kóry sanowi nieskończoną mieszankę rozkładów 3
normalnych względem parameru skali, gdy wagi maą rozkład gamma. Szerze o wybranych modelach regresi uzyskiwanych za pomocą nieskończonych mieszanek rozkładów normalnych piszą Fernández i Seel [000]. Isoną cechą modeli oparych na mieszankach es złożoność funkci wiarygodności. Funkca gęsości dla zmienne ciągłe z ma posać p ( z ) = π p( z, ) θ dla =,T, (5) = gdzie θ = [ θ,, ] K θ reprezenue wekor nieznanych paramerów, θ Θ (=,). W przypadku mieszanki normalne mamy = [ π ] rozkład dla z, p ( θ ) z θ. Problemy z esymacą wynikaą z ego, że gdy Θ = K = Θ, o, es niezmienniczy ze względu na permuace składników mieszanki, zob. np. Richardson i Green [997], Celeux, Hurn i Rober [000], Geweke [007], Marin, Mengersen i Rober [005]. W lieraurze en problem nosi nazwę label swiching problem i wynika z prawa przemienności dodawania (warość sumy nie zależy od porządku składników). Zaem koleność składowych mieszanki może być dowolna, a przypisane numery maą charaker umowny. Negaywną ego konsekwencą es wielomodalność funkci wiarygodności, gdyż liczba symerycznych eksremów lokalnych es równa liczbie permuaci zbioru elemenowego (!). Badania symulacyne pokazuą, że im więce obserwaci, ym wielomodalność es bardzie wyraźna; zob. Geweke [007]. es o zgodne z inuicą, gdyż wraz ze wzrosem liczby obserwaci funkca wiarygodności sae się bardzie wyosrzona w ooczeniu eksremum (im mnie obserwaci, ym funkca es bardzie płaska). Zaem bez akichkolwiek resrykci na paramery, model opary na mieszance rozkładów es nieidenyfikowalny. Nawe w naprosszym przypadku próby prose, gdy = i paramery, π są usalone, zaś esymaci podlegaą paramery i, o uzyskue się różne oceny MNW w zależności od doboru punku sarowego. Wielomodalność funkci wiarygodności, uzyskane na podsawie próby wygenerowane przy założeniu = i =, prezenue wykres linii konurowych funkci wiarygodności; zob. Rysunek. Warości pozosałych paramerów usaliliśmy nasępuąco: π = 0,5, =0, =6.667. Eksremum znadue się w dwóch punkach: = i = oraz = i =, w kórych gęsość przymue idenyczną warość. Wysarczaącym warunkiem zapewniaącym idenyfikowalność paramerów es narzucenie resrykci na bądź. Zakłada się, że - <, albo - <, albo rzadzie π - <π dla =,,; zob. Geweke i Keane [999], Koop [005], Geweke [007]. W przypadku analizowanego w arykule modelu dychoomicznego, gdy funkca wiarygodności ma posać ( ) = ( T y p ; y F( xβθ ) F( xβθ) = gdzie ( βθ) y θ, (6) F es dane wzorem (3), wymaga się dodakowo, aby eden ze składników mieszanki miał x usaloną warość parameru rozproszenia, zn. aby isniało akie, że np. = ; zob. Geweke i Keane [999]. es o warunek niezbędny dla idenyfikowalność funkci wiarygodności, bo w przeciwnym przypadku isniałoby nieskończenie wiele kombinaci paramerów, dla kórych funkca wiarygodności osiągałaby idenyczne i maksymalne warości. Wybór es dowolny. 4
Rysunek. Linie konurowe funkci wiarygodności dla próby prose, gdy = i =. Źródło: obliczenia własne. Częso rozważa się szczególne przypadki mieszanki rozkładów normalnych. W modelu z mieszanką względem średnie (ang. mean ure of normals) zakłada się, że = dla każdego oraz - < dla =,,. Zarówno w ym przypadku, ak i w modelu naogólnieszym wygodnie es przyąć, że brak szuczne zmienne, gdyż w przeciwnym przypadku należałoby usalić =0 dla pewnego. Naomias w modelu z mieszanką względem parameru skali (ang. scale ure of normals), gdy = 0 dla każdego i wysępue wyraz wolny, o wymaga się, aby - < dla =,,. Gdyby w ym osanim przypadku nie byłoby wyrazu wolnego, o należałoby założyć, że eden spośród paramerów es swobodny i podlega esymaci. W ninieszym arykule podsawową specyfikacą es model mieszanki zarówno względem parameru położenia, ak i parameru skali, więc przyęliśmy, że w równaniu regresi dla zmienne ukrye z brak es wyrazu wolnego. W zdecydowane części prac doyczących mieszanek liczba ich składowych es usalona, naczęście rozważa się przypadki =, 3 lub 4. Wówczas esowanie konkurencynych modeli można przeprowadzić poprzez zw. bayesowskie kryerium informacyne Schwarza; zob. Roeder i Wassermann [997]. Na uwagę zasługue praca Richardson i Green [997], w kóre przyęo, że liczba składowych es wielkością nieznaną (losową), a nasępnie przedsawiono pełne wnioskowanie bayesowskie, łącznie z wyborem nalepszego modelu. Naomias w ym opracowaniu rozważa się pełną mieszankę dwuskładnikową, zaś esowanie e specyfikaci względem prosszych,. modelu mieszanki względem średnie czy precyzi, albo modelu podsawowego, będzie opierać się na prawdopodobieńswach a poseriori; zob. Geweke i Keane [999], Qu i Qu [000], Ausin i Escobar [003]. Szerze o bayesowskim porównywaniu konkurencynych modeli piszą m.in. O Hagan [994], Osiewalski i Seel [993], Kass i Rafery [995], Osiewalski [00]. 3. Konsrukca rozkładów a priori Bayesowski model saysyczny es ednoznacznie zdefiniowany poprzez łączny rozkład prawdopodobieńswa dla obserwaci i paramerów ( y,θ) p = p( yθ) p( θ), gdzie ( yθ) p o rozkład próbkowy 5
warunkowy względem θ, zaś p ( θ) o brzegowy rozkład paramerów zwany rozkładem a priori. Paramery są rakowane ako wielkości losowe, zaś wsępną o nich wiedzę reprezenue właśnie rozkład a priori. Zasady bayesowskie esymaci paramerów sprowadzaą się do wyznaczenia z rozkładu łącznego, p ( y,θ), warunkowe gęsości dla wekora paramerów θ przy danym y, dane wzorem Bayesa p ( ) ( y, θ) pθ y = L( θ; y) p( θ), (7) p y ( ) gdzie p ( θ;y) es funkcą wiarygodności; zob. np. O Hagan [994], Osiewalski [00], Koop [003]. Rozkład a poseriori es kombinacą rozkładów a priori i próbkowego, zaem niesie on - po zaobserwowaniu danych - pełną informacę o ineresuących charakerysykach opisuących zawisko, w szczególności o paramerach. Wyznaczenie rozkładów a poseriori wg formuły (7) dla poszczególnych składowych wekora θ wymaga całkowania wielokronego, podobnie ak obliczenie wybranych charakerysyk ych rozkładów, np. warości oczekiwanych i warianci (eżeli isnieą). W przypadku omawianych modeli realizue się o wyłącznie za pomocą meod numerycznych. W pierwsze koleności omówimy zagadnienie konsrukci rozkładów a priori. W przypadku modeli oparych na mieszankach wykluczone es sosowanie niewłaściwych rozkładów a priori dla wszyskich paramerów składników mieszanki, i (=,,), gdyż prowadzi o do braku rozkładów a poseriori; zob. Diebol i Rober [994], Roeder i Wassermann [997], Marin, Mengersen i Rober [005]. W lieraurze rwa dyskusa doycząca srukury rozkładów a priori w konekście konieczności uwzględnienia resrykci daących idenyfikowalność. Zgodność badaczy doyczy przede wszyskim rozkładów dla paramerów β i π. W przypadku wekora β przymue się zwykle k-wymiarowy rozkład normalny ( β) = f ( ββ, Η β ) k N p, (8) o warości oczekiwane a priori β i dodanio określone macierz precyzi H β, kóre są usalane przez badacza, zob. Geweke i Keane [999]. Dla nieznanych wag sosue się wielomianowy rozkład bea, czyli rozkład Dirichlea z paramerami π, K,π ( > 0 π dla =,,), kórego funkca gęsości ma posać π π p( π ) = Γ( π + K + π )[ Γ( π ) K Γ( π )] ( π) K ( π ), (9) gdzie Γ ( ) oznacza funkcę gamma; zob. DeGroo [98], Magiera [005]. Brzegowe rozkłady dla π są rozkładami bea. Zwykle przymue się π = dla =,,, więc każda składowa π ma brzegowy rozkład ednosany na przedziale (0; ). W odniesieniu do pozosałych, kluczowych paramerów i, można w lieraurze spokać różne propozyce. Dyskusa skupia się na akim skonsruowaniu rozkładów a priori lub wprowadzeniu odpowiednie reparameryzaci, aby możliwe było uwzględnienie resrykci gwaranuących idenyfikowalność paramerów i ednocześnie e rozkłady nie wnosiły arbiralne wiedzy, kóra nie znadue powierdzenia w danych. Zaem konsrukca rozkładów a priori winna iść w parze z narzuceniem odpowiednich resrykci gwaranuących idenyfikowalność, - <, albo - <, albo π - <π (=,,). Narzucenie resrykci nie es ławe. Po pierwsze, ich uwzględnienie powodue problemy numeryczne, co podnoszą Celeux, Hurn i Rober [000]. Po drugie, szczególnie rudno es dobrać rozkłady dla paramerów, gdyż e przymuą warości z całego zbioru liczb rzeczywisych. A es o konieczne, gdy rozważa się model z mieszanką rozkładów względem średnie. Pewne rozwiązanie w ym zakresie proponue Mengersen i Rober [993] oraz Roeder i Wassermann [997], proponuąc zw. rozkłady a priori ypu Markowa (ang. Markov prior). Dla paramerów precyzi przymue się a priori rozkłady z rodziny gamma, np. chi kwadra lub wykładniczy; zob. Geweke i Keane [999] oraz Roeder, Wassermann [997], Ausin i Escobar [003], Koop [003]. Celeux, Hurn i Rober [000] sosue rozkład wykładniczy dla odchylenia sandardowego ( -0,5 ), co prowadzi do rozkładu dla precyzi charakeryzuącego się nieskończoną warością oczekiwaną i brakiem 6
momenów wyższych rzędów. W przypadku wekora = [ ] K naproście es przyąć -wymiarowy rozkład normalny. Zaem, gdy resrykce narzuca się na paramery precyzi, o p ( ) (, H ) = f N proponue Geweke i Keane [999]. Naomias u Koopa [005] resrykce doyczą ( ) f N ( H ) I ( < < K < ),, ak, więc p, co prowadzi do wielowymiarowego, ucięego rozkładu normalnego, przy czym H nie musi być macierzą diagonalną. W ym arykule rozważamy mieszankę dwuskładnikową (=), więc narzucenie resrykci nie nasręcza problemów, gdy uwzględni się e w rozkładzie a priori dla precyzi; podobnie uczynili Geweke i Keane [999]. Można e narzucić na dwa sposoby, uzyskuąc równoważne parameryzace. Niech wg pierwsze parameryzaci = i >, gdy pozosałymi paramerami mieszanki są, i π. Zaem w drugim przypadku < i =, przy czym paramery obu specyfikaci są związane zależnością: =, =, = i π = π. W ym arykule zakładamy, że = i >, więc dla osaniego parameru es wygodnie przyąć lewosronnie ucięy rozkład wykładniczy z paramerem r >0. W konsekwenci warunkowa warość oczekiwana w rozkładzie a priori, E[ > ], wynosi +r, zaś warianca (r ). W przypadku drugie parameryzaci, < i =, sosuąc przekszałcenie zmiennych losowych konsruuemy rozkłady dla,, i π. Takie spóne podeście gwaranue, że rozkłady a poseriori dla obu specyfikaci akże będą równoważne. Przyęcie dla ucięego rozkładu wykładniczego powodue, iż dla uzyskamy odwrony rozkład gamma określony na przedziale (0; ). ego funkca gęsości p( ) es ograniczona od góry, ponado dla r >0.5 posiada modalną w punkcie ( r ) -, zaś dla 0<r <0,5 es wyłącznie funkcą rosnącą. Warość sałe r można usalić na poziomie,, 3 lub 4. W prezenowanych dale badaniach w odniesieniu do sałych definiuących rozkłady a priori przyęo: r = w przypadku rozkładu dla precyzi, β = 0[ k ] i H β = I [ k k ] dla β, = 0[ ] i H = I[ ] dla. Wsępną informacę o wadze ( 0; ) π reprezenował rozkład ednosany. Przeprowadzaąc analizę wrażliwości można ex pos określić wpływ sałych definiuących rozkłady a priori na kszał rozkładów a poseriori. 4. Uzyskiwanie rozkładów a poseriori W celu uzyskania rozkładów a poseriori i ich charakerysyk wykorzysaliśmy algorym Meropolisa i Hasingsa. Wygodnie es ze względów numerycznych wprowadzić aką parameryzacę, aby zbiory dopuszczalnych warości dla wszyskich paramerów były zbiorami liczb rzeczywisych. Przyspiesza o numeryczną realizacę algorymu. Gdy =, o wymiar wekora θ = β θ θ ] wynosi k+4. Dla wagi π zasosowaliśmy ransformacę logisyczną, więc ln( π ( π )) θ π [ π = ma sandardowy rozkład logisyczny; zob. akże Celeux, Hurn i Rober [000]. Gdy narzuca się resrykcę = i >, o wygodnie es zdefiniować zmienną ln( r ) θ =, zaś gdy < i θ =. Wówczas θ ma ucięy na lewo od warości ln(r ) sandardowy rozkład Gumbela. Uwzględniaąc płynące z lieraury sugesie na ema konsrukci rozkładów a priori, łączny rozkład a priori dla wekora wszyskich paramerów modelu ma posać ( ) = p( β) p( ) p( θ ) p( ) θ π = przyąć ln( r ) pθ, (0) [005]. Wówczas uzyskamy uemny rozkład wykładniczy z paramerem położenia równym i paramerem skali r ; zob. Magiera 7
k p θ = ( ) exp( θ + r ) I ( ln r ; + )( θ ), ( β) = f ( ββ, H ) N β ( ) f (, H ) p θ = exp θ ( + exp θ ). gdzie ( ) exp exp( θ ) = N p, ( ) ( ) ( ) π π π p, Łączny rozkład dla obserwaci y i paramerów θ, sanowiący nasz model bayesowski, ma posać T y (, θ) = p( yθ) p( θ) = p( θ) ( F( xβθ ) F( xβθ) p y. () = W celu prakyczne realizaci wnioskowania bayesowskiego zasosowano algorym Meropolisa i Hasingsa. Za pomocą ego mechanizmu losowania uzyskaliśmy wekory liczb pseudolosowych rozkładu a poseriori p ( θ y) y ( ) ( ) ( n ) θ, θ, K, θ z. Rozkłady a poseriori aproksymue się hisogramami skonsruowanymi na podsawie e próby pseudolosowe. W szczególności, w celu wyznaczenia warości oczekiwane wg rozkładu a poseriori pewne skalarne funkci wekora θ, g ( θ), czyli aproksymaci całki E g( θ) y = gθ pθ y dθ, oblicza się średnią empiryczną [ ] ( ) ( ) n n i= ( i ) ( ) gθ. () Szczegółowe omówienie zasosowane procedury Mone Carlo opare na łańcuchach Markowa (MCMC) można znaleźć w pracach: O Hagan [994], Tierney [994], Gamerman [997] lub Koop [003], akże Magiera [005]. W prezenowanych badaniach za funkcę pomocniczą, z kóre losue się liczby pseudolosowe, przyęo wielowymiarowy rozkład Sudena o 3 sopniach swobody, modalne równe ( i ) poprzedniemu wylosowanemu wekorowi θ oraz usalone wcześnie macierzy precyzi; zob. Osiewalski i Marzec [004]. ako warości sarowe dla paramerów przyęo: dla β - bayesowskie oceny modelu probiowego, zaś dla pozosałych: π = 0,5, = 0,, = 0,, =,. 5. Wyniki empiryczne W ym rozdziale prezenuemy wyniki bayesowskich modeli dwumianowych z dwuelemenową mieszanką rozkładów normalnych. W ym celu wykorzysaliśmy informacę o niespłacalności kredyów dealicznych. Zbiór danych obemował 39034 rachunków kredyowych, pochodził z la 000-00 i był wykorzysywany w innych pracach auora, zob. Marzec [006]. Przyęo, że y =, eżeli kredy es zakwalifikowany do kaegorii zagrożonych (poniże sandardu, wąpliwych i sraconych). W przeciwnym przypadku dla kredyów z grupy należności normalnych y = 0. Zbiór poencalnych zmiennych egzogenicznych wyaśniaących ryzyko poedyncze umowy kredyowe zawierał: płeć, wiek kredyobiorcy, wpływy na rachunki ROR, posiadanie rachunku ROR, informacę o ym, czy kredyobiorca posiada kary płanicze lub kredyowe wydane przez en bank, sposób udzielenia kredyu (przez pośrednika kredyowego albo bezpośrednio przez bank), yp kredyu (kredy konsumpcyny albo hipoeczny), okres rwania umowy kredyowe, kwoa przyznanego kredyu, walua kredyu, podsawowe źródło dochodu uzyskiwanego przez kredyobiorcę (umowa o pracę, albo rena lub emeryura, albo własna działalność, umowa o dzieło lub umowa zlecenie, albo inne źródło). W konsekwenci liczba składowych wekora β wynosiła k=3 (bez wyrazu wolnego). 5.. Porównywanie konkurencynych modeli Proponuąc model dwumianowy z mieszanką rozkładów normalnych (model M ) można posawić pyanie, czy w świele posiadanych danych akie uogólnienie sandardowego modelu probiowego (M 4 ) było zasadne? eżeli ak, o czy model M lepie pasue do danych, niż inne uogólnienia probiu? 8
Rozważaąc dwumianowy model posaci () i () zakładamy, że rozkład składnika losowego może być asymeryczny, wielomodalny lub wyosrzony albo spłaszczony. Innymi, prosszymi specyfikacami są: mieszanka względem średnie ( = dla =,,; model M ) albo precyzi ( = 0 dla =,,; model M 3 ). W pierwszym przypadku rozkład składnika ε może posiadać rozkład o własnościach ak w M, zaś w drugim mamy do czynienia wyłącznie z rozkładem symerycznym i lepokurycznym. Modele M, M 3 i M 4 uzyskuemy poprzez warunkowanie względem paramerów w M. Zaem ich rozkłady a priori orzymaliśmy poprzez narzucenie odpowiednich resrykci na paramery w rozkładzie a priori modelu M. Dodakowo w porównaniu uwzględniliśmy wyniki innych modeli uogólniaących model probiowy. Rozważyliśmy model Sudena o nieznane liczbie sopni swobody (M 5 ), w kórym dodakowo zależność między z a zmiennymi egzogenicznymi es w formie wielomianu drugiego sopnia; zob. Marzec [006]. Rozkład Sudena można rakować ako nieskończoną mieszankę względem precyzi (M 3 ), kóra dopuszcza grube ogony rozkładu dla ε, ale narzuca ednomodalność i symerię. Zaem model M 5 es uogólnieniem specyfikaci M 3. Inną ineresuącą alernaywą wydae się być model z modyfikacą rozkładu Sudena, kóry dopuszcza asymerię (M 6 ), zob. Osiewalski i Marzec [004]. Należy podkreślić, że modele M i M 6 są specyfikacami nie zagnieżdżonymi, więc ich esowanie byłoby rudne na gruncie klasycznym, w przeciwieńswie do wnioskowania bayesowskiego, kóre dae nam do ego prose narzędzie. Porównanie modeli przeprowadzono w oparciu o prawdopodobieńswo a poseriori liczone wg formuły (zob. np. Osiewalski [00], Koop [005]) p ( M ) i ( y M i ) p( M i ) p( y M ) p( M ) p y = dla i, (3) 6 h= h h {, K,6} gdzie p ( M i ) (dla i=, 6) oznacza prawdopodobieńswo a priori poszczególnych specyfikaci, zaś p( y M h ) es brzegową gęsością obserwaci w h-ym modelu, liczoną w oparciu o średnią harmoniczną warości wiarygodności, ak o proponuą Newon i Rafery [994]. Z uwagi na fak, że badane modele posiadaą różną liczbę paramerów ( k i ), przy usalaniu ich prawdopodobieńsw a priori przyęo zasadę, że preferowane są oszczędne parameryzace; zob. Osiewalski i Seel [993], Osiewalski [00]. Naprosszemu modelowi probiowemu przypisano nawiększe prawdopodobieńswa a priori równe 0,47. Model M posiada prawdopodobieńswo równe 0,06 i es ono dwukronie mniesze niż prawdopodobieńswo modelu mieszanki względem średnie (M ) i skośnego Sudena, a nawe rzykronie mniesze od mieszanki względem precyzi (M 3 ). Szczegółowe wyniki doyczące mocy wyaśniaące poszczególnych modeli prezenue Tabela. Tabela. Brzegowe gęsości wekora obserwaci i prawdopodobieńswa a poseriori badanych modeli Źródło: obliczenia własne. Model Liczba paramerów ln p(y M i ) k p(m i ) i p(m i y) M 7-3569 0,06,4 0 0 M ; = = 6-3836 0, 3, 0 6 M 3 : = =0 5-3845 0,4 7,6 0 30 M 4 : probiowy 4-3846 0,47 5,6 0 30 M 5 : -Sudena 80-3600 6,38 0 5, 0 43 M 6 : skośny -Sudena 6-3547 0, Porównuąc model M dla le M, M 3 i M 4 widzimy, że es on zdecydowanie nabardzie prawdopodobny. Podobnie es w odniesieniu do M 5, kóry dopuszcza wyłącznie grube ogony i wyosrzenie rozkładu. Szczegółowa analiza wyników prowadzi nas do konkluzi, iż model M 3, kóry zakłada lepokuryczność w sosunku do rozkładu normalnego, w świele ych danych niewiele wnosi w sosunku do probiu (M 4 ). Dane skłaniaą się ku rozkładom asymerycznym, gdyż prawdopodobieńswo modelu M es większe niż M 3 i M 4. Pierwszy model es czery rzędy wielkości bardzie prawdopodobny niż dwa pozosałe. ednocześnie dane preferuą rozkład o grubych ogonach, bo model M 5 es co prawda gorszy od ' 9
M, ale bardzie prawdopodobny niż M, M 3 i M 4. Modelem, kóry łączy asymerię z grubymi ogonami, es M 6. ego prawdopodobieńswa wynosi prawie eden i es dziesięć rzędów wielkości bardzie prawdopodobny niż nasępny w rankingu model z pełną mieszanką (M ). Wobec powyższego dane przedkładaą skośny rozkład z grubymi ogonami nad rozkład ze skończonymi momenami wszyskich rzędów i ewenualną asymerią lub dwumodalnością. Model mieszanki dwuelemenowe es ineresuący, ale wyłącznie w konekście pozosałych specyfikaci. Alernaywą dla M 6 może być rzyelemenowa mieszanka, lecz w sosunku do M nie zmienia ona grubości ogonów i ma o rzy paramery więce. Innym kierunkiem dalszych badań mogłaby być konsrukca skończone mieszanki rozkładów Sudena o nieznanych liczbach sopni swobody, kóra pozwoliłaby uzyskać asymeryczny rozkład wielomodalny z grubymi ogonami. 5.. Wyniki esymaci Poniże prezenuemy szczegółowe wyniki esymaci paramerów modeli oparych na mieszankach. Uwagę zwraca zgodność znaków ocen punkowych paramerów przy zmiennych obaśniaących we wszyskich modelach (wyąek o paramer przy zmienne ROR). Zaem znaki efeków krańcowych w ych modelach są idenyczne. Przeważaąca większość paramerów es saysycznie isona, zn. bayesowskie przedziały o nawiększe gęsości a poseriori odpowiedniki klasycznych przedziałów ufności nie zawieraą warości zero. W modelu M płeć, kwoa i yp kredyu (konsumpcyny, hipoeczny) wydaą się nie mieć isonego wpływu na prawdopodobieńswo niespłacenia kredyu. Odchylenia sandardowe a poseriori dla wszyskich paramerów β były zdecydowanie mniesze od edności, czyli odchylenia sandardowego a priori. Zaem rozkłady a poseriori charakeryzuą się mnieszym rozproszeniem niż rozkłady a priori. Wyniki mieszanek względem średnich (M ) i precyzi (M 3 ) są bardzo zbliżone do ocen modelu probiowego. Przypomnimy, iż paramery, i nie mogą być bezpośrednio inerpreowalne w modelu M, gdyż ak wcześnie wspomniano, w mieszance dwuskładnikowe z resrykcami doyczącymi precyzi isnieą dwie równoważne parameryzace: = i > oraz = r < i =. Naomias można porównywać ilorazy paramerów i / i /. Wszyskie kluczowe paramery definiuące rozważane mieszanki (,,, π ) są saysycznie isone. W modelu probiowym zakłada się, że wszyskie obserwace pochodzą z edne homogeniczne próby, naomias w modelach dwuelemenowe mieszanki przymue się, że isnieą dwie odrębne podpróby. O podziale próby informue waga π, kóre warość oczekiwana a poseriori w modelu M wynosi 0,0, co wskazue na nierówny podział zbioru obserwaci. Te same informace uzyskuemy w modelu mieszanki względem średnie M, w kórym przyęo = =. W modelu probiowym wyraz wolny można rakować ako ucięcie, kórego warość decydue o ym, czy zaobserwowano y = czy y =0. Ten paramer es nieidenyfikowalny, gdy swobodnym paramerem es warość oczekiwana rozkładu dla ε,. Wówczas przemuę rolę wyrazu wolnego. W ramach specyfikaci M, M 3 i M 4 można porównywać i precyzę rozkładu dla ε, czyli. W modelu M ocena a poseriori dla wynosi -,7 (±0,4), naomias w M 3 orzymuemy, iż E[ y) =-,5 (±0,30), gdy ymczasem w modelu probiowym E[ y) =-,0 (±0,4). Warości oczekiwane a poseriori dla precyzi wynoszą odpowiednio: E[ y) =,04 (±0,0) w M oraz 0,85 (±0,07) w M 3. W modelu M 4 precyza es usalona na poziomie, co wynika ze znanego warunku idenyfikowalności. Wszyskie e rezulay są zbliżone do siebie. Tabela. Warości oczekiwane i odchylenia sandardowe paramerów poszczególnych modeli (zał. = i > ) Model M Model M Model M 3 Model M 4 Zmienna (paramer) E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) - - - - -,5 (0,30) -,0 (0,4) Płeć 0,005 (0,004) 0,037 (0,08) 0,09 (0,07) 0,038 (0,08) 0
Wiek -0,66 (0,0) -0,886 (0,09) -0,804 (0,075) -0,866 (0,085) Wpływy -4,808 (0,336) -,370 (0,34) -,749 (0,76) -,73 (0,75) ROR 0,08 (0,0) -0,8 (0,038) -0,60 (0,04) -0,94 (0,038) Kary -0,04 (0,009) -0,74 (0,035) -0,57 (0,03) -0,69 (0,033) Pośrednik 0,43 (0,09),35 (0,036),99 (0,05),9 (0,03) Typ kredyu 0,73 (0,00) 0,89 (0,3) 0,33 (0,4) 0,47 (0,4) Okres -0,089 (0,05) -0,7 (0,06) -0,4 (0,058) -0,37 (0,057) Kwoa 0,09 (0,00) 0,7 (0,03) 0,04 (0,08) 0,7 (0,09) Walua 0,5 (0,0) 0,40 (0,53) 0,347 (0,35) 0,33 (0,36) Zrdoch -0,03 (0,006) -0,097 (0,03) -0,08 (0,06) -0,094 (0,09) Zrdoch 0,030 (0,0) 0,307 (0,043) 0,87 (0,038) 0,304 (0,040) Zrdoch3-0,076 (0,07) -0,00 (0,08) -0,68 (0,080) -0,89 (0,077) 5,96 (0,604) -,90 (0,44) - - - - -0,343 (0,03) 0,87 (0,86) - - - - 8,359 (4,79) - -,473 (0,6) - - π 0,0 (0,00) 0,990 (0,004) 0,53 (0,48) - - Źródło: obliczenia własne. Zbadaliśmy akże własności rozkładu składnika losowego w modelu M, aby sprawdzić w akim sopniu różnią się od własności sandaryzowanego rozkładu normalnego. W ym celu wykorzysaliśmy, ak sugerue Geweke [007], eksces i współczynnik asymerii. Obie miary są funkcami ednorodnymi sopnia zero ze względu na i (dla =,,). Obliczanie warości oczekiwane i warianci nie es zasadne, gdyż e charakerysyki nie są idenyfikowalne. Warość oczekiwana ekscesu wynosi 80,6, a odchylenie sandardowe ±6,4, zaś współczynnik asymerii es dodani i wynosi 8,6 (±0,3). Wyniki wskazuą, że mamy do czynienia z rozkładem prawosronnie asymerycznym, kóry w sosunku do rozkładu normalnego es bardzo wyosrzony wokół warości modalne. W uzupełnieniu prezenuemy hisogramy rozkładów a priori i a poseriori dla, i. ako rozkład a priori przyęliśmy dla i sandaryzowany rozkład normalny, zaś dla precyzi ( ) ucięy rozkład wykładniczy o warości oczekiwane równe i ednoskowym odchyleniu sandardowym. Rozkład a poseriori dla es silnie przesunięy na prawo w sosunku do rozkładu a priori i charakeryzue się większą precyzą, więc es bardzie skupiony wokół modalne. Naomias w przypadku obserwuemy, że rozkład a poseriori es lewosronnie asymeryczny, ego warość modalna a poseriori wynosi -0,7, a ponado charakeryzue się on bardzo małym rozproszeniem w sosunku do rozkładu a priori. W przypadku precyzi widzimy, że hisogram rozkładu a poseriori es co prawda bardzo rozproszony, ale znadue się w obszarze o bardzo małym prawdopodobieńswie a priori. Rola danych w sosunku do założeń a priori była decyduąca w kszałowaniu wyników a poseriori. Rysunek. Brzegowe rozkłady a priori (linia) i a poseriori (słupki) dla paramerów i. 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 -,9 -,3 -,7 -, -0,5 0,06 0,66,6,86,46 3,06 3,66 4,6 4,86 5,46 6,06 6,66 7,6 7,86 8,46 Źródło: obliczenia własne.
Rysunek 3. Brzegowe rozkłady a priori (linia) i a poseriori (słupki) dla. 4,5 4 3,5 3,5,5 0,5 0-3 -,7 -,4 -, -,8 -,5 -, -0,9-0,6-0,3 0,03 0,33 0,63 0,93,3,53,83,3,43,73 Źródło: obliczenia własne. Rysunek 4. Brzegowe rozkłady a priori (linia) i a poseriori (słupki) dla precyzi. 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 3 5 7 9 3 5 7 9 3 5 7 9 3 33 35 37 39 Źródło: obliczenia własne. Podsumowanie W ninieszym arykule rozważano model dwumianowy opary na skończone mieszance rozkładów normalnych ako uogólnienie modelu probiowego. Przedsawiono podsawowe własności mieszanek, zwracaąc uwagę na problem wielomodalności funkci wiarygodności. Nasępnie omówiono specyfikacę modelu bayesowskiego, w ym konsrukcę rozkładów a priori w konekście idenyfikowalności paramerów i skuecznego wykorzysania meod MCMC (algorymu Meropolisa i Hasingsa). W warswie empiryczne dokonano bayesowskie esymaci modeli oparych na mieszankach, wykorzysuąc dane o spłacalności kredyów. Nasępnie porównano konkurencyne specyfikace wykorzysuąc prawdopodobieńswa a poseriori. Celem arykułu było akże zbadanie, czy w świele posiadanych danych uzasadnione było zasosowanie mieszanek ako uogólnienia modelu probiowego. A eżeli ak, o czy lepie one opisuą badane zawisko niż modele dwumianowe z rozkładem Sudena. Wyniki a poseriori pokazały, że dwuskładnikowa mieszanka posiada większe prawdopodobieńswo niż model probiowy, a akże model zakładaący rozkład Sudena (symeryczny) z grubymi ogonami. ednakże w porównaniu ze specyfikacą dopuszczaącą asymerię i grube ogony model mieszanki zosał negaywnie zweryfikowany. Posiadane dane preferuą modele z rozkładem asymerycznym i ednocześnie grubymi
ogonami, ale nie powierdzaą porzeby wprowadzenia wielomodalności. Wnioski e wskazuą na kierunek dalszych badań, kóry mógłby doyczyć mieszanek oparych na rozkładach Sudena. Bibliografia Aikin M. [00], Likelihood and Bayesian Analysis of Mixures, Saisical Modeling, nr, s. 87-304. Allenby G.M., R.P. Leone, L.C. en [999], A Dynamic Model of Purchase Timing wih Applicaion o Direc Markeing, ournal of he American Saisical Associaion, vol. 94, nr 446; s. 365-374. Amemiya T. [985], Advanced Economerics, Harvard Universiy Press, Cambridge (Massachuses). Ausin P., M. Escobar [003], The Use of Finie Mixure Models o Esimae he Disribuion of he Healh Uiliies Index in he Presence of a Ceiling Effecs, ournal of Applied Saisics, vol. 30, nr 8, s. 909-93. Celeux G., M. Hurn, C.P. Rober [000], Compuaional and Inferenial Difficulies Wih Mixure Poseriori Disribuion, ournal of he American Saisical Associaion, vol. 95, nr 45; s. 957-970. DeGroo M. [98], Opymalne decyze saysyczne, PWN, Warszawa. Dempser A.P., N.M. Laird, D.B. Rubin [977], Maximum Likelihood From Incomplee Daa via he EM Algorihm (wih discussion), ournal of he Royal Saisical Sociey B, vol. 39, s. -38. Diebol., C.P. Rober [994], Esimaion of Finie Mixure Disribuions hough Bayesian Sampling, ournal of he Royal Saisical Sociey B, vol. 56, nr, s. 363-375. Dueker M. [999], Condiional Heeroscedasiciy in Qualiaive Response Models of Time Series, A Gibbsa Sampling Approach in he Bank Prime Rae, ournal of Business and Economic Saisics, vol 7, nr 4, s. 466-47. Erkanli A., D. Sangl, P. Müller [993], A Bayesian Analysis of Ordinal Daa Using Mixures, Technical Repor 93-0 Insiue of Saisics and Decision Sciences, Duke Universiy. Fernández C., M.F. Seel [000], Bayesian Regression Analysis wih Scale Mixure of Normals, Economeric Theory, 6, s. 80-0. Frühwirh-Schnaer S. [00], Markov Chain Mone Carlo Esimaion of Classical and Dynamic Swiching and Mixure Models, ournal of he American Saisical Associaion, vol. 96, nr 453; s. 94-09. Frühwirh-Schnaer S., R. Frühwirh [006], Auxiliary Mixure Sampling wih Applicaions o Logisics Models, Compuaional Saisics and Daa Analysis, vol. 5, nr 7. Gamerman D. [997], Markov Chain Mone Carlo. Sochasic Simulaion for Bayesian Inference, Chapman and Hall, London. Geweke. [007], Inerpreaion and Inference in Mixure Models: Simple MCMC Works, Compuaional Saisics and Daa Analysis, vol. 5, nr 7, s. 359-3550. Geweke., M. Keane [999], Mixure of Normals Probi Models, [w:] Analysis of Panel and Limied Dependen Variables: A Volume in Honor of G.S. Maddala, red. Hsiao C., Lahiri K., Lee L.F., Pesaran M.H., Cambridge Universiy Press, Cambridge. Hamilon.D. [989], A New Approach o he Economic Analysis of Nonsaionary ime Series and he Business Cycle, Economerica, 57, s. 357-384. asra A., C.C. Holmes, D.A. Sephens [005], Markov Chain Mone Carlo Mehods and he Label Swiching Problem in Bayesian Mixure Modeling, Saisical Science, vol. 0, nr, s. 50-67. edidi K., H.S. agpal. W.S. Desarbo [997], Finie Mixure Srucural Equaion Models for Response-Based Segmenaion and Unobserved Heerogeniy, Markeing Science, 6, s. 35-859. Kass R.E., A. Rafery [995], Bayes Facor, ournal of he American Saisical Associaion, vol. 90, nr 90, s. 773-795. Koop G. [003], Bayesian Economerics, Wiley, Chicheser. Lesage.P. [99], Scoring he Composiing Leading Indicaors a Bayesian Turning Poins Approach, ournal of Forecasing,, s. 35-46. Liesenfeld R. [00], A Generalized Bivariae Mixure Model for Sock Price Volailiy and Training Volume, ournal of Economerics,, s. 4-78. Maddala G.S. [983], Limied-dependen and Qualiaive Variables in Economerics, Cambridge Universiy Press, Cambridge. Magiera R. [005], Modele i meody saysyki maemayczne. Część I: Rozkłady i symulace sochasyczne, Oficyna wydawnicza GiS, Wrocław. 3
Marin.M., K. Mengersen, C.P. Rober [005], Bayesian Modelling and Inference on Mixures of Disribuions, [w]: Handbook of Saisics (Bayesian Thinking, Modeling and Compuaion), 5, red. D. Dey, C.R. Rao), Elsevier- Sciences. Marzec. [006], Bayesowski model wielomianowy z rozkładem Sudena dla kaegorii uporządkowanych, Meody ilościowe w naukach ekonomicznych (red. A. Welfe), Wydawnicwo SGH w Warszawie, s. 3-44 McFadden D.L. [984], Economerics Analysis of Qualiaive Response Models, [w:] Handbooks of Economerics vol II, red.z. Griliches, M. Inriligaor, Elsevier Science Publishers. Newon M.A., A.E. Rafery [994], Approximae Bayesian Inference by he Weighed Likelihood Boosrap (wih discussion), ournal of he Royal Saisical Sociey B, 56, s. 3-48. O Hagan A. [994], Bayesian Inference,. Wiley, New York. Osiewalski., M.F.. Seel [993] A Bayesian Perspecive on Model Selecion (maszynopis); opublikowano w. hiszpańskim: Una perspecive bayesiana en selección de modelos, Cuadernos Economicos, 55/3. Osiewalski. [99] Ekonomeria bayesowska w zasosowaniach, Wydawnicwo Akademii Ekonomiczne w Krakowie, Kraków. Osiewalski.,. Marzec [004], Model dwumianowy II rzędu i skośny rozkład Sudena w analizie ryzyka kredyowego, Folia Oeconomica Cracoviensia, vol. 45, s. 63-84 Pearson K. [894] Conribuions o he Mahemaical Theory of Evoluion, Philosophical Transacions of he Royal Sociey of London A, 85, 7-0. Qu P., Y. Qu [000], A Bayesian Aproach o Finie Mixure models in Bioassay via Daa Augmenaion and Gibbs Sampling and Is Applicaion o Insecicide Resisance, Biomerics, 56, s. 49-55. Quand R.E.,.B. Ramsey [978], Esimaing Mixures of Normal Disribuions and Swiching Regressions, ournal of he American Saisical Associaion, vol. 73, s. 730-738. Richardson S., P.. Green [997], On Bayesian Analysis of Mixure wih an Unknown Number of Componens, ournal of he Royal Saisical Sociey B, vol. 59, s. 73-79. Roeder K., L. Wasserman [997], Pracical Bayesian Densiy Esimaion Using Mixures of Normals, ournal of he American Saisical Associaion, vol. 9, nr. 439; s. 894-90. So M.K.P., K. Lan, W.K Li [989], A Sochasic volailiy model wih Markov Swiching, ournal of Business and Economic Saisic, nr 6, s. 44-53. Tierney L. [994], Markov Chains for Exploring Poserior Disribuions (wih discussion), Annals of Saisics,, s. 70-76. Tieringon D.M., A.F.M. Smih, U.E. Makov [985], Saisical Analysis of Finie Mixure Disribuions, ohn Wiley, New York. 4