2. Model wielomianowowy dla kategorii uporządkowanych
|
|
- Sebastian Rudnicki
- 6 lat temu
- Przeglądów:
Transkrypt
1 Jerzy Marzec BAYESOWSKI MODEL WIELOMIANOWY Z ROZKŁADEM t STUDENTA DLA KATEGORII UPORZĄDKOWANYCH. Wprowadzenie W literaturze ekonometryczne modele akościowych zmiennych endogenicznych określa się terminem: modele dyskretnego wyboru (ang. quantal response or discrete choice models). Jeżeli zmienna obaśniana przymue skończoną liczbę wartości i mierzona est na skali porządkowe, wówczas otrzymuemy wielomianowy model dla kategorii uporządkowanych. Powyższy model est oryginalną propozycą Aitchisona i Silveya z 957 roku i (ak wiele innych modeli dla zmiennych akościowych) zastosowano go po raz pierwszy w biostatystyce. Dopiero w 975 roku został przeniesiony na grunt nauk społecznych przez McKelveya i Zavoina. Wykorzystali go do analizy zachowań kongresmenów amerykańskich podczas głosowania nad ustawą z 965 roku, dotyczącą rządowego programu pomagaącego osobom o niskich dochodach pokryć koszty leczenia. W tym przypadku, ako zmienne obaśniaące wykorzystano: przynależność partyną (demokraci, republikanie), region (południe, północ), poziom bezrobocia, odsetek ludności powyże 65 roku życia i gęstość zaludnienia w regionie, który reprezentował kongresmen. Autorzy rozważali trzy stanowiska: głosuących za przyęciem nabardzie socalne wersi ustawy, głosuących za wersą z poprawkami zgłoszonymi przez umiarkowanych przeciwników tego programu oraz głosuących za odrzuceniem ustawy w całości. Postawy kongresmanów są podobne do skali odpowiedzi respondentów w badaniach ankietowych, tzw. skali Likerta: zdecydowanie tak, racze tak, nie mam zdania, racze nie i zdecydowanie nie. Innym przykładem zmiennych mierzonych na skali porządkowe est np. informaca o zatrudnieniu (bezrobotny, zatrudniony w niepełnym wymiarze godzin, na pełny etat). Klasyfikacę modeli dyskretnych ze względu na rodza wartości, akie przymue zmienna endogeniczna wraz z zastosowaniami w ekonomii, prezentue m.in. Maddala [983]. Głównym celem ninieszego artykułu est prezentaca i wykorzystanie modelu wielomianowego z rozkładem t Studenta w analizie niespłacalności kredytów detalicznych. W szczególności przedstawiona zostanie bayesowska specyfikaca i estymaca tego modelu. Przedstawione w artykule wyniki stanowią kontynuacę podęte problematyki, zaprezentowane wcześnie w pracach Marzec [003b,c].. Model wielomianowowy dla kategorii uporządkowanych W ninieszym artykule przedmiotem analizy est wyłącznie wielomianowy model dla kategorii uporządkowanych przy założeniu ednakowe liczby alternatyw i posiadaniu danych charakteryzuących edynie podmiot dokonuący wybór. Wprowadzaąc ciągłe, nieobserwowalne (ukryte) zmienne z t, których wartości determinuą obserwowaną kategorię zmienne y t, model ma następuącą postać (zob. McKelvey i Zavoina [975]) Artykuł powstał w ramach badań statutowych finansowanych przez Akademię Ekonomiczną w Krakowie w 005 r.
2 zt = x t β + ε t () yt = I[ α ( z ) t = T = J, ) t dla, K,, K, α gdzie I Ω (ω) est funkcą charakterystyczną zbioru, zaś α są tzw. punktami granicznymi Ponadto x t est wektorem zmiennych egzogenicznych (lub ich znanych funkci) charakteryzuących ednostkę podemuącą wybór. Zmienna y t est zmienną skalarną przymuącą wartości odpowiadaące numerom kategorii, czyli,,,j, zatem zmienna pomocnicza y t przymue wartość eden, gdy y t = albo zero w pozostałych przypadkach. O składnikach losowych ε t zakłada się, że posiadaą identyczne i niezależne rozkłady o wartości oczekiwane równe zero i nieznanym parametrze skali. Z uwagi na identyfikowalność parametrów przymue się, analogicznie ak w modelu dychotomicznym, że parametr skali rozkładu zmienne ε t est równy edności. Ponadto identyfikowalność wymaga, aby α 0 = i α J =+ oraz α = 0, eżeli w równaniu dla zmienne z t występue wyraz wolny, co zakładamy w te pracy. Zatem wymiar wektora α wynosi J. W dalsze części zakładamy, że zmienna ε t posiada rozkład t Studenta z nieznaną liczbą stopni swobody (ν), z zerową modalną (µ = 0) i ednostkową precyzą (τ =), o funkci gęstości ( ν + ) ν τ τ f S ( ε t µ, ν, τ ) = B, + ( ε t µ ) () gdzie ( ν, ) ν ν B est funkcą beta. Wówczas funkca wiarygodności modelu () ma postać ( ) = T J α, β, ν ( p ) yt p y t, (3) t= = gdzie prawdopodobieństwo zaobserwowania kategorii wynosi pt Pr( yt = ) = Pr( α < zt < α ) = FS ( α x tβ) FS ( α x tβ), (4) J przy czym = p =, zaś F S (a) est wartością dystrybuanty zmienne losowe ε t o rozkładzie t Studenta z ν t stopniami swobody w punkcie a. Uzyskaliśmy przez to uogólnienie standardowego modelu probitowego (z rozkładem normalnym). Wprowadzenie dodatkowego parametru ν umożliwia naturalne uwzględnienie modelu standardowego ako przypadku granicznego, gdy ν +. Zastosowanie rodziny rozkładów t Studenta est tym bardzie uzasadnione, że ak zauważyli Mudholkar i George [978], kształt dystrybuanty rozkładu logistycznego est zbliżony racze do gęstości rozkładu t Studenta niż rozkładu normalnego. Rozkład t Studenta i logistyczny charakteryzuą się grubszymi ogonami niż rozkład normalny, dla którego kurtoza (moment centralny czwartego rzędu podzielony przez kwadrat warianci) wynosi 3. Współczynnik ekscesu (kurtoza pomnieszona o 3), mierzący grubość ogonów w stosunku do rozkładu normalnego, dla rozkładu logistycznego wynosi 6/5, zaś w przypadku t Studenta 6/(ν 4). Zatem dla ν = 9 współczynnik ekscesu dla obu rozkładów przymue identyczną wartość. Mudholkar i George pokazuą graficznie, że dla rozkładu logistycznego zmienne standaryzowane mniesze różnice między dystrybuantami obserwue się w stosunku do rozkładu t Studenta (o ν = 9 i ednostkowe warianci) niż rozkładu normalnego. Albert i Chib [993] przedstawiaą wyniki własnych badań, które to potwierdzaą. W uzupełnieniu dołączamy Rysunek przedstawiaący różnice między funkcą gęstości standaryzowanego rozkładu logistycznego, a standaryzowanym rozkładem normalnym oraz t Studenta o ednostkowe warianci i różne liczbie stopni swobody. Zauważmy, że namniesze różnice dla wartości zmienne z przedziału od 4 do 4 występuą w stosunku do rozkładu t Studenta o ν = 7. Wartość ν = 7,3 minimalizue miarę podobieństwa między rozkładami, opartą na metryce odległości Kulbacka-Leiblera, zdefiniowaną ako f ( x) ln [ f ( x) f ( x; ν )] + dx L L ST. Zatem przymimy, że rozkład logistyczny można aproksymować rozkładem t Studenta o około 7 9 stopniach swobody. W ramach modelu t Studenta istniee prosta możliwość testowania empiryczne adekwatności dwóch specyfikaci, które naczęście stosue się w przypadku danych akościowych, t. modelu probitowego i logitowego. Dla tych modeli podstawową metodą estymaci est metoda nawiększe wiarygodności (MNW); zob. Aitchison i Silvey [957] oraz McKelvey i Zavoina [975]. Natomiast zastosowanie rozkładu t Studenta zmusza do korzystania z inne metody estymaci niż MNW, ponieważ e własności, nawet w modelu regresi
3 liniowe ze składnikiem losowym o rozkładzie t Studenta z nieznanym parametrem stopni swobody, nie są poznane. Stanowi to motywacę do wykorzystania małopróbkowego podeścia bayesowskiego. Rysunek. Różnice między funkcą gęstości rozkładu logistycznego f L (x) a rozkładu normalnego f N (x) i t Studenta f ST (x; ν) o ν stopniach swobody (rozkłady o ednostkowe warianci) 0,06 0,05 0,04 0,03 0,0 0,0 0-0,0-0,0 f L (x) f N (x) f L (x) f ST (x;ν=9) f L (x) f ST (x;ν=7) -0,03 0 0,5,5,5 3 3,5 4 W przypadku modelu () zakładamy, że równanie regresi z t est liniowe względem β. W literaturze naczęście zakłada się, że to równanie est także liniowe względem oryginalnych zmiennych egzogenicznych. W artykule wykorzystuemy zależność w formie wielomianu stopnia drugiego względem oryginalnych zmiennych egzogenicznych w th x t β = β + β hwth + β hiwthwti = G( w t, β). (5) h h i h Osiewalski i Marzec [004] proponuą więc nazywać taki przypadek modelem II rzędu, ako proste uogólnienie przypadku liniowego x = β + β w t β h h th, czyli modelu I rzędu. Z punktu widzenia estymaci, modele I i II rzędu różnią się edynie liczbą parametrów, czyli wymiarem wektora β. W pierwszym modelu liczba parametrów wynosi k = m+, zaś w modelu II rzędu wymiar wektora β est nie większy niż (+m)(+m/) uwzględniaąc wyraz wolny, gdzie m oznacza liczbę oryginalnych zmiennych egzogenicznych. Zasadnicza przewaga drugiego modelu nad pierwszym przeawia się w charakterze efektów krańcowych, co było główną motywacą zastosowania modelu II rzędu w pracy Marzec [003a]. Wnioskowanie o sile i kierunku wpływu zmiennych egzogenicznych w t może opierać się na efektach krańcowych zdefiniowanych dla zmiennych ciągłych ako pt G ( ( ) ( ) ( w t, β) η th = = f S α x tβ f S α x tβ, (6) w w th gdzie f S (a) est wartością funkci gęstości zmienne losowe ε t w punkcie a. W przypadku modelu I rzędu G w t, β = β. Natomiast dla zmiennych zero-edynkowych efekt krańcowy oblicza się otrzymuemy ( ) w th h ako różnicę prawdopodobieństw η Pr y = ; w = Pr y = ; w = 0. (7) ( ) ( ) th = t th t th Własności efektów krańcowych w obu modelach są istotnie różne. W modelu I rzędu znak efektu krańcowego dla prawdopodobieństwa zaobserwowania edne ze skranych kategorii względem ustalone zmienne w th est identyczny dla wszystkich obserwaci i zależy od znaku parametru β h. Ponadto iloraz th 3
4 efektów krańcowych względem pary zmiennych w th i w ti dla ustalone kategorii i obserwaci est równy ilorazowi parametrów, t. β h /β i. Zatem nie zależy on od wartości tych zmiennych i est identyczny dla wszystkich obserwaci. Możemy uwolnić się od tych dwóch ograniczeń przymuąc, że z t związane est ze zmiennymi egzogenicznymi w t poprzez funkcę G(w t, β), daną wzorem (5). Ponadto niezależną od postaci G(w t, β) własnością efektów krańcowych est to, że dla ustalone obserwaci i zmienne obaśniaące w th suma efektów krańcowych η th po wynosi zero. W konsekwenci efekty krańcowe dla dwóch skranych alternatyw, t. η th i η tjh, charakteryzuą się przeciwnymi znakami; zob. Greene [003]. O pozostałych możemy powiedzieć tylko tyle, że istniee taka kategoria (>), że efekty krańcowe dla poprzedzaących ą kategorii posiadaą znak identyczny ak η th i ednocześnie znak efektów dla pozostałych kategorii +, + itd. est zgodny ze znakiem efektu krańcowego dla Pr(y tj = ), czyli η tjh. Ta własność zachodzi, eżeli zmienna ε t ma rozkład ednomodalny, a takim est rozkład t Studenta o funkci gęstości określone przez wzór (). 3. Bayesowska specyfikaca i estymaca modelu Na gruncie bayesowskim model statystyczny est zdefiniowany poprzez łączny rozkład prawdopodobieństwa dla obserwaci i parametrów lub innych wielkości nieobserwowalnych. W tym przypadku est on określony przez uogólnioną łączną funkcę gęstości T J yt (, α, β, ν) = p( yα, β, ν) p( α, β, ν) = ( p ) p( α) p( β) p( ν) p y t, (8) t = = ako iloczyn brzegowego rozkładu a priori ( α,β,ν) p i funkci wiarygodności (3). Niezależność rozkładu a priori dla poszczególnych parametrów est naturalnym założeniem. Ponadto wielkość p t, dana wzorem (4) est funkcą α, β i ν. Podstawą estymaci bayesowskie modelu parametrycznego est wyznaczenie z gęstości (8) dla interesuące wielkości (np. dla wybranego parametru bądź znane funkci parametru) gęstości rozkładu warunkowego względem obserwaci y i ednocześnie brzegowego względem pozostałych składowych, czyli tzw. funkci gęstości rozkładu a posteriori. Zagadnieniu wnioskowania bayesowskiego są poświęcone takie fundamentalne prace ak np. Zellner [97] i O Hagan [994], zaś w ęzyku polskim monografie Osiewalski [99] i [00]. Podeście bayesowskie wymaga od badacza specyfikaci rozkładu a priori na przestrzeni nieznanych parametrów. Analizowany model est zbyt skomplikowany, aby próbować wyznaczyć analitycznie wzorcowe rozkłady a priori w sensie Jeffreysa. W modelu z rozkładem t Studenta, w przypadku parametru ν przymue się wyłącznie właściwe rozkłady a priori, określone na dziedzinie (0,+ ). Jest to konieczne, aby istniał rozkład a posteriori. Ponadto, w praktyce rozkład t Studenta o ν>30 może być przybliżany rozkładem p c I ν, gdzie c est dowolną normalnym. Przymuąc zatem niewłaściwy rozkład o priori postaci ( ) ( )( ) dodatnią stałą, otrzymuemy, iż Pr ( ν 30) Pr( ν > 30) = 0 ν 0; +. Oznacza to, że taki rozkład est tylko na pozór nieinformacyny. W rzeczywistości est rozkładem silnie informacynym, gdyż z prawdopodobieństwem równym eden dopuszcza wyłącznie normalność. Właściwy rozkład a priori należy przyąć także dla pozostałych parametrów. Albert i Chib [993] proponuąc model z rozkładem t Studenta dla binarne zmienne endogeniczne zastosowali nieinformacyny rozkład a priori dla β. Przeprowadzone własne badania symulacyne wskazały na problemy numeryczne z istnieniem właściwych rozkładów a posteriori, gdy stosue się nieinformacyne rozkłady a priori dla α lub β w modelu wielomianowym z rozkładem t Studenta. O problemach z istnieniem rozkład a posteriori dla β w modelu regresi pisał Geweke [993]. Rozważał on liniowy model regresi, przy założeniu, że składniki losowe maą niezależne rozkłady t Studenta o ustalone 4
5 liczbie stopni swobody. Pokazał on, że eżeli przymue się nieinformacyny rozkład a priori dla β, to wartość oczekiwana a posteriori dla β istniee i est skończona, gdy ν> oraz odchylenie standardowe a posteriori istniee i est skończone, gdy ν>4. Zatem, w celu zapewnienia istnienia rozkładów a posteriori i dogodne symulaci w modelu t Studenta stosuemy informacyną strukturę a priori postaci J k (, β, ν ) = f ( β β, H ) f ( ν r) f ( α α ) I ( )( α ) N EXP = pα. (9) EXP α, α + Dla β przymuemy a priori k-wymiarowy rozkład normalny o wartości oczekiwane kowarianci postaci H = s odchyleniu standardowym czyli α, dobieramy tak, aby β i macierzy I, zaś dla α (=,,J ) rozkłady wykładnicze o wartości oczekiwane i α. Z uwagi na restrykcę α < α < α + < α < α +, stałe definiuące rozkład a priori, α, przy czym α 0 Alternatywą dla α est rozkład normalny ucięty na lewo od zera. W przypadku parametru ν przyęto, ak często czyni się to w literaturze, rozkład wykładniczy o wartości oczekiwane i odchyleniu standardowym r. Stałe = β, s i α powinny być tak dobrane, aby implikowane rozkłady a priori efektów krańcowych (η tk ) i prawdopodobieństw (p t ), będących nieliniowymi funkcami α, β i ν, były zgodne z posiadaną wiedzą ekonomiczną bądź odzwierciedlały e brak. W artykule przyęliśmy r = 0 i β = 0, zaś dla α i α 3 różne zestawy wartości np. i, i 4 oraz 4 i 0. Dla s ustaliliśmy wartość 4, ednocześnie badaąc wrażliwość uzyskanych wyników a posteriori na inne wartości, np., 9 oraz 6. Przyęte założenia o tych stałych uczyniły rozkłady a priori dla α i ν rozkładami słabo informacynymi. Porównanie rozkładów a priori i a posteriori dla η tk i p t prezentuemy w dalsze części tego artykułu. W celu wyznaczenia rozkładów a posteriori lub ich charakterystyk całkowanie analityczne stosue się tylko w naprostszych przypadkach; zob. Zellner [97], Osiewalski [99]. Skomplikowana postać funkci wiarygodności (3) nie pozwala na to. W omawianym modelu konieczne est całkowanie numeryczne, które realizue się wykorzystuąc metody Monte Carlo. Pierwotnie Albert i Chib [993] zaproponowali losowanie Gibbsa. Natomiast w ninieszym artykule zastosowano algorytm Metropolisa i Hastingsa, który okazał się efektywną, a w stosunku do próbnika Gibbsa także szybszą metodą uzyskiwania próbek z rozkładu a posteriori. Zastosowanie algorytmu Gibbsa wymagało niesłychanie długiego czasu obliczeń, ponieważ w tym schemacie korzysta się ze zmiennych ukrytych z t, których ilość est równa liczbie obserwaci, a tych w prezentowanych badaniach est ich ponad 39 tys. Stosowanie algorytmu Metropolisa i Hastingsa opiera się na ądrze uogólnione funkci gęstości (8). Wygodnie est przyąć taką parametryzacę, aby zbiory dopuszczalnych wartości wszystkich parametrów były zbiorami liczb rzeczywistych, np. θ = [β θ k+ θ k+ θ k+j ], gdzie θ k+ = ln(ν/r), θ = ln( α α ) k + h h h dla h =,,J, podobnie ak w pracy Osiewalski i Marzec [004]. Wówczas ądro funkci gęstości rozkładu a posteriori ma postać p k ( θ y) f ( β β, H ) exp θ exp( θ ) J exp h= N ( ) k + T J yt ( θ k + h exp( θ k + h )) I( θ k + h ) ( pt ), t = = gdzie funkca I(θ) uwzględnia te restrykce ak I(α) we wzorze (9), tzn. I ( ( )) ( ) θ ; θ ln / k k 3 α3 α I ( ( ) ( )) ( ) θ θ + + ( ) = ( ( ) ( )) ( + + ln / ; + ln / k 3 k α α3 θk 4 α 4 α3 I θ I ) θ θ ln 3 / 4 ; + 5 ln 5 / k k α α θk α α 4 K I ( ( ) ) ( ) θ θ ln / ; k J k J α J α J Otrzymywanie próbekθ, θ,, θ k + K n z rozkładu a posteriori ( θ y) (0) p uzyskue się za pomocą mechanizmu losowania opisanego m.in. w pracy Osiewalski i Marzec [004]. Szczegółowe omówienie 5
6 zastosowanych procedur Monte Carlo można znaleźć m.in. w pracach: O Hagan [994], Tierney [994], Geweke [996], Gamerman [997] lub Koop [003]. 6
7 4. Wyniki empiryczne 4.. Definica zmiennych Omówiony powyże bayesowski model wielomianowy z rozkładem t Studenta wykorzystano do badania spłacalności kredytów detalicznych udzielonych przez polski bank komercyny. Wcześnie te dane, pochodzące z lat , zostały wykorzystane w pracach Marzec [003a,b,c], [005] i Osiewalski, Marzec [004]. Zbiór danych obemował rachunków kredytowych. Konstrukca zmienne wielomianowe opiera się na klasyfikaci należności pozostaących do spłaty przez kredytobiorcę, określone przez Komisę Nadzoru Bankowego. Wobec powyższego przyęliśmy, iż zmienna obaśniana y t przymue cztery wartości (J=4), które ednocześnie oznaczaą kategorie należności lub równoważnie okres opóźnienia ze spłatą przez kredytobiorcę rat kapitałowo-odsetkowych: J Kategoria należności Okres opóźnienia w spłacie Obserwowany udział w próbie Normalne Do miesiąca 80,3% Poniże standardu Od do 3 miesięcy 6,0% 3 Wątpliwe Od 3 do 6 miesięcy 6,3% 4 Stracone Powyże 6 miesięcy 7,4% Jako potencalne zmienne wyaśniaące ryzyko poedyncze umowy kredytowe wprowadziliśmy (ak we wcześnieszych pracach): płeć (zmienna przymue wartość, eżeli klientem est mężczyzna, 0 w przypadku kobiety), wiek kredytobiorcy (w setkach lat), wpływy, tzn. wielkość kwartalnych wpływów w latach (w setkach tys. zł) na rachunki typu ROR kredytobiorcy w badanym banku, posiadanie rachunku ROR w analizowanym banku ( posiada, 0 nie posiada), informacę o tym, czy kredytobiorca posiada karty płatnicze lub kredytowe wydane przez ten bank ( posiada choć edną kartę płatniczą, 0 nie posiada), sposób udzielenia kredytu ( poprzez pośrednika kredytowego, 0 bezpośrednio przez rozważany bank), typ kredytu ( kredyt konsumpcyny, 0 kredyt hipoteczny), okres trwania umowy kredytowe (w dziesiątkach lat), kwota przyznanego kredytu (w setkach tys. zł), waluta kredytu ( EUR, DEM lub USD, 0 PLN), podstawowe źródło dochodu uzyskiwanego przez kredytobiorcę (zmienne zrdoch), t. umowa o pracę, albo renta lub emerytura, albo własna działalność, umowa o dzieło lub umowa zlecenie, albo inne źródło (np. stypendium). Ostatnia zmienna może przymować cztery różne wartości. Chcąc ą uwzględnić w równaniu regresi z wyrazem wolnym, wprowadziliśmy trzy zmienne zeroedynkowe, przy czym za kategorię referencyną przyęliśmy umowę o pracę (zrdoch = zrdoch = zrdoch3 = 0); w pozostałych przypadkach: zrdoch =, gdy źródłem dochodu kredytobiorcy est renta lub emerytura, zrdoch =, gdy źródłem dochodu kredytobiorcy est własna działalność, umowa o dzieło lub umowa zlecenie, zrdoch3 = w przypadku innego źródła dochodu, np. stypendium. 7
8 4.. Porównywanie mocy wyaśniaące modeli W ninieszym artykule wykorzystano uogólnienie probitowego modelu wielomianowego. Zatem rodzi się pytanie: czy w świetle posiadanego materiału empirycznego to uogólnienie est potrzebne? Który z modeli lepie opisue badane zawisko? Rozważyliśmy cztery specyfikace, t. model naogólnieszy z rozkładem t Studenta z nieznaną liczbą stopni swobody (ν) i z częścią regresyną postaci wielomianu II stopnia (M ), następnie model I rzędu z rozkładem t Studenta (M ), model probitowy ze specyfikacą II rzędu (M 3 ) oraz standardowy model probitowy (M 4 ). Modele M, M 3 i M 4 uzyskuemy poprzez warunkowanie względem β lub ν. Narzucenie odpowiednich restrykci na parametry ν lub β w rozkładzie a priori implikue rozkłady a priori dla poszczególnych modeli. W bayesowskim porównywaniu modeli wymaga się, aby rozkłady a priori dla parametrów swoistych w każdym modelu (a takimi są β i ν) były rozkładami właściwymi. Jest to dodatkowy argument za stosowaniem właściwych rozkładów a priori. Bayesowskie porównywanie modeli opiera się na obliczeniu prawdopodobieństw a posteriori każdego modelu wg wzoru p ( M ) gdzie ( ) M i i = 4 h= ( y M i ) p( M i ) p( y M ) p( M ) p y dla i {,,3,4}, () p y i ( ) M i h h p są odpowiednio brzegową gęstością wektora obserwaci i określonym przez badacza prawdopodobieństwem a priori modelu M i ; zob. np. Zellner 97], O Hagan A. [994], Osiewalski [00], Koop[003]. Wyniki wskazały, iż model naogólnieszy (M ) est nabardzie prawdopodobny a posteriori, bez względu czy przymiemy ednakowe szanse a priori każdego modelu czy faworyzuemy te naprostsze, czyli naoszczędnie sparametryzowane. Prawdopodobieństwo a posteriori pozostałych modeli (M, M 3 i M 4 ) w odniesieniu do M wynosi praktycznie zero. Ponadto warto wspomnieć, że spośród dwóch możliwych rozszerzeń standardowego modelu probitowego (M 4 ), dane liczbowe zdecydowanie wskazuą na aproksymacę II rzędu (M 3 ) niż na wprowadzenie rozkładu t Studenta (M ). Szczegółowe wyniki prezentue Tabela. Wszystkie prezentowane dale wyniki dotyczą modelu naogólnieszego, tzn. modelu II rzędu z rozkładem t Studenta. Tabela. Brzegowe gęstości wektora obserwaci i prawdopodobieństwa a posteriori badanych modeli Model M M M 3 M 4 Liczba parametrów (k ) Ln p(y M i ) p(m i ) 0,5 0,5 0,5 0,5 P(M i y) ' i k p(m i ) 9 0 0,3333, P(M i y), , 0 47, Wnioskowanie o wybranych parametrach modelu Rysunek przedstawia histogramy rozkładu a priori i a posteriori dla ν oraz α. Rozkłady a priori, w przeciwieństwie do rozkładów a posteriori, są bardzo rozproszone, zaś dane wnoszą nową informacę w stosunku do te zawarte w rozkładzie a priori. Rozkład a posteriori dla ν est skupiony w wąskim paśmie 4,5-7, przy czym prawdopodobieństwo a priori, że ν (4,5; 7) wynosi edynie 0,4 dla r = 0. Wartość oczekiwana a posteriori dla stopni swobody ν wynosi 5,7, zaś odchylnie standardowe 0,44 i te wyniki nie są wrażliwe na zmiany stałe r. Jeśliby przyąć, że dla ν > 30 rozkład t Studenta można przybliżać rozkładem 8
9 normalnym, to zaproponowana struktura a priori dopuszcza taki przypadek z prawdopodobieństwem Pr[ν > 30] = 0,05. Prawdopodobieństwo a posteriori takiego modelu wynosi praktycznie zero. Wyniki zdecydowanie odrzucaą model probitowy, a nawet logitowy, gdyby przyąć, że rozkład logistyczny może być aproksymowany przez rozkład logistyczny dla 7-9 stopni swobody. Z drugie strony wartości ν (0; ] są mało prawdopodobne a posteriori, więc rozkład składnika losowego ε t w () posiada momenty pierwszego i drugiego rzędu, a nawet wyższych rzędów. Wyniki dotyczące parametru ν potwierdzaą, w przypadku analizowanych danych, zasadność wprowadzonego rozkładu t Studenta. W przypadku parametrów α i α 3 prawie cała masa prawdopodobieństwa a posteriori znadue się w przedziałach (0,35; 0,4) i (0,87;,0). Wartości oczekiwane rozkładu a posteriori dla α i α 3 wynoszą odpowiednio 0,377 i 0,94, zaś odchylenia standardowe 0,008 i 0,06. Tymczasem przymuąc np. α 4 i α 0 prawdopodobieństwo a priori, że = α (0,35; 0,4) wynosi 0,0 zaś Pr[α 3 (0,87;,0)] = 0,0. Wyniki a posteriori nie były wrażliwe na dobór stałych definiuących rozkłady a priori badanych wielkości. 3 = Rysunek. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) parametru ν modelu M 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 0,0 3, 6,4 9,6 p(ν y, M ),8 6,0 9,,4 5,6 8,8 3,0 35, 38,4 0,0 0,9 0,37 p (α y, M ) i p (α 3 y, M ) Rozkład a priori 0,54 0,73 0,9,09,7,45,63,8, Wnioskowanie o niespłacalności kredytów O niespłacalności kredytów detalicznych wnioskuemy w oparciu o efekty krańcowe (η tk ) i prawdopodobieństwa zakwalifikowania danego kredytu do edne z czterech kategorii należności (p t ). Zagadnienie to omówimy na przykładzie dwóch wybranych klientów. Typowy kredytobiorca ma ponad 40 lat, est mężczyzną zatrudnionym na umowę o pracę, ego wpływy na rachunek ROR wynoszą 8,5 tys. zł na kwartał, posiada karty płatnicze lub kredytowe, w banku udzielono mu złotowego kredytu konsumpcynego o wartości tys. zł na okres 3 miesięcy. Natomiast drugi, hipotetyczny kredytobiorca biznesmen - ma 0 lat i w odróżnieniu od typowego klienta nie posiada rachunku ROR i nie korzysta z kart płatniczych tego banku, prowadzi własną działalność gospodarczą, zaś kredyt został mu udzielony poprzez pośrednika, nie zaś bezpośrednio w banku. Rysunki 4 i 5 przedstawiaą rozkłady a priori i a posteriori efektów krańcowych w przypadku tych kredytobiorców. Porównanie obu rozkładów niesie informacę o tym ak dane modyfikuą wiedzę a priori o badanych wielkościach η tk. Zauważmy, że dla dwóch diametralnie różnych kredytobiorców kształt i położenie rozkładów a priori są prawie identyczne. Rozkłady a priori dla η tk są silnie skupione w otoczeniu zera, lecz charakteryzuą się grubymi ogonami. Wraz ze wzrostem stałe s rozkład a priori dla efektów krańcowych ma charakter coraz bardzie leptokurtyczny, por. Rysunek 3. Identyczne rezultaty otrzymamy przymuąc dla każdego β h rozkład ednostany na ustalonym przedziale, np. ( 0; 0), co skłania nas do przypuszczeń, że rozkład niewłaściwy indukue trzypunktowy rozkład a priori dla efektów krańcowych, t. o nawiększe masie prawdopodobieństwa wokół zera, a następnie w ogonach rozkładu. Dla zeroedynkowych zmiennych obaśniaących prawdopodobieństwo a priori, że η tk ( 0,5; 0,5) wynosi od 0, do 0,5 i nie zależy od s. W przypadku zmiennych ciągłych prawdopodobieństwo, że η tk ( 0,75; 0,75) 9
10 est niższe i waha się między 0,03 a 0,05. Natomiast rozkłady a posteriori, w zależności od informaci zawarte w danych, mogą istotnie różnić się co do kształtu i położenia w stosunku do rozkładów a priori. Przykładowo, w przypadku typowego klienta położenie rozkładu a posteriori efektu krańcowego względem okresu kredytowania wskazue, że dane nie wnoszą inne informaci niż rozkład a priori. Oznacza to brak wpływu a posteriori te zmienne na prawdopodobieństwo zakwalifikowania kredytu tego klienta do pierwsze kategorii należności (p t ). Natomiast zmienne wpływy i pośrednik silnie modyfikuą informacę a priori, więc rozkłady a posteriori są zlokalizowane kilka odchyleń standardowych na lewo lub prawo od zera. Następnie, zgodnie z intuicą wnioskowanie o typowym kredytobiorcy est precyzyniesze niż o hipotetycznym (młodym biznesmenie), co przeawia się dużym rozproszeniem rozkładów a posteriori tego ostatniego klienta. Rysunek 3. Rozkłady a priori efektu krańcowego względem zmienne pośrednik w zależności od s Pośrednik - -0,75-0,5-0,5 0 0,5 0,5 0,75 Rysunek 4. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) efektów krańcowych η dla = względem wybranych zmiennych dla typowego klienta 0
11 Rysunek 5. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) efektów krańcowych η dla = względem wybranych zmiennych dla młodego biznesmena Szczegółowe charakterystyki rozkładów a posteriori efektów krańcowych w badanym modelu przedstawiaą tabele, 3 i 4. Udzielenie kredytu konsumpcynego bezpośrednio przez bank (Pośrednik = 0) powodue u typowego klienta wzrost o 0,7 (z błędem ±0,04) prawdopodobieństwa zakwalifikowania kredytu do pierwsze kategorii (p t ) oraz spadek prawdopodobieństwa średnio o 0,06 w przypadku pozostałych kategorii należności ceteris paribus. Wzrost ego wpływów o tys. zł na kwartał powodue wzrost p t o 0,006. Udzielenie kredytu konsumpcynego (typ = ) zamiast hipotecznego zmniesza p t o prawie 0,03. Rola pozostałych zmiennych, z wyłączeniem wieku, posiadania kart, okresu i waluty kredytu, est istotna, ale niewielka z punktu widzenia ryzyka kredytowego. W przypadku młodego biznesmena wpływ zmiennych pośrednik i wpływy na p t est silnieszy niż u typowego klienta. Przyznanie kredytu przez pośrednika zmniesza p t o 0,30 (±0,05) i ednocześnie zwiększa o 0,6 (±0,03) prawdopodobieństwo zakwalifikowania go do należności straconych (p t4 ). Szanse przynależności kredytu od pośrednika do drugie i trzecie kategorii wzrastaą o 0,05 i 0,09. Wzrost kwartalnych wpływów o tys. zł zwiększa p t o 0,05 (±0,006) i ednocześnie zmniesza p t4 o 0,0 (±0,005). Dla 0-letniego klienta wiek est dodatkowym czynnikiem ryzyka. Z roku na rok szanse uznania ego kredytu ako należności normalnych rosną o 0,006, zaś ako należności stracone maleą o 0,004. Wysoka wartość efektu względem zmienne karty odzwierciedla brak zaufania banku do klienta, któremu nie udzielono kart płatniczych i kredytowych (karty=0) z powodu zbyt niskich lub nieregularnych wpływów bądź braku rachunku ROR. Duże znaczenie ma też waluta kredytu, tzn. kredyt w walucie obce zwiększa p t o 0,44 (±0,6), zaś zmniesza p t o 0,0 (±0,04) i p t3 o 0,4 (±0,05) oraz p t4 o 0,0 (±0,08). Wpływ zmienne typ kredytu est nieistotny, ale wskazue, iż udzielnie pożyczki bądź kredytu hipotecznego, które są naczęście w walucie obce, racze zwiększa prawdopodobieństwo regularne spłaty rat i odsetek. W uzupełnieniu Tabela 4 zawiera uśrednione po wszystkich obserwacach wartości efektów krańcowych. Zauważmy, że eżeli kwartalne wpływy na rachunek ROR wzrosną o tys. zł (ceteris paribus), to prawdopodobieństwo terminowe spłaty kredytu konsumpcynego (p t ) wzrośnie średnio o prawie 0,03 (±0,003), a prawdopodobieństwo opóźnienia w spłacie od do 3 miesięcy (p t ) obniży się o 0,004, opóźnienia od 3 do 6 miesięcy (p t3 ) spadnie prawie o 0,007, zaś prawdopodobieństwo opóźnienia dłuższego niż 6 miesięcy (p t4 ) obniży się o 0,0 (±0,00). Ponadto wraz z wydłużeniem o eden rok okresu kredytowania prawdopodobieństwo terminowe spłaty rat wzrośnie o 0,0 (±0,0), zaś szansa całkowitego
12 zaniechania spłaty spadnie o 0,0. Wraz ze wzrostem o tys. zł kwoty udzielnego kredytu szanse zakwalifikowania go do należności normalnych maleą o 0,004 (±0,00), zaś do należności straconych rosną o prawie 0,00 (±0,00). Korzystanie przez kredytobiorcę z kart płatniczych i kredytowych est przeawem większego zaufania banku, p t wzrasta o 0, i ednocześnie p t4 malee o 0,05. Udzielenie kredytu poprzez pośrednika także istotnie zwiększa ryzyko kredytowe, tzn. p t malee o 0,7 (±0,0), zaś p t4 rośnie o 0, (±0,0). Przyznanie kredytu konsumpcynego zamiast hipotecznego zmniesza p t o 0,8 (±0,0) oraz zwiększa p t i p t o około 0,05, zaś p t o 0,07. Studenci korzystaący z kredytu studenckiego (zrdoch3) oraz emeryci i renciści (zrdoch) są mnie ryzykownymi kredytobiorcami niż klienci zatrudnieni na umowę o pracę. Natomiast klienci prowadzący własną działalność gospodarczą (zrdoch) charakteryzuą się nawiększym ryzykiem kredytowym spośród typów klientów rozważanych ze względu na źródło ich dochodów. Efekty krańcowe względem zmiennych ROR i waluta kredytu charakteryzuą się relatywnie dużymi odchyleniami standardowymi a posteriori szacunku, co wskazue na brak wpływu tych zmiennych na wielkość p t. Reasumuąc, w analizowanych trzech przypadkach efekty krańcowe względem te same zmienne posiadaą identyczne znaki (z wyłączeniem nieistotne zmienne ROR dla biznesmena). Znaki efektów krańcowych względem ustalone zmienne dla p t, p t3 i p t4 są identyczne. Głównymi czynnikami determinuącymi spłatę kredytu są typ, kwota, waluta i sposób ego przyznania oraz wpływy na rachunek ROR klienta. Tabela. Wartości oczekiwane i odchylenia standardowe a posteriori efektów krańcowych w przypadku typowego klienta Kategoria = normalne = poniże standardu = 3 wątpliwe = 4 stracone Zmienna E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) Płeć -0,007 (0,003) 0,003 (0,00) 0,00 (0,00) 0,00 (0,00) Wiek 0,03 (0,03) -0,005 (0,006) -0,004 (0,004) -0,004 (0,004) Wpływy 0,55 (0,06) -0,6 (0,06) -0,7 (0,0) -0,54 (0,06) ROR -0,00 (0,003) 0,004 (0,00) 0,003 (0,00) 0,003 (0,00) Karty 0,007 (0,004) -0,003 (0,00) -0,00 (0,00) -0,00 (0,00) Pośrednik -0,73 (0,038) 0,064 (0,0) 0,056 (0,03) 0,05 (0,03) Typ kredytu -0,030 (0,004) 0,0 (0,00) 0,009 (0,00) 0,009 (0,00) Okres kredytu 0,047 (0,09) -0,09 (0,0) -0,05 (0,009) -0,03 (0,008) Kwota -0,089 (0,040) 0,036 (0,06) 0,08 (0,03) 0,05 (0,0) Waluta -0,087 (0,0) 0,03 (0,035) 0,08 (0,036) 0,08 (0,04) Tabela 3. Wartości oczekiwane i odchylenia standardowe a posteriori efektów krańcowych w przypadku biznesmena Kategoria = normalne = poniże standardu = 3 wątpliwe = 4 stracone Zmienna E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) Płeć 0,09 (0,040) 0,00 (0,00) -0,004 (0,00) -0,05 (0,03) Wiek 0,557 (0,0) 0,00 (0,08) -0,35 (0,045) -0,43 (0,79) Wpływy,478 (0,633) -0,0 (0,076) -0,368 (0,69) -,099 (0,486) ROR 0,0 (0,077) -0,003 (0,005) -0,005 (0,0) -0,004 (0,057) Karty 0,34 (0,70) -0,070 (0,043) -0,09 (0,053) -0,63 (0,08) Pośrednik -0,303 (0,05) 0,048 (0,04) 0,095 (0,06) 0,59 (0,09) Typ kredytu -0,88 (0,93) 0,037 (0,035) 0,06 (0,056) 0,088 (0,6) Okres kredytu 0,57 (0,65) -0,005 (0,08) -0,9 (0,070) -0,384 (0,0) Kwota -0,353 (0,335) 0,003 (0,03) 0,088 (0,086) 0,6 (0,50) Waluta 0,440 (0,63) -0,0 (0,04) -0,4 (0,049) -0,97 (0,08)
13 Tabela 4. Wartości oczekiwane i odchylenia standardowe a posteriori uśrednionych efektów krańcowych, T t η tk Kategoria = normalne = poniże standardu = 3 wątpliwe = 4 stracone Zmienna E( y) D( y) E( y) D( y) E( y) D( y) E( y) D( y) Płeć -0,005 (0,003) 0,00 (0,00) 0,00 (0,00) 0,003 (0,00) Wiek 0,35 (0,05) -0,00 (0,005) -0,040 (0,008) -0,075 (0,04) Wpływy,9 (0,53) -0,36 (0,036) -0,685 (0,077) -,44 (0,45) ROR -0,008 (0,04) 0,00 (0,00) 0,00 (0,004) 0,006 (0,009) Karty 0,08 (0,055) -0,08 (0,05) -0,035 (0,08) -0,045 (0,03) Pośrednik -0,73 (0,0) 0,074 (0,003) 0,088 (0,004) 0,0 (0,006) Typ kredytu -0,78 (0,09) 0,049 (0,007) 0,056 (0,006) 0,073 (0,006) Okres kredytu 0,05 (0,3) -0,03 (0,08) -0,059 (0,034) -0,5 (0,06) Kwota -0,45 (0,46) 0,07 (0,04) 0,8 (0,044) 0,6 (0,079) Waluta 0,077 (0,085) -0,04 (0,09) -0,07 (0,04) -0,06 (0,044) Zrdoch 0,05 (0,0) -0,007 (0,00) -0,008 (0,003) -0,00 (0,005) Zrdoch -0,0 (0,006) 0,0 (0,00) 0,007 (0,00) 0,003 (0,003) Zrdoch3 0,9 (0,0) -0,039 (0,004) -0,039 (0,006) -0,04 (0,0) Oszacowany model możemy wykorzystać do celów prognostycznych, czyli prognozowania kategorii należności kredytu udzielonego wybranemu klientowi. Rysunki 6 i 7 przedstawiaą rozkłady a priori i a posteriori prawdopodobieństw zakwalifikowania kredytu konsumpcynego wybranych klientów do edne z czterech kategorii (p t ). Rozkłady a priori p t dla poszczególnych klientów są do siebie bardzo zbliżone. Przymuąc s = 4 (lub większe) otrzymuemy równe szanse a priori, że prawdopodobieństwo zakwalifikowania kredytu do pierwsze kategorii należności est większe niż 0,5 albo mniesze niż 0,5. Mediany a priori dla pozostałych p t są rzędu 0,0 lub mnie i wskazuą, że pozostałe kategorie należności są mało prawdopodobne a priori. Może to pozornie wskazywać na silnie informacyny charakter rozkładu a priori dla p t, gdy =, 3, 4. Z drugie strony, te rozkłady są l-kształtne, więc mediany tych rozkładów są mniesze niż wartości oczekiwane. Rozkłady te są ednak rozproszone, na co wskazuą wartości oczekiwane i odchylenia standardowe (w nawiasie): E[p t ]=0,50 (±0,44), E[p t ]=0, (±0,3), E[p t3 )]=0, (±0,4), E[p t4 ]=0,7 (±0,3). Zatem rozkłady a priori dla p t (=,3,4) mogą być akceptowalne z punktu widzenia posiadane wiedzy o niespłacalności kredytów. Mediana rozkładu a posteriori dla p t typowego klienta wynosi 0,97. W przypadku biznesmena mediany a posteriori p t wynoszą odpowiednio 0,44, 0,4, 0,8 i 0,4 dla =,,4. Dla obu kredytobiorców dane empiryczne silnie zmodyfikowały informacę a priori o p t. Precyza rozkładów a posteriori w stosunku do rozkładów a priori est większa u typowego klienta niż u hipotetycznego biznesmena. 3
14 Rysunek 6. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) prawdopodobieństwa zakwalifikowania kredytu typowego klienta do poszczególnych kategorii należności Rysunek 7. Brzegowe rozkłady a priori (linia ciągła) i a posteriori (słupki) prawdopodobieństwa zakwalifikowania kredytu młodego biznesmena do poszczególnych kategorii należności Spośród czterech rozważanych poniże kredytobiorców namniesze ryzyko kredytowe związane est ze 60-letnią klientką utrzymuącą się z emerytury w kwocie tysiąca złotych netto, które udzielono kredytu hipotecznego. Prawdopodobieństwo terminowe spłaty przez nią rat kapitałowo-odsetkowych est praktycznie równe edności, zob. Tabela 5. Nawiększe ryzyko kredytowe związane est z kredytem konsumpcynym, który został udzielony poprzez pośrednika młodemu biznesmenowi. Prawdopodobieństwo, że będzie on terminowo spłacał kredyt wynosi tylko 0,44 (±0,04), a prawdopodobieństwo opóźnienia spłaty od ednego do 3 miesięcy wynosi 0,4, zaś opóźnienia od 3 do 6 miesięcy 0,8 (±0,0). Natomiast prawdopodobieństwo opóźnienia dłuższego niż 6 miesięcy (czwarta kategoria należności), które powodue obowiązek tworzenia 00% rezerw celowych, wynosi aż 0,4 (±0,03). Istotny, negatywny wpływ korzystania przez bank z usług pośredników kredytowych na ryzyko kredytowe potwierdza analiza 4
15 typowego klienta. Jeżeli udzielono mu kredytu bezpośrednio przez bank, a zatem ego zdolność kredytowa została szczegółowo zweryfikowana przez pracownika banku, wówczas prawdopodobieństwo dotrzymania przez niego umowy est bardzo wysokie i wynosi ponad 0,97, natomiast prawdopodobieństwo opóźnienia w spłacie dłuższego niż 6 miesięcy est znikome 0,0. Gdyby udzielono mu kredytu poprzez pośrednika, wówczas prawdopodobieństwo zakwalifikowania tego kredytu do pierwsze kategorii obniżyłoby się do poziomu 0,80 (±0,04), zakwalifikowania do drugie wynosiłoby 0,08 (±0,0), do trzecie prawie 0,07 (±0,0), a prawdopodobieństwo całkowitego zaniechania spłaty kształtowałoby się na poziomie 0.06 (±0,0). Zauważmy, że oszacowane wielkości p t dla typowego kredytobiorcy odpowiadaą w przybliżeniu empirycznym udziałom ilości poszczególnych kategorii należności w badanym portfelu kredytów detalicznych. Tabela 5. Prognozy prawdopodobieństwa zakwalifikowania kredytu (p t ) wybranego klienta do poszczególnych kategorii ryzyka Klient Kategoria = = = 3 = 4 Typowy E( y) 0,795 0,077 0,066 0,06 (pośrednik=) D( y) (0,039) (0,03) (0,03) (0,03) Typowy E( y) 0,967 0,03 0,00 0,00 (pośrednik=0) D( y) (0,004) (0,00) (0,00) (0,00) Młody E( y) 0,437 0,4 0,80 0,4 Biznesmen D( y) (0,04) (0,003) (0,0) (0,03) Starsza E( y) 0,99 0,003 0,00 0,003 Pani D( y) (0,006) (0,003) (0,00) (0,00) 5. Podsumowanie Celem artykułu było przedstawienie wielomianowego modelu z rozkładem t Studenta dla kategorii uporządkowanych. W szczególność zaprezentowano bayesowską specyfikacę modelu i ego estymacę przy użyciu metod typu Monte Carlo. W artykule wykorzystano pewne uogólnienie modeli naczęście stosowanych w praktyce, t. modelu probitowego i logitowego. Uogólnienie polegało na wprowadzeniu rozkładu z szersze klasy, t. rozkładu t Studenta z nieznaną liczbą stopni swobody, a także na zastosowaniu w równaniu dla zmienne ukryte z t wielomianu stopnia drugiego względem zmiennych egzogenicznych zamiast zależności liniowe. W przypadku posiadanego materiału empirycznego uzyskane wyniki preferuą model naogólnieszy t Studenta z około 6 stopniami swobody i uzasadniaą potrzebę wprowadzonego uogólnienia. Dokonana analiza wrażliwości wskazue, iż dane empiryczne niosą dużo informaci, które modyfikuą wiedzę a priori zarówno o parametrach, ak efektach krańcowych, a dobór stałych definiuących rozkłady a priori nie ma wpływu na wyniki a posteriori. Z punktu widzenia zarządzania ryzykiem poedynczego kredytu detalicznego wyróżniono determinanty kształtuące prawdopodobieństwo zakwalifikowania kredytu do edne z czterech kategorii należności. Głównymi czynnikami determinuącymi spłatę kredytu były typ, kwota i waluta kredytu oraz sposób ego przyznania (przez pośrednika albo bezpośrednio przez bank) i wpływy klienta. Bibliografia Aitchison J., S. Silvey [957], The Generalization of Probit Analysis to the Case of Multiple Responses, Biometrika, 44, s Albert J., S. Chib [993], Bayesian Analysis of Binary and Polychotomous Response Data, Journal of the American Statistical Association, 88, s
16 Gamerman D. [997], Markov Chain Monte Carlo. Stochastic Simulation for Bayesian Inference, Chapman and Hall, London Geweke J. [993], Bayesian Treatment of the Independent Student t Linear Model, Journal of Applied Econometrics, vol. 8, s Geweke J. [996], Monte Carlo Simulation and Numerical Integration: in H. Amman, D. Kendrick and J. Rust (eds.), Handbook of Computational Economics, North-Holland, Amsterdam Koop G. [003], Bayesian Econometrics, Wiley, Chichester. Maddala G.S. [983], Limited Dependent and Qualitative Variables in Econometrics, Cambrigde University Press, Cambrigde McKelvey R.D., W. Zavoina [975], A Statistical Model for the Analysis of Ordinary Level Dependent Variables, Journal of Mathematical Sociology, nr 4, s Marzec J. [003a], Bayesowska analiza modeli dyskretnego wyboru (dwumianowych), Przegląd Statystyczny, t. 50, s Marzec J. [003b], Modele wielomianowe dla kategorii uporządkowanych w badaniu niespłacalności kredytów konsumpcynych, w: Prognozowanie w zarządzaniu firmą (red. P. Dittmann), Prace Naukowe AE we Wrocławiu nr 00, s.43-5 Marzec J. [003c], Bayesowska analiza wielomianowego modelu probitowego dla kategorii uporządkowanych, Folia Oeconomica Cracoviensia, vol s Marzec J. [005], Bayesowski model tobitowy z rozkładem t Studenta w analizie niespłacalności kredytów, Metody ilościowe w naukach ekonomicznych (red. A. Welfe), Wydawnictwo SGH w Warszawie, s Mudholkar G., E. George [978], A Remark on the shape of the logistic distribution, Biometrika, nr 65, s O Hagan A. [994], Bayesian Inference, J. Wiley, New York Osiewalski J. [99], Bayesowska estymaca i predykca dla ednorównaniowych modeli ekonometrycznych, Zeszyty Naukowe Akademii Ekonomiczne w Krakowie, Seria specalna: Monografie, Kraków, nr 00 Osiewalski J. [00], Ekonometria bayesowska w zastosowaniach, Wydawnictwo Akademii Ekonomiczne w Krakowie, Kraków Osiewalski J., J. Marzec [004], Model dwumianowy II rzędu i skośny rozkład Studenta w analizie ryzyka kredytowego, Folia Oeconomica Cracoviensia, vol. 45, s Tierney L. [994], Markov Chains for Exploring Posterior Distributions (with discussion), Annals of Statistics,, s Zellner A. [97], An Introduction to Bayesian Inference in Econometrics, J.Wiley, New York 6
Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Modelowanie zmiennej jakościowej Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 1 / 25 Zmienna jakościowa Zmienna ilościowa może zostać zmierzona
dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.
Zadanie. Dla dowolnej zmiennej losowej X o wartości oczekiwanej μ, wariancji momencie centralnym μ k rzędu k zachodzą nierówności (typu Czebyszewa): ( X μ k Pr > μ + t σ ) 0. k k t σ *
Prawdopodobieństwo i statystyka
Wykład XIV: Metody Monte Carlo 19 stycznia 2016 Przybliżone obliczanie całki oznaczonej Rozważmy całkowalną funkcję f : [0, 1] R. Chcemy znaleźć przybliżoną wartość liczbową całki 1 f (x) dx. 0 Jeden ze
REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój
1 REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój 2 DOTYCHCZASOWE MODELE Regresja liniowa o postaci: y
Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH
Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego Łukasz Kończyk WMS AGH Plan prezentacji Model regresji liniowej Uogólniony model liniowy (GLM) Ryzyko ubezpieczeniowe Przykład
Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 14 Mikołaj Czajkowski Wiktor Budziński Symulacje Analogicznie jak w przypadku ciągłej zmiennej zależnej można wykorzystać metody Monte Carlo do analizy różnego rodzaju problemów w modelach
Matematyka ubezpieczeń majątkowych r.
Zadanie. Niech łączna wartość szkód: Ma złożony rozkład Poissona. Momenty rozkładu wartości poedyncze szkody wynoszą:, [ ]. Wiemy także, że momenty nadwyżki wartości poedyncze szkody ponad udział własny
Uogolnione modele liniowe
Uogolnione modele liniowe Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Uogolnione modele liniowe grudzien 2013 1 / 17 (generalized linear model - glm) Zakładamy,
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Porównanie opłacalności kredytu w PLN i kredytu denominowanego w EUR Przykładowa analiza
Porównanie opłacalności kredytu w PLN i kredytu denominowanego w EUR Przykładowa analiza Opracowanie: kwiecień 2016r. www.strattek.pl strona 1 Spis 1. Parametry kredytu w PLN 2 2. Parametry kredytu denominowanego
Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11
Modele DSGE Jerzy Mycielski Maj 2008 Jerzy Mycielski () Modele DSGE Maj 2008 1 / 11 Modele DSGE DSGE - Dynamiczne, stochastyczne modele równowagi ogólnej (Dynamic Stochastic General Equilibrium Model)
Zawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 3..007 r. Zadanie. Każde z ryzyk pochodzących z pewnej populacji charakteryzuje się tym że przy danej wartości λ parametru ryzyka Λ rozkład wartości szkód z tego ryzyka
Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej
Ekonometria Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Wykład 4 Prognozowanie, stabilność 1 / 17 Agenda
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =
Matematyka ubezpieczeń majątkowych 0.0.006 r. Zadanie. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k 5 Pr( N = k) =, k = 0,,,... 6 6 Wartości kolejnych szkód Y, Y,, są i.i.d.,
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyka i eksploracja danych
Wykład II: i charakterystyki ich rozkładów 24 lutego 2014 Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa,
HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =
HISTOGRAM W pewnych przypadkach interesuje nas nie tylko określenie prawdziwej wartości mierzonej wielkości, ale także zbadanie całego rozkład prawdopodobieństwa wyników pomiarów. W takim przypadku wyniki
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:
W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana
Agata Boratyńska Statystyka aktuarialna... 1
Agata Boratyńska Statystyka aktuarialna... 1 ZADANIA NA ĆWICZENIA Z TEORII WIAROGODNOŚCI Zad. 1. Niech X 1, X 2,..., X n będą niezależnymi zmiennymi losowymi z rozkładu wykładniczego o wartości oczekiwanej
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)
Statystyka I Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) 1 Zmienne jakościowe qzmienne jakościowe niemierzalne kategorie: np. pracujący / bezrobotny qzmienna binarna Y=0,1 qczasami
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka
Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE Joanna Sawicka Plan prezentacji Model Poissona-Gamma ze składnikiem regresyjnym Konstrukcja optymalnego systemu Bonus- Malus Estymacja
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA
STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA Zadanie 0.1 Zmienna losowa X ma rozkład określony funkcją prawdopodobieństwa: x k 0 4 p k 1/3 1/6 1/ obliczyć EX, D X. (odp. 4/3;
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 5.0.00 r. Zadanie. Dla dowolnej zmiennej losowej X o wartości oczekiwanej µ wariancji oraz momencie centralnym µ k rzędu k zachodzą nierówności (typu Czebyszewa): ( X
ANALIZA EFEKTÓW SKALI
acek BATÓG Uniwersytet Szczeciński ANALIZA EFEKTÓW SKALI Podstawowe definice Wzrost wielkości przedsiębiorstwa związany ze zwiększaniem się poziomu produkci oraz takimi zawiskami ak: wzrost specalizaci
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 0.0.005 r. Zadanie. Likwidacja szkody zaistniałej w roku t następuje: w tym samym roku z prawdopodobieństwem 0 3, w następnym roku z prawdopodobieństwem 0 3, 8 w roku
METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład 3-4. Parametry i wybrane rozkłady zmiennych losowych
METODY BADAŃ NA ZWIERZĘTACH ze STATYSTYKĄ wykład - Parametry i wybrane rozkłady zmiennych losowych Parametry zmiennej losowej EX wartość oczekiwana D X wariancja DX odchylenie standardowe inne, np. kwantyle,
STATYSTYKA MATEMATYCZNA WYKŁAD stycznia 2010
STATYSTYKA MATEMATYCZNA WYKŁAD 14 18 stycznia 2010 Model statystyczny ROZKŁAD DWUMIANOWY ( ) {0, 1,, n}, {P θ, θ (0, 1)}, n ustalone P θ {K = k} = ( ) n θ k (1 θ) n k, k k = 0, 1,, n Geneza: Rozkład Bernoulliego
Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe
Rachunek Prawdopodobieństwa istatystyka W4 Rozkład normalny Parametry rozkładu zmienne losowe Zmienne losowe wielowymiarowe Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Rozkład normalny - standaryzaca
Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)
MODELE STATYSTYCZNE Punktem wyjścia w rozumowaniu statystycznym jest zmienna losowa (cecha) X i jej obserwacje opisujące wyniki doświadczeń bądź pomiarów. Zbiór wartości zmiennej losowej X (zbiór wartości
Testy zgodności 9 113
Testy zgodności 9 3 9. TESTY ZGODNOŚCI 9. Różne sytuace praktyczne W praktyce badań statystycznych, ak uż poprzednio stwierdzono, cały proces analizy statystyczne dzielimy na dwa etapy: formułowanie hipotezy
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria prof. dr hab. inż. Jacek Mercik B4 pok. 55 jacek.mercik@pwr.wroc.pl (tylko z konta studenckiego z serwera PWr) Konsultacje, kontakt itp. Strona WWW Elementy wykładu.
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
5 Błąd średniokwadratowy i obciążenie
5 Błąd średniokwadratowy i obciążenie Przeprowadziliśmy 200 powtórzeń przebiegu próbnika dla tego samego zestawu parametrów modelowych co w Rozdziale 1, to znaczy µ = 0, s = 10, v = 10, n i = 10 (i = 1,...,
Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f
Zadanie. W kolejnych latach t =,,,... ubezpieczony charakteryzujący się parametrem ryzyka Λ generuje N t szkód. Dla danego Λ = λ zmienne N, N, N,... są warunkowo niezależne i mają (brzegowe) rozkłady Poissona:
BAYESOWSKA ANALIZA KRAŃCOWEJ SKŁONNOŚCI DO KONSUMPCJI
Bayesowska analiza krańcowej skłonności do konsumpcji STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 9 MARIUSZ DOSZYŃ Uniwersytet Szczeciński BAYESOWSKA ANALIZA KRAŃCOWEJ SKŁONNOŚCI DO KONSUMPCJI
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak 1 Wprowadzenie. Zmienne losowe Podczas kursu interesować nas będzie wnioskowanie o rozpatrywanym zjawisku. Poprzez wnioskowanie rozumiemy
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
Analiza niepewności pomiarów
Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej
6. ANALIZA POST-OPTYMALIZACYJNA analiza wrażliwości rozwiązania optymalnego
6. ANALIZA POST-OPTYMALIZACYJNA analiza wrażliwości rozwiązania optymalnego Analiza wrażliwości est studium analizy wpływu zmian wartości różnych parametrów modelu PL na rozwiązanie optymalne. Na optymalne
Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.
Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,
gdzie. Dla funkcja ma własności:
Ekonometria, 21 listopada 2011 r. Modele ściśle nieliniowe Funkcja logistyczna należy do modeli ściśle nieliniowych względem parametrów. Jest to funkcja jednej zmiennej, zwykle czasu (t). Dla t>0 wartośd
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
POMIAR KORZYŚCI Z ZASTOSOWANIA MODELU WIELOMIANOWEGO W OGRANICZANIU RYZYKA KREDYTOWEGO. Wprowadzenie
Jerzy Marzec 1 Katedra Ekonometrii i Badań Operacyjnych Uniwersytet Ekonomiczny w Krakowie POMIAR KORZYŚCI Z ZASTOSOWANIA MODELU WIELOMIANOWEGO W OGRANICZANIU RYZYKA KREDYTOWEGO Wprowadzenie Jednym z głównych
Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 9 Mikołaj Czajkowski Wiktor Budziński Wielomianowy model logitowy Uogólnienie modelu binarnego Wybór pomiędzy 2 lub większą liczbą alternatyw Np. wybór środka transportu, głos w wyborach,
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.
Zadanie 1 Niech y t ma rozkład logarytmiczno normalny o funkcji gęstości postaci [ ] 1 f (y t ) = y exp (ln y t β ln x t ) 2 t 2πσ 2 2σ 2 Zakładamy, że x t jest nielosowe a y t są nieskorelowane w czasie.
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Poszukiwanie optymalnego wyrównania harmonogramu zatrudnienia metodą analityczną
Mieczysław POŁOŃSKI Wydział Budownictwa i Inżynierii Środowiska, Szkoła Główna Gospodarstwa Wieskiego, Warszawa, ul. Nowoursynowska 159 e-mail: mieczyslaw_polonski@sggw.pl Poszukiwanie optymalnego wyrównania
N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:
Zadanie. O niezależnych zmiennych losowych N, M M, M 2, 3 wiemy, że: N ma rozkład Poissona z wartością oczekiwaną równą 00 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach: 2, 3 Pr( M = )
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016 Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja
Prawdopodobieństwo i statystyka
Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Zmienne losowe Wartość oczekiwana Dystrybuanty Słowniczek teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej
Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania
Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym
Wykład 5. Skręcanie nieskrępowane prętów o przekroju prostokątnym.
Adresy internetowe, pod którymi można znaleźć wykłady z Wytrzymałości Materiałów: Politechnika Krakowska http://limba.wil.pk.edu.pl/kwm-edu.html Politechnika Łódzka http://kmm.p.lodz.pl/dydaktyka Wykład
Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Metoda największej wiarogodności
Wprowadzenie Założenia Logarytm funkcji wiarogodności Metoda Największej Wiarogodności (MNW) jest bardziej uniwersalną niż MNK metodą szacowania wartości nieznanych parametrów Wprowadzenie Założenia Logarytm
Rozkład Gaussa i test χ2
Rozkład Gaussa jest scharakteryzowany dwoma parametramiwartością oczekiwaną rozkładu μ oraz dyspersją σ: METODA 2 (dokładna) polega na zmianie zmiennych i na obliczeniu pk jako różnicy całek ze standaryzowanego
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Ekonometria. Zajęcia
Ekonometria Zajęcia 16.05.2018 Wstęp hipoteza itp. Model gęstości zaludnienia ( model gradientu gęstości ) zakłada, że gęstość zaludnienia zależy od odległości od okręgu centralnego: y t = Ae βx t (1)
Wybrane rozkłady zmiennych losowych. Statystyka
Wybrane rozkłady zmiennych losowych Statystyka Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość 1 z prawdopodobieństwem p i wartość 0 z prawdopodobieństwem 1- p x i p i 0 1-p 1
Wybrane rozkłady zmiennych losowych. Statystyka
Wybrane rozkłady zmiennych losowych Statystyka Rozkład dwupunktowy Zmienna losowa przyjmuje tylko dwie wartości: wartość 1 z prawdopodobieństwem p i wartość 0 z prawdopodobieństwem 1- p x i p i 0 1-p 1
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 13 i 14 1 / 15 MODEL BAYESOWSKI, przykład wstępny Statystyka
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
Ćwiczenia IV
Ćwiczenia IV - 17.10.2007 1. Spośród podanych macierzy X wskaż te, których nie można wykorzystać do estymacji MNK parametrów modelu ekonometrycznego postaci y = β 0 + β 1 x 1 + β 2 x 2 + ε 2. Na podstawie
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
STATYSTYKA wykład 5-6
TATYTYKA wykład 5-6 Twierdzenia graniczne Rozkłady statystyk z próby Wanda Olech Twierdzenia graniczne Jeżeli rozpatrujemy ciąg zmiennych losowych {X ; X ;...; X n }, to zdarza się, że ich rozkłady przy
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Janusz Adamowski METODY OBLICZENIOWE FIZYKI Kwantowa wariacyjna metoda Monte Carlo. Problem własny dla stanu podstawowego układu N cząstek
Janusz Adamowski METODY OBLICZENIOWE FIZYKI 1 Rozdział 20 KWANTOWE METODY MONTE CARLO 20.1 Kwantowa wariacyjna metoda Monte Carlo Problem własny dla stanu podstawowego układu N cząstek (H E 0 )ψ 0 (r)
ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW
ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW POPULACJI Szkic wykładu Wprowadzenie 1 Wprowadzenie 2 3 4 Przypomnienie dotychczasowych rozważań Przedziałem ufności nazywamy przedział losowy, o którym przypuszczamy
(Dantzig G. B. (1963))
(Dantzig G.. (1963)) Uniwersalna metoda numeryczna dla rozwiązywania zadań PL. Ideą metody est uporządkowany przegląd skończone ilości rozwiązań bazowych układu ograniczeń, które możemy utożsamiać, w przypadku
Wnioskowanie statystyczne. Statystyka w 5
Wnioskowanie statystyczne tatystyka w 5 Rozkłady statystyk z próby Próba losowa pobrana z populacji stanowi realizacje zmiennej losowej jak ciąg zmiennych losowych (X, X,... X ) niezależnych i mających
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
WYKORZYSTANIE MODELU LOGITOWEGO DO ANALIZY BEZROBOCIA WŚRÓD OSÓB NIEPEŁNOSPRAWNYCH W POLSCE W 2010 ROKU
STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 31 Beata Bieszk-Stolorz Uniwersytet Szczeciński WYKORZYSTANIE MODELU LOGITOWEGO DO ANALIZY BEZROBOCIA WŚRÓD OSÓB NIEPEŁNOSPRAWNYCH W POLSCE W
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka. Wstęp teoretyczny Zmienne losowe Zmienne losowe
Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju
Funkcje charakterystyczne zmiennych losowych, linie regresji -go i 2-go rodzaju Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
System bonus-malus z mechanizmem korekty składki
System bonus-malus z mechanizmem korekty składki mgr Kamil Gala Ubezpieczeniowy Fundusz Gwarancyjny dr hab. Wojciech Bijak, prof. SGH Ubezpieczeniowy Fundusz Gwarancyjny, Szkoła Główna Handlowa Zagadnienia