Studa Ekonomczne Zeszyty Naukowe Unwersytetu Ekonomcznego w Katowcach ISSN 083-86 Nr 4 05 Ekonoma 3 Alcja Wolny-Domnak Unwersytet Ekonomczny w Katowcach Wydzał Ekonom Katedra Metod Statystyczno-Matematycznych w Ekonom alcjawolny-domnak@uekatowcepl adeusz Czernk Unwersytet Ekonomczny w Katowcach Wydzał Fnansów Ubezpeczeń Katedra Matematyk Stosowanej w Ekonom tadeuszczernk@uekatowcepl Jan Acedańsk Unwersytet Ekonomczny w Katowcach Wydzał Ekonom Katedra Metod Statystyczno-Matematycznych w Ekonom janacedansk@uekatowcepl MODEL REGRESJN WAROŚCI POJEDNCZEJ SZKOD UWZGLĘDNIAJĄC POLIS BEZSZKODOWE Streszczene: Celem pracy jest zaproponowane rozkładu prawdopodobeństwa, w którym dowolny rozkład dyspersyjnej rodzny rozkładów wykładnczych zostaje rozszerzony o wartośc zerowe (ozn ZA-rozkład) Rozkład ten wykorzystywany jest dalej do konstrukcj modelu regresyjnego mającego zastosowane w prognozowanu wartośc pojedynczej szkody w masowym portfelu pols ubezpeczenowych (np komunkacyjne czy neruchomośc) Słowa kluczowe: ZA-rozkład, GLM, portfel pols Wprowadzene W dzałalnośc ubezpeczenowej, w szczególnośc w ubezpeczenach majątkowych, stotnym zagadnenem jest prognozowane wartośc pojedynczej szkody w portfelu majątkowych pols ubezpeczenowych Uzyskane prognozy stosowane są dalej w takch zagadnenach ubezpeczenowych, jak: taryfkacja [Antono Berlant, 006; Wolny-Domnak, 009; Ohlsson Johansson, 00; Praca częścowo fnansowana przez grant Narodowego Centrum Nauk (nr NN 46540)
56 Alcja Wolny-Domnak, adeusz Czernk, Jan Acedańsk Antono Valdez, 0), szacowane rezerw szkodowych [aylor, 000; Wolny, 003, s 678-684; Pobłocka, 0, s 73-89] czy zarządzane ryzykem Jednym z podejść w prognozowanu jest podejśce modelowe, w którym analzuje sę wartośc szkód dla pojedynczych pols wraz z czynnkam, które mogą meć wpływ na wystąpene szkody oraz jej wysokość Najczęścej budowane są modele regresyjne, a w szczególnośc uogólnone modele lnowe (ozn GLM) [por Nelder Wedderburn, 97] W ubezpeczenowych modelach GLM zmenną objaśnaną jest mn wartość pojedynczej szkody W przypadku gdy w portfelu ubezpeczenowym występuje duża lczba pols, dla których ne wystąpła żadna szkoda (dalej nazywanych polsam bezszkodowym), rodz sę problem określena rozkładu zmennej losowej reprezentującej wartość szkód dla pojedynczej polsy w modelu GLM Jednym z możlwych podejść jest pomnęce pols bezszkodowych wykorzystywane nformacj dotyczących jedyne tych pols, dla których wystąpła co najmnej jedna szkoda zakładając asymetryczny rozkład gamma [MacCullagh Nelder, 989; Ostasewcz Dębcka, 004; Ohlsson Johansson, 00] Jednak wydaje sę, ż prowadz to do utraty pewnych stotnych nformacj zawartych w portfelu pols, jeśl chodz np o czynnk wpływające na wystąpene szkody oraz częstość szkód dla danej polsy Celem pracy jest zaproponowane rozkładu prawdopodobeństwa, w którym rozszerzamy dowolny rozkład dla > 0 o wartośc zerowe (ozn ZA-rozkład) oraz konstrukcja modelu regresyjnego służącego do prognozowana wartośc pojedynczej szkody w portfelu pols Problemem predykcj z wykorzystanem model lnowych będącym przypadkam szczególnym modelu GLM w problemach ekonomcznych zajmowal sę mn Rao [003] Żądło [008] W perwszej częśc pracy charakteryzujemy ogólne ZA-rozkład oraz rozpatrujemy przypadek rozkładu gamma Dalej prezentujemy model regresyjny do szacowana składk czystej dla pojedynczej polsy Postać tego modelu jest zblżona do modelu GLM, jednak formalne ne jest to model GLM, gdyż ne jest spełnone założene stanowące, ż rozkład zmennej objaśnanej pochodz z dyspersyjnej rodzny rozkładów wykładnczych W ostatnej częśc pracy przedstawamy studum przypadku na danych zaczerpnętych w lteratury przedmotu [de Jong Heller, 008] Do oblczeń wykorzystujemy program R [R_Core_eam, 03] Charakterystyka ZA-rozkładu W celu zdefnowana ogólnej postac ZA-rozkładu prawdopodobeństwa oznaczmy przez zmenną losową o wartoścach neujemnych, 0 Dystrybuanta ZA-rozkładu zmennej ma wtedy postać:
Model regresyjny wartośc pojedynczej szkody 57 F ( y) 0 dla y 0 = v + ( v) F > 0 ( y) dla y > 0 () lub równoważne ( ) = + ( ) ( ) F y vi v F y y> 0 > 0 + gdze: supp ( F > 0 ) =, F ( y/ 0) F> 0 ( y), () > = jest dowolnym rozkładem, ν oznacza prawdopodobeństwo ne wystąpena szkody oraz I > 0 0 dla y 0 = dla y > 0 Zatem funkcja gęstośc jest wyrażenem postac: gdze: δ δ ( ), (3) 0 = y jest marą atomową zwaną równeż deltą Draca [Drac, 98] Mara dana jest wzorem: zachodz: ( ) = + ( ) ( ) f y v v f y +, y = 0 δ ( y) =, 0, y 0 Korzystając ze wzorów (3) oraz (4) mamy: δ 0 > 0 δ ( y) dy = (4) f ( > 0 y) dy = ν δ ( y) dy + ( ν ) f ( y) dy = (5) Rozpatrywana zmenna jest meszaną zmenną losową posadającą komponentę dyskretną oraz cągłą Łatwo wyprowadzć dwa perwsze momenty ZA-rozkładu Wartość oczekwaną z g() oblczamy ze wzoru (o le wartość oczekwana stneje):
58 Alcja Wolny-Domnak, adeusz Czernk, Jan Acedańsk E [ g( )] = ν g( y) d( I > 0 ) + ( ν ) g( y) df > 0 Dalej gdze: E g( )] = νg(0) + ( ν ) g( y) f ( y) dy, E[ g( ) > 0] = g( y) f 0 ( y) dy Skąd łatwo znajdujemy: [ > 0 > E[ ] = ( ν ) yf > 0 ( y) dy = ( ν ) E[ > 0] = ( ν ) μ, dla parametru μ będącym wartoścą oczekwaną pod warunkem > 0 Interpretując, parametr ten jest wartoścą oczekwaną wartośc pojedynczej szkody, o le do nej doszło Przechodząc do warancj wyprowadźmy: D ( ) = E[ E[ ] ( E[ ]) ] = ( ν ) E[ = ( ν ) E[ > 0], > 0] ( ν ) ( E[ > 0]) Ostateczne znajdujemy: D ( ) = ( ν ) D[ > 0] ( ν ) ν ( E[ > Zatem warancja zmennej ma postać: D ( ) = ( ν )[ σ νμ ], (6) 0]) gdze: D [ > 0] = σ jest warancją pod warunkem 0 > Interesującym nasz przypadkem ZA-rozkładu znajdującym zastosowane w zagadnenach ubezpeczenowych jest przyjęce założena, ż rozkład dla częśc dodatnej > 0 jest rozkładem gamma z parametram ( k, θ ) o gęstośc: f g > 0 α ( y, μ, α) = μ α y α e αy μ Γ( α) (7)
Model regresyjny wartośc pojedynczej szkody 59 Dla postac (7) rozkładu gamma, dwa perwsze momenty wynoszą: α E[ > 0] = 3 α, D ( > 0) = μ μ Możlwa jest równeż nna parametryzacja rozkładu gama, jednak wzór (7) jest najczęścej stosowany w modelach GLM Model regresyjny do prognozowana wartośc pojedynczej szkody w portfelu ubezpeczenowym Nech,,n będą nezależnym zmennym losowym reprezentującym wartość pojedynczej szkody w portfelu pols ubezpeczenowych przyjętym w modelu regresyjnym jako zmenne objaśnane o realzacjach y,, yn Klasyczne w modelowanu wartośc pojedynczej szkody przyjmuje sę rozkład gamma zmennej, =,, n W celu wykorzystana nformacj dotyczących pols bezszkodowych, w modelu regresyjnym zakładamy ZA-rozkład zmennej postac: g f ( y ) = νδ0 + ( ν ) f > 0( y ) (8) Dalej nech X,, X k będą jakoścowym zmennym objaśnającym, które nterpretujemy jako czynnk wpływające na wartość pojedynczej szkody w portfelu (np czynnk charakteryzujące osobę ubezpeczającą oraz czynnk charakteryzujące przedmot ubezpeczena, tj pojazd, meszkane, dom) Przyjmujemy równeż, ż pewne czynnk wpływają równeż na wystąpene szkody dla ustalena uwag oznaczmy je poprzez Z,, Z q W proponowanym modelu regresyjnym oznaczmy β = ( β0, β,, β k ) jako efekty dla wartośc pojedynczej szkody oraz = ( 0,,, q ) jako efekty dla prawdopodobeństwa ne wystąpena szkody Model regresyjny defnujemy następująco: E[ X,, X k, Z,, Z q ] = [ ν (, Z,, Z q )] μ ( β, X,, X k ) (9) W modelu (0) parametry μ są uzależnone od zmennych objaśnających za pomocą funkcj logarytmcznej natomast parametry v funkcj logtowej Zatem mamy: β e x μ, X,, X ) ( k = β,
60 Alcja Wolny-Domnak, adeusz Czernk, Jan Acedańsk ν, Z,, Z ( q z e ) = + e z = + e z, gdze: x oznacza -ty wersz macerzy modelu X dla zmennych, oraz z oznacza -ty wersz macerzy modelu Z dla zmennych Z,, X, Z q X k Do estymacj parametrów modelu regresyjnego stosujemy metodę najwększej warygodnośc Funkcja warygodnośc ma zatem postać: N N s L( β, ) = ν ( ν ) f ( y, μ ), (0) = N j= N Ns + > 0 j j N s lczbą szkód ( > 0) Po- gdze: N jest lczbą pols w portfelu natomast wyższą funkcję warygodnośc można zapsać: N N s L( β, ) = [ ν ( ν )] f ( y, μ ), () = Zatem funkcja L ( ) dekomponuje sę na funkcje L ( ) oraz L ( ) następująco: gdze: L ( β ) zależy tylko od β natomast L ( ) zależy jedyne od Przechodząc dalej do postac logarytmcznej we wzorze (5), funkcja log-warygodnośc może być zapsana jako dwe odrębne funkcje: Warunk koneczne wystąpena ekstremum: ) (3) log L log L = = 0 (4) β β log L log L = = 0 (5) Hesjan jest macerzą blokowo-dagonalno, poneważ zachodz: N = N Ns + N > 0 j= N Ns + L β, ) = L ( β) L ( ), () ( logl = logl ( β) + logl ( H (log L) β j log L = = 0 (6) β m n j
Model regresyjny wartośc pojedynczej szkody 6 Z własnośc wyznacznka (dla macerzy dagonalno-klatkowej) wynka, że cała macerz jest ujemne określona, jeżel obe kwadratowe, dagonalnoklatkowe macerze są ujemne określone Wraz z (4) (5) oznacza to, że możemy poszukwać maksmum osobno dla funkcj log L ( β) oraz log L ( ) 3 Studum przypadku Chcąc zlustrować możlwośc omawanego modelu wykorzystano zbór danych z lteratury przedmotu [de Jong Heller, 008], dostępny na strone nternetowej [www ] Zawera on dane dotyczące rocznych pols obowązkowego ubezpeczena odpowedzalnośc cywlnej posadaczy pojazdów mechancznych Zbór lczy 67 856 pols, z czego w badanym roku szkody odnotowano na 464 polsach, co stanow około 6,8% całego zboru Oprócz danych na temat wysokośc szkód, zbór zawera nformacje dotyczące typu (zmenna PE możlwych typów) oraz weku (VEH_AGE 4 grupy (GR_ najmłodszy)) pojazdów, a także płc (SEX), weku (AGE 6 grup wekowych (GR_ - najmłodszy)) oraz mejsca zameszkana właśccel (AREA 6 obszarów) W perwszym kroku analzy szacowano parametry całego modelu uwzględnające wszystke pęć zmennych objaśnających, korzystając z metody najwększej warygodnośc Zgodne z rozważanam przedstawonym w poprzednch punktach pracy estymowano oddzelne dwa modele cząstkowe (wzór 4) Prawdopodobeństwa wystąpena szkody modelowano korzystając z klasycznego modelu logtowego [Greene, 003], natomast wysokość szkody opsywana była uogólnonym modelem lnowym z rozkładem gamma (wzór 8) Następne z poszczególnych model cząstkowych usunęte zostały zmenne, dla których żadna z możlwych kategor ne mała stotnego (przyjmując pozom stotnośc równy 0,) wpływu na wystąpene wysokość szkody W efekce w obu cząstkowych modelu wykorzystywano nne zestawy zmennych objaśnających: w przypadku szacowana prawdopodobeństwa wystąpena szkody stotnym zmennym okazały sę typ oraz wek pojazdu, natomast przy estymacj wysokośc szkody statystyczne stotne okazały sę wek pojazdu, a także płeć, wek oraz mejsce zameszkana właśccela Wartośc oszacowanych parametrów zestawono w tabel
6 Alcja Wolny-Domnak, adeusz Czernk, Jan Acedańsk abela Oszacowana parametrów modelu Prawdopodobeństwo szkody Wysokość szkody p- p- Zm Wartość ˆ Zm Wartość βˆ -wart -wart exp(βˆ ) CONS 0,9*** 0,00 CONS 7,68*** 0,00 64,60 CONV,74***,00 GR_ 0,07 0,33 000,07 VEH_A COUPE,54*** 0,99 GR_3 0, 0,5 000, GE HBACK,9*** 0,97 GR_4 0,9** 0,0 000, HDOP,5*** 0,99 SEX M 0,6*** 0,00 000,7 MCARA 0,88*** 0,00 B 0,03 0,67 0000,97 PE MIBUS 0 5,76*** 0,00 C 0,05 0,48 000,05 PANVN,5*** 0,99 AREA D 0,00 0,97 000,00 RDSR,34***,00 E 0,4 0,6 000,5 SEDAN 0 8,53*** 0,00 F 0,35*** 0,00 000,4 SNWG 0 5,0*** 0,00 GR_ 0,0** 0,03 0000,8 RUCK 0 4,00*** 0,00 GR_3 0,9*** 0,00 0000,75 UE,3*** 0,98 AGE GR_4 0,3*** 0,00 0000,74 GR_ 0 0,9*** 0,80 GR_5 0,4*** 0,00 0000,66 VEH_A GR_3 0 0,5*** 0,50 GR_6 0,33*** 0,00 0000,7 GE GR_4 0,8*** 0,00 NULL DEV 864,37 NULL DEV 7705, RESID DEV 593, RESID DEV 7538, Prawdopodobeństwo wystąpena szkody jest najwększe dla karawanów (MCARA) Istotne jest równeż dla cężarówek (RUCK), samochodów o nadwozu komb (SNWG), mnbusów (MIBUS) oraz w mnejszym stopnu, samochodów z nadwozem sedan (SEDAN) Ponadto, prawdopodobeństwo to w znaczącym stopnu zwększa duży wek pojazdu (GR_4) Duża różnca pomędzy zmennoścą modelowanej zmennej (NULL DEV) a zmennoścą reszt modelu (RESID DEV) wskazuje, że przyjęty zestaw zmennych pozwala na wyjaśnene znaczącej częśc różnc w obserwowanej szkodowośc pols akże w odnesenu do modelowana wysokośc szkody w przypadku najstarszych pojazdów wysokość ta, w porównanu do pojazdów najmłodszych, jest stotne wyższa wynos około 0% Wysokość szkody w przypadku mężczyzn jest o około 7% wyższa nż dla kobet Duża różnca szkodowośc, sęgająca mnej węcej 40%, występuje pomędzy regonem A oraz F Najwyższą wartoścą szkód charakteryzują sę kerowcy najmłods Różnca w stosunku do pozostałych grup wekowych jest w każdym przypadku stotna statystyczne waha sę od 0% do 35% Należy dodać, że średna wartość szkody dla polsy odnoszącej sę do pojazdu z najnższej grupy wekowej, którego posadaczem jest kobeta zameszkująca regon A, z najmłodszej grupy wekowej wynos w rozpatrywanym zborze 64 $ Jakość dopasowana tej częśc modelu jest jednak znaczne nższa nż poprzednej Redukcja zróżncowana jest bowem newelka
Model regresyjny wartośc pojedynczej szkody 63 Podsumowane W pracy zaproponowano model regresyjny do szacowana wartośc pojedynczej szkody z uwzględnenem pols bezszkodowych Wykazano, ż model ten dekomponuje sę na dwa modele GLM, co znaczne upraszcza jego praktyczne zastosowane Omawany model wykorzystano do szacowana czynnków oddzałujących na wysokość szkody portfela pols obowązkowego ubezpeczena OC posadaczy pojazdów mechancznych Wśród zmennych najslnej wpływających na prawdopodobeństwo zgłoszena szkody zdentyfkowano klka typów pojazdów oraz jego wek Na wysokość szkody wpływ mają wek pojazdu, płeć oraz wek posadacza, a także regon zameszkana W omawanym przypadku model lepej wyjaśna prawdopodobeństwa zgłoszena szkody nż jej wysokość Lteratura Antono K Berlant J (006), Rsk Classfcaton n Nonlfe Insurance [w:] EL Melnck, BS Evertt (eds), Encyclopeda of Quanttatve Rsk Analyss and Assessment, Vol, Wley, Chchester Antono K Valdez EA (0), Statstcal Concepts of a Pror and a Posteror Rsk Classfcaton n Insurance, AStA Advances n Statstcal Analyss, Vol 96(), s 87-4 Drac PAM (98), he Prncples of Quantum Mechancs, Internatonal Seres of Monographs on Physcs, Oxford Unversty Press, Oxford Greene WH (003), Econometrc Analyss, 5/e, Pearson Educaton Inda, Delh Jong P de Heller GZ (008), Generalzed Lnear Models for Insurance Data, Cambrdge Unversty Press, Cambrdge MacCullagh P Nelder JA (989), Generalzed Lnear Models, CRC Monographs on Statstcs & Appled Probablty, Sprnger Verlag, New ork, Nelder JA Wedderburn RW (97), Generalzed Lnear Models, Journal of the Royal Statstcal Socety Seres A (General), s 370-384 Ohlsson, E Johansson B (00), Non-Lfe Insurance Prcng Wth Generalzed Lnear Models, Sprnger Verlag, New ork Ostasewcz, W Dębcka J (004), Składk ryzyko ubezpeczenowe: modelowane stochastyczne, Wydawnctwo Akadem Ekonomcznej, Wrocław Pobłocka A (0), Rezerwa IBNR w ubezpeczenach majątkowych praktyczne metody jej szacowana, Wydawnctwo Unwersytetu Ekonomcznego, Wrocław R_Core_eam (03), R: A language and Envronment for Statstcal Computng, R Foundaton for Statstcal Computng, Venna, Austra Rao JN (003), Small Area Estmaton, Wley, Hoboken
64 Alcja Wolny-Domnak, adeusz Czernk, Jan Acedańsk Ronka-Chmelowec W Helpern S (000), Zarządzane ryzykem w ubezpeczenach, Wydawnctwo Akadem Ekonomcznej, Wrocław Szkutnk W (003), Wybrane modele w zarządzanu ryzykem ubezpeczenowym w ujęcu probablstycznym, Wydawnctwo Akadem Ekonomcznej, Katowce aylor GC (000), Loss Reservng: An Actuaral Perspectve, Kluwer Academc, Dordrecht Wanat S (008), Wybrane metody uwzględnana zależnośc w modelowanu ryzyka ubezpeczycela [w:] rzaskalk (red), Modelowane preferencj a ryzyko'07, Wydawnctwo Akadem Ekonomcznej, Katowce, s 377-39 Wolny A (003), Analza wrażlwosc wynku techncznego zakladu ubezpeczen na zmane stanu rezerwy na ne wyplacone odszkodowana swadczena, Wydawnctwo Akadem Ekonomcznej, Wroclaw Wolny-Domnak A (009), Szacowane pozomu zmennych taryfkacyjnych w ubezpeczenach typu non-lfe, Studa Ekonomczne, nr 57, Wydawnctwo Akadem Ekonomcznej, Katowce, s 0-09 Żądło (008), Elementy statystyk małych obszarów z programem R, Wydawnctwo Akadem Ekonomcznej, Katowce [www ] http://wwwbusnessandeconomcsmqeduau/our_departments/appled_fnance _and_actuaral_studes/research/books/glmsforinsurancedata/data_sets (dostęp: 003) REGRESSION MODEL OF A SINGLE CLAIM VALUE WIH NO-CLAIMS POLICIES Summary: In the paper, we ntroduce probablty dstrbuton whch augments any dstrbuton from the exponental famly wth zero value (ZA-dstrbuton) he new dstrbuton s then employed n a regresson model appled for forecastng value of a sngle clam n a large nsurance portfolo (motor or property) Keywords: ZA-dstrbuton, GLM, nsurance portfolo