Alica Wolny-Dominiak Uniwersytet Ekonomiczny w Katowicach ZMODYFIKOWANA REGRESJA LOGARYTMICZNO-NORMALNA W SZACOWANIU REZERWY SZKODOWEJ * Wprowadzenie W pracy est analizowany proces wyznaczania rezerwy szkodowe na szkody zaistniałe i niezgłoszone (oz. rezerwa IBNR). Rezerwę tą definiue się następuąco: est to wartość odpowiadaąca wysokości odszkodowań, które zostaną wypłacone dla szkód zaszłych w danym okresie sprawozdawczym, ale nie zostały dotychczas zgłoszone ubezpieczycielowi lub wartość szacunkowa ustalona na podstawie oceny stopnia kataklizmu (huraganu, suszy itp.). Wysokość i liczba odszkodowań nie est znana i może być edynie szacowana na podstawie danych historycznych, co dae duże możliwości eżeli chodzi o zastosowanie metody do prognozowania. Przykładowo można stosować modele oparte na analizie falkowe stosowane w zagadnieniach aktuarialnych [Dyduch, 011]. Oba parametry są istotne w ocenie działalności finansowe w każde firmie ubezpieczeniowe [Szkutnik, 004]. Zgodnie z wytycznymi Solvency II, które weszły w życie 01.11.01 r., rezerwę IBNR należy wyznaczać zgodnie z zasadą best estimate. Zasada ta dae zakładom ubezpieczeń możliwość stosowania modeli stochastycznych w procesie wyznaczania rezerwy IBNR, które są szeroko opisywane w literaturze aktuarialne [Wüthrich, Merz, 008; England, Verrall, 00; Wolny, 005; Pobłocka, 011]. W pracy przedstawiono stochastyczną metodę kalkulaci rezerwy IBNR, w które est stosowana regresa logarytmiczno-normalna do szacowania wartości przyszłych odszkodowań (oz. RLN) [Bradu, Mundlak, 1970]. Zaproponowano korektę obciążenia funkcą g m oraz przeprowadzono studium przypadku. * Praca częściowo finansowana przez grant Narodowego Centrum Nauki (nr NN 111461540).
0 Alica Wolny-Dominiak 1. Analiza rozwou szkodowości Do oszacowania wartości rezerwy IBNR wykorzystue się naczęście dane w postaci macierzy zwane trókątem szkód. Rozważmy trókąt szkód, który przedstawia tab. 1 Nieskumulowany trókąt szkód Tabela 1 i 1... n 1 n 1 S 1,1... S 1,n 1, S 1,n... S,1 S,n 1.... n S n,1 W powyższym trókącie: i okres wystąpienia szkody (okres wypadkowy), i = 0,..., n 1, opóźnienie w wypłacie odszkodowania (okres rozwou szkody), = 0,..., n 1, n 1 okres bieżący, S wartość wypłaconych odszkodowań dla szkód, które zaszły w okresie wypłaconych z opóźnieniem. Celem rozważane metody RLN est prognoza wartości Ŝ leżących poniże przekątne trókąta szkód (1), co w literaturze przedmiotu est nazywane krótko analizą rozwou szkodowości [Straub, 1988]. Prognozowaną wartość rezerwy IBNR wyznacza się następuąco: Proces kalkulaci w rezerwy IBNR metodą RLN można zatem zapisać w etapach: (i) zdefiniowanie modelu stochastycznego, (ii) estymaca parametrów modelu, (iii) prognozowanie nieznanych wartości S, (iv) prognozowanie rezerwy IBNR, (v) wyznaczenie przedziału ufności. ()
Zmodyfikowana regresa logarytmiczno-normalna... 1. Metoda RLN estymaca parametrów modelu Zakładamy, że elementy trókąta szkód (1) są niezależnymi zmiennymi losowymi o rozkładzie logarytmiczno-normalnym [Kelly et. al, 1995]. W pierwszym etapie kalkulaci rezerwy IBNR definiuemy model stochastyczny, wykorzystuąc regresę logarytmiczno-normalną [Christofides, 1990]: S = C i P, (3) gdzie C i oznacza efekt okresu wypadkowego, natomiast P oznacza efekt okresu rozwou szkody. W modelu występue zatem n parametrów. Logarytmuąc powyższe równanie, uzyskuemy postać liniowego modelu ekonometrycznego: n 1 n 1 s = ci X i + X + ξ i= 0 = n p, gdzie ξ est składnikiem losowym oraz ln S = s, ln C = c, ln P = p. Zmienne obaśniaące X są zmiennymi binarnym które definiue się w zależności od i i i numeru indeksu: X = 1 dla wszystkich obserwaci w okresie wypadkowym i X = 0 dla wszystkich obserwaci w okresie wypadkowym różnym od okresu i gdzie i = 0,..., n 1, X X = 1 dla wszystkich obserwaci w okresie opóźnienia, = 0 dla wszystkich obserwaci w okresie opóźnienia, gdzie = n,..., n 1. W drugim etapie estymuemy parametry modelu (4), stosuąc klasyczną metodę namnieszych kwadratów (oz. KMNK). Dla danego trókąta szkód konstruuemy zero-edynkową macierz X. Jedynki odpowiadaą obserwacom dla okresów wypadkowych oraz opóźnień spełniaących warunek n i 1. Liczba wierszy macierzy est równa liczbie wszystkich możliwych par ( ), dla których n i 1. W dalszych rozważaniach przez X będziemy oznaczać kolumnę macierzy, które odpowiada para ( ). Postać macierzowa modelu (4) est następuąca: c0 M cn gdzie cp est wektorem postaci cp = p1 M pn (4) S = X. cp + ξ, (5) 1 1. Estymator cpˆ uzyskany
Alica Wolny-Dominiak KMNK dany est wzorem: ĉ i = (X T X) 1 X T s, = 0,..., n 1 (6) Oszacowane wartości c i to zatem n pierwszych elementów wektora cpˆ, natomiast p to n ostatnich elementów. Macierz warianci i kowarianci est natomiast dana wzorem: D (cpˆ ) = σ (X T X) 1, (7) gdzie nieobciążonym estymatorem warianci składnika losowego σ est warianca resztowa. Korzystaąc z macierzy (7), obliczamy średni błąd szacunku dla parametrów modelu: D ( ˆ ), D ( ˆ ), i, = 0,..., n 1. (8) c i p Estymatory (6) parametrów modelu są liniowe, nieobciążone oraz naefektywniesze przy spełnieniu założeń KMNK. 3. Metoda RLN prognozowanie rezerwy IBNR Kolenymi etapami w procesie wyznaczania wartości rezerwy IBNR est prognozowanie elementów trókąta szkód, a ostatecznie rezerwy. W pierwsze koleności prognozuemy logarytmiczne wartości okresowych wypłat odszkodowań s dla okresów spełniaących warunek > n i 1. W tym celu konstruuemy macierz X * dla okresów > n i 1, analogicznie ak w przypadku macierzy X. Stosuąc zasadę predykci nieobciążone mamy: gdzie błąd średni te predykci wyraża się wzorem: s i S = X * cpˆ, (9) * T T 1 B, = σ (X ) (X X) X. (10) Dale przechodzimy do prognozowania wartości wypłaconych odszkodowań S. W tym celu wykorzystuemy fakt, iż zmienne te posiadaą rozkład logarytmiczno-normalny o parametrach [Green, 1993]: *
Zmodyfikowana regresa logarytmiczno-normalna... 3 s wartość oczekiwana E(S ) = exp (s + 0,5B ), warianca D s (S ) = exp [s + (B ) s ].[exp (B ) 1]. Stawiamy zatem prognozę na poziomie wartości oczekiwane i otrzymuemy postać predykci: ˆ exp( ˆ 0,5 ˆ s S = s + B ). (11) Jednakże powyższy estymator est estymatorem obciążonym. Aby zlikwidować obciążenie, wprowadzamy korektę obciążenia za pomocą funkci g m (x) [Finney, 1941], daną wzorem: z g m( x) = m ( m + z) x, (1) ( m + l) z! z z = 0 l = 0 gdzie m est liczbą stopni swobody rozkładu warianci składnika losowego σ. Funkca ta korygue obciążenie estymatora danego ogólnym wzorem [Bradu, Mundlak, 1970]: ê = exp (s + d σ ), (13) gdzie d est dowolną stałą. Nieobciążony estymator ma więc postać: * T T 1 * eˆ = exp( sˆ ) g [( a 0,5(X ) (X X) X ) ˆ i m ]. (14), σ Dla uproszczenia zapisu przymuemy w dalszych rozważaniach oznaczenie * * T T 1 * x = (X ) (X X) X. Prognozowana okresowa wypłata odszkodowań ma zatem postać: ˆ i m σ S z * = exp( sˆ ) g [0,5(1 x ) ˆ ]. (15) Średni błąd te predykci można przedstawić następuąco: ˆ D S S ) = D ( S ) + D ( Sˆ ), (16) ( co wynika z niezależności zmiennych S oraz Ŝ [Verrall, 1994]. Widzimy zatem, iż do szacunku tego błędu niezbędne est oszacowanie zmiennych D (Ŝ ) oraz D (S ). W pierwszym przypadku stosuemy estymator nieobciążony, dany wzorem: D ( Sˆ ˆ m m * * ) = exp( sˆ ){ g [0,5(1 x ) σˆ ] g [(1 x ) σˆ ]}. (17)
4 Alica Wolny-Dominiak Do oszacowania drugie zmienne stosuemy wzór na wariancę rozkładu logarytmiczno-normalnego, skorygowany funkcą g m [Verrall, 1994]: ˆ ( S m m D * * ) = exp( sˆ ){ g [(1 x ) σˆ ] g [(1 x ) σˆ ]}. (18) Ostatecznie przechodzimy do prognozowania wartości całkowite rezerwy IBNR: n 1 n 1 Sˆ i, i= 1 = n i R ˆ =. (19) Estymator ten est nieobciążony pod warunkiem nieobciążoności estymatorów Ŝ. Średni błąd B r powyższe predykci nieobciążone obliczamy z następuące równości: ˆ D ( R R) = D ( R) + D ( Rˆ ). (0) Korzystaąc z niezależności zmiennych R i Ȓ, analogicznie ak w przypadku zmiennych S oraz Ŝ. Przy założeniu niezależności zmiennych S mamy: n 1 n 1 D ( R) = D ( ). (1) i= 1 = n i S i, W przypadku zmiennych Ŝ nie est uż spełnione założenie o niezależnośc gdyż oddziałuą na nie parametry P, takie same dla każdego okresu wypadkowego. W związku z tym do obliczenia D (Ȓ) niezbędne est wprowadzenie kowarianci: n 1 n 1 D ( Sˆ ) + i= 1 = n i, k, l D ( Rˆ ) = cov( Sˆ, Sˆ ). () n n Druga suma zawiera dokładnie elementów, takich że ( ) (k, l). Widzimy że niezbędna est zatem znaomość estymatora kowarianci côv(ŝ, Ŝ ). k, l Aby otrzymać estymator nieobciążony, ponownie zastosowanie znadue funkca g m : ˆ ˆ = ˆ + ˆ * * côv( S, S ) exp( S S ){ g [0,5(1 x ) σˆ ] g [0,5(1 x ) ˆ ] (3) k k m m k σ * * Τ 1 * * Τ g [(1 0,5(Χ + Χ )(Χ Χ) (Χ Χ ) ) σˆ ]. m k + Ostatecznie średni błąd prognozy rezerwy IBNR ma postać: k k, l
Zmodyfikowana regresa logarytmiczno-normalna... 5 ˆ ˆ ( ) ˆ B r = D R + D ( Rˆ ). (4) Wykorzystuąc predykcę Rˆ oraz Bˆ r przechodzimy do wyznaczania przedziału ufności rezerwy całkowite, który definiuemy ako przedział ufności dla R. Aby wyznaczyć ednak ten przedział, niezbędna est znaomość rozkładu zmienne R. Zgodnie z centralnym twierdzeniem granicznym przy dostatecznie duże liczbie obserwaci est przymowany rozkład normalny. W przypadku rezerwy IBNR rozkład ten nie powinien być ednakże symetryczny, gdyż wartości rezerwy IBNR dla okresów wypadkowych są niskie dla początkowych okresów i i dale zwiększaą się znacznie dla okresów końcowych. W związku z tym przymuemy rozkład logarytmiczno-normalny, w którym wykorzystuemy Ȓ oraz Bˆ r ako estymatory parametrów rozkładu: wartości oczekiwane oraz warianci. Przedział ufności na poziomie ufności 90% ma postać [Mack, 1994] PZ = [Ȓa; Ȓb], gdzie c c ˆ r B a = exp(1,8c ), gdzie b = exp( 1,8c ), oraz c = ln[1 + ( ) ]. Rˆ Widzimy, iż przymuąc model (4), praktyczna aplikaca est skomplikowana poprzez zawiłą postać funkci g m. Do znalezienia odpowiednie wartości te funkci niezbędne est obliczenie nieskończone sumy szeregu. Korekta obciążenia stae się zatem zasadniczo problemem czysto numerycznym. 4. Kalkulaca rezerwy IBNR studium przypadku W studium przypadku był analizowany trókąt szkód zaczerpnięty z literatury w postaci nieskumulowane (tab. ). Tabela Nieskumulowany trókąt szkód 0 1 3 4 5 6 7 8 0 1 59 56 1 94 1 116 415 143 43 1 3 1 664 1 57 1 551 68 18 58 11 6 1 1 339 1 664 1 080 40 176 51 3 3 833 000 119 569 6 158 4 1 687 503 1 370 859 337 5 1 086 3 14 1 306 835 6 631 38 1 53 7 1 655 8 391 8 8 46
6 Alica Wolny-Dominiak W pierwsze koleności została zastosowana metoda RLN z korektą obciążenia funkcą g m. Dale w celach porównawczych skalkulowano rezerwę IBNR metodami: MackChainLadder (MCL) [Mack, 1994], BootChainLadder (BCL) [England, Verrall, 00], MultiChainLadder (MultiCL) [Zhang, 010]. Do obliczeń wykorzystano program R oraz pakiet {ChainLadder} [R Core Team, 01]. W analizowanym trókącie szkód, rozwó szkodowości graficznie obrazue rys. 1. Rys. 1. Skumulowane wartości wypłaconych odszkodowań w poszczególnych latach rozwou szkody W pierwsze koleności zostały oszacowane parametry c i oraz p za pomocą KMNK oraz również średnie błędy szacunku uzyskanych wartości estymatorów: D ( c i ), D ( p ). Wyniki przedstawia tab. 3. Tabela 3 Oszacowane parametry modelu Oszacowanie Średni błąd szacunku 1 3 c0 7,63 0,0 c1 7,11 0,0 c 7,6 0,0 c3 7,55 0,1 c4 7,44 0, c5 7,35 0,3 c6 7,56 0,5 c7 8,05 0,9 c8 9,0 0,39 p1 0,34 0,0
Zmodyfikowana regresa logarytmiczno-normalna... 7 1 3 p -0,08 0,1 p3-0,73 0, p4-1,70 0,3 p5 -,66 0,5 p6-4,09 0,8 p7-5,8 0,33 p8-6,51 0,44 Otrzymane wyniki pokazuą, iż średnie błędy szacunku dla większości powyższych parametrów zawieraą się w przedziale od 0, do 0,9. Wyątkiem są parametry c 8, p 7 oraz p 8, dla których błędy są wyższe. Jest to efektem małe liczby obserwaci dla okresów opóźnień 7 oraz 8. Warianca resztowa kształtue się na poziomie σˆ = 0,159. Często stosowaną praktyką est pomianie parametru p 0, co dae pewność, iż macierz X est macierzą nieosobliwą, co również uczyniono w tym przykładzie [Verrall, 1994]. W kolenym etapie szacowano wartości trókąta szkód poniże przekątne, uzyskuąc następuące wyniki: Tabela 4 Prognozy okresowych wartości wypłat odszkodowań 0 1 3 4 5 6 7 8 0 1 59 56 1 94 1 116 415 143 43 1 3 cd. tabeli 3 1 664 1 57 1 551 68 18 58 11 6 1,81 S ˆ i, 0,55 Dˆ ( ˆ ) S 1 1 339 1 664 1 080 40 176 51 10,35 3,01 S ˆ i, 5,45 1,87 Dˆ ( ˆ ) S 3 3 833 000 119 569 6 158 3 9,70,83 S ˆ i, 0,38 4,93 0,81 Dˆ ( ˆ ) S
8 Alica Wolny-Dominiak cd. tabeli 4 4 1 687 503 1 370 859 337 10 9 8,71,54 S ˆ i, 81,83 17,35 4,3 0,69 Dˆ ( ˆ ) S 5 1 086 3 14 1 306 835 86 109 6 7,94,31 S ˆ i, 195 68,88 14,73 3,6 0,59 Dˆ ( ˆ ) S 6 631 38 1 53 936 353 135 3 9,81,86 S ˆ i, 594 13 75,60 16,33 4,06 0,65 Dˆ ( ˆ ) S 7 1 655 8 391 898 1 514 571 18 53 15,9 4,64 S ˆ i, 1 54 769 77 99,60 1,73 5,44 0,79 Dˆ ( ˆ ) S 8 8 46 11661 7 653 4 000 1 509 577 139 4,11 1,8 S ˆ i, 3 541 59 1 14 41 147,00 31,47 7,19 1,45 Dˆ ( ˆ ) S Opieraąc się na powyższych wynikach, uzyskano prognozowaną wartość rezerwy IBNR, która wynosi Rˆ = 3 989,1. Średni błąd predykci oraz przedział zmienności PZ na poziomie ufności 90% wynosi natomiast odpowiednio Bˆ r = 11 698,1 oraz PZ = [0 014,1; 48 301,85]. W analizie porównawcze przeprowadzono estymacę punktową, uzyskuąc następuące wyniki. Tabela 5 Wartości rezerwy IBNR w analizowanych modelach Wartość rezerwy IBNR Średni błąd szacunku RLN z korektą obciążenia 3 989,1 11 698,1 MCL 35 551,14 1 566,54 BCL 36 459,93 8 573,84 MultiCL 35 553,4 1 596,51
Zmodyfikowana regresa logarytmiczno-normalna... 9 Widać, iż w metodzie RLN z korektą obciążenia funkcą g m uzyskano naniższą wartość rezerwy IBNR, co est korzystne z punktu widzenia zakładu ubezpieczeń. Otrzymano również stosunkowo niski błąd prognozy. W analizowanym trókącie szkód naniższy błąd uzyskał ednak model bootstrsapowy. Zgodnie z zasadą Solvency II best estimate, należałoby zatem zawiązać rezerwę IBNR na poziomie uzyskanym w tym modelu. Podsumowanie Szacowanie wartości rezerwy IBNR za pomocą regresi logarytmiczno-liniowe est alternatywą do klasycznego podeścia chain-ladder. Po zastosowaniu korekty obciążenia może dawać interesuące wyniki. W dobie rozwou technik obliczeniowych techniczny problem kalkulaci rezerwy IBNR nie est obecnie przeszkodą i pozwala na dalszy rozwó tego podeścia. Literatura Bradu D., Mundlak Y., 1970: Estimation in Lognormal Linear Models. JASA, Vol. 6. Christofides E., 1989: Claims Reserving Manual: Vol. II. The Institute of Actuaries, London. Dyduch M.: Niekonwenconalna metoda prognozy wartości ednostek funduszy emerytalnych. W: Zagadnienia aktuarialne teoria i praktyka. Red. W. Ostasiewicz. Wydawnictwo Uniwersytetu Ekonomicznego, Wrocław 011. England P.D., Verrall R.J., 00: Stochastic Claims Reserving in General Insurance With Discussion. British Actuarial Journal 8, III. Green W.H., 1993: Econometric Analysis. Macmillan Publishing Company, New York. Kelly M.V., 199: Practical Loss Reserving Method with Stochastic Development Factor. CAS Discussion Paper Program. Mack T., 1999: The Standard Error of Chain Ladder Reserve Estimates: Recursive Calculation and Inclusion of a Tail Factor. Astin Bulletin, Vol. 9, No.. Pobłocka A., 011: Rezerwa IBNR w ubezpieczeniach maątkowych-praktyczne metody e szacowania. Wydawnictwo Uniwersytetu Ekonomicznego, Wrocław. R Core Team, 01: R: A language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. Straub E., 1988: Non-Life Insurance Mathematics. Springer-Verlang, New York. Szkutnik W., 004: Ryzyko ubezpieczeniowe w aspekcie szczególnych warunków realizaci procesu szkód. W: Zastosowania metod ilościowych w ekonomii i zarządzaniu. Red. J. Mika. Wydawnictwo Akademii Ekonomiczne, Katowice. Verrall R.J., 1994: Statistical Methods for the Chain-Ladder technique. Casualty Actuarial Society Forum, Spring.
30 Alica Wolny-Dominiak Wolny A., 005: Podeście Aktuarialne do kalkulaci rezerwy szkodowe. Statystyczne zaawansowane metody kalkulaci rezerwy szkodowe. W: Metody kalkulaci ryzyka rezerw szkodowych w ubezpieczeniach maątkowo-osobowych. Red. W. Szkutnik, A. Wolny. Wydawnictwo Akademii Ekonomiczne, Katowice. Wüthrich M.V., Merz M., 008: Stochastic Claims Reserving Methods in Non-Life Insurance. John Willey & Sons, England. Zhang Y., 010: A General Multivariate Chain Ladder Model. Insurance: Mathematics and Economics, 46. MODIFIED LOG-NORMAL REGRESSION IN LOSS RESERVING Summary In the paper we consider the problem of loss reserving estimation in non-life insurance company. We focus on the log-normal regression as in [Bradu, Mundlak, 1970; Chrostofieds, 1989]. In order to reduce the bias of IBNR reserve estimator we propose some modification by introducing function. In the case study we compare few different methods of loss reserving with modified log-normal regression. It is now typical practice in insurance business according Solvensy II and Best Estimate rule. In all calculation we apply R software and {ChainLadder} package.
Zmodyfikowana regresa logarytmiczno-normalna... 31 Załącznik A Wyniki kalkulaci rezerwy szkodowe uzyskane w pakiecie {ChainLadder} <MackChainLadder(Triangle, weights = 1, alpha=1, est.sigma= log-linear, tail=false, tail.se=null, tail.sigma=null) Rys. A.1. Szczegółowe wyniki dla MCL
3 Alica Wolny-Dominiak Rys. A.. Analiza reszt dla MCL <BootChainLadder(Triangle, R=999, process.distr= gamma ) Rys. A.3. Szczegółowe wyniki dla BCL
Zmodyfikowana regresa logarytmiczno-normalna... 33 Rys. A.4. Symulaca dla BCL <MultiChainLadder(list(Triangle), fit.method = SUR ) Rys. A.5. Szczegółowe wyniki dla MultiCL
34 Alica Wolny-Dominiak Rys. A.6. Wykres kwantyli dla MultiCL