Dynamické modelování úmrtnosti Lucie Mazurová AS 13.10. a 27.10.2017
Riziko úmrtnosti a) volatilita - odchylky od očekáváných hodnot způsobené náhodným charakterem délky života b) katastrofické riziko - krátkodobé zvýšení úmrtnosti (epidemie, přírodní katastrofy,...) c) riziko nejistoty - systematické odchylky způsobené nevhodnou volbou modelu, případně vychýlením v odhadech parametrů zvoleného modelu spec.: riziko dlouhověkosti - pokles úmrtnosti ve vyšším dospělém věku
Matematický popis úmrtnosti T x - zbývající doba života osoby ve věku x, náhodná veličina tq x = P(T x t), q x = 1 q x funkce přežití: S(t) = P(T 0 > t) Předpoklad: tp x = P(T x > t) = P(T 0 > x + t T 0 > x) = S(x + t) S(x)
Matematický popis úmrtnosti intenzita úmrtnosti: P(T x t) P(x < T 0 x + t T 0 > x) µ x = lim = lim t 0+ t t 0+ t = d ln S(x) d x Podobně hustota náhodné veličiny T x : µ x+t = d d t ln tp x f x (t) = t p x µ x+t
Typický průběh hustoty f 0 (x) a intenzity úmrtnosti µ x zdroj: Pitacco et al.(2009)
Matematický popis úmrtnosti míra úmrtnosti: S(x) S(x + 1) m x = 1 0 S(x + u) du výpočet pro reálnou populaci za kalendářní rok t (x obvykle celočíselné): m x (t) = D x,t E x,t D x,t - počet osob zemřelých ve věku x (mezi x a x + 1) v roce t E x,t - (centrální) expozice - v praxi střední velikost věkové skupiny v polovině roku
Matematický popis úmrtnosti Předpoklad konstantní intenzity úmrtnosti uvnitř věkového intervalu (x, x + 1): µ x+t = µ (x), 0 < t < 1 Odtud plyne m x = µ (x), q x = 1 e µ (x) V praxi se užívá k výpočtu pravděpodobností úmrtí q x = 1 e mx
Matematický popis úmrtnosti střední zbývající délka života ve věku x: střední délka života: ē x = E T x = 1 S(x) ē 0 = E T 0 = 0 0 S(x + t) dt S(t) dt
Trendy ve vývoji úmrtnosti rektangularizace - zvyšující se koncentrace úmrtí kolem modu rozdělení náhodné veličiny T 0 (ve vysokých věcích) zdroj: Pitacco et al.(2009) (z průřezových ÚT Belgie - muži)
Trendy ve vývoji úmrtnosti expanze - modus rozdělení n. v. T 0 se posunuje k vyšším věkům zdroj: Pitacco et al.(2009) (z průřezových ÚT Belgie - muži)
Dynamické modelování úmrtnosti dynamický model úmrtnosti: Γ(x, t) - funkce věku a času (např. q x (t), m x (t), µ(x, t), S(x, t)) t - referenční rok (poslední období, ke kterému jsou k dispozici data) projekce úmrtnosti: Γ(x, t), t > t Příklad projekce vyjádřené pomocí redukčního faktoru: q x (t) = q x (t ) R x (t t ), Pro t > t se předpokládá R x (t t ) < 1.
Příklad Continuous Mortality Investigation Bureau, 1999 R x (t t ) = α x + (1 α x ) (1 f x ) t t 20, f x = 0.13, x < 60 = 1 + (1 0.13) x 110, 60 x 110 50 = 1 x > 110, α x = 0.55, x < 60 = kde t = 1992. (110 x) 0.55 + (x 60) 0.29, 60 x 110 50 = 0.29 x > 110,
Lee-Carterův model Model předpokládá závislost cenrální míry úmrtnosti (resp. intenzity úmrtnosti) na věku a čase ve tvaru ln m x (t) α x + β x κ t, α x - (průměrná) závislost úmrtnosti na věku κ t - změna v úrovni úmrtnosti v čase β x - citlivost na změnu v časovém indexu pro daný věk Parametry nejsou určeny jednoznačně, proto se zavádí omezení β x = 1, κ t = 0. x t
Lee-Carterův model Z pozorovaných hodnot pro dané věky a časy se získají odhady ˆα x, ˆβ x, ˆκ t pro t t. Předpovědi budoucích hodnot κ t pro t > t se dostanou užitím vhodného modelu časové řady. Projekce pro t > t : m x (t) = exp(ˆα x + ˆβ x κ t ) nebo m x (t) = m x (t ) exp [ ˆβ x ( κ t ˆκ t ) ].
Lee-Carterův model Základem pro odhad parametrů mohou být různé stochastické předpoklady. Klasický Lee-Carterův model předpokládá ln m x (t) = α x + β x κ t + ɛ x,t, kde ɛ x,t jsou náhodné veličiny s nulovou střední hodnotou a rozptylem σɛ 2. Pro odhad parametrů máme k dispozici pozorování uspořádaná do matice M = { m xi (t j ) } i=1,...,m;j=1,...,n.
Lee-Carterův model - odhad parametrů Metoda nejmenších čtverců: Odhady ˆα x, ˆβ x, ˆκ t minimalizují O = x m x=x 1 t n t=t 1 (ln m x (t) α x β x κ t ) 2. Za předpokladu normálního rozdělení chyb ɛ x,t jde o maximálně věrohodné odhady. Alternativa: vážená metoda nejmenších čtverců (váhy w x,t = D x,t ).
Lee-Carterův model - odhad parametrů Možnosti řešení minimalizační úlohy 1) užitím singulárního rozkladu matice Položením derivace O podle α x rovné 0 dostáváme t n t=t 1 ln m x (t) = (t n t 1 + 1) α x + β x t n t=t 1 κ t. Odtud vzhledem k t κ t = 0 plyne ˆα x = 1 t n t 1 + 1 t n t=t 1 ln m x (t).
Lee-Carterův model - odhad parametrů Označme Z = ln M ˆα matici s prvky z x,t = ln m x (t) α x, x = x 1,..., x m, t = t 1,..., t n. Hledané odhady ˆβ x, ˆκ t minimalizují x m t n x=x 1 t=t 1 (z xt β x κ t ) 2. Necht u 1 je vlastní vektor odpovídající největšímu vlastnímu číslu λ 1 matice Z T Z, v 1 je odpovídající vlastní vektor matice ZZ T. Nejlepší přibĺıžení matice Z: λ 1 v 1 u1 T.
Lee-Carterův model - odhad parametrů S ohledem na x β x = 1 klademe ˆβ = pokud x n x 1 +1 j=1 v 1j 0. v 1 xn x 1 +1 j=1 v 1j, ˆκ = (x n x 1 +1 λ 1 j=1 v 1j ) u 1,
Lee-Carterův model - odhad parametrů Numerický výpočet odhadů ˆα x, ˆβ x, ˆκ t užitím Newton-Raphsonova algoritmu: Položením derivací O podle jednotlivých parametrů rovných 0 dostaneme soustavu: t n 0 = (ln m x (t) α x β x κ t ), x = x 1,..., x m t=t 1 x m 0 = β x (ln m x (t) α x β x κ t ), t = t 1,..., t n x=x 1 0 = t n t=t 1 κ t (ln m x (t) α x β x κ t ), x = x 1,..., x m.
Lee-Carterův model - odhad parametrů Řešení získáme iteračně ze vztahů: ˆα (k+1) x ˆκ (k+1) t ˆβ (k+1) x tn = ˆα x (k) + t=t1 (ln m x (t) ˆα x (k) t n t 1 + 1 xm = ˆκ (k) t + tn = ˆβ x (k) + x=x1 ˆβ x (k) t=t1 ˆκ (k+1) t ˆβ x (k) κ (k) t ) (ln m x (t) ˆα x (k+1) xm ( x=x1 ˆβ x (k) ) 2 (ln m x (t) ˆα (k+1) tn (k+1) t=t1 (ˆκ x x ) 2 ˆβ x (k) κ (k) t ) ˆβ x (k) κ (k+1) t )
Lee-Carterův model Úprava výsledných odhadů s ohledem na omezující podmínky: ˆα x ˆα x + ˆβ x κ ˆκ t (ˆκ t κ) ˆβ ˆβ x ˆβ x / ˆβ, kde κ = 1 t n t 1 +1 tn t=t1 κ t, ˆβ = x m x=x1 ˆβ x.
Lee-Carterův model Úprava výsledných odhadů ˆκ t - např. na základě shody s pozorovaným celkovým počtem úmrtí v roce t: x m x=x 1 D x,t = x m D x,t...počet úmrtí ve věku x v roce t x=x 1 E x,t exp(ˆα x + ˆβ x ˆκ t ), E x,t...expozice riziku úmrtí ve věku x v čase t (pozorované míry úmrtnosti m x (t) = Dx,t E x,t ) Následně nahradíme ˆκ t hodnotou ˆκ t κ a ˆα x hodnotou ˆα x + ˆβ x κ.
Poissonovský model Alternativní přístup k odhadu parametrů Lee-Carterova modelu vychází z předpokladu, že máme k dispozici počty zemřelých D x,t a expozice E x,t. Předpokládáme, že náhodná veličina D x,t má Poissonovo rozdělení s parametrem E x,t exp(α x + β x κ t ) Parametry odhadujeme maximalizací logaritmické věrohodnostní funkce L = x m t n x=x 1 t=t 1 ( Dx,t (α x + β x κ t ) E x,t exp(α x + β x κ t ) ) + konst.
Poissonovský model Položením derivace L podle α x rovné nule dostáváme t n t n D x,t = E x,t exp(ˆα x + ˆβ x ˆκ t ), t=t 1 t=t 1 odhady tedy reprodukují pozorované celkové počty úmrtí v jednotlivých věcích obsažené v datech. Položením derivací logarimické věrohodnostní funkce podle jednotlivých parametrů rovných nule dostaneme soustavu rovnic, kterou lze opět řešit pomocí Newton-Raphsonova iteračního algoritmu:
Poissonovský model ˆα (k+1) x ˆκ (k+1) t ˆβ (k+1) x = ˆα (k) x + = ˆκ (k) t + = ˆβ (k) x + ( tn t=t1 tn xm x=x1 ˆβ x (k) xm D xt E xt exp(ˆα (k) t=t1 E x,t exp(ˆα x (k) x + ˆβ (k) x + ˆβ (k) x ˆκ (k) t ) ( D xt E x,t exp(α (k+1) x x=x1 E x,t exp(α x (k+1) tn t=t1 ˆκ (k+1) t + β (k) x ) ˆκ (k) t ) κ (k) t + β (k) x ) ( ˆβ (k) x ( D xt E x,t exp(ˆα x (k+1) (k) + ˆβ x tn t=t1 E x,t exp(ˆα x (k+1) + ˆβ x (k) ˆκ (k+1) t ) κ (k) t ) ) 2 ) ˆκ (k+1) t ) (k+1)) 2 (ˆκ x )
Další aspekty Lee-Carterova modelu Řadu odhadů parametrů β x je často před použitím k projekci úmrtnosti třeba vyhladit. Požadavek na hladkost průběhu β x v závislosti na věku může být součástí optimalizační úlohy pro odhad parametrů, např. místo funkce O lze minimalizovat x m x=x 1 t n x n (ln m x (t) α x β x κ t ) 2 + π β (β x+2 2 β x+1 + β x ) 2 t=t 1 x=x 1
modelování časového indexu Na odhady ˆκ t se pohĺıží jako na realizaci časové řady, která se řídí ARIMA(p,l,q) modelem l κ t =d + φ 1 l κ t 1 + + φ p l κ t p + ξ t + ψ 1 ξ t 1 +... ψ q ξ t q, kde φ p 0, ψ q 0, l κ t je l-tá diference procesu κ t. Posloupnost {ξ t } je gaussovský bílý šum s kladným rozptylem.
modelování časového indexu Z empirických studíı vyplývá, že často je vhodným modelem pro κ t κ t = κ t 1 + d + ξ t, kde ξ t jsou i.i.d. normální se střední hodnotou 0 a rozptylem σ 2. (náhodná procházka s driftem) Bodová projekce do času t > t n vychází ze vztahu κ t = E [κ t κ t1,..., κ tn ] = κ tn + d ( t t n ), kde pro odhad parametru d užijeme ˆd = ˆκ t n ˆκ t1 t n t 1.
modelování časového indexu Pro podmíněný rozptyl predikce využijeme vztah Var [κ t κ t1,..., κ tn ] = d σ 2 a parametr σ 2 odhadneme pomocí ˆσ 2 = 1 t n t 1 t n t=t 2 ( ˆκ t ˆκ t 1 ˆd) 2.
Renshaw-Habermanův model Renshaw-Habermanův model (2006) rozšířil původní Lee-Carterův model o složku závislou na roce narození (příslušnosti ke kohortě). Je označován jako APC model (age-period-cohort). Model předpokládá závislost cenrální míry úmrtnosti (resp. intenzity úmrtnosti) na věku a čase ve tvaru ln m x (t) α x + β (0) x i t x + β (1) x κ t. speciální případy: AC (age-cohort): β (1) x = 0 Lee-Carter: β (0) x = 0
Poissonovský model Uvažujeme zobecněný nelineární model pro počty úmrtí D xt - model s poissonovskou odezvou a logaritmickým linkem Y xt = D xt E Y xt = E xt exp Var Y xt = φ E Y xt ( α x + β (0) x i t x + β (1) x κ t ) η xt = ln(e Y xt ) = ln E xt + α x + β x (0) i t x + β x (1) κ t
Cairns-Blake-Dowdův model CBD model (2006) je založen na empiricky podložené představě, že funkce ln q x(t) p x (t) pro pevné t závisí na x přibližně lineárně. CBD model předpokládá ln q x(t) p x (t) = κ[1] t + κ [2] t kde κ [1] t a κ [2] t jsou náhodné procesy. x
kalibrace CBD modelu Kalibrace metodou nejmenších čtverců vychází z modelu ln q x(t) p x (t) = κ[1] t + κ [2] t x + ɛ xt, kde ɛ xt jsou nezávislé normálně rozdělené veličiny s nulovou střední hodnotou a stejným rozptylem. Součet O = x m x=x 1 ( ln q x(t) p x (t) κ[1] t κ [2] t se minimalizuje pro každý kalendářní rok t. ) 2 x
modelování časových indexů Možnost: dvourozměrná náhodná procházka s driftem κ [1] t = κ [1] t 1 + d 1 + ξ [1] t κ [2] t = κ [2] t 1 + d 2 + ξ [2] t kde (ξ [1] t, ξ [2] t ) jsou nezávislé náhodné vektory s dvourozměrným normálním rozdělením s nulovou střední hodnotou a varianční maticí Σ. Kromě driftů a rozptylů je třeba odhadovat i kovarianci.
kohortnı efekt
Literatura Pitacco, E., Denuit, M., Haberman, S., Olivieri, A.: Modelling Longevity Dynamics for Pensions and Annuity Business. Oxford University Press, 2009. Lee, R.D., Carter, L.R.: Modelling and forecasting U.S. mortality. Journal of the American Statistical Association, 87(14), 659-675, 1992. Renshaw, A.E., Haberman, S.: A cohort-based extension to the Lee-Carter model for mortality reduction factors. Insurance: Mathematics & Economics, 38(3), 556-570, 2006. Cairns, A.J.G., Blake, D., Dowd, K.:A two-factor model for stochastic mortality with parameter uncertainty: theory and calibration. The journal of risk and insurance, 73(4), 687-718, 2006. Skřivanová, Z.: Stochastické modelování úmrtnosti pro více populací. Diplomová práce, MFF UK, 2015.