Dynamické modelování úmrtnosti Lucie Mazurová AS 18.3.2016
Riziko úmrtnosti a) volatilita - odchylky od očekáváných hodnot způsobené náhodným charakterem délky života, b) katastrofické riziko - krátkodobé zvýšení úmrtnosti (epideme, přírodní katastrofy,...) c) riziko nejistoty - systematické odchylky způsobené nevhodnou volbou modelu, případně vychýlením v odhadech parametrů zvoleného modelu spec.: riziko dlouhověkosti - pokles úmrtnosti ve vyšším dospělém věku
Matematický popis úmrtnosti T x - zbývající doba života osoby ve věku x, náhodná veličina tq x = P(T x t), q x = 1 q x funkce přežití: S(t) = P(T 0 > t) Předpoklad: tp x = P(T x > t) = P(T 0 > x T 0 > x) = S(x + t) S(x)
Matematický popis úmrtnosti intenzita úmrtnosti: P(T x t) P(x < T 0 x + t T 0 > x) µ x = lim = lim t 0+ t t 0+ t = d ln S(x) d x Podobně hustota náhodné veličiny T x : µ x+t = d d t ln tp x f x (t) = t p x µ x+t
Typicky pru be h hustoty f0 (x) a intenzity u mrtnosti µx
Matematický popis úmrtnosti míra úmrtnosti: S(x) S(x + 1) m x = 1 0 S(x + u) du výpočet pro reálnou populaci za kalendářní rok t: m x (t) = D x,t E x,t D x,t - počet osob zemřelých ve věku x v roce t E x,t - (centrální) expozice - v praxi střední velikost věkové skupiny v polovině roku
Matematický popis úmrtnosti Předpoklad konstantní intenzity úmrtnosti uvnitř věkového intervalu (x, x + 1): µ x+t = µ (x), 0 < t < 1 Odtud plyne m x = µ (x), q x = 1 e µ (x) V praxi se užívá k výpočtu pravděpodobností úmrtí q x = 1 e mx
Matematický popis úmrtnosti střední zbývající délka života ve věku x: střední délka života: ē x = E T x = 1 S(x) ē 0 = E T 0 = 0 0 S(x + t) dt S(t) dt
Trendy ve vývoji úmrtnosti rektangularizace - zvyšující se koncentrace úmrtí kolem modu rozdělení náhodné veličiny T 0 (ve vysokých věcích)
Trendy ve vývoji úmrtnosti expanze - modus rozdělení n. v. T 0 se posunuje k vyšším věkům
Dynamické modelování úmrtnosti dynamický model úmrtnosti: Γ(x, t) - funkce věku a času (např. q x (t), m x (t), µ(x, t), S(x, t)) t - referenční rok (poslední období, ke kterému jsou k dispozici data) projekce úmrtnosti: Γ(x, t), t > t Příklad projekce vyjádřené pomocí redukčního faktoru: q x (t) = q x (t ) R x (t t ), Pro t > t se předpokládá R x (t t ) < 1.
Příklad Continuous Mortality Investigation Bureau, 1999 R x (t t ) = α x + (1 α x ) (1 f x ) t t 20, f x = 0.13, x < 60 = 1 + (1 0.13) x 110, 60 x 110 50 = 1 x > 110, α x = 0.55, x < 60 = kde t = 1992. (110 x) 0.55 + (x 60) 0.29, 60 x 110 50 = 0.29 x > 110,
Lee-Carterův model Model předpokládá závislost cenrální míry úmrtnosti (resp. intenzity úmrtnosti) na věku a čase ve tvaru ln m x (t) = α x + β x κ t, α x - (průměrná) závislost úmrtnosti na věku κ t - změna v úrovni úmrtnosti v čase β x - citlivost na změnu v časovém indexu pro daný věk Parametry nejsou určeny jednoznačně, proto se zavádí omezení β x = 1, κ t = 0. x t
Lee-Carterův model Z pozorovaných hodnot pro dané věky a časy se získají odhady ˆα x, ˆβ x, ˆκ t pro t t. Předpovědi budoucích hodnot κ t pro t > t se dostanou užitím vhodného modelu časové řady. Projekce pro t > t : m x (t) = exp(ˆα x + ˆβ x κ t ) nebo m x (t) = m x (t ) exp [ ˆβ x ( κ t ˆκ t ) ].
Lee-Carterův model Základem pro odhad parametrů mohou být různé stochastické předpoklady. Klasický LC model předpokládá ln m x (t) = α x + β x κ t + ɛ x,t, kde ɛ x,t jsou náhodné veličiny s nulovou střední hodnotou a rozptylem σɛ 2. Pro odhad parametrů máme k dispozici pozorování uspořádaná do matice M = { m xi (t j ) } i=1,...,m;j=1,...,n.
LC model - odhad parametrů Metoda nejmenších čtverců: Odhady ˆα x, ˆβ x, ˆκ t minimalizují O = x m x=x 1 t n t=t 1 (ln m x (t) α x β x κ t ) 2. Za předpokladu normálního rozdělení chyb ɛ x,t jde o maximálně věrohodné odhady. Alternativa: vážená metoda nejmenších čtverců (váhy w x,t = D x,t ).
LC model - odhad parametrů Možnosti řešení minimalizační úlohy 1) užitím singulárního rozkladu matice Položením derivace O podle α x rovné 0 dostáváme t n t=t 1 ln m x (t) = (t n t 1 + 1) α x + β x t n t=t 1 κ t. Odtud vzhledem k t κ t = 0 plyne ˆα x = 1 t n t 1 + 1 t n t=t 1 ln m x (t).
LC model - odhad parametrů Označme Z = ln M ˆα matici s prvky z x,t = ln m x (t) α x, x = x 1,..., x m, t = t 1,..., t n. Hledané odhady ˆβ x, ˆκ t minimalizují x m t n x=x 1 t=t 1 (z xt β x κ t ) 2. Necht u 1 je vlastní vektor odpovídající největšímu vlastnímu číslu λ 1 matice Z T Z, v 1 je odpovídající vlastní vektor matice ZZ T. Nejlepší přibĺıžení matice Z: λ 1 v 1 u1 T.
LC model - odhad parametrů S ohledem na x β x = 1 klademe ˆβ = pokud x n x 1 +1 j=1 v 1j 0. v 1 xn x 1 +1 j=1 v 1j, ˆκ = (x n x 1 +1 λ 1 j=1 v 1j ) u 1,
LC model - odhad parametrů Numerický výpočet odhadů ˆα x, ˆβ x, ˆκ t užitím Newton-Raphsonova algoritmu: Položením derivací O podle jednotlivých parametrů rovných 0 dostaneme soustavu: t n 0 = (ln m x (t) α x β x κ t ), x = x 1,..., x m t=t 1 x m 0 = β x (ln m x (t) α x β x κ t ), t = t 1,..., t n x=x 1 0 = t n t=t 1 κ t (ln m x (t) α x β x κ t ), x = x 1,..., x m.
LC model - odhad parametrů ˆα (k+1) x ˆκ (k+1) t ˆβ (k+1) x tn = ˆα x (k) + t=t1 (ln m x (t) ˆα x (k) t n t 1 + 1 xm = ˆκ (k) t + tn = ˆβ x (k) + ˆβ(k) x=x1 x t=t1 ˆκ (k+1) t ˆβ x (k) κ (k) t ) (ln m x (t) ˆα x (k+1) xm ( ) ˆβ(k) 2 x=x1 x (ln m x (t) ˆα x (k+1) tn (k+1)) 2 t=t1 (ˆκ x (k) ˆβ x κ (k) t ) (k) ˆβ x κ (k+1) t )
LC model Úprava výsledných odhadů s ohledem na omezující podmínky: ˆα x ˆα x + ˆβ x κ ˆκ t (ˆκ t κ) ˆβ ˆβ x ˆβ x / ˆβ, kde κ = 1 t n t 1 +1 tn t=t1 κ t.
LC model Úprava výsledných odhadů ˆκ t - např. na základě shody s pozorovaným celkovým počtem úmrtí v roce t: x m x=x 1 D x,t = x m D x,t...počet úmrtí ve věku x v roce t x=x 1 E x,t exp(ˆα x + ˆβ x ˆκ t ), E x,t...expozice riziku úmrtí ve věku x v čase t (pozorované míry úmrtnosti m x (t) = Dx,t E x,t ) Následně nahradíme ˆκ t hodnotou ˆκ t κ a ˆα x hodnotou ˆα x + ˆβ x κ.
Poissonovský model Alternativní přístup k odhadu parametrů LC modelu vychází z předpokladu, že máme k dispozici počty zemřelých D x,t a expozice E x,t. Předpokládáme, že náhodná veličina D x,t má Poissonovo rozdělení s parametrem E x,t exp(α x + β x κ t ) Parametry odhadujeme maximalizací logaritmické věrohodnostní funkce L = x m t n x=x 1 t=t 1 ( Dx,t (α x + β x κ t ) E x,t exp(α x + β x κ t ) ) + konst.
Poissonovský model Položením derivace L podle α x rovné nule dostáváme t n t n D x,t = E x,t exp(ˆα x + ˆβ x ˆκ t ), t=t 1 t=t 1 odhady reprodukují pozorované celkové počty úmrtí v jednotlivých věcích obsažené v datech.
Další aspekty LC modelu Řadu odhadů parametrů β x je často před použitím k projekci úmrtnosti třeba vyhladit. Požadavek na hladkost průběhu β x v závislosti na věku může být součástí optimalizační úlohy pro odhad parametrů, např. místo funkce O lze minimalizovat x m x=x 1 t n x n (ln m x (t) α x β x κ t ) 2 + π β (β x+2 2 β x+1 + β x ) 2 t=t 1 x=x 1
modelování časového indexu Na odhady ˆκ t se pohĺıží jako na realizaci časové řady, kteá se řídí ARIMA modelem. ARIMA(p,d,q) je stacionární proces splňující d κ t = φ 1 d κ t 1 + +φ p d κ t p +ξ t +ψ 1 ξ t 1 +... ψ q ξ t q, kde φ p 0, ψ q 0, d κ t je d-tá diference procesu κ t. Posloupnost ξ t je gaussovský bílý šum s kladným rozptylem.
modelování časového indexu Z empirických studíı vyplývá, že často je vhodným modelem pro κ t κ t = κ t 1 + d + ξ t, kde ξ t jsou i.i.d. normální se střední hodnotou 0 a rozptylem σ 2. (náhodná procházka s driftem) odhady parametrů: ˆσ 2 = 1 t n t 1 ˆd = ˆκ t n ˆκ t1 t n t 1 t n t t 2 ( ) 2 ˆκ t ˆκ t 1 ˆd
Cairns-Blake-Dowdův model CBD model (2006) je založen na empiricky podložené představě, že funkce ln q x(t) p x (t) pro pevné t závisí na x přibližně lineárně. CBD model předpokládá ln q x(t) p x (t) = κ[1] t + κ [2] t kde κ [1] t a κ [2] t jsou náhodné procesy. x
kalibrace CBD modelu Kalibrace metodou nejmenších čtverců vychází z modelu ln q x(t) p x (t) = κ[1] t + κ [2] t x + ɛ x,t, kde ɛ x,t jsou nezávislé normálně rozdělené veličiny s nulovou střední hodnotou a stejným rozptylem. Součet O = x m x=x 1 ( ln q x(t) p x (t) κ[1] t κ [2] t se minimalizuje pro každý kalendářní rok t. ) 2 x
modelování časových indexů Možnost: dvourozměrná náhodná procházka s driftem κ [1] t = κ [1] t 1 + d 1 + ξ [1] t κ [2] t = κ [2] t 1 + d 2 + ξ [2] t kde (ξ [1] t, ξ [2] t ) jsou nezávislé náhodné vektory s dvourozměrným normálním rozdělením s nulovou střední hodnotou a varianční maticí Σ. Kromě driftů a rozptylů je třeba odhadovat i kovarianci.
APC rozšíření LC modelu Renshaw-Habermanův model (2006) rozšířil původní LC model o složku závislou na roce narození (příslušnosti ke kohortě) APC - age-period-cohort speciální případy: AC: β (1) x = 0 LC: β (0) x = 0 ln m x (t) = α x + β x (0) i t x + β x (1) κ t
Poissonovský model Uvažujeme zobecněný nelineární model pro počty úmrtí D x,t - model s poissonovskou odezvou a logaritmickým linkem Y x,t = D x,t E Y x,t = E x,t exp Var Y x,t = φ E Y x,t ( α x + β (0) x i t x + β (1) x κ t ) η x,t = ln(e Y x,t ) = ln E x,t + α x + β x (0) i t x + β x (1) κ t
kohortnı efekt
Literatura Pitacco, E., Denuit, M., Haberman, S., Olivieri, A.: Modelling Longevity Dynamics for Pensions and Annuity Business. Oxford University Press, 2009.