Przyszła długość życia x-latka Rozważmy osobę mającą x lat; oznaczenie: (x) Jej przyszłą długość życia oznaczymy T (x), lub krótko T Zatem x+t oznacza całkowitą długość życia T jest zmienną losową, której dystrybuantę oznaczymy G(t): G(t) Pr(T t), t Tak G(t) oznacza prawdopodobieństwo, że osoba umrze w ciągu t lat Będziemy zakładać, że dystrybuanta G jest znana oraz że jest ciągła i ma gęstość g(t) G (t) Zatem g(t)dt Pr(t < T < t + dt) oznacza prawdopodobieństwo, że śmierć nastąpi w nieskończenie małym przedziale [t, t + dt] Prawdopodobieństwa i wartości oczekiwane można wyrażać używając funkcji g i G Tradycyjna notacja aktuarialna jest jednak inna Np symbol t q x oznacza prawdopodobieństwo, że x-latek umrze w ciągu t lat Stąd Zatem tq x G(t) tp x G(t) jest prawdopodobieństwem, że x-latek przeżyje t lat Następnie s tq x Pr(s < T s + t) G(s + t) G(s) s+t q x s q x s p x s+t p x jest prawdopodobieństwem, że x-latek przeżyje s lat, a następnie umrze w ciągu t lat G(s + t) tp x+s Pr(T > s + t T > s), jest z kolei prawdopodobieństwem warunkowym, że osoba przeżyje dalsze t lat po przeżyciu s lat Podobnie G(s + t) G(s) tq x+s Pr(T s + t T > s), jest prawdopodobieństwem śmierci w ciągu t lat po przeżyciu s lat Mamy tożsamości s+tp x G(s + t) [] G(s + t) s p x tp x+s, s tq x G(s + t) G(s) [] G(s + t) G(s) s p x tq x+s Wartość oczekiwaną pozostałej długości życia x-latka, E(T ) oznaczamy e x Zatem e x tg(t)dt
Ponieważ ze wzoru na całkowanie przez części otrzymujemy: [ G(t)]dt ( G(t))t + tg(t)dt tg(t)dt, e x [ G(t)]dt tp x dt Jeżeli t, indeks t jest zawsze opuszczany w symbolach t p x, t q x, s t q x Zatem q x jest prawdopodobieństwem, że x-latek umrze w ciągu roku, a s q x jest prawdopodobieństwem, że x-latek przeżyje s lat, a potem umrze w ciągu roku Intensywność wymierania Intensywność (natężenie) wymierania dla x-latków w wieku x + t lat określamy jako µ x+t g(t) G(t) d ln[ G(t)] dt Wtedy mamy: Pr(t < T < t + dt) g(t)dt g(t) [ G(t)]dt G(t) µ x+tt p x dt, a także: e x tg(t)dt t t p x µ x+t dt o o Z równości poprzedniej mamy dla małych s: Pr(t < T < t + s) t p x µ x+t s Lewa strona tej równości to t s q x, czyli t p xs q x+t Stąd tp xs q x+t t p x µ x+t s, sq x+t µ x+t s Interpretacja: prawdopodobieństwo śmierci w wieku bliskim x + t jest proporcjonalne do intensywności wymierania w tym wieku Ponieważ z definicji całkując otrzymamy µ x+t d dt ln[ G(t)] d dt ln( tp x ), t ln( t p x ) µ x+s ds, tp x e t µ x+sds 2
2 Analityczne dystrybuanty zmiennej losowej T Funkcję G nazywamy dystrybuantą analityczną, jeśli można ją określić prostym wzorem Dawniej próbowano wyprowadzić wzory na G(t) z pewnych podstawowych postulatów, na wzór fizyki Obecnie te próby wydają się nieco naiwne i mistyczne Historycznie pierwszą próbą był postulat de Moivre a (724) zakładający, że rozkład zmiennej T jest jednostajny między wiekiem (liczonym od momentu x) a wiekiem ω x, gdzie ω jest hipotetycznym maksymalnym wiekiem Stąd otrzymujemy g(t) dla < t < ω x, ω x i dalej skąd G(t) t ω x ds µ x+t g(t) G(t) ω x t ω x t ω x, ω x t dla < t < ω x Jak widać intensywność wymierania jest rosnącą funkcją t W roku 824 Gompertz postulował wykładniczy wzrost intensywności wymierania: µ x+t Bc x+t, t >, co lepiej oddaje charakter procesu starzenia a ponadto usuwa założenie wieku maksymalnego ω Prawo Gompertza zostało uogólnione przez Makehama, który zaproponował wzór µ x+t A + Bc x+t, t > Szczególnym przypadkiem tych praw jest stała intensywność wymierania (przyjąć c w prawie Gompertza lub B w prawie Makehama) Wtedy tp x e µt Jest to matematycznie proste lecz niezbyt realistyczne Ogólniej, przy założeniu prawa Makehama: tp x exp[ t (A + Bcx+s )ds] exp( [As + B ln c cx+s ] t ) exp[ At B ln c cx (c t )] exp( At mc x (c t )), gdzie m B/ ln c Kolejna propozycja pochodzi od Weibulla (939): µ x+t k(x + t) n, k, n > Wtedy prawdopodobieństwo przeżycia wynosi ( (x + s)n+ tp x exp k n + exp( k n + [(x + t)n+ x n+ ]) 3 t )
3 Obcięta długość życia x-latka Określimy pewne zmienne losowe związane ze zmienną T K [T ] jest liczbą pełnych lat przeżytych później przez x-latka (tzw obcięta długość życia) K jest zmienną losową o wartościach całkowitych i jej rozkład określają wzory: Pr(K k) Pr(k T < k + ) k p x, k,, Wartość oczekiwaną zmiennej K oznaczamy e x Mamy: Korzystając ze wzoru możemy napisać e x e x kpr(k k) k k p x k k k a ik a ik, k i i ki k kpr(k k) Pr(K k) k k i Pr(K k) Pr(K i), i ki i czyli e x Pr(K k) kp x k k Niech S oznacza tę część roku śmierci, którą przeżywa (x), tj T K + S Zmienna losowa S ma ciągły rozkład między i Przybliżając jej wartość oczekiwaną przez 2 mamy: ex e x + 2 Załóżmy, że K i S są niezależnymi zmiennymi losowymi, tj że dystrybuanta zmiennej S pod warunkiem K nie zależy od K, czyli: nie zależy od k, można napisać Pr(S u K k) u u H(u), dla k,,, u i pewnej funkcji H(u) Jeżeli założymy, że H(u) u (rozkład jednostajny), to mamy równość dokładną: oraz (bo Var(S) (x 2 )2 dx 2 ) e x e x + 2 Var(T ) Var(K) + 2 4
4 Tablice trwania życia Rozkład prawdopodobieństwa przyszłej długości życia x-latka można zbudować w oparciu o odpowiednią tablicę trwania życia, zbudowaną na podstawie danych statystycznych Tablica taka jest w zasadzie tablicą prawdopodobieństwa śmierci dotyczących kolejnych lat Tworzy się tablice dla różnych grup populacji (np wg płci, rasy, pokolenia) Wiek początkowy x może znacząco wpływać na taką tablicę Np niech x oznacza wiek w którym dana osoba kupiła ubezpieczenie na życie Ponieważ ubezpieczenie oferuje się tylko ludziom zdrowym (czasem po badaniach lekarskich), należy oczekiwać, że osoba, która właśnie nabyła ubezpieczenie będzie lepszego zdrowia niż ta, która je kupiła kilkanaście lat temu (chociaż teraz wiek jest ten sam) To zjawisko uwzględniają tzw ścięte tablice trwania życia W takiej tablicy prawdopodobieństwa śmierci są stopniowane zależnie od wieku wejścia do systemu ubezpieczeń Zatem q [x]+t jest prawdopodobieństwem śmierci (w ciągu roku) dla x + t-latka, gdzie x jest wiekiem wejścia Mamy nierówności q [x] < q [x ]+ < q [x 2]+2 < Efekt selekcji zanika po kilku, powiedzmy r, latach po wejściu Zakładamy, że q [x r]+r q [x r ]+r+ q x Okres r nazywa się okresem selekcji 5 Prawdopodobieństwo śmierci dla części roku Rozkład zmiennej K i jej charakterystyki można wyznaczyć na podstawie tablic trwania życia Np kp x p x p x+ p x+2 p x+k Aby otrzymać rozkład zmiennej T czyni się założenia odnośnie prawdopodobieństwa śmierci u q x lub intensywności wymierania µ x+u w wieku x + u (x całkowite, < u < ) Podamy trzy takie założenia Założenie a: Liniowość u q x To założenie nazywa się hipotezą jednostajności (uniform distribution of deaths) Zakładamy, że u q x jest liniową funkcją u, tj u q x uq x Jak już wiadomo jest to przypadek gdy K i S są niezależne i S ma rozkład jednostajny Wtedy oraz up x uq x µ x+u d du ln( up x ) d du ln( uq x) Prawdziwa jest także równość: gdyż n+up x ( u) np x + u n+ p x, q x uq x n+up x n p x up x+n n p x ( uq x+n ) n p x ( u+up x+n ) n p x ( u)+u n+ p x 5
Założenie b: µ x+u jest stała To założenie nazywa się hipotezą stałego natężenia zgonów (constant force of mortality) Zakładamy, że µ x+u jest stała dla < u <, i oznaczamy tę wartość µ x+/2 Mamy µ x+/2 d dt ln tp x, czyli u µ x+/2 ds ln u p x, < u <, uµ x+/2 ln( u p x ) () skąd dla u otrzymujemy: µ x+/2 ln p x Ponadto z równości () mamy up x e uµ x+ 2 ( e µ ) u x+ 2, Stąd uzyskujemy up x (p x ) u Pr(S u K k) u (p x+k) u p x+k up x+k p x+k Rozkład warunkowy zależy od K, zmienne S i K nie są teraz niezależne Przykład Na podstawie tablic trwania życia wiemy, że q 26 jest równe: dla mężczyzny,6, a dla kobiety,29 Obliczyć prawdopodobieństwo, że osoba 26-letnia przeżyje najbliższe pół roku Przyjmijmy Założenie a Wtedy,5p 26, 5 q 26, dla mężczyzny,5 p 26, 99942, a dla kobiety,999855 Przy Założeniu b mamy,5p 26 p 26 q 26, czyli tak samo: dla mężczyzny,5 p 26, 99942, a dla kobiety,999855 Założenie c: Liniowość u q x+u To założenie zaproponował Balducci Stwierdza ono, że uq x+u ( u)q x 6
Aby wyznaczyć µ x+u obliczymy u p x z równości p x u p x u p x+u, Ponadto up x p x up x+u q x ( u)q x, ln u p x ln[ ( u)q x ] ln( q x ), µ x+u d du (ln up x ) q x ( u)q x Pr(S u K k) u up x+k ( u) Zatem zmienne losowe K i S nie są niezależne ( u) + [ ( u) ] u ( u) 7