ŚLĄSKI PRZEGLĄD STATYSTYCZNY

Podobne dokumenty
STOCHASTYCZNE MODELOWANIE UMIERALNOŚCI. Kamil Jodź. 1. Wstęp

Stochastyczne modelowanie intensywności zgonów na przykładzie Polski

ŚLĄSKI PRZEGLĄD STATYSTYCZNY

Model Lee i Cartera a wysokość świadczeń dożywotnich wyniki dla Polski

ŚLĄSKI PRZEGLĄD STATYSTYCZNY

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Szacowanie optymalnego systemu Bonus-Malus przy pomocy Pseudo-MLE. Joanna Sawicka

ŚLĄSKI PRZEGLĄD STATYSTYCZNY

Uogolnione modele liniowe

Ćwiczenie 5 PROGNOZOWANIE

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

ŚLĄSKI PRZEGLĄD STATYSTYCZNY

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

3. Modele tendencji czasowej w prognozowaniu

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Ekonometria. Zajęcia

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

MODELE MATEMATYCZNE W UBEZPIECZENIACH

Rozdział 8. Regresja. Definiowanie modelu

Kalibracja. W obu przypadkach jeśli mamy dane, to możemy znaleźć równowagę: Konwesatorium z Ekonometrii, IV rok, WNE UW 1

Ekonometryczna analiza popytu na wodę

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

7.4 Automatyczne stawianie prognoz

MODELOWANIE STRUKTURY PROBABILISTYCZNEJ UBEZPIECZEŃ ŻYCIOWYCH Z OPCJĄ ADBS JOANNA DĘBICKA 1, BEATA ZMYŚLONA 2

Wydłużanie wieku emerytalnego w kontekście poprawy wskaźników. Warszawa, Arkadiusz Filip

Matematyka ubezpieczeń majątkowych r.

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Ćwiczenia 2. Tablice trwania życia. (life tables)

Agata Boratyńska Statystyka aktuarialna... 1

PROGNOZOWANIE PRZYCHODÓW ZE SPRZEDAŻY

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Dopasowywanie modelu do danych

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Dynamiczne stochastyczne modele równowagi ogólnej

Wnioskowanie statystyczne. Statystyka w 5

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Metody aktuarialne - opis przedmiotu

Oszczędności gospodarstw domowych Analiza przekrojowa i analiza kohort

1 Elementy teorii przeżywalności

Rachunek Prawdopodobieństwa Anna Janicka

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Testowanie hipotez statystycznych.

Spis treści 3 SPIS TREŚCI

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Analiza regresji - weryfikacja założeń

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Ćwiczenia 2. Tablice trwania życia. (life tables)

Wykład 8,

1 Elementy teorii przeżywalności

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2017/2018

1. Przyszła długość życia x-latka

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

ANALIZA PORÓWNAWCZA KONIUNKTURY WOJEWÓDZTW POLSKI W LATACH

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2017/2018

1.1 Klasyczny Model Regresji Liniowej

Ekonometryczne modele nieliniowe

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

Regresja linearyzowalna

Zagadnienia statystyki aktuarialnej. pod redakcją Joanny Dębickiej

MODELE LINIOWE. Dr Wioleta Drobik

A.Światkowski. Wroclaw University of Economics. Working paper

Matematyka ubezpieczeń majątkowych r.

Stanisław Cichocki Natalia Neherbecka

Badanie ewolucji tablic trwania życia: Modyfikacje modelu Lee-Cartera Wojciech Otto Wydział Nauk Ekonomicznych Uniwersytetu Warszawskiego

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Metoda największej wiarogodności

Parametr Λ w populacji ubezpieczonych ma rozkład dany na półosi dodatniej gęstością: 3 f

Statystyka i Analiza Danych

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Stanisław Cichocki. Natalia Neherbecka. Zajęcia 13

Własność iteracyjności składek ubezpieczeniowych wyznaczonych w oparciu o teorię skumulowanej perspektywy Kahnemana-Tversky

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

MIĘDZY I WEWNĄTRZPOKOLENIOWA REDYSTRYBUCJA DOCHODOWA W POLSKIM SYSTEMIE EMERYTALNYM

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

1. Ubezpieczenia życiowe

Ubezpieczenia majątkowe

MODELOWANIE ZMIENNOŚCI CEN AKCJI MODEL ADDYTYWNY MODEL MULTIPLIKATYWNY

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Robert Kubicki, Magdalena Kulbaczewska Modelowanie i prognozowanie wielkości ruchu turystycznego w Polsce

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

EKONOMETRIA ECONOMETRICS 2(36) 2012

Zawansowane modele wyborów dyskretnych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Zróżnicowanie poziomu ubóstwa w Polsce z uwzględnieniem płci

UBEZPIECZ SIĘ, NAJLEPIEJ U MATEMATYKA

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Transkrypt:

Polskie Towarzystwo Statystyczne Oddział we Wrocławiu ŚLĄSKI Silesian Statistical Review Nr 12 (18) Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2014

RADA NAUKOWA Walenty Ostasiewicz, Tadeusz Bednarski, Luisa Canal, Stanisław Heilpern, Stanislava Hronová, Angiola Pollastri, Jerzy Śleszyński, Reinhard Viertl, Emilia Zimková KOMITET REDAKCYJNY Zofia Rusnak (redaktor naczelny) Edyta Mazurek (sekretarz naukowy) Tadeusz Borys, Katarzyna Ostasiewicz, Grażyna Trzpiot RECENZENCI WSPÓŁPRACUJĄCY Z CZASOPISMEM: Milan Bašta, Mariusz Czekała, Stanisława Hronová, Helena Jasiulewicz, Dorota Kuchta, Tomáš Löster, Ivana Malá, Witold Miszczak, Stanisława Ostasiewicz, Witold Więsław Publikacja jest dostępna w Internecie na stronach: www.ibuk.pl; www.ebscohost.com, The Central European Journal of Social Sciences and Humanities http://cejsh.icm.edu.pl The Central and Eastern European Online Library www.ceeol.com, a także w adnotowanej bibliografii zagadnień ekonomicznych BazEkon http://kangur.uek.krakow.pl/bazy_ae/bazekon/nowy/index.php Informacje o naborze artykułów i zasadach recenzowania znajdują się na stronie internetowej Wydawnictwa www.wydawnictwo.ue.wroc.pl

Spis treści Od Redakcji 7 Editor s note on the paper C.F. Gauss and the method of least aquares 8 Oscar Sheynin, C.F. Gauss and the method of least squares 9 Addenda to the paper C.F. Gauss and the method of least squares 39 Oscar Sheynin, Addendum No. 1: Elementary exposition of Gauss final justification of least squares 39 Oscar Sheynin, Addendum No. 2: Antistigler 48 Oscar Sheynin, Addendum No. 3: Theory of errors and statistics. Some thoughts about Gauss 53 Witold Więsław, Gauss theorem on continued fractions 55 Oscar Sheynin, Randomness and determinism: Why are the planetary orbits elliptical? 57 Walenty Ostasiewicz, The emergence of statistical science 75 Adam Korczyński, Review of methods for data sets with missing values and practical applications 83 Katarzyna Ostasiewicz, Impact of outliers on inequality measures a comparison between Polish voivodeships 105 Magdalena Barska, Seasonality testing for macroeconomic time series comparison of X-12-ARIMA and TRAMO/SEATS procedures 121 Małgorzata Gotowska, Anna Jakubczak, Satisfaction with education and work as a basis for assessing the quality of life in selected regions with different levels of standard of living 141 22. Scientific Statistical Seminar Wrocław-Marburg, Świeradów Zdrój, 30 IX 4 X 2014. Extended abstracts 157 Stanisław Heilpern, Zależny, złożony proces Poissona wyznaczanie składek ubezpieczeniowych 195 Stanisława Bartosiewicz, Anna Błaczkowska, Analiza niedowartościowania kobiet w Polsce w zakresie wysokich wynagrodzeń 209 Beata Bal-Domańska, Alina Bieńkowska, Zrównoważony rozwój w pracach Eurostatu i GUS 225

4 Spis treści ŚLĄSKI Nr 12 (18) Kamil Jodź, Stochastyczne modelowanie umieralności 237 Agnieszka Marciniuk, Renta hipoteczna a odwrócony kredyt hipoteczny na rynku polskim 253 Agnieszka Mruklik, Struktura terminowa stóp procentowych opisana modelami stopy krótkoterminowej 273 Katarzyna Ostasiewicz, Racjonalność, konflikty i teoria gier w życiu i pracy Roberta J. Aumanna (Nagroda imienia Nobla w dziedzinie ekonomii, 2005) 285 Elżbieta Stańczyk, Analiza porównawcza województw ze względu na działalność innowacyjną przedsiębiorstw w latach 2004 2012 313 Piotr Sulewski, Wykorzystanie uogólnionego rozkładu gamma do generowania tablicy dwudzielczej 339 Walenty Ostasiewicz, Refleksje o pisarstwie statystycznym 349 Agata Girul, Ważniejsze dane społeczno-gospodarcze o województwach 353 Summaries Oscar Sheynin, C.F. Gauss i metoda najmniejszych kwadratów 37 Oscar Sheynin, Addendum 1. Elementarne przedstawienie ostatecznego Gaussowskiego uzasadnienia najmniejszych kwadratów 48 Oscar Sheynin, Addendum 2. Antistigler 53 Oscar Sheynin, Addendum 3. Teoria błędów i statystyka. Pewne przemyślenia gaussowskie 55 Oscar Sheynin, Losowość i determinizm. Dlaczego orbity planet są eliptyczne? 74 Walenty Ostasiewicz, Pojawienie się nauki statystycznej 81 Adam Korczyński, Przegląd metod analizy niekompletnych zbiorów danych wraz z przykładami zastosowań 103 Katarzyna Ostasiewicz, Wpływ obserwacji odstających na miary nierówności porównanie pomiędzy polskimi województwami 120 Magdalena Barska, Weryfikacja sezonowości dla makroekonomicznych szeregów czasowych porównanie metod X-12-ARIMA i TRAMO/SEATS 139 Małgorzata Gotowska, Anna Jakubczak, Zadowolenie z edukacji i pracy jako podstawa do oceny jakości życia w wybranych województwach o różnym poziomie życia 156

Spis treści 5 ŚLĄSKI Stanisław Heilpern, Dependent compound Poisson process insurance premium determination 207 Stanisława Bartosiewicz, Anna Błaczkowska, Analysis of women undervaluation in Poland in terms of high salaries 223 Beata Bal-Domańska, Alina Bieńkowska, Sustainable development as seen by Eurostat and GUS 235 Kamil Jodź, Stochastic modeling mortality 251 Agnieszka Marciniuk, Reverse annuity contract and reverse mortgage on the Polish market 272 Agnieszka Mruklik, Term structure of interest rates described with short-rate models 284 Katarzyna Ostasiewicz, Rationality, conflicts and game theory in the life and career of Robert J. Aumann (Nobel Prize in Economic Sciences, 2005) 312 Elżbieta Stańczyk, Comparative analysis of voivodeships due to the innovation activity of industrial enterprises in the years 2004 2012 338 Piotr Sulewski, Using the generalized gamma distribution to generate contingency tables 347 Nr 12 (18)

STOCHASTYCZNE MODELOWANIE UMIERALNOŚCI ŚLĄSKI Kamil Jodź Uniwersytet Przyrodniczy we Wrocławiu ISSN 1644-6739 Streszczenie: W artykule została przedstawiona metodologia stochastycznego modelowania intensywności zgonów na przykładzie modeli: Lee-Cartera, Renshawa-Habermana oraz Plata. W wyniku przeprowadzonych obliczeń otrzymano oszacowania parametrów modeli opisujących poziom umieralności w polskiej populacji. Na podstawie oszacowanych modeli wyznaczono prognozy dalszego trwania życia w Polsce. Słowa kluczowe: natężenie zgonów, model Lee-Cartera, model Renshawa-Habermana, model Plata, modelowanie stochastyczne. DOI: 10.15611/sps.2014.12.13 1. Wstęp Od 1950 do 2010 r. przeciętna długość życia noworodka w Polsce wydłużyła się o 18 lat. Ciągły proces wydłużania się ludzkiego życia stał się poważnym wyzwaniem dla firm ubezpieczeniowych oraz dla polskiego systemu emerytalnego. Wysokości składek emerytalnych i ubezpieczeniowych są najczęściej wyliczane w oparciu o przekrojowe tablice trwania życia, publikowane przez Główny Urząd Statystyczny. Tablice te z założenia nie uwzględniają faktu wydłużania się przeciętnego dalszego trwania życia, wraz z kolejnymi latami kalendarzowymi, co powoduje, że jest ono niedoszacowane. Kompletna analiza intensywności zgonów oraz dalszego trwania życia powinna zawierać podejście zarówno przekrojowe, jak i kohortowe. Podejście kohortowe dotyczy analizy demograficznej poszczególnych grup osób urodzonych w tym samym roku. Modelem, który opisuje zmiany w poziomie umieralności związane zarówno z wiekiem, jak i rokiem kalendarzowym, jest model Lee-Cartera. Model wraz z jego licznymi wariantami zyskał w ostatnich latach wielu zwolenników. W artykule zostanie przedstawiona metodologia stochastycznego modelowania intensywności zgonów na przykładzie trzech modeli: Lee-Cartera, Renshawa- -Habermana oraz Plata.

ŚLĄSKI 238 Kamil Jodź Praca ma następujący podział. W części drugiej omówiono pokrótce niektóre historyczne metody modelowania umieralności. Część trzecia zawiera szczegółowy opis wybranych, stochastycznych modeli intensywności zgonów oraz metody ich estymacji. Kolejna część zawiera wartości uzyskanych estymatorów oraz prognozę dalszego trwania życia w Polsce. W ostatniej części zawarto podsumowanie oraz wnioski. 2. Tło historyczne Tablice trwania życia mają początek w rejestrach osób zmarłych. Rejestry te prowadzone w XVI XVII w. miały na celu informować oraz ostrzegać władze o niekorzystnej sytuacji epidemiologicznej w dużych miastach. Rosnąca liczba zgonów w rejestrach mogła świadczyć o początkach zarazy w mieście. Wczesna reakcja władz zmniejszała skalę strat, które w przypadku epidemii mogły być bardzo duże. W tym miejscu należałoby wspomnieć o jeszcze wcześniejszych tablicach pochodzących z III w. n.e., tzw. tablicach Ulpiana. Jednakże ich interpretacja oraz przeznaczenie nie do końca są jasne, dlatego można przyjąć, że tablice trwania życia pojawiły się po raz pierwszy w XVII w. Autorem jednej z pierwszych prac poświęconych zmianom w poziomie umieralności był Edmund Halley. Stworzył on tablice trwania życia dla miasta Wrocławia, oparte na obserwacjach liczby zgonów i wielkości populacji w badanym roku. Podejście takie jest stosowane powszechnie również dzisiaj. E. Halley na podstawie swoich tablic stwierdził, że ówczesne renty sprzedawane przez państwo są niedowartościowane, a ich cena nie zależy od wieku nabywcy. Wraz ze wzrostem zainteresowania matematyków tematyką prognozowania dalszego trwania życia pojawiły się pierwsze analityczne modele dotyczące intensywności zgonów. Jednym z pierwszych modeli był model stworzony przez de Moivre a, który zakładał, że istnieje nieprzekraczalny wiek ω, jaki są w stanie osiągnąć jednostki w badanej populacji. Prawo to można zapisać w następujący sposób: μ t = 1 ω t, gdzie: μ t natężenie zgonów w momencie t. Kolejnym istotnym krokiem w modelowaniu umieralności było prawo zaproponowane przez Gompertza. Natężenie liczby zgonów w tym prawie ma analityczną postać funkcji wykładniczej:

Stochastyczne modelowanie umieralności 239 gdzie: A, B dodatnie stałe. μ t = A B t, Gompertz twierdził, że powyższą formułę można interpretować jako,,przeciętny ubytek odporności na śmierć w badanej populacji [Haberman 1996]. Uogólnieniem prawa Gompertza jest prawo Makehama: μ t = C + A B t. Prawo to z pewnymi modyfikacjami (np. z różnymi parametrami wyznaczonymi dla grup wiekowych 0 9, 9 55, 55 95) było w późniejszym okresie powszechnie stosowane. Nie tylko funkcje wykładnicze były rozważane do analitycznego opisu umieralności. Weibull zaproponował do opisu umieralności w pewnych populacjach funkcję potęgową [Pitacco 2004]: μ t = A t n. Dalsze trwanie życia jest zmienną losową, mimo to w pionierskich pracach modele długości życia miały charakter deterministyczny. Dopiero w drugiej połowie XX w. zagościł na stałe modele z losową wartością opisującą obecną wartość świadczenia ubezpieczeniowego wyrażoną jako funkcja dalszego losowego trwania życia. Z roku na rok dysponujemy coraz dłuższymi szeregami czasowymi, które pozwalają na zaobserwowanie trendu umieralności i prognozowanie przyszłych poziomów natężenia zgonów. W modelowaniu stochastycznym przyjmuje się, że wartości intensywności zgonów są realizacjami pewnej zmiennej losowej. ŚLĄSKI 3. Modele stochastyczne Jednym z obecnie najpopularniejszych modeli tego typu jest model Lee-Cartera (LC) wraz z jego licznymi modyfikacjami. W 1992 r. R. Lee oraz L. Carter zaproponowali model oparty na podejściu związanym z analizą głównych składowych, a następnie dopasowali model do danych amerykańskich z lat 1900 1987 [Lee, Carter 1992]. W metodologii tej zmienną objaśnianą jest logarytm rocznego współczynnika natężenia zgonów ln (m x,t ). Postać modelu dana jest wzorem: ln ( m x,t ) = α x + β x κ t + ε x,t, gdzie: m x,t roczne współczynniki natężenia zgonów,

ŚLĄSKI 240 Kamil Jodź α x średnie względem czasu poziomy umieralności, estymowane jako średnie arytmetyczne logarytmów rocznych współczynników natężeń zgonów: α x = 1 T ln m x,t, t κ t zmiany poziomów umieralności w czasie, β x modyfikacja wartości κ t w zależności od wieku x, ε x,t niezależne zmienne losowe o średniej zero oraz stałej wariancji. Parametry κ t i β x nie są wyznaczone jednoznacznie. Podstawiając κ t = cκ t i β x = β x /c w miejscach κ t i β x można uzyskać takie same wartości ln (m x,t ). Z tego powodu wprowadza się dwa warunki zapewniające identyfikowalność modelu: κ t = 0, β x = 1. t Charakter parametrów uniemożliwia wykorzystanie takich standardowych metod estymacji, jak np. klasyczna metoda najmniejszych kwadratów. R. Lee i L. Carter rozwiązali ten problem, stosując metodę odwołującą się do rozkładu wartości osobliwych macierzy (SVD). Podejście takie wymaga założenia o homoskedastyczności składnika losowego ε x,t. Przeprowadzone badania [Brouhns i in. 2002] wskazują na to, że wariancja nie jest równomiernie rozłożona. Zjawisko to jest wyraźnie widoczne np. przy porównaniu wariancji w grupach wiekowych 30 50 lat oraz 80 100 lat. Alternatywą dla metody SVD jest metoda największej wiarygodności. W tej metodzie estymacji zakładamy, że liczba zgonów jest zmienną losową o rozkładzie Poissona, a dokładniej: D x,t ~Poisson(m x,t E x,t ), gdzie: m x,t = exp (α x + β xκ t), E x,t centralna liczba osób narażanych na ryzyko zgonu. Istotą tej metody jest maksymalizacja logarytmu funkcji wiarygodności, który w przypadku modelu Lee-Cartera ma postać: ln L = [D x,t ln (m x,t E x,t ) E x,t exp(α x + β x κ t ) ln (D x,t!)]. x t x

Stochastyczne modelowanie umieralności 241 W równaniu występuje iloczyn szacowanych składników β oraz κ, dlatego nie można ich oszacować standardowymi metodami. Rozwiązaniem tego problemu jest zastosowanie podejścia iteracyjnego. W każdym kroku iteracyjnym szacowany jest jeden z parametrów, przy niezmienionych wartościach pozostałych wcześniej oszacowanych parametrów, zgodnie z ogólną zasadą: ŚLĄSKI θ 2 L (v) θ 2 θ (v+1) = θ (n) L(v) Dla konkretnych parametrów wyrażenie to przybiera postaci: α (v+1) = α (n) (D (x) t x,t D x,t ), (x) t D x,t κ (v+1) = κ (n) (D (x) x,t D x,t )β (v) t x, (x) (v) t D x,t (β x ) 2 β (v+1) = β (n) (D (x) (v) t x,t D x,t )κ t. (x) (v) t D x,t (κ t ) 2 Procedura jest stopowana w momencie, gdy przyrost wartości funkcji wiarogodności nie przewyższa 10 7. Efektywnymi punktami startowymi są κ t = 0 oraz β x = 0,01 [Jodź 2013]. Jednym z najważniejszych powodów, dla których model został stworzony i oszacowany, jest możliwość dokonania na jego podstawie prognoz. Do tego konieczna jest ekstrapolacja κ t, parametru opisującego zmiany w umieralności w czasie. Załóżmy, że κ t ma charakter błądzenia losowego z dryfem, tzn. κ t = κ t 1 + c + ξ t, gdzie: ξ t niezależne składniki losowe o jednakowych rozkładach normalnych N(0, σ 2 ). Estymacja parametrów c oraz σ 2 została przeprowadzona analogicznie jak w pracach N. Li, R. Lee i S. Tuljapurkara [2004] oraz J. Bijak i B. Więckowskiej [2008]. Estymatory powyższych parametrów mają postać: oraz c = (κ T κ 1 )/(T 1) T σ 2 = 1/(T 1) (κ t κ t 1 c ) 2. t=2.

ŚLĄSKI 242 Kamil Jodź Mając powyższe oszacowania, możemy dokonać ekstrapolacji parametru κ na chwilę T + s: T+s κ T+s = κ T + (c + sc η) s + σ ξ τ, τ=t+1 gdzie η ma rozkład normalny N(0,1), zaś sc σ / T 1 jest błędem oszacowania stałej c. W 2006 r. A.E. Renshaw oraz S. Haberman przedstawili modyfikację modelu Lee-Cartera. Zauważyli, że część zmienności w poziomie natężenia zgonów można przypisać efektowi kohortowemu, czyli przynależeniu badanych jednostek do grupy osób urodzonych w tym samym roku [Renshaw, Haberman 2006]. Model ten (RH) można zapisać w następującej postaci: ln ( m x,t ) = α x + β x 0 γ t x + β x 1 κ t + ε x,t. 1 Interpretacja parametrów α x, β x oraz κ t jest taka sama jak w modelu Lee-Cartera. Dodatkowy parametr γ t x w modelu Renshawa- -Habermana opisuje zmiany w poziomie umieralności wynikające z przynależności do kohorty osób urodzonych w roku t x. W tym przypadku również pojawia się problem z jednoznacznością parametrów, dlatego wprowadza się następujące warunki: x β 0 x = 1, x β 1 x = 1oraz γ tmin x max = 0. Za autorami tego modelu przyjmujemy dodatkowo, że estymatory nieznanych parametrów wyznaczane są z wykorzystaniem metody iteracyjnej: γ (v+1) z = γ (v) z + (D xt D (x) xt )β x0 (v) z=t x, z=t x (β x0 (v) ) 2 (x) D xt (x) (v) )γ t x β 0 (v+1) = β 0 (v) + (D xt D xt (x) t D xt (γ (v), t x ) 2 κ (v+1) = κ (v) + (D xt D (x) xt )β x1 (v) x (x) t D xt (β x1 (v), ) 2 β 1 (v+1) = β 1 (v) + (D (x) (v) x xt D xt )κ t x. (x) (v) t D xt (κ t ) 2 Model jest ekstrapolowany w analogiczny sposób jak model Lee- -Cartera.

Stochastyczne modelowanie umieralności 243 Kolejną modyfikacją stochastycznego modelu Lee-Cartera jest model zaproponowany przez R. Plata w 2009 r. (określany skrótem PL) [Plat 2009]. Ulepszeniem w tym modelu jest dodanie kolejnego, zależnego od wieku parametru, mającego wpływ na poziom intensywności zgonów w młodszych grupach wiekowych. Pomimo dodania nowego składnika, mającego uchwycić specyficzny charakter zmian w poziomie umieralności osób młodych, konstrukcja modelu pozwala na stosowanie go dla całego przedziału wiekowego. Postać modelu dana jest wzorem: ln m x,t = α x + κ t 1 + κ t 2 (x x) + κ t 3 (x x) + + γ t x + ε x,t, gdzie (x x) + = max(x x, 0). Szacowanie parametrów modelu odbywa się w sposób iteracyjny: γ (v+1) z = γ (v) z + (D xt D (x) z=t x xt ), z=t x (x) D xt ŚLĄSKI (x) ) 1 κ (v+1) 1 = κ (v) + (D xt D xt (x) x D xt 2 κ (v+1) 2 = κ (v) + (D xt D (x) x xt )(x x), (x) x D xt (x x) 2 3 κ (v+1) 3 = κ (v) + (D (x) xt D xt )(x x) + x 4. Wartości estymatorów i prognozy x. (x) x D xt {(x x) + } 2 We wszystkich trzech modelach parametr α szacowany jest tak samo: α x = 1 T ln m x,t. t Na rysunku 1 przedstawione są wartości estymatora parametru α x dla kobiet i mężczyzn. Analizując powyższy wykres, można zauważyć, że od 50. roku życia powiększa się różnica w średnim poziomie umieralności między kobietami a mężczyznami (na korzyść kobiet). Wysokie wartości α x w grupie osób najmłodszych związane są z wysoką śmiertelnością noworodków, co jest zgodne z prowadzonymi obserwacjami. Na następnych rysunkach znajdują się oszacowane oraz ekstrapolowane wartości parametrów κ. Parametrów, które opisują tempo zmian umieralności w kolejnych latach kalendarzowych.,

ŚLĄSKI 244 Kamil Jodź Rys. 1. Wykres wartości estymatorów parametru α dla danych polskich Rys. 2. Wykres wartość estymatorów κ w modelu LC kobiety

Stochastyczne modelowanie umieralności 245 ŚLĄSKI Rys. 3. Wykres wartości estymatora parametru κ w modelu LC mężczyźni Rys. 4. Wykres wartości estymatora parametru κ w modelu RH kobiety

ŚLĄSKI 246 Kamil Jodź Rys. 5. Wykres wartości estymatora parametru κ w modelu RH mężczyźni Rys. 6. Wykres wartości estymatora parametru κ w modelu PL kobiety

Stochastyczne modelowanie umieralności 247 ŚLĄSKI Rys. 7. Wykres wartości estymatora parametru κ w modelu PL mężczyźni Rys. 8. Wykres wartości estymatora parametru γ w modelu RH

ŚLĄSKI 248 Kamil Jodź Rysunki 8 i 9 przedstawiają oszacowania parametru γ. Duże wahania wartości tego współczynnika na początku i na końcu wykresu wynikają z tego, że nie dysponujemy pełną informacją o zgonach w skraj- Rys. 9. Wykres wartości estymatora parametru γ w modelu PL Rys. 10. Wykres współczynników zgonów μ dla kobiet i mężczyzn z Polski łącznie

Stochastyczne modelowanie umieralności 249 nych kohortach. Na przykład nie wiemy, jak będzie wyglądał rozkład zgonów w kohorcie osób urodzonych w 2005 r., bo te osoby nadal żyją. Na wykresie można również zauważyć nietypową zmianę tendencji z malejącej na rosnącą w zachowaniu się parametru γ w okresie 1940 1950, co zapewne jest efektem zmian w polskiej populacji, jakie nastąpiły w czasie oraz po zakończeniu II wojny światowej. Wyestymowane parametry pozwalają na wyznaczenie wartości teoretycznych logarytmu intensywności zgonów oraz na konstrukcje prognoz przeciętnego dalszego trwania życia w Polsce. Następny rysunek przedstawia przykładową prognozę wielkości natężenia zgonów uzyskaną na podstawie modelu Lee-Cartera. ŚLĄSKI Tabela 1. Przekrojowe i kohortowe dalsze trwanie życia Rok Przekrojowe e p (65) Kohortowe e c (65) kobiety mężczyźni kobiety mężczyźni 1969 16,20 12,84 17,49 13,74 1989 17,25 13,73 20,08 15,48 2009 19,73 15,93 22,55 17,97 2016 20,51 16,66 23,22 18,67 Rys. 11. Kohortowe dalsze trwanie życia osoby w wieku 65 lat dla kobiet i mężczyzn z Polski

ŚLĄSKI 250 Kamil Jodź Wyliczone na podstawie oszacowanych i prognozowanych wartości μ x,t przeciętne dalsze trwanie życia 65-latka w ujęciu przekrojowym i kohortowym, zostało zaprezentowane w tab. 1 i na rys. 11. 5. Podsumowanie i wnioski Z przeprowadzonych badań wynika, że modelowanie intensywności zgonów z użyciem modeli stochastycznych, takich jak modele Lee-Cartera, Renshawa-Habermana oraz Plata, pozwala na wyliczenie przeciętnego dalszego trwania życia zarówno w ujęciu przekrojowym, jak i w ujęciu wzdłużnym (kohortowym). W kalkulacji składek w ubezpieczeniach długoterminowych należy uwzględnić podejście kohortowe, które stanowi uzupełnienie dla powszechnie stosowanego podejścia przekrojowego. Z porównania wartości przekrojowego dalszego trwania życia oraz kohortowego dalszego trwania życia wynika, że ta druga wartość w przypadku polskich danych jest istotnie większa. W sytuacji, gdy obserwowany jest spadek poziomu umieralność, podejście przekrojowe, które nie doszacowuje wartości dalszego trwania życia, powinno być uzupełniane o podejście kohortowe. Literatura Bijak J., Więckowska B., Prognozowanie przeciętnego dalszego trwania życia na podstawie modelu Lee-Cartera wybrane zagadnienia, [w:] W. Ostasiewicz (red.), Statystyka aktuarialna teoria i praktyka, Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu, Wrocław 2008, s. 9 27. Bowers N.et al., Actuarial Mathematics, Society of Actuaries, USA, Schaumbury 1997. Brouhns N., Denuit M., Vermunt J., A Poisson log-bilinear regression approach to the construction of projected life tables,,,insurance: Mathematics and Economics 2002, Vol. 31, s. 373 393. Haberman S., Landmarks in the history of actuarial science (up to 1919), Actuarial Research Paper No. 84, Faculty of Actuarial Science and Insurance, City University London, UK, 1996. Imhoff E. van, The exponential multidimensional demographic projection model,,,mathematical Population Studies 1990, Vol. 2, s. 171 182. Jodź K., Stochastyczne modelowanie intensywności zgonów na przykładzie Polski, Roczniki Kolegium Analiz Ekonomicznych SGH 2013, t. 31, s. 199 213. Koissi M.-C., Shapiro A., Högnäs G., Evaluating and extending the Lee-Carter model for mortality forecasting: Bootstrap confidence interval,,,insurance: Mathematics and Economics 2006, Vol. 38, s. 1 20. Lee R., Carter L., Modeling and forecasting U.S. mortality,,,journal of the American Statistical Association 1992, Vol. 87, s. 659 671. Li J., Chan W., Cheung S., Structural changes in the Lee-Carter mortality indexes: detection and implications,,,north American Actuarial Journal 2011, Vol. 15, s. 13 31.

Stochastyczne modelowanie umieralności 251 Li N., Lee R., Tuljapurkar S., Using the Lee-Carter method to forecast mortality for populations with limited data,,,international Statistical Review 2004, Vol. 72, s. 19 36. Mitchell D., Brockett P., Mendoza-Arriaga R., Muthuraman K., Modeling and forecasting mortality rates,,,insurance: Mathematics and Economics 2013, Vol. 52, s. 275 285. Pitacco E., From Halley to frailty : A review of survival models for actuarial calculations, Giornale dell Istituto Italiano degli Attuari 2004, Vol. 67, No. 1/2, s. 17 47. Plat R., On stochastic mortality modeling,,,insurance: Mathematics and Economics 2009, Vol. 45, s. 393 404. Renshaw A.E., Haberman S., A cohort-based extension to the Lee-Carter model for mortality reduction factors,,,insurance: Mathematics and Economics, 2006, Vol. 38, s. 556 570. ŚLĄSKI STOCHASTIC MODELING MORTALITY Summary: This article presents the methodology of stochastic modeling mortality on the example of the models: Lee-Carter, Renshaw-Haberman and Plat. As a result of calculations, estimated model parameters describing the level of mortality in the Polish population have been obtained. Based on the estimated models predictions of life expectancy in Poland have been made. Keywords: mortality rate, Lee-Carter model, Renshaw-Haberman model, Plata model, stochastic modeling.