Ewa Frątczak ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII, WYBRANE PRZYKŁADY ZASTOSOWAŃ Z WYKORZYSTANIEM PAKIETU TDA MATERIAŁY DO WYKŁADU I ĆWICZEŃ SZKOŁA GŁÓWNA HANDLOWA
2 Recenzenci Redaktor Ewa Heynar-Skowrońska Skład komputerowy Paweł Murak Copyright by Oficyna Wydawnicza SGH, Warszawa 1997 ISBN Druk i oprawa: Oficyna Wydawnicza Szkoły Głównej Handlowej Warszawa 1996. Wydanie I. Ark.wyd.. Ark.druk. Zamówienie
3 Spis treści Wstęp... 7 CZĘŚĆ I ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII Rozdział 1. Co to jest analiza historii zdarzeń?... 11 Rozdział 2. Podstawowe pojęcia i zagadnienia badawcze analizy historii zdarzeń... 16 Rozdział 3. Rodzaje informacji i badań statystycznych oraz ich uŝyteczność w analizie historii zdarzeń... 24 Rozdział 4. Podstawowe miary stosowane w analizie historii zdarzeń... 32 Rozdział 5. Analiza historii zdarzeń jako proces stochastyczny... 36 Rozdział 6. Metody i modele stosowane w analizie historii zdarzeń... 38 Rozdział 7. Modele nieparametryczne. Teoria oraz procedury estymacji i weryfikacji... 40 7.1. Informacje ogólne... 40 7.2. Tradycyjna metoda konstrukcji tablic trwania Ŝycia... 46 7.3. Konstrukcja tablic trwania Ŝycia przy zastosowaniu metody Kaplana-Meiera Product-Limit-Estimation... 51 7.4. Procedury weryfikacji... 53 7.5. Przykład empiryczny... 56 Rozdział 8. Metody i modele parametryczne. Teoria oraz procedury estymacji i weryfikacji... 58 8.1. Rozkład wykładniczy... 58 8.2. Rozkład Weibulla... 60 8.3. Rozkład wartości ekstremalnych... 63 8.4. Rozkład logarytmiczno-normalny... 65 8.5. Rozkład Gompertza i Gompertza-Makehama... 66 8.6. Rozkład log-logistyczny... 68 8.7. Odwrócony rozkład Gaussa... 70 8.8. Rozkład Box-Coxa... 71 8.9. Rozkład Sickle... 72 8.10. Uogólniony rozkład Gamma... 74 8.11. Rozkład w postaci wielomianu... 75
4 8.12. Parametryczne modele regresji... 79 8.13. Zagadnienia estymacji modelu... 81 8.14. Procedury weryfikacji... 85 Rozdział 9. Modele semiparametryczne. Teoria oraz procedury estymacji i weryfikacji. 90 Rozdział 10. Modele o czasie dyskretnym. Teoria oraz procedury estymacji i weryfikacji 102 CZĘŚĆ II ANALIZA HISTORII ZDARZEŃ - PRZYKŁADY APLIKACJI Z WYKORZYSTA- NIEM PAKIETU TDA Rozdział 1. Pakiety i programy komputerowe uŝyteczne w analizie historii zdarzeń... 119 Rozdział 2. Pakiet TDA TRANSITION DATA ANALYSIS... 123 2.1. Struktura pakietu... 123 2.2. Podstawowe operatory, zasada konstrukcji komend, procedury archiwizacji... 125 2.3. Informacje o danych źródłowych stanowiących podstawę do estymacji modeli z wykorzystaniem pakietu TDA... 126 Rozdział 3. Estymacja modeli nieparametrycznych - wybrane przykłady... 134 3.1. Tradycyjna metoda konstrukcji tablic trwania Ŝycia, programy - wyniki... 134 3.2. Metoda Kaplana-Meiera konstrukcji tablic trwania Ŝycia, programy - wyniki 152 Rozdział 4. Estymacja modeli parametrycznych - wybrane przykłady... 170 4.1. Modele parametryczne z wykorzystaniem zmiennych niezaleŝnych od czasu, programy - wyniki... 173 4.2. Model wykładniczy przedziałami stały z wykorzystaniem zmiennych zaleŝnych od czasu... 179 Rozdział 5. Estymacja modeli wielu epizodów - przykłady estymacji parametrycznej... 182 Rozdział 6. Grafika pakietu TDA, testowanie modeli z wykorzystaniem procedur graficznych... 188 LITERATURA... 209 POSTAWOWA TERMINOLOGIA Z ANALIZY HISTORII ZDARZEŃ -
SŁOWNICZEK ANGIELSKO-POLSKI... 217 5
6 Contents Introduction... 7 PART I EVENT HISTORY ANALYSIS - BASIC THEORY Chapter 1. What is an event history analysis?... 11 Chapter 2. Basic definitions and research aspects... 16 Chapter 3. Type of information, surveys and theirs utility for event history analysis... 24 Chapter 4. Basic measures of event history analysis... 32 Chapter 5. Event history analysis as a stochastic process... 36 Chapter 6. Methods and models applied in event history analysis... 38 Chapter 7. Nonparametric models. Theory, estimation and testing... 40 7.1. General information... 40 7.2. Life table estimation... 46 7.3. Product-limit (Kaplan-Meier) estimation... 51 7.4. Testing... 53 7.5. Empirical example... 56 Chapter 8. Parametric methods and models. Theory, estimation and testing... 58 8.1. Exponential model... 58 8.2. Weibull model... 60 8.3. Extreme value model... 63 8.4. Log-normal model... 65 8.5. Gompertz, Gompertz-Makeham models... 66 8.6. Log-logistic model... 68 8.7. Inverse Gausian model... 70 8.8. Box-Cox model... 71 8.9. Sickle model... 72 8.10. Generalized Gamma model... 74 8.11. Polynominal model... 75 8.12. Parametric regression model... 79 8.13. Methods of estimation... 81 8.14. Methods of testing... 85
7 Chapter 9. Semiparametric models. Theory, estimation and testing.... 90 Chapter 10. Discrete time models. Theory, estimation and testing... 102 PART II EVENT HISTORY ANALYSIS - EXAMPLE OF APPLICATION WITH TDA PACKAGE Chapter 1. Computer software for event history analysis... 119 Chapter 2. TDA Package, Transition Data Analysis... 123 2.1. Structure of TDA... 123 2.2. Basic operators, comand principles, archive procedure... 125 2.3. General description source of information for TDA model applications... 126 Chapter 3. Estimation of nonparametric models - selected examples... 134 3.1. Model of life table estimation - programmes and results... 134 3.2. Model of Kaplan-Meier estimation - programmes and results... 152 Chapter 4. Estimation of parametric models - selected examples... 170 4.1. Parametric models with fixed variables - programmes and results... 173 4.2. Picewise constant exponential model... 179 Chapter 5. Multiepisode models - example of parametric estimation... 182 Chapter 6. TDA Graphics, Graphical test for testing... 188 BIBLIOGRAPHY... 209 ENGLISH - POLISH DICTIONARY - BASIC TERMINOLOGY OF EVENT HISTORY ANALYSIS... 217
8 Wstęp Oddana do rąk Czytelnika praca jest drugą w Polsce publikacją z zakresu analizy historii zdarzeń. W pierwszej pracy autorów: E. Frątczak, J. Jóźwiak, B. Paszek Zastosowania analizy historii zdarzeń w demografii, SGH, Warszawa 1996 połoŝono główny akcent na zastosowania metod analizy historii zdarzeń do procesów i zjawisk demograficznych. W tej publikacji akcent w większym stopniu połoŝony jest na teorię, która to teoria podporządkowana została przykładom zastosowań metod i modeli analizy historii zdarzeń z wykorzystaniem pakietu TDA (Transition Data Analysis). Autorka jest bardzo wdzięczna Profesorowi G. Rohwerowi za dotychczasową współpracę i liczne konsultacje. Część teorii dotycząca opisu, głównie modeli nieparametrycznych i parametrycznych została przedstawiona w pracy w oparciu o przewodniki metodologiczne do pakietu TDA, tzw. Working Papers. Istota takiego postępowania była uzasadniona tym, aby Czytelnik przed zapoznaniem się z przykładami aplikacji modeli z wykorzystaniem pakietu TDA podanymi w pracy, posiadł podstawową wiedzę na temat teorii modeli tj. funkcji i charakterystyk je opisujących oraz metod estymacji w weryfikacji. NaleŜy pamiętać, Ŝe kaŝdy z pakietów lub programów statystycznych bazuje na sobie właściwej metodologii, która w du- Ŝym stopniu determinuje jakość i interpretacje otrzymanych wyników. Wielce pomocne w przygotowaniu tej ksiąŝki okazały się materiały oraz wiedza i konsultacje zdobyte na licznych seminariach, kursach szkoleniowych i staŝach naukowych z zakresu analizy historii zdarzeń. Do waŝniejszych z nich naleŝy zaliczyć: 1. Regression Analysis of Life History Data with Demogrphic Application. Graduate Course, Demography Unit, Stockholm University, Stockholm 1991, 1992. Kurs prowadzony był przez profesora Jana M. Hoema. 2. International Training Seminar on Event History Analysis, Population Activities Unit, United Nations Economic Commision for Europe and Labolatorie do Demographie Économique et Sociale, University of Geneve, Geneve 1994. Wykładowcami na seminarium byli profesorowie Hans P. Blossfeld i Goetz Rohwer. 3. International Training Seminar Analysis of Survival Data and Event History Data, Center for Continuing Education, Johannes-Gutenberg-Universität, Mainz-Wiesbaden 1997. Se-
9 minarium prowadzone było przez profesorów: Davida R. Coxa i Verna Farewella. 4. International Training Seminar Use of Markov Graphs for Planning and Analysis, Center for Continuing Education, Johannes-Gutenberg-Universität, Mainz-Wiesbaden 1997. Seminarium prowadzone było przez profesorów: Davida R. Coxa i Nany Wermuth. Bardzo poŝyteczne były równieŝ konsultacje profesora Daniela Caergeau z Francuskiego Narodowego Instytutu Demograficznego (INED) w ParyŜu. Praca składa się z dwóch części: Część I. Analiza historii zdarzeń - elementy teorii Część II. Analiza historii zdarzeń - przykłady aplikacji z wykorzystaniem pakietu TDA. W części I. składającej się z 10-ciu rozdziałów przedstawiono głównie zagadnienia metodologiczne takie jak: podstawowe pojęcia i zagadnienia badawcze, zakres stosowanych metod i modeli, rodzaj badań statystycznych i ich uŝyteczność w analizie historii zdarzeń. Dość szczegółowo przedstawiono teorię, procedury estymacji i weryfikacji modeli nieparametrycznych, parametrycznych i semiparametrycznych. Ostatni rozdział 10 w tej części pracy omawia metody i modele analizy historii zdarzeń o czasie dyskretnym - jest to nowe podejście badawcze w tym obszarze metod. Część II składa się z sześciu rozdziałów. Dwa pierwsze rozdziały to głównie informacje o pakietach i programach komputerowych uŝytecznych dla analizy historii zdarzeń, w tym głównie o pakiecie TDA. W kolejnych trzech rozdziałach zamieszczono przykładowe programy estymacji modeli nieparametrycznych i parametrycznych, procedury wykonania i wyniki w pakiecie TDA. Ostatni, szósty rozdział omawia moŝliwości graficzne pakietu TDA do prezentacji wyników estymacji modeli oraz do celu testowania. Bardziej zaawansowane przykłady modeli z wykorzystaniem pakietu TDA znajdzie Czytelnik w pracy E. Frątczak, I. Kowalska, G. Rohwer, S. Dronič i H.P. Blosfeld (1996). Do pracy dołączony jest bogaty wykaz literatury przedmiotu i słowniczek angielsko-polski podstawowej terminologii z zakresu historii zdarzeń. Praca napisana z myślą o studentach Materiały do wykładu i ćwiczeń powstała równieŝ na bazie doświadczeń w trakcie prowadzonego wykładu z zakresu zastosowań analizy historii zdarzeń w demografii. Fragmenty wykładu z zakresu zastosowań analizy historii zdarzeń były częścią wykładu Metod Statystycznych na studiach dziennych i zaocznych w Szkole Głównej Handlowej. Część prac związana z przygotowaniem publikacji została wykonana w ramach grantu KBN nr 951/H02/96/11 Postawy i zachowania demograficzne w okresie transformacji systemowej w Polsce (kariery rodzinne, edukacyjne, zawodowe, migracyjne).
10 CZĘŚĆ I ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII
11