ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII, WYBRANE PRZYKŁADY ZASTOSOWAŃ Z WYKORZYSTANIEM PAKIETU TDA

Podobne dokumenty
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nie dotyczy

PŁODNOŚĆ I MAŁZENSKOSC W POLSCE - analiza kohortowa: kohorty urodzeniowe

Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć zorganizowanych w

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

KARTA PRZEDMIOTU / SYLABUS

Matematyka Stosowana na Politechnice Wrocławskiej. Komitet Matematyki PAN, luty 2017 r.

KARTA PRZEDMIOTU / SYLABUS

KARTA PRZEDMIOTU / SYLABUS

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

KARTA PRZEDMIOTU / SYLABUS

KARTA PRZEDMIOTU / SYLABUS

KARTA PRZEDMIOTU / SYLABUS Wydział Nauk o Zdrowiu Zdrowie Publiczne ogólnoakademicki praktyczny inny jaki. Zakład Statystyki i Informatyki Medycznej

PRZEWODNIK PO PRZEDMIOCIE. Negotiation techniques. Management. Stationary. II degree

KARTA PRZEDMIOTU / SYLABUS

STATYSTYKA MATEMATYCZNA

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Modelowanie stochastyczne Stochastic Modeling. Poziom przedmiotu: II stopnia. Liczba godzin/tydzień: 2W E, 2C

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

BIOSTATYSTYKA. Liczba godzin. Zakład Statystyki i Informatyki Medycznej

Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć zorganizowanych w Uczelni

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

KARTA PRZEDMIOTU / SYLABUS. Zakład Statystyki i Informatyki Medycznej. tel./fax (85) dr Robert Milewski

KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI 1. Brak

Zastosowania analizy stochastycznej w finansach Application of Stochastic Models in Financial Analysis Kod przedmiotu: Poziom przedmiotu: II stopnia

Spis treści. Wprowadzenie 13

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty)

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

KARTA PRZEDMIOTU / SYLABUS Nauk o Zdrowiu Dietetyka x ogólnoakademicki praktyczny inny jaki. Zakład Statystyki i Informatyki Medycznej

KARTA PRZEDMIOTU / SYLABUS Wydział Nauk o Zdrowiu PIELĘGNIARSTWO ogólnoakademicki x praktyczny inny jaki. Zakład Statystyki i Informatyki Medycznej

Uczelnia Łazarskiego Wydział Medyczny Kierunek Lekarski

Katedra Demografii i Statystki Ekonomicznej

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Przedmioty do wyboru oferowane na stacjonarnych studiach II stopnia (magisterskich) dla II roku w roku akademickim 2015/2016

LISTA KURSÓW PLANOWANYCH DO URUCHOMIENIA W SEMESTRZE ZIMOWYM 2015/2016

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

Instytucje gospodarki rynkowej w Polsce

KARTA PRZEDMIOTU / SYLABUS

KARTA MODUŁU KSZTAŁCENIA

1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Opisy przedmiotów do wyboru

Dotyczy PN-EN ISO 14001:2005 Systemy zarządzania środowiskowego Wymagania i wytyczne stosowania

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Data wydruku: Dla rocznika: 2015/2016. Opis przedmiotu

OPIS PRZEDMIOTU/MODUŁU KSZTAŁCENIA (SYLABUS)

Modele uporządkowań zmiennych losowych w charakteryzacjach rozkładów prawdopodobieństwa, estymacji i miarach zależności.

Egzamin / zaliczenie na ocenę*

Instrumenty i efekty wsparcia Unii Europejskiej dla regionalnego rozwoju obszarów wiejskich w Polsce

ZASTOSOWANIE TESTU GEHANA DO PORÓWNYWANIA FUNKCJI PRZEŻYCIA FIRM 1

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

KARTA PRZEDMIOTU / SYLABUS

INFORMACJA O PRZEDMIOTACH OFEROWANYCH W ROKU AKADEMICKIM 2019/20

Spis treści. Przedmowa Monika Książek Rozdział I Analiza danych jakościowych... 25

PRZEWODNIK PO PRZEDMIOCIE

Statystyka matematyczna i ekonometria

Wpływ zasiłku na proces poszukiwania pracy

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

W4 Eksperyment niezawodnościowy

KARTA PRZEDMIOTU / SYLABUS Wydział Nauk o Zdrowiu ELEKTROLADIOLOGIA ogólnoakademicki praktyczny inny jaki. Zakład Statystyki i Informatyki Medycznej

Program studiów. Wydział prowadzący studia doktoranckie Wydział Biologii i Ochrony Środowiska

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Wprowadzenie do teorii ekonometrii. Część A

Kierunek: Matematyka Poziom studiów: Studia II stopnia Forma i tryb studiów: Stacjonarne

WYKAZ PRAC PUBLIKOWANYCH

Metody Badań Methods of Research

HARMONOGRAM GODZINOWY ORAZ PUNKTACJA ECTS CZTEROLETNICH STUDIÓW DOKTORANCKICH

KARTA KURSU. Kod Punktacja ECTS* 1

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2017/2018

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Zaliczenie na ocenę 0,5 0,5

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

Nauczanie informatyki przez Internet w Polsko-Japońskiej WyŜszej Szkole Technik Komputerowych

KARTA PRZEDMIOTU / SYLABUS. Zakład Statystyki i Informatyki Medycznej. tel./fax (85) statinfmed@uwb.edu.pl dr Robert Milewski

Wykłady specjalistyczne. (Matematyka w finansach i ekonomii; Matematyczne podstawy informatyki)

strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:

Spis treści 3 SPIS TREŚCI

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

laboratoria 24 zaliczenie z oceną

Opis efektów kształcenia i sposobów ich weryfikacji

Course type* German I BA C 90/120 WS/SS 8/9. German I BA C 30 WS 2. English I BA C 60/90 WS/SS 5/6. English I BA C 30 WS 2. German I BA L 30 WS 4

Oferta przetargu. Poland Tender. Nazwa. Miejscowość. Warszawa Numer ogłoszenia. Data zamieszczenia Typ ogłoszenia

5.3. Analiza maskowania przez kompaktory IED-MISR oraz IET-MISR wybranych uszkodzeń sieci połączeń Podsumowanie rozdziału

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Z poprzedniego wykładu

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Podstawy statystyki matematycznej w programie R

Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes.

PROGRAM NAUCZANIA PRZEDMIOTU OBOWIĄZKOWEGO NA WYDZIALE LEKARSKIM I ROK AKADEMICKI 2014/2015 PRZEWODNIK DYDAKTYCZNY dla STUDENTÓW IV ROKU STUDIÓW

Transkrypt:

Ewa Frątczak ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII, WYBRANE PRZYKŁADY ZASTOSOWAŃ Z WYKORZYSTANIEM PAKIETU TDA MATERIAŁY DO WYKŁADU I ĆWICZEŃ SZKOŁA GŁÓWNA HANDLOWA

2 Recenzenci Redaktor Ewa Heynar-Skowrońska Skład komputerowy Paweł Murak Copyright by Oficyna Wydawnicza SGH, Warszawa 1997 ISBN Druk i oprawa: Oficyna Wydawnicza Szkoły Głównej Handlowej Warszawa 1996. Wydanie I. Ark.wyd.. Ark.druk. Zamówienie

3 Spis treści Wstęp... 7 CZĘŚĆ I ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII Rozdział 1. Co to jest analiza historii zdarzeń?... 11 Rozdział 2. Podstawowe pojęcia i zagadnienia badawcze analizy historii zdarzeń... 16 Rozdział 3. Rodzaje informacji i badań statystycznych oraz ich uŝyteczność w analizie historii zdarzeń... 24 Rozdział 4. Podstawowe miary stosowane w analizie historii zdarzeń... 32 Rozdział 5. Analiza historii zdarzeń jako proces stochastyczny... 36 Rozdział 6. Metody i modele stosowane w analizie historii zdarzeń... 38 Rozdział 7. Modele nieparametryczne. Teoria oraz procedury estymacji i weryfikacji... 40 7.1. Informacje ogólne... 40 7.2. Tradycyjna metoda konstrukcji tablic trwania Ŝycia... 46 7.3. Konstrukcja tablic trwania Ŝycia przy zastosowaniu metody Kaplana-Meiera Product-Limit-Estimation... 51 7.4. Procedury weryfikacji... 53 7.5. Przykład empiryczny... 56 Rozdział 8. Metody i modele parametryczne. Teoria oraz procedury estymacji i weryfikacji... 58 8.1. Rozkład wykładniczy... 58 8.2. Rozkład Weibulla... 60 8.3. Rozkład wartości ekstremalnych... 63 8.4. Rozkład logarytmiczno-normalny... 65 8.5. Rozkład Gompertza i Gompertza-Makehama... 66 8.6. Rozkład log-logistyczny... 68 8.7. Odwrócony rozkład Gaussa... 70 8.8. Rozkład Box-Coxa... 71 8.9. Rozkład Sickle... 72 8.10. Uogólniony rozkład Gamma... 74 8.11. Rozkład w postaci wielomianu... 75

4 8.12. Parametryczne modele regresji... 79 8.13. Zagadnienia estymacji modelu... 81 8.14. Procedury weryfikacji... 85 Rozdział 9. Modele semiparametryczne. Teoria oraz procedury estymacji i weryfikacji. 90 Rozdział 10. Modele o czasie dyskretnym. Teoria oraz procedury estymacji i weryfikacji 102 CZĘŚĆ II ANALIZA HISTORII ZDARZEŃ - PRZYKŁADY APLIKACJI Z WYKORZYSTA- NIEM PAKIETU TDA Rozdział 1. Pakiety i programy komputerowe uŝyteczne w analizie historii zdarzeń... 119 Rozdział 2. Pakiet TDA TRANSITION DATA ANALYSIS... 123 2.1. Struktura pakietu... 123 2.2. Podstawowe operatory, zasada konstrukcji komend, procedury archiwizacji... 125 2.3. Informacje o danych źródłowych stanowiących podstawę do estymacji modeli z wykorzystaniem pakietu TDA... 126 Rozdział 3. Estymacja modeli nieparametrycznych - wybrane przykłady... 134 3.1. Tradycyjna metoda konstrukcji tablic trwania Ŝycia, programy - wyniki... 134 3.2. Metoda Kaplana-Meiera konstrukcji tablic trwania Ŝycia, programy - wyniki 152 Rozdział 4. Estymacja modeli parametrycznych - wybrane przykłady... 170 4.1. Modele parametryczne z wykorzystaniem zmiennych niezaleŝnych od czasu, programy - wyniki... 173 4.2. Model wykładniczy przedziałami stały z wykorzystaniem zmiennych zaleŝnych od czasu... 179 Rozdział 5. Estymacja modeli wielu epizodów - przykłady estymacji parametrycznej... 182 Rozdział 6. Grafika pakietu TDA, testowanie modeli z wykorzystaniem procedur graficznych... 188 LITERATURA... 209 POSTAWOWA TERMINOLOGIA Z ANALIZY HISTORII ZDARZEŃ -

SŁOWNICZEK ANGIELSKO-POLSKI... 217 5

6 Contents Introduction... 7 PART I EVENT HISTORY ANALYSIS - BASIC THEORY Chapter 1. What is an event history analysis?... 11 Chapter 2. Basic definitions and research aspects... 16 Chapter 3. Type of information, surveys and theirs utility for event history analysis... 24 Chapter 4. Basic measures of event history analysis... 32 Chapter 5. Event history analysis as a stochastic process... 36 Chapter 6. Methods and models applied in event history analysis... 38 Chapter 7. Nonparametric models. Theory, estimation and testing... 40 7.1. General information... 40 7.2. Life table estimation... 46 7.3. Product-limit (Kaplan-Meier) estimation... 51 7.4. Testing... 53 7.5. Empirical example... 56 Chapter 8. Parametric methods and models. Theory, estimation and testing... 58 8.1. Exponential model... 58 8.2. Weibull model... 60 8.3. Extreme value model... 63 8.4. Log-normal model... 65 8.5. Gompertz, Gompertz-Makeham models... 66 8.6. Log-logistic model... 68 8.7. Inverse Gausian model... 70 8.8. Box-Cox model... 71 8.9. Sickle model... 72 8.10. Generalized Gamma model... 74 8.11. Polynominal model... 75 8.12. Parametric regression model... 79 8.13. Methods of estimation... 81 8.14. Methods of testing... 85

7 Chapter 9. Semiparametric models. Theory, estimation and testing.... 90 Chapter 10. Discrete time models. Theory, estimation and testing... 102 PART II EVENT HISTORY ANALYSIS - EXAMPLE OF APPLICATION WITH TDA PACKAGE Chapter 1. Computer software for event history analysis... 119 Chapter 2. TDA Package, Transition Data Analysis... 123 2.1. Structure of TDA... 123 2.2. Basic operators, comand principles, archive procedure... 125 2.3. General description source of information for TDA model applications... 126 Chapter 3. Estimation of nonparametric models - selected examples... 134 3.1. Model of life table estimation - programmes and results... 134 3.2. Model of Kaplan-Meier estimation - programmes and results... 152 Chapter 4. Estimation of parametric models - selected examples... 170 4.1. Parametric models with fixed variables - programmes and results... 173 4.2. Picewise constant exponential model... 179 Chapter 5. Multiepisode models - example of parametric estimation... 182 Chapter 6. TDA Graphics, Graphical test for testing... 188 BIBLIOGRAPHY... 209 ENGLISH - POLISH DICTIONARY - BASIC TERMINOLOGY OF EVENT HISTORY ANALYSIS... 217

8 Wstęp Oddana do rąk Czytelnika praca jest drugą w Polsce publikacją z zakresu analizy historii zdarzeń. W pierwszej pracy autorów: E. Frątczak, J. Jóźwiak, B. Paszek Zastosowania analizy historii zdarzeń w demografii, SGH, Warszawa 1996 połoŝono główny akcent na zastosowania metod analizy historii zdarzeń do procesów i zjawisk demograficznych. W tej publikacji akcent w większym stopniu połoŝony jest na teorię, która to teoria podporządkowana została przykładom zastosowań metod i modeli analizy historii zdarzeń z wykorzystaniem pakietu TDA (Transition Data Analysis). Autorka jest bardzo wdzięczna Profesorowi G. Rohwerowi za dotychczasową współpracę i liczne konsultacje. Część teorii dotycząca opisu, głównie modeli nieparametrycznych i parametrycznych została przedstawiona w pracy w oparciu o przewodniki metodologiczne do pakietu TDA, tzw. Working Papers. Istota takiego postępowania była uzasadniona tym, aby Czytelnik przed zapoznaniem się z przykładami aplikacji modeli z wykorzystaniem pakietu TDA podanymi w pracy, posiadł podstawową wiedzę na temat teorii modeli tj. funkcji i charakterystyk je opisujących oraz metod estymacji w weryfikacji. NaleŜy pamiętać, Ŝe kaŝdy z pakietów lub programów statystycznych bazuje na sobie właściwej metodologii, która w du- Ŝym stopniu determinuje jakość i interpretacje otrzymanych wyników. Wielce pomocne w przygotowaniu tej ksiąŝki okazały się materiały oraz wiedza i konsultacje zdobyte na licznych seminariach, kursach szkoleniowych i staŝach naukowych z zakresu analizy historii zdarzeń. Do waŝniejszych z nich naleŝy zaliczyć: 1. Regression Analysis of Life History Data with Demogrphic Application. Graduate Course, Demography Unit, Stockholm University, Stockholm 1991, 1992. Kurs prowadzony był przez profesora Jana M. Hoema. 2. International Training Seminar on Event History Analysis, Population Activities Unit, United Nations Economic Commision for Europe and Labolatorie do Demographie Économique et Sociale, University of Geneve, Geneve 1994. Wykładowcami na seminarium byli profesorowie Hans P. Blossfeld i Goetz Rohwer. 3. International Training Seminar Analysis of Survival Data and Event History Data, Center for Continuing Education, Johannes-Gutenberg-Universität, Mainz-Wiesbaden 1997. Se-

9 minarium prowadzone było przez profesorów: Davida R. Coxa i Verna Farewella. 4. International Training Seminar Use of Markov Graphs for Planning and Analysis, Center for Continuing Education, Johannes-Gutenberg-Universität, Mainz-Wiesbaden 1997. Seminarium prowadzone było przez profesorów: Davida R. Coxa i Nany Wermuth. Bardzo poŝyteczne były równieŝ konsultacje profesora Daniela Caergeau z Francuskiego Narodowego Instytutu Demograficznego (INED) w ParyŜu. Praca składa się z dwóch części: Część I. Analiza historii zdarzeń - elementy teorii Część II. Analiza historii zdarzeń - przykłady aplikacji z wykorzystaniem pakietu TDA. W części I. składającej się z 10-ciu rozdziałów przedstawiono głównie zagadnienia metodologiczne takie jak: podstawowe pojęcia i zagadnienia badawcze, zakres stosowanych metod i modeli, rodzaj badań statystycznych i ich uŝyteczność w analizie historii zdarzeń. Dość szczegółowo przedstawiono teorię, procedury estymacji i weryfikacji modeli nieparametrycznych, parametrycznych i semiparametrycznych. Ostatni rozdział 10 w tej części pracy omawia metody i modele analizy historii zdarzeń o czasie dyskretnym - jest to nowe podejście badawcze w tym obszarze metod. Część II składa się z sześciu rozdziałów. Dwa pierwsze rozdziały to głównie informacje o pakietach i programach komputerowych uŝytecznych dla analizy historii zdarzeń, w tym głównie o pakiecie TDA. W kolejnych trzech rozdziałach zamieszczono przykładowe programy estymacji modeli nieparametrycznych i parametrycznych, procedury wykonania i wyniki w pakiecie TDA. Ostatni, szósty rozdział omawia moŝliwości graficzne pakietu TDA do prezentacji wyników estymacji modeli oraz do celu testowania. Bardziej zaawansowane przykłady modeli z wykorzystaniem pakietu TDA znajdzie Czytelnik w pracy E. Frątczak, I. Kowalska, G. Rohwer, S. Dronič i H.P. Blosfeld (1996). Do pracy dołączony jest bogaty wykaz literatury przedmiotu i słowniczek angielsko-polski podstawowej terminologii z zakresu historii zdarzeń. Praca napisana z myślą o studentach Materiały do wykładu i ćwiczeń powstała równieŝ na bazie doświadczeń w trakcie prowadzonego wykładu z zakresu zastosowań analizy historii zdarzeń w demografii. Fragmenty wykładu z zakresu zastosowań analizy historii zdarzeń były częścią wykładu Metod Statystycznych na studiach dziennych i zaocznych w Szkole Głównej Handlowej. Część prac związana z przygotowaniem publikacji została wykonana w ramach grantu KBN nr 951/H02/96/11 Postawy i zachowania demograficzne w okresie transformacji systemowej w Polsce (kariery rodzinne, edukacyjne, zawodowe, migracyjne).

10 CZĘŚĆ I ANALIZA HISTORII ZDARZEŃ - ELEMENTY TEORII

11