Analiza przeżycia Survival Analysis

Podobne dokumenty
Analiza przeżycia Survival Analysis

Analiza przeżycia. Wprowadzenie

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Mgr inż. Kasietczuk Magdalena. Wydział Geodezji Górniczej i Inżynierii Środowiska Katedra Kształtowania i Ochrony Środowiska

Modele długości trwania

Uogólniony model liniowy

Model Cox a. Testowanie założeń o proporcjonalnym hazardzie.

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Podstawy statystycznego modelowania danych Analiza prze»ycia

Badania obserwacyjne 1

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

W4 Eksperyment niezawodnościowy

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Krzywe przeżycia - testowanie różnic

Analiza długości okresu bezrobocia według przyczyny wyrejestrowania na przykładzie Powiatowego Urzędu Pracy w Szczecinie

Wprowadzenie do estymacji rozkładów w SAS.

Matematyka ubezpieczeń majątkowych r.

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Zapadalność (epidemiologia)

Zadanie 1. Zmienne losowe X 1, X 2 są niezależne i mają taki sam rozkład z atomami:

PARAMETRY, WŁAŚCIWOŚCI I FUNKCJE NIEZAWODNOŚCIOWE NAPOWIETRZNYCH LINII DYSTRYBUCYJNYCH 110 KV

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Zawansowane modele wyborów dyskretnych

W3 - Niezawodność elementu nienaprawialnego

STATYSTYKA MATEMATYCZNA

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

MODELOWANIE CZASU TRWANIA MODEL PROPORCJONALNEGO HAZARDU COXA

Metody statystyki medycznej stosowane w badaniach klinicznych

Metody oceny ryzyka operacyjnego

"Wsparcie procesu decyzyjnego dla metodyk zwinnych w procesie testowania z wykorzystaniem modeli z obszaru teorii niezawodności."

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

Prawdopodobieństwo i statystyka r.

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

EGZAMIN DYPLOMOWY, część II, Biomatematyka

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Własności statystyczne regresji liniowej. Wykład 4

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

MODELE LINIOWE. Dr Wioleta Drobik

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Matematyka ubezpieczeń majątkowych r.

Własności porządkowe w modelu proporcjonalnych szans

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Analiza przeżycia, teoria i przykład zastosowania w badaniu długości życia pacjentek z rakiem piersi

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Quick Launch Manual:

Uogolnione modele liniowe

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Zastosowanie modeli hazardu do szacowania długości czasu pozostawania bez pracy w Niemczech i w Polsce. 2. Wybór i opis właściwej metody analizy

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

S T R E S Z C Z E N I E

Analiza niepewności pomiarów

STATYSTYKA MATEMATYCZNA

Wprowadzenie. { 1, jeżeli ˆr(x) > 0, pozatym. Regresja liniowa Regresja logistyczne Jądrowe estymatory gęstości. Metody regresyjne

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

WYKŁAD 8 ANALIZA REGRESJI

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Tablice trwania życia

Matematyka ubezpieczeń majątkowych r.

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Regresja nieparametryczna series estimator

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

Metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Testowanie hipotez statystycznych

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

MODELE MATEMATYCZNE W UBEZPIECZENIACH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych. Wprowadzenie

Wycena papierów wartościowych - instrumenty pochodne

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 13 i 14 - Statystyka bayesowska

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

1 Estymacja przedziałowa

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Ubezpieczenia majątkowe

Statystyka w przykładach

Metoda najmniejszych kwadratów

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VII: Regresja logistyczna

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

METODY ANALIZY PRZEŻYCIA W OCENIE RYZYKA UTRATY KLIENTA NA RYNKU USŁUG BANKOWYCH

Transkrypt:

Analiza przeżycia Survival Analysis 2016

Analiza przeżycia Analiza takich zdarzeń jak zachorowanie, wyzdrowienie, zejście, ciąża, Ważne jest nie tylko wystąpienie zdarzenia, ale również czas do momentu wystąpienia zdarzenia

Analiza przeżycia Uwzględniamy, że dane są recenzowane Zwierzęta znikają w czasie obserwacji. Tylko niektóre znikają z przyczyn, którymi się interesujemy

Dane cenzorowane (ucięte) Czas jest znany tylko dla niektórych osobników Dla innych czas jest nieznany: Zdarzenie nie zaszło podczas trwania obserwacji Zwierzę padło z innych przyczyn Farmer wycofał zgodę, itp

Dane cenzorowane (ucięte) A B C Osobnik Czas przeżycia Zdarzenie A 5 1 (śmierć) B 10 0 (ucięte) C 3 0 (ucięte)

Dane ucięte także z lewej strony Rzadziej spotykane Infekcja (czas nieznany) Test pozytywny Choroba

Cele analizy przeżycia Porównanie funkcji przeżycia/hazardu między grupami Opis przeżycia znanym rozkładem teoretycznym (np. Weibull) Opis relacji między przeżyciem a potencjalnymi zmiennymi objaśniającymi

Funkcja przeżycia Jakie jest prawdopodobieństwo, że osobnik przeżyje co najmniej 5 jednostek czasu (np. 5 dni)? P( T > t=4 ) T = czas śmierci (zdarzenia) Ogólnie: S( t ) = P( T > t)

Funkcja hazardu h(t) warunkowe prawdopodobieństwo zdarzenia (np. śmierci) w następnej jednostce czasu przypadające na jednostkę czasu h(t) = lim t 0 P( t T < (t+ t) T t ) / t

Przeżycie a hazard h(t) = -1 / S( t ) pierwsza pochodna S(t) Komputer łatwo przelicza między funkcjami

Estymator Kaplana-Meiera Uwzględnia cenzorowane dane Najpopularniejszy S(0)=1 Przedział (dzień) Zwierząt na początku (n) Śmierć (d) Utrata z innych powodów 12 13 116 0 1 1,0 14 15 115 1 0 0,9913 S(t) 55 56 85 1 0,7435 60 61 84 0 84 0,7435

Estymator Kaplana-Meiera

Cele analizy przeżycia Porównanie funkcji przeżycia/hazardu między grupami Opis przeżycia znanym rozkładem teoretycznym (np. Weibulla) Opis relacji między przeżyciem a potencjalnymi zmiennymi objaśniającymi

Typowe przebiegi funkcji hazardu Ryzyko upadku po infekcji (lognormal) Ryzyko wybrakowania (rosnący Weibull) h(t) Ryzyko kulawizyny na skutek stresu Ryzyko upadku po operacji (malejący Weibull) t

Rozkład Weibulla S( t ) = exp( - ( a t ) p ) h( t ) = a p ( a t ) p-1 a = parametr skali p = parametr kształtu a i p muszą być oszacowane z danych Może przypominać rozkład wykładniczy lub normalny

Kaplan-Meier oraz Weibull

Cele analizy przeżycia Porównanie funkcji przeżycia/hazardu między grupami Opis przeżycia znanym rozkładem teoretycznym (np. Weibull) Opis relacji między przeżyciem a potencjalnymi zmiennymi objaśniającymi

Modelowanie funkcji hazardu rozkładem wykładniczym h( t, x ) = h 0 ( t ) exp( β 1 x 1 +... + β k x k ) h 0 to zerowa linia hazardu (gdy każdy x=0) Model regresji wykładniczej: h 0 = 1 (mniej elastyczny) Regresja Weibulla: h 0 ( t ) = a p ( a t ) p-1 Model proporcjonalnych hazardów Coksa: nie ma potrzeby definicji h 0 (bardzo praktyczne)

Model proporcjonalnych hazardów Coksa Hazard ratio = HR = h( t, x=1 ) / h( t, x=0 ) = exp( β 1 x 1 ) Nie trzeba estymować parametrów funkcji zerowej Ale warunek: HR musi być stałe w czasie, sprawdź rysując dla każdej grupy ln[-ln(s(t))]) względem ln(t), przebiegi powinny być równoległe David Cox, ur. 1924

HR=1: czynnik nie ma znaczenia HR>1: czynnik pozytywnie powiązany z chorobą HR<1: czynnik negatywnie skorelowany z chorobą

Przykład danych uciętych z prawej strony Porównywane grupy Czas zdarzenia lub cenzury (np. dni) Zdarzenie tak=1, nie=0 plec czas smierc 1 131 0 1 150 1 1 231 0 1 240 0 1 400 0 2 1 1 2 3 1 2 4 0 2 5 1

Dane ucięte także z lewej strony Czas pozytywnego testu (np. wiek) Czas zdarzenia lub cenzury (np. dni) plec czas1 czas2 smierc 2 51 52 1 2 58 59 1 2 55 57 1 2 28 50 1 1 21 51 0 1 19 28 1 2 25 32 1

Analiza przeżycia w R Zainstaluj i przygotuj do działania pakiet survival install.packages( survival ) library( survival )

read.table( dane.txt, header=true ) -> d attach( d ) survfit( Surv( czas, smierc ) ~ plec ) -> fit plot( fit ) summary( fit ) summary( fit )$surv -> s summary( fit )$time -> t plot( log(t), log( -log(s) ) ) coxph( formula = Surv( czas, smierc ) ~ plec )

Zadanie 1 Badano skuteczność szczepionki porównując grupę kontrolną (grupa=0) z zaszczepioną (grupa=1). Dane o poszczególnych osobnikach zebrano w pliku szczepionka.txt. (a) Narysuj wykres Kaplana-Meiera prezentujący prawdopodobieństwa przeżycia w czasie dla obu grup. (b) Zbadaj wpływ szczepienia modelem proporcjonalnych hazardów Coksa