Analiza przeżycia Survival Analysis



Podobne dokumenty
Analiza przeżycia Survival Analysis

Analiza przeżycia. Wprowadzenie

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Uogólniony model liniowy

Mgr inż. Kasietczuk Magdalena. Wydział Geodezji Górniczej i Inżynierii Środowiska Katedra Kształtowania i Ochrony Środowiska

Modele długości trwania

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Podstawy statystycznego modelowania danych Analiza prze»ycia

Model Cox a. Testowanie założeń o proporcjonalnym hazardzie.

Badania obserwacyjne 1

W4 Eksperyment niezawodnościowy

Wprowadzenie do estymacji rozkładów w SAS.

Analiza długości okresu bezrobocia według przyczyny wyrejestrowania na przykładzie Powiatowego Urzędu Pracy w Szczecinie

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Zadanie 1. Ilość szkód N ma rozkład o prawdopodobieństwach spełniających zależność rekurencyjną:

Krzywe przeżycia - testowanie różnic

Mikroekonometria 14. Mikołaj Czajkowski Wiktor Budziński

Matematyka ubezpieczeń majątkowych r.

Zadanie 1. Zmienne losowe X 1, X 2 są niezależne i mają taki sam rozkład z atomami:

PARAMETRY, WŁAŚCIWOŚCI I FUNKCJE NIEZAWODNOŚCIOWE NAPOWIETRZNYCH LINII DYSTRYBUCYJNYCH 110 KV

Zapadalność (epidemiologia)

Prawdopodobieństwo i statystyka r.

Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

STATYSTYKA MATEMATYCZNA

Metody statystyki medycznej stosowane w badaniach klinicznych

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Zawansowane modele wyborów dyskretnych

Metody oceny ryzyka operacyjnego

"Wsparcie procesu decyzyjnego dla metodyk zwinnych w procesie testowania z wykorzystaniem modeli z obszaru teorii niezawodności."

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

18. Obliczyć. 9. Obliczyć iloczyn macierzy i. 10. Transponować macierz. 11. Transponować macierz. A następnie podać wymiar powstałej macierzy.

EGZAMIN DYPLOMOWY, część II, Biomatematyka

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

MODELOWANIE CZASU TRWANIA MODEL PROPORCJONALNEGO HAZARDU COXA

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Własności statystyczne regresji liniowej. Wykład 4

MODELE LINIOWE. Dr Wioleta Drobik

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

W3 - Niezawodność elementu nienaprawialnego

Regresja nieparametryczna series estimator

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

STATYSTYKA MATEMATYCZNA

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Analiza przeżycia, teoria i przykład zastosowania w badaniu długości życia pacjentek z rakiem piersi

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

N ma rozkład Poissona z wartością oczekiwaną równą 100 M, M M mają ten sam rozkład dwupunktowy o prawdopodobieństwach:

Analiza niepewności pomiarów

S T R E S Z C Z E N I E

METODY ESTYMACJI PUNKTOWEJ. nieznanym parametrem (lub wektorem parametrów). Przez X będziemy też oznaczać zmienną losową o rozkładzie

Niezawodność diagnostyka systemów laboratorium. Ćwiczenie 2

Tablice trwania życia

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Funkcje charakteryzujące proces. Dr inż. Robert Jakubowski

Statystyka w przykładach

Estymacja parametrów rozkładu cechy

METODY ANALIZY PRZEŻYCIA W OCENIE RYZYKA UTRATY KLIENTA NA RYNKU USŁUG BANKOWYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VII: Regresja logistyczna

Zastosowanie modeli hazardu do szacowania długości czasu pozostawania bez pracy w Niemczech i w Polsce. 2. Wybór i opis właściwej metody analizy

Quick Launch Manual:

Własności porządkowe w modelu proporcjonalnych szans

Statystyczna analiza awarii pojazdów samochodowych. Failure analysis of cars

METODY STATYSTYCZNE W BIOLOGII

ep do matematyki aktuarialnej Micha l Jasiczak Wyk lad 2 Tablice trwania życia

Zadanie 1. Liczba szkód N w ciągu roku z pewnego ryzyka ma rozkład geometryczny: k =

MODELE MATEMATYCZNE W UBEZPIECZENIACH

Matematyka ubezpieczeń majątkowych r.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wycena papierów wartościowych - instrumenty pochodne

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

1 Estymacja przedziałowa

dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.

JAK DŁUGO ŻYJĄ SPÓŁKI NA POLSKIEJ GIEŁDZIE? ZASTOSOWANIE STATYSTYCZNEJ ANALIZY PRZEŻYCIA DO MODELOWANIA UPADŁOŚCI PRZEDSIĘBIORSTW

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Ubezpieczenia majątkowe

Uogolnione modele liniowe

Wykład 12: Tablice wielodzielcze

Badanie zależności zmiennych kolumnowej i wierszowej:

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

PAKIETY STATYSTYCZNE

Testowanie hipotez statystycznych.

z przedziału 0,1 liczb dodatnich. Rozważmy dwie zmienne losowe:... ma złożony rozkład dwumianowy o parametrach 1,q i, gdzie X, wszystkie składniki X

Testowanie hipotez statystycznych.

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

STATYSTYKA MATEMATYCZNA

Transkrypt:

Analiza przeżycia Survival Analysis 2013

Analiza przeżycia Doświadczenie dynamiczne - zwierzęta znikają lub pojawiają się w czasie doświadczenia Obserwowane zdarzenia: zachorowanie, wyzdrowienie, zejście, ciąża, Ważne jest nie tylko wystąpienie zdarzenia, ale również czas do momentu wystąpienia zdarzenia Dane są recenzowane

Dane cenzorowane (ucięte) Czas jest znany tylko dla niektórych osobników Dla innych czas jest nieznany: Zdarzenie nie zaszło podczas trwania obserwacji Zwierzę padło z innych przyczyn Farmer wycofał zgodę, itp

Dane cenzorowane (ucięte) A B C Osobnik Czas przeżycia Zdarzenie A 5 1 (śmierć) B 10 0 (ucięte) C 3 0 (ucięte)

Dane ucięte także z lewej strony Rzadziej spotykane Infekcja (czas nieznany) Test pozytywny Choroba

Cele analizy przeżycia Porównanie funkcji przeżycia/hazardu między grupami Opis przeżycia znanym rozkładem teoretycznym (np. Weibull) Opis relacji między przeżyciem a potencjalnymi zmiennymi objaśniającymi

Funkcja przeżycia Jakie jest prawdopodobieństwo, że osobnik przeżyje co najmniej 5 jednostek czasu (np. 5 dni)? P( T > t=4 ) T = czas śmierci (zdarzenia) Ogólnie: S( t ) = P( T > t)

Funkcja hazardu h(t) warunkowe prawdopodobieństwo zdarzenia (np. śmierci) w następnej jednostce czasu przypadające na jednostkę czasu h(t) = lim t 0 P( t T < (t+ t) T t ) / t

Przeżycie a hazard h(t) = -1 / S( t ) pierwsza pochodna S(t) Komputer łatwo przelicza między funkcjami

Estymator Kaplana-Meiera Uwzględnia cenzorowane dane Najpopularniejszy S(0)=1 Przedział (dzień) Zwierząt na początku (n) Śmierć (d) Utrata z innych powodów 12 13 116 0 1 1,0 14 15 115 1 0 0,9913 S(t) 55 56 85 1 0,7435 60 61 84 0 84 0,7435

Estymator Kaplana-Meiera

Cele analizy przeżycia Porównanie funkcji przeżycia/hazardu między grupami Opis przeżycia znanym rozkładem teoretycznym (np. Weibulla) Opis relacji między przeżyciem a potencjalnymi zmiennymi objaśniającymi

Typowe przebiegi funkcji hazardu Ryzyko upadku po infekcji (lognormal) Ryzyko wybrakowania (rosnący Weibull) h(t) Ryzyko kulawizyny na skutek stresu Ryzyko upadku po operacji (malejący Weibull) t

Rozkład Weibulla S( t ) = exp( - ( a t ) p ) h( t ) = a p ( a t ) p-1 a = parametr skali p = parametr kształtu a i p muszą być oszacowane z danych Może przypominać rozkład wykładniczy lub normalny

Kaplan-Meier oraz Weibull

Cele analizy przeżycia Porównanie funkcji przeżycia/hazardu między grupami Opis przeżycia znanym rozkładem teoretycznym (np. Weibull) Opis relacji między przeżyciem a potencjalnymi zmiennymi objaśniającymi

Modelowanie funkcji hazardu rozkładem wykładniczym h( t, x ) = h 0 ( t ) exp( β 1 x 1 +... + β k x k ) h 0 to zerowa linia hazardu (gdy każdy x=0) Model regresji wykładniczej: h 0 = 1 (mniej elastyczny) Regresja Weibulla: h 0 ( t ) = a p ( a t ) p-1 Model proporcjonalnych hazardów Coksa: nie ma potrzeby definicji h 0 (bardzo praktyczne)

Model proporcjonalnych hazardów Coksa Hazard ratio = HR = h( t, x=1 ) / h( t, x=0 ) = exp( β 1 x 1 ) Nie trzeba estymować parametrów funkcji zerowej Ale warunek: HR musi być stałe w czasie, sprawdź rysując dla każdej grupy ln[-ln(s(t))]) względem ln(t), przebiegi powinny być równoległe David Cox, ur. 1924

HR=1: czynnik nie ma znaczenia HR>1: czynnik pozytywnie powiązany z chorobą HR<1: czynnik negatywnie skorelowany z chorobą

Analiza przeżycia w R install.packages( survival ) library( survival )

Porównywane grupy Czas zdarzenia lub cenzury (np. dni) Zdarzenie tak=1, nie=0 sex time event 1 131 0 1 150 1 1 231 0 1 240 0 1 400 0 2 1 1 2 3 1 2 4 0 2 5 1

Dane ucięte także z lewej strony Czas pozytywnego testu (np. wiek) Czas zdarzenia lub cenzury (np. dni) sex time time2 event 2 51 52 1 2 58 59 1 2 55 57 1 2 28 50 1 1 21 51 0 1 19 28 1 2 25 32 1

read.table... attach... survfit( Surv( time, event ) ~ sex ) -> fit plot( fit ) summary( fit ) summary( fit )$surv -> s summary( fit )$time -> t plot( log(t), log( -log(s) ) ) coxph( formula = Surv( time, event) ~ sex )

Zadanie 1 Badano skuteczność szczepionki porównując grupę kontrolną (grupa=0) z zaszczepioną (grupa=1). Dane o poszczególnych osobnikach zebrano w pliku szczepionka.txt. (a) Narysuj wykres Kaplana-Meiera prezentujący prawdopodobieństwa przeżycia w czasie dla obu grup. (b) Zbadaj wpływ szczepienia modelem proporcjonalnych hazardów Coksa