Krzywe przeżycia - testowanie różnic

Transkrypt

1 5 listopada 2008

2 Podstawowe pojęcia Przypomnienie Cel testowania Badamy np.: przeżywalność pacjentów po operacji; długość trwania małżeństwa. T zmienna losowa oznaczająca czas do interesującego nas zdarzenia (survival time). Funkcja przeżycia: S(t) = P(T >= t) = 1 F (t ) S(t) oznacza prawdopodobieństwo, że obiekt przeżyje do czasu t.

3 Krzywe przeżycia Wprowadzenie Przypomnienie Cel testowania Krzywe przeŝycia z podziałem ze względu na płeć biorcy S(t) kobiety-biorcy męŝczy?ni-biorcy Czas obserwacji

4 Przypomnienie Cel testowania Po co testujemy różnice krzywych przeżycia? Szukamy odpowiedzi na pytania: Czy dłużej żyją pacjenci poddani jednej terapii, czy drugiej? Czy długość trwania małżeństwa zależy od statusu majątkowego małżonków? Czy procesy, w których adwokat jest wynajęty trwają dłużej niż te, w których adwokat jest przydzielony? Itd. Szukamy czynników, które wpływają na przeżycie.

5 Testy dla danych niecenzorowanych Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Brak obserwacji cenzorowanych używamy standardowych nieparametrycznych testów do porównania 2 funkcji przeżycia dla 2 grup. GRUPY: Niezależne: np. test serii, Wilcoxon-Mann-Whitney Test U; Zależne: np. test znaków (Sign Test).

6 Test serii Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych X 1,..., X n próba prosta z rozkładu o nieznanej dystrybuancie F 1; Y 1,..., Y m próba prosta z rozkładu o nieznanej dystrybuancie F 2; Testujemy hipotezę H 0: F 1 = F 2 przeciw hipotezie alternatywnej H 1: F 1 F 2. Kolejne kroki: ustawiamy obserwacje z obu grup w 1 niemalejący ciąg; obserwacje z pierwszej grupy oznaczamy zerami, z drugiej jedynkami; (n+m)! n!m! liczba różnych ciągów składających się z n zer oraz m jedynek (wszystkie równie prawdopodobne, bo zakładamy, że X 1,..., Xn, Y 1,..., Y m są nzal, o tym samym rozkładzie) statystyka testowa: L = liczba serii w ciągu (L 2), Np. dla ciągu L=5; mała liczba serii = zdarzenie przemawiające przeciw hipotezie H 0. Zbiór krytyczny W = [2, l(alfa, n, m)]. l(alfa, n, m) tak dobrane, aby P(L W ) alfa (istnieją tablice tych wartości).

7 Wilcoxon-Mann-Whitney Test U Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych ustawiamy obserwacje z obu grup w 1 niemalejący ciąg; sumujemy pozycje w ciągu (rank) dla obserwacji z obu grup (oddzielnie). Mniejsza z otrzymanych liczb jest wartością statystyki testowej jeśli jest odpowiednio duża, hipotezę o równości dystrybuant odrzucamy. Test nie powinien być stosowany, gdy rozkłady w 2 grupach różnią się bardzo może wtedy wygenerować błędny wynik.

8 Sign Test Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych p = P(X > Y ), H 0 : p = 1 2 mamy pary obserwacji (x i, y i ), i 1,..., n; pary (x i, y i ), t.że x i = y i odrzucamy. Zostaje m par; w := #{(x i, y i ) : y i x i > 0}; H 0 jest prawdą W b(m; 0, 5).

9 Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Niektóre ważne testy: Log-rank test (najbardziej popularny test); Breslow s test; Cox s F test.

10 Log-rank Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Analiza oparta jest na momentach, w których obserwujemy zdarzenia. Dla każdej takiej chwili liczymy zaobserwowaną oraz oczekiwaną liczbę zdarzeń w każdej grupie. Niech j = 1,..., J momenty, w których obserwujemy zdarzenia (w dowolnej grupie), N 1j, N 2j - liczby obserwowanych obiektów zagrożonych w j-tym momencie w 1. i 2. grupie odpowiednio. N j := N 1j + N 2j O 1j, O 2j liczby zaobserwowanych zdarzeń w chwili j w obu grupach O j := O 1j + O 2j

11 Log-rank Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Znając wartość O j (łączna liczba zdarzeń w chwili j) i zakładając prawdziwość hipotezy, O j1 ma hipergeometryczny rozkład z parametrami N j, N 1j, O j : expected value: E j = O j N 1j N 1 variance: V j = O N 1j j (1 N 1j )(N N 1 N j O j ) 1 N j 1 statystyka testowa: Z = J j=1 (O 1j E j ) J j=1 V j H prawdziwa Z N(0, 1).

12 Log-rank Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Inna statystyka testowa: O t1, O t2 są sumami obserwowanych zdarzeń we wszystkich momentach w grupie 1. i 2. odpowiednio; E t1, E t2 są sumami oczekiwanych zdarzeń we wszystkich momentach w grupie 1. i 2. odpowiednio; Statystyka testowa: S = (O t1 E t1 ) 2 E t1 + (O t2 E t2 ) 2 E t2 S χ 2 z (liczba grup 1) stopniami swobody.

13 Log-rank przykład Wprowadzenie Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Porównujemy krzywe przeżycia dla pacjentów z powracającymi guzami (recurrent malignant gliomas) różnego typu. 51 dorosłych pacjentów; 20 z guzami typu A = astrocytoma, 31 z guzami typu G = glioblastoma;

14 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych A G * * * * * * * 35...

15 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych 1 Moment: j=1 w 6. Tygodniu N 1 = 51, O 1 = 1 prawd.smierci= 1 51 W grupie 1. N 1,1 = 20, więc oczekiwana liczba śmierci E 1,1 = 20 1 W grupie 2. N 2,1 = 31, więc oczekiwana liczba śmierci E 2,1 = Moment: j=2 w 10. Tygodniu N 2 = 50, O 2 = 2 prawd.śmierci= 2 50 W grupie 1. N 1,2 = 19, więc oczekiwana liczba śmierci E 1,2 = 19 1 W grupie 2. N 2,2 = 31, więc oczekiwana liczba śmierci E 2,2 = Itd Po zsumowaniu: O t1 = 14, O t2 = 28 E t1 = 22.48, E t2 = S = ( ) ( ) = W tablicy rozkładu χ 2 odnajdujemy P < 0.01, okazuje się więc, że różnica między grupami jest statystycznie znacząca.

16 log-rank Breslow test Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych Breslow test: V = wi (Oi Ei) i w i waga Log-rank test: waga wszędzie jest jednakowa Breslow test: w i = N i (czyli wcześniejsze zdarzenia mają większą wagę) Log-rank test lepszy, gdy: Śmiertelność w obu grupach jest proporcjonalna krzywe przeżycia nie przecinają się (funkcje hazardu są paralelne) Breslow test jest lepszy, gdy: Śmiertelność w obu grupach nie jest proporcjonalna krzywe przeżycia przecinają się. Moc tego testu zmniejsza się, kiedy zwiększa się liczba cenzorowanych obserwacji.

17 log-rank Breslow test Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych {t j : j = 1, 2,..., r} zbiór wszystkich momentów wystąpienia zdarzenia (np. śmierci obiektu); O j liczba wystąpień zdarzenia w chwili t j; N j liczba obserwowanych obiektów zagrożonych w chwili t j; C j liczba ocenzorowanych obserwacji w okresie [t j, t j+1); w j waga; r (Cj + Oj) = Ni; j=i O ja, N ja, C ja analogicznie jak O j, N j, C j tylko dla podgrupy a; Statystyka Coxa-Mantela dla próbki a: V a = r i=0 wi(oia O i N ia N i )

18 Testy dla danych niecenzorowanych Testy dla danych cenzorowanych Log-rank test dla danych cenzorowanych V a = r i=0 wi(oia O i N ia N i = r i=0 wioia r i=0 (Cia + Oia) i j=0 wj O j N j ) = r i=0 wioia r i=0 wi O i r (Cja N i + Oja) j=i = r i=0 (wi i j=0 wj O j N j )O ia r i=0 ( i j=0 wj O j N j )C ia V a = N a Vja, gdzie: { j=0 w i i k=0 V ja = w k O k N k gdy wystąpiła obrerwacja X ja = t i; i w k=0 k O k N k gdy X ja jest ocenzorowaną wartością; log-rank { rho = 0, w i = 1 1 i O k k=0 N V ja = k gdy wystąpiła obrerwacja X ja = t i; i gdy X k=0 ja jest ocenzorowaną wartością; O k N k Jeśli brak cenzorowania i remisów to: O k = 1, N k = N k + 1. i O k k=0 N k = 1 ik=0 = N 1 log( N ) N k+1 k=n i+1 k N i+1

19 Funkcja survdiff Wprowadzenie Funkcja survdiff Współczynnik rho RandomSurvivalForest Funkcja survdiff przeprowadza test na różnice między dwoma lub większą liczbą krzywych przeżycia używając rodziny G rho testów lub wykazuje różnice krzywą doświadczalną a teoretyczną. Funkcja survdiff implementuje rodzinę testów sparametryzowaną współczynnikiem rho. Każda śmierć w próbce testowej jest przemnożona przez S(t) rho, gdzie S(t) jest funkcją przeżycia. Wartości szczególne rho: rho = 0 log-rank lub Mantel-Haenszel test; rho = 1 Peto & Peto test (modyfikacja testu Gehana-Wilcoxona);

20 Składnia Wprowadzenie Funkcja survdiff Współczynnik rho RandomSurvivalForest Składnia: > survdiff (formula, data, subset, na.action, rho = 0) gdzie formula obiekt postaci Surv(time, status) predictors, gdzie predictors jest cechą lub zbiorem cech dzielącym nam obserwacje na podgrupy; data zbiór danych; subset wyrażenie określające które wiersze z danych testowych mają zostać użyte w teście; na.action filtr brakujących danych; rho wartość określająca typ testu;

21 survdiff - przykład1 Wprowadzenie Funkcja survdiff Współczynnik rho RandomSurvivalForest >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane) Call: survdiff(formula = Surv(dane$czas, dane$status) plec.biorcy, dane) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 0.6 on 1 degrees of freedom, p= Zmienne w tabeli oznaczają: N liczba osobników w grupie; obs liczba obserwacji w grupie (czasem z wagą różną od 1); exp oczekiwana wartość obserwacji (z wagą); Chisq statystyka Chi-kwadrat; p p-value;

22 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na płeć biorcy S(t) kobiety-biorcy męŝczy?ni-biorcy Czas obserwacji Call: survdiff(formula = Surv(dane$czas, dane$status) plec.biorcy, dane, rho=1) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 1.2 on 1 degrees of freedom, p= 0.283

23 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na wiek dawcy S(t) wiek dawcy < < wiek dawcy < 60 wiek dawcy > Czas obserwacji >dane$myvalue=round(dane$wiek.dawcy/20)*20 >survdiff(surv(dane$czas, dane$status) myvalue, dane) E V N Observed Expected myvalue= myvalue= myvalue= Chisq= 8.7 on 2 degrees of freedom, p=

24 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na plec dawcy i biorcy S(t) plec.dawcy=k, plec.biorcy=k plec.dawcy=k, plec.biorcy=m plec.dawcy=m, plec.biorcy=k plec.dawcy=m, plec.biorcy=m Czas obserwacji >survdiff(surv(dane$czas, dane$status) plec.dawcy+plec.biorcy, dane) E V N Observed Expected plec.dawcy=k, plec.biorcy=k plec.dawcy=k, plec.biorcy=m plec.dawcy=m, plec.biorcy=k plec.dawcy=m, plec.biorcy=m Chisq= 3.3 on 3 degrees of freedom, p= 0.345

25 Funkcja survdiff Współczynnik rho RandomSurvivalForest >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane, rho = 0) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 0.6 on 1 degrees of freedom, p= >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane, rho = 0.5) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 0.9 on 1 degrees of freedom, p= >survdiff(surv(dane$czas, dane$status) plec.biorcy, dane, rho = 1) E V N Observed Expected plec.biorcy=k plec.biorcy=m Chisq= 1.2 on 1 degrees of freedom, p= 0.283

26 Zależność p-value od rho Funkcja survdiff Współczynnik rho RandomSurvivalForest ZaleŜność p-value od rho dla podziału względem plec.dawcy p-value rho

27 RandomSurvivalForest importance Funkcja survdiff Współczynnik rho RandomSurvivalForest >plot(rsf(survrsf(czas.obserwacji, status)., data = dane[,-6])) wiek.dawcy Error Rate MDRD36m plec.biorcy MDRD60m wagastart niezgodnosci.ab plec.dawcy wiek.biorcy MDRD12m niezgodnosci.dr MDRDend MDRD30 wagaend MDRD24m MDRD6m MDRD Number of Trees Importance

28 Funkcja survdiff Współczynnik rho RandomSurvivalForest left daughter right daughter split var split point status prediction MDRD MDRD36m MDRD36m wiek.dawcy MDRDend wiek.biorcy wiek.biorcy MDRD36m MDRD12m wiek.dawcy plec.dawcy

29 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na wiek.dawcy S(t) wiek.dawcy < 43.5 wiek.dawcy >= Czas obserwacji >dane$myvalue=dane$wiek.dawcy>= 43.5 >survdiff(surv(dane$czas.obserwacji, dane$status) myvalue, data = dane) E V N Observed Expected myvalue=false myvalue=true Chisq= 11.9 on 1 degrees of freedom, p=

30 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na MDRD36m S(t) MDRD36m <= 40 MDRD36m > Czas obserwacji >dane$myvalue=round(dane$mdrd36m/40)*40 >survdiff(surv(dane$czas.obserwacji, dane$status) myvalue, data = dane) E V N Observed Expected myvalue= myvalue= Chisq= 5.2 on 1 degrees of freedom, p=

31 Funkcja survdiff Współczynnik rho RandomSurvivalForest Krzywe przeŝycia z podziałem ze względu na MDRD7 S(t) MDRD7 <= median MDRD7 > median Czas obserwacji >dane$myvalue=dane$mdrd7<=median(dane$mdrd7) >survdiff(surv(dane$czas.obserwacji, dane$status) myvalue, data = dane) E V N Observed Expected myvalue=false myvalue=true Chisq= 0.2 on 1 degrees of freedom, p= 0.696

32 Bibliografia Stevenson, M., 2007, An Introduction to Survival Analysis. IVABS, s Therneau, T.M., Foundation, M., 1999, A package for Survival Analysis in S. s Jones, M.P, Crowley, J., 1989, A General Class of Nonparametric Tests for Survival Analysis. Biometrics, Vol. 45, No. 1, s Harrington, D.P., Fleming, T.R., 1982, A Class of Rank Test Procedures for Censored Survival Data. Biometrika, Vol. 69, No. 3, s

33 ! Wprowadzenie Dziękujemy za uwagę!