STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH WYKŠAD 4 03 listopad 2014 1 / 47
Plan wykªadu 1. Testowanie zaªo»e«o proporcjonalnym hazardzie w modelu Cox'a 2. Wybór zmiennych do modelu Cox'a 3. Meta analiza 4. Pakiet R 2 / 47
TESTOWANIE ZAŠO E O PROPORCJONALNYM HAZARDZIE W MODELU COX'A 3 / 47
Model Cox'a Funkcja hazardu oparta na modelu Cox'a ma nast puj c posta : λ(t, X) = λ 0 (t) exp (β T X), gdzie λ 0 (t) - hazard bazowy; X - wektor k zmiennych obja±niaj cych; β T - wektor nieznanych wspóªczynników. 4 / 47
Model Cox'a W modelu proporcjonalnego hazardu zakªada si,»e funkcja hazardu dla obserwacji w analizie zale»y jedynie od warto±ci zmiennych obja±niaj cych i hazardu bazowego. Dla dwóch obserwacji o ustalonych warto±ciach stosunek estymowanych warto±ci hazardu w czasie t b dzie staªy (model proporcjonalnego hazardu). 5 / 47
Model Cox'a - jedna zmienna binarna Zdeniujmy: h(t) = λ(t, X) λ 0 (t) = exp βx = h X. Je»eli X jest zmienn binarn (przyjmuje dwie warto±ci 0 lub 1) to: HR F = h 1 h 0 = exp (β F ) exp (0) = exp (β F ). Przykªad: Mamy dwie grupy pacjentów chorych na raka trzustki. Jednej grupie jest podawane nowo testowane lekarstwo, a drugiej placebo. HR F = 0.6754 < 1 i oznacza to,»e pacjenci, którzy przyjmuj nowo testowane lekarstwo maj lepsze rokowania ni» pacjenci leczeni placebo. Dodatkowo β F = 0.3925 i SE( β F ) = 0.1159. Na tej podstawie mo»emy sprawdzi, czy parametr β jest statystycznie istotny tzn. testujemy hipotez H 0 : β = 0 na przeciw H 1 : β 0 przy pomocy testu z = β F /SE( β F ) = 3.3877. P warto± wynosi 0.0007 co nie daje nam podstaw do odrzucenia H 0. 6 / 47
Model Cox'a - jedna zmienna ci gªa Je»eli X jest zmienn ci gª to: HR A = h X 1 h X2 = exp (β AX 1 ) exp (β A X 2 ) = exp (β A(X 1 X 2 )). Wzgl dny hazard zale»y w powy»szym przypadku tylko i wyª cznie od ró»- nicy (X 1 X 2 ). Przykªad: Mamy dwóch pacjentów chorych na raka trzustki w wieku ) 50 i 40 lat. Dla tych pacjentów funkcja HR A = exp ( βa (50 40). Gdy wiemy,»e β A = 0.0320 to HR A = 1.3771. Sugeruje to,»e starszy pacjent ma du»o wi ksze ryzyko ±mierci ni» pacjent mªodszy. Skoro pacjenci ró»ni si o 10 lat to 1.3771 = 1.033 10. 7 / 47
Model Cox'a Zaªó»my,»e istnieje wektor g(t), taki»e λ(t, X) = λ 0 exp ( [β + g(t)] T X ) wtedy proporcja funkcji hazardu (hazard ratio) mo»e zmienia si w czasie. Aby sprawdzi zaªo»enie o proporcjonalnym hazardzie trzeba sprawdzi, czy funkcja g(t) jest bliska zeru. 8 / 47
Model Cox'a Dla dwóch grup (np. osoby chore na raka trzustki poddane leczeniu A i B) zaªo»enie proporcjonalnego hazardu jest speªnione, gdy: λ(t, X 1 ) λ(t, X 2 ) = λ ( ) 0 exp βt X 1 λ 0 exp (β T X 2 ) = exp ( ) βt X 1 exp (β T X 2 ) = c. Czyli testowanie zaªo»enia o proporcjonalnym hazardzie mo»na sprowadzi do porównania przeksztaªconych funkcji prze»ycia. 9 / 47
Model Cox'a Niech λ(t, X i ) = λ i (t) dla i {1, 2}. Wiemy,»e S i (t) = exp ( t ) λ i (s)ds. 0 Po dalszym przeksztaªceniu otrzymujemy: log ( log (S i (t))) = log ( λ 0 exp ( β T X i )) = log (λ0 ) + β T X i. 10 / 47
Model Cox'a Wykorzystuj c zaªo»enie o proporcjonalnym hazardzie mamy: log ( log (S 1 (t)))=log (λ 0 ) + β T X 1 =log (λ 0 ) + β T X 2 + log c = log ( log (S 2 (t))) + log c. St d, gdy wykresy funkcji log ( log (S 1 (t))) i log ( log (S 2 (t))) s przesuni te o staª c to mo»emy uzna,»e zaªo»enie o proporcjonalnym hazardzie jest speªnione. 11 / 47
Model Cox'a 12 / 47
Model Cox'a 13 / 47
Model Cox'a Uwagi: Testowanie wizualne najlepiej sprawdza si w przypadku dwóch warto±ci cechy u»ytej przy konstrukcji modelu. W przypadku cechy o wi kszej liczbie warto±ci lub cech o warto±ciach ci gªych metody gracznej si nie stosuje. W wielu przypadkach wykres nie jest jednoznaczny. 14 / 47
Model Cox'a 15 / 47
Model Cox'a Residua Schoenfeld'a maj posta : czyli gdzie ( βt ) j R i X j exp X j r i = X i ), j R i exp ( βt X j r i = X i Ê(X i R i ), R i = {j : t j < t i } - zbiór ryzyk do czasu t i ; β - estymatory parametrów β. 16 / 47
Model Cox'a E( r i ) V i g(t i ), gdzie czyli V i = j R i X j X T j j R i exp [ j Ri ( βt ) exp X j ) + ( βt X j ( βt )] [ ( βt )] T X j exp X j X j Ri j exp X j ( )) 2, exp ( βt X j Ri j V i = E(X 2 i R i ) E(X i R i ) 2. 17 / 47
Model Cox'a Je»eli zaªo»enie o proporcjonalnym hazardzie b dzie speªnione to: E( r i ) 0, a wykres zale»no±ci r i od czasu t b dzie poªo»ony blisko 0. 18 / 47
PAKIET R 19 / 47
Pakiet R 1 library(survival) 2 data(stanford2) 3 attach(stanford2) 4 model=coxph(surv(time,status)~age) 5 res=residuals(model,''scaledsch'') 6 times=as.numeric(names(residuals(model,"schoenfeld"))) 7 plot(times,res,ylab="residua",xlab="czas") 8 abline(0,0,lty=2) 9 lines(smooth.spline(times,res),col="red") 20 / 47
Pakiet R 21 / 47
Pakiet R Graczne testowanie zaªo»e«o proporcjonalnym hazardzie sprowadza si do badania, czy residua Schoenfelda znajduj si blisko 0. Przesªank za uznaniem proporcjonalno±ci hazardu jest wykres gªadkiej funkcji (czerwona linia) przypominaj ca staª prost blisk 0. 22 / 47
Pakiet R 1 test=cox.zph(coxph(surv(time,status)~age+t5),global=t) 2 plot(test) 23 / 47
Pakiet R 24 / 47
WYBÓR ZMIENNYCH DO MODELU COX'A 25 / 47
Wybór zmiennych do modelu Cox'a 1. Metoda step-up. 2. Metoda step-down. 26 / 47
META ANALIZA 27 / 47
Meta analiza - cele Gªówne cele meta analizy to: mierzenie niejednorodno±ci wyników pomi dzy ró»nymi publikacjami; testowanie, czy niejednorodno± jest statystycznie istotna. 28 / 47
Meta analiza Model staªy ma posta : y i = θ i + ɛ i, gdzie y i - obserwowany efekt w itej pracy; θ i - nieznany prawdziwy efekt; ɛ i - residua. ɛ i N (0, v i ) 29 / 47
Meta analiza Model losowy ma posta : θ i = µ + u i, gdzie µ - ±redni efekt; u i - efekt losowy; u i N (0, τ 2 ); τ 2 jest caªkowit niejednorodno±ci prawdziwych efektów. Je±li τ 2 = 0, to mamy jednorodno± wyników (tzn. θ 1 =... = θ k = θ). 30 / 47
Meta analiza Wyniki w analizach mog by prezentowane jako: dla zmiennych binarnych: iloraz szans (OR); ró»nica ryzyk (RD); relatywne ryzyko (RR). dla zmiennych ci gªych: ró»nica ±rednich (MD); standaryzowana ró»nica ±rednich (SMD). SMD = µ A µ B σ, gdzie σ 2 jest wariancj typu pooled. 31 / 47
Meta analiza Statystyka H = Q df jest miar niejednorodno±ci wyników. H = 1 oznacza jednorodno± wyników. H > 1 oznacza niejednorodno± wyników. I 2 = H2 1 H 2 Je±li H = 1 to I 2 = 0. I 2 [0, 1]. Im wi ksza warto± I 2 tym wi ksza niejednorodno± wyników. Q - test jednorodno±ci / niejednorodno±ci Cohrana. Q χ 2 k 1, gdzie k - liczba rozwa»anych publikacji. 32 / 47
Meta analiza 33 / 47
Meta analiza - przykªad Wyniki z 6 publikacji: 1. Comin-Colet et al., 2009; 2. Okonko et al., 2008; 3. Ponikowski et al., 2014; 4. Anker et al., 2009; 5. Beck-da-Silva et al., 2012; 6. Toblli et al., 2007. 34 / 47
Meta analiza - przykªad Wyniki odnosz si do nast puj cych cech: 1. zgony; 2. hospitalizacje sercowo naczyniowe i zgony; 3. klasy NYHA 4. dystans pokonany w ci gu 6-min.; 5. LVEF. Dla ka»dej cech dost pne s dwie grupy pacjentów. lekiem z»elazem druga placebo. Jedna leczona jest 35 / 47
Wyniki - zgony OR 95% CI z p Model staªy 0.8003 [0.4587; 1.3963] 0.7845 0.4328 Model losowy 0.8003 [0.4587; 1.3963] 0.7845 0.4328 Test niejednorodno±ci Q d.f. p 0.3 4 0.9901 36 / 47
Wyniki - hospitalizacje i zgony OR 95% CI z p Model staªy 0.4072 [0.2856; 0.5806] 4.963 < 0.001 Model losowy 0.4072 [0.2856; 0.5806] 4.963 < 0.001 Test niejednorodno±ci Q d.f. p 2.27 3 0.5170 37 / 47
Wyniki - klasy NYHA OR 95% CI z p Model staªy 0.510 [ 0.649; 0.372] 7.222 < 0.0001 Model losowy 0.946 [ 1.434; 0.457] 3.794 0.0001 Test niejednorodno±ci Q d.f. p 33.23 4 < 0.0001 38 / 47
Wyniki - klasy NYHA OR 95% CI z p Model staªy 0.386 [ 0.478; 0.294] 8.248 < 0.0001 Model losowy 0.722 [ 1.111; 0.332] 3.628 0.003 Test niejednorodno±ci Q d.f. p 47.9 4 < 0.001 39 / 47
Wyniki - dystans pokonany w 6 min OR 95% CI z p Model staªy 30.942 [19.284; 42.600] 5.202 < 0.0001 Model losowy 30.942 [19.284; 42.600] 5.202 < 0.0001 Test niejednorodno±ci Q d.f. p 0.54 1 0.4642 40 / 47
Wyniki - LVEF OR 95% CI z p Model staªy 3.431 [ 5.691; 1.171] 2.976 0.0029 Model losowy 2.774 [ 10.023; 4.477] 0.750 0.4533 Test niejednorodno±ci Q d.f. p 9.89 1 0.0017 41 / 47
PAKIET R 42 / 47
Pakiet R 1 library(meta) 2 death=read.table("death.csv",sep=";",header=t) 3 m.death=metabin(event.e, n.e, event.c, n.c,data=death,sm="or",method="i",comb.xed=f) 4 summary(m.death) 5 forest(m.death) 43 / 47
Pakiet R 1 death 1 summary(m.death) 44 / 47
Pakiet R 1 NYHA=read.table("NYHAfun.csv",sep=";",header=T) 2 m.nyha=metacont(n.e, event.e, sd.e, n.c, event.c, sd.c,data=nyha,sm="md",comb.xed=f) 3 summary(m.nyha) 4 forest(m.nyha) 45 / 47
Pakiet R 1 NYHA 1 summary(m.nyha) 46 / 47
Bibliograa Wykªad opracowany na podstawie ksi»ki: Mahesh K. B. Parmer i David Machin Survival Analysis - A Practical Approach Burawska Marta i Kolankowski Marcin Model Cox'a. Testowanie zaªo»e«o proporcjonalnym hazardzie. 47 / 47