STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Podobne dokumenty
STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Model Cox a. Testowanie założeń o proporcjonalnym hazardzie.

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Statystyka matematyczna - ZSTA LMO

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)

Podstawy statystycznego modelowania danych Analiza prze»ycia

Ekonometria - wykªad 8

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Wykªad 6: Model logitowy

Podstawy statystycznego modelowania danych - Wykªad 7

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Pakiety statystyczne - Wykªad 8

Podstawy statystycznego modelowania danych Analiza prze»ycia. Tomasz Suchocki

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Biostatystyka, # 5 /Weterynaria I/

Modele wielorównaniowe. Problem identykacji

Matematyka 1. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Ekonometria Bayesowska

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

In»ynierskie zastosowania statystyki wiczenia

MODELE LINIOWE i MIESZANE

Stacjonarne szeregi czasowe

Elementy Modelowania Matematycznego Wykªad 1 Prawdopodobie«stwo

Proste modele o zªo»onej dynamice

3. (8 punktów) EGZAMIN MAGISTERSKI, Biomatematyka

Pakiety statystyczne Wykªad 14

Statystyka Matematyczna Anna Janicka

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Zbiory i odwzorowania

Wst p do ekonometrii II

Rozwini cia asymptotyczne dla mocy testów przybli»onych

Testowanie hipotez statystycznych.

Liniowe równania ró»niczkowe n tego rz du o staªych wspóªczynnikach

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Analiza przeżycia Survival Analysis

Wykªad 4. Funkcje wielu zmiennych.

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Analiza przeżycia Survival Analysis

Opis matematyczny ukªadów liniowych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

1 Poj cia pomocnicze. Przykªad 1. A A d

Numeryczne zadanie wªasne

Egzamin z ekonometrii - wersja ogólna

Lekcja 9 - LICZBY LOSOWE, ZMIENNE

Ekonometria Bayesowska

Ekonometria - wykªad 1

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Makroekonomia Zaawansowana

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Biostatystyka, # 4 /Weterynaria I/

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Przykªadowe analizy. Grzegorz Kemski. 26 listopada 2008

Statystyka matematyczna - ZSTA LMO

Ekonometria Bayesowska

Lekcja 9 Liczby losowe, zmienne, staªe

Bash i algorytmy. Elwira Wachowicz. 20 lutego

Wykład 5 Teoria eksperymentu

Mierzalne liczby kardynalne

Ekonometria. wiczenia 5 i 6 Modelowanie szeregów czasowych. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Prawdopodobieństwo i statystyka r.

Agata Boratyńska Statystyka aktuarialna... 1

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

AM II /2019 (gr. 2 i 3) zadania przygotowawcze do I kolokwium

Wst p do informatyki. Systemy liczbowe. Piotr Fulma«ski. 21 pa¹dziernika Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

Wybrane poj cia i twierdzenia z wykªadu z teorii liczb

A = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy.

1 0 Je»eli wybierzemy baz A = ((1, 1), (2, 1)) to M(f) A A =. 0 2 Daje to znacznie lepszy opis endomorzmu f.

wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. Metodyka bada«do±wiadczalnych dr hab. in». Sebastian Skoczypiec Cel wiczenia Zaªo»enia

Zadanie 1. (8 punktów) Dana jest nast puj ca macierz: M =

Elementy geometrii w przestrzeni R 3

Ekonometria Przestrzenna

2. (8 punktów) 3. (8 punktów) 4. (8 punktów) 5. (8 punktów) EGZAMIN MAGISTERSKI, Matematyka w ekonomii i ubezpieczeniach

Lab. 02: Algorytm Schrage

Zadania z PM II A. Strojnowski str. 1. Zadania przygotowawcze z Podstaw Matematyki seria 2

Zadania. 4 grudnia k=1

Ekstremalnie maªe zbiory

Informacje pomocnicze

Ciaªa i wielomiany. 1 Denicja ciaªa. Ciaªa i wielomiany 1

Szeregowanie zada« Wykªad nr 5. dr Hanna Furma«czyk. 4 kwietnia 2013

Modele wielorównaniowe. Estymacja parametrów

Zadania z analizy matematycznej - sem. II Rachunek ró»niczkowy funkcji wielu zmiennych

Liniowe zadania najmniejszych kwadratów

Funkcje, wielomiany. Informacje pomocnicze

Elementarna statystyka

Materiaªy do Repetytorium z matematyki

Prawdopodobieństwo i statystyka r.

Metody probabilistyczne

W poprzednim odcinku... Podstawy matematyki dla informatyków. Relacje równowa»no±ci. Zbiór (typ) ilorazowy. Klasy abstrakcji

Twierdzenie Wainera. Marek Czarnecki. Warszawa, 3 lipca Wydziaª Filozoi i Socjologii Uniwersytet Warszawski

Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Transkrypt:

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH WYKŠAD 4 03 listopad 2014 1 / 47

Plan wykªadu 1. Testowanie zaªo»e«o proporcjonalnym hazardzie w modelu Cox'a 2. Wybór zmiennych do modelu Cox'a 3. Meta analiza 4. Pakiet R 2 / 47

TESTOWANIE ZAŠO E O PROPORCJONALNYM HAZARDZIE W MODELU COX'A 3 / 47

Model Cox'a Funkcja hazardu oparta na modelu Cox'a ma nast puj c posta : λ(t, X) = λ 0 (t) exp (β T X), gdzie λ 0 (t) - hazard bazowy; X - wektor k zmiennych obja±niaj cych; β T - wektor nieznanych wspóªczynników. 4 / 47

Model Cox'a W modelu proporcjonalnego hazardu zakªada si,»e funkcja hazardu dla obserwacji w analizie zale»y jedynie od warto±ci zmiennych obja±niaj cych i hazardu bazowego. Dla dwóch obserwacji o ustalonych warto±ciach stosunek estymowanych warto±ci hazardu w czasie t b dzie staªy (model proporcjonalnego hazardu). 5 / 47

Model Cox'a - jedna zmienna binarna Zdeniujmy: h(t) = λ(t, X) λ 0 (t) = exp βx = h X. Je»eli X jest zmienn binarn (przyjmuje dwie warto±ci 0 lub 1) to: HR F = h 1 h 0 = exp (β F ) exp (0) = exp (β F ). Przykªad: Mamy dwie grupy pacjentów chorych na raka trzustki. Jednej grupie jest podawane nowo testowane lekarstwo, a drugiej placebo. HR F = 0.6754 < 1 i oznacza to,»e pacjenci, którzy przyjmuj nowo testowane lekarstwo maj lepsze rokowania ni» pacjenci leczeni placebo. Dodatkowo β F = 0.3925 i SE( β F ) = 0.1159. Na tej podstawie mo»emy sprawdzi, czy parametr β jest statystycznie istotny tzn. testujemy hipotez H 0 : β = 0 na przeciw H 1 : β 0 przy pomocy testu z = β F /SE( β F ) = 3.3877. P warto± wynosi 0.0007 co nie daje nam podstaw do odrzucenia H 0. 6 / 47

Model Cox'a - jedna zmienna ci gªa Je»eli X jest zmienn ci gª to: HR A = h X 1 h X2 = exp (β AX 1 ) exp (β A X 2 ) = exp (β A(X 1 X 2 )). Wzgl dny hazard zale»y w powy»szym przypadku tylko i wyª cznie od ró»- nicy (X 1 X 2 ). Przykªad: Mamy dwóch pacjentów chorych na raka trzustki w wieku ) 50 i 40 lat. Dla tych pacjentów funkcja HR A = exp ( βa (50 40). Gdy wiemy,»e β A = 0.0320 to HR A = 1.3771. Sugeruje to,»e starszy pacjent ma du»o wi ksze ryzyko ±mierci ni» pacjent mªodszy. Skoro pacjenci ró»ni si o 10 lat to 1.3771 = 1.033 10. 7 / 47

Model Cox'a Zaªó»my,»e istnieje wektor g(t), taki»e λ(t, X) = λ 0 exp ( [β + g(t)] T X ) wtedy proporcja funkcji hazardu (hazard ratio) mo»e zmienia si w czasie. Aby sprawdzi zaªo»enie o proporcjonalnym hazardzie trzeba sprawdzi, czy funkcja g(t) jest bliska zeru. 8 / 47

Model Cox'a Dla dwóch grup (np. osoby chore na raka trzustki poddane leczeniu A i B) zaªo»enie proporcjonalnego hazardu jest speªnione, gdy: λ(t, X 1 ) λ(t, X 2 ) = λ ( ) 0 exp βt X 1 λ 0 exp (β T X 2 ) = exp ( ) βt X 1 exp (β T X 2 ) = c. Czyli testowanie zaªo»enia o proporcjonalnym hazardzie mo»na sprowadzi do porównania przeksztaªconych funkcji prze»ycia. 9 / 47

Model Cox'a Niech λ(t, X i ) = λ i (t) dla i {1, 2}. Wiemy,»e S i (t) = exp ( t ) λ i (s)ds. 0 Po dalszym przeksztaªceniu otrzymujemy: log ( log (S i (t))) = log ( λ 0 exp ( β T X i )) = log (λ0 ) + β T X i. 10 / 47

Model Cox'a Wykorzystuj c zaªo»enie o proporcjonalnym hazardzie mamy: log ( log (S 1 (t)))=log (λ 0 ) + β T X 1 =log (λ 0 ) + β T X 2 + log c = log ( log (S 2 (t))) + log c. St d, gdy wykresy funkcji log ( log (S 1 (t))) i log ( log (S 2 (t))) s przesuni te o staª c to mo»emy uzna,»e zaªo»enie o proporcjonalnym hazardzie jest speªnione. 11 / 47

Model Cox'a 12 / 47

Model Cox'a 13 / 47

Model Cox'a Uwagi: Testowanie wizualne najlepiej sprawdza si w przypadku dwóch warto±ci cechy u»ytej przy konstrukcji modelu. W przypadku cechy o wi kszej liczbie warto±ci lub cech o warto±ciach ci gªych metody gracznej si nie stosuje. W wielu przypadkach wykres nie jest jednoznaczny. 14 / 47

Model Cox'a 15 / 47

Model Cox'a Residua Schoenfeld'a maj posta : czyli gdzie ( βt ) j R i X j exp X j r i = X i ), j R i exp ( βt X j r i = X i Ê(X i R i ), R i = {j : t j < t i } - zbiór ryzyk do czasu t i ; β - estymatory parametrów β. 16 / 47

Model Cox'a E( r i ) V i g(t i ), gdzie czyli V i = j R i X j X T j j R i exp [ j Ri ( βt ) exp X j ) + ( βt X j ( βt )] [ ( βt )] T X j exp X j X j Ri j exp X j ( )) 2, exp ( βt X j Ri j V i = E(X 2 i R i ) E(X i R i ) 2. 17 / 47

Model Cox'a Je»eli zaªo»enie o proporcjonalnym hazardzie b dzie speªnione to: E( r i ) 0, a wykres zale»no±ci r i od czasu t b dzie poªo»ony blisko 0. 18 / 47

PAKIET R 19 / 47

Pakiet R 1 library(survival) 2 data(stanford2) 3 attach(stanford2) 4 model=coxph(surv(time,status)~age) 5 res=residuals(model,''scaledsch'') 6 times=as.numeric(names(residuals(model,"schoenfeld"))) 7 plot(times,res,ylab="residua",xlab="czas") 8 abline(0,0,lty=2) 9 lines(smooth.spline(times,res),col="red") 20 / 47

Pakiet R 21 / 47

Pakiet R Graczne testowanie zaªo»e«o proporcjonalnym hazardzie sprowadza si do badania, czy residua Schoenfelda znajduj si blisko 0. Przesªank za uznaniem proporcjonalno±ci hazardu jest wykres gªadkiej funkcji (czerwona linia) przypominaj ca staª prost blisk 0. 22 / 47

Pakiet R 1 test=cox.zph(coxph(surv(time,status)~age+t5),global=t) 2 plot(test) 23 / 47

Pakiet R 24 / 47

WYBÓR ZMIENNYCH DO MODELU COX'A 25 / 47

Wybór zmiennych do modelu Cox'a 1. Metoda step-up. 2. Metoda step-down. 26 / 47

META ANALIZA 27 / 47

Meta analiza - cele Gªówne cele meta analizy to: mierzenie niejednorodno±ci wyników pomi dzy ró»nymi publikacjami; testowanie, czy niejednorodno± jest statystycznie istotna. 28 / 47

Meta analiza Model staªy ma posta : y i = θ i + ɛ i, gdzie y i - obserwowany efekt w itej pracy; θ i - nieznany prawdziwy efekt; ɛ i - residua. ɛ i N (0, v i ) 29 / 47

Meta analiza Model losowy ma posta : θ i = µ + u i, gdzie µ - ±redni efekt; u i - efekt losowy; u i N (0, τ 2 ); τ 2 jest caªkowit niejednorodno±ci prawdziwych efektów. Je±li τ 2 = 0, to mamy jednorodno± wyników (tzn. θ 1 =... = θ k = θ). 30 / 47

Meta analiza Wyniki w analizach mog by prezentowane jako: dla zmiennych binarnych: iloraz szans (OR); ró»nica ryzyk (RD); relatywne ryzyko (RR). dla zmiennych ci gªych: ró»nica ±rednich (MD); standaryzowana ró»nica ±rednich (SMD). SMD = µ A µ B σ, gdzie σ 2 jest wariancj typu pooled. 31 / 47

Meta analiza Statystyka H = Q df jest miar niejednorodno±ci wyników. H = 1 oznacza jednorodno± wyników. H > 1 oznacza niejednorodno± wyników. I 2 = H2 1 H 2 Je±li H = 1 to I 2 = 0. I 2 [0, 1]. Im wi ksza warto± I 2 tym wi ksza niejednorodno± wyników. Q - test jednorodno±ci / niejednorodno±ci Cohrana. Q χ 2 k 1, gdzie k - liczba rozwa»anych publikacji. 32 / 47

Meta analiza 33 / 47

Meta analiza - przykªad Wyniki z 6 publikacji: 1. Comin-Colet et al., 2009; 2. Okonko et al., 2008; 3. Ponikowski et al., 2014; 4. Anker et al., 2009; 5. Beck-da-Silva et al., 2012; 6. Toblli et al., 2007. 34 / 47

Meta analiza - przykªad Wyniki odnosz si do nast puj cych cech: 1. zgony; 2. hospitalizacje sercowo naczyniowe i zgony; 3. klasy NYHA 4. dystans pokonany w ci gu 6-min.; 5. LVEF. Dla ka»dej cech dost pne s dwie grupy pacjentów. lekiem z»elazem druga placebo. Jedna leczona jest 35 / 47

Wyniki - zgony OR 95% CI z p Model staªy 0.8003 [0.4587; 1.3963] 0.7845 0.4328 Model losowy 0.8003 [0.4587; 1.3963] 0.7845 0.4328 Test niejednorodno±ci Q d.f. p 0.3 4 0.9901 36 / 47

Wyniki - hospitalizacje i zgony OR 95% CI z p Model staªy 0.4072 [0.2856; 0.5806] 4.963 < 0.001 Model losowy 0.4072 [0.2856; 0.5806] 4.963 < 0.001 Test niejednorodno±ci Q d.f. p 2.27 3 0.5170 37 / 47

Wyniki - klasy NYHA OR 95% CI z p Model staªy 0.510 [ 0.649; 0.372] 7.222 < 0.0001 Model losowy 0.946 [ 1.434; 0.457] 3.794 0.0001 Test niejednorodno±ci Q d.f. p 33.23 4 < 0.0001 38 / 47

Wyniki - klasy NYHA OR 95% CI z p Model staªy 0.386 [ 0.478; 0.294] 8.248 < 0.0001 Model losowy 0.722 [ 1.111; 0.332] 3.628 0.003 Test niejednorodno±ci Q d.f. p 47.9 4 < 0.001 39 / 47

Wyniki - dystans pokonany w 6 min OR 95% CI z p Model staªy 30.942 [19.284; 42.600] 5.202 < 0.0001 Model losowy 30.942 [19.284; 42.600] 5.202 < 0.0001 Test niejednorodno±ci Q d.f. p 0.54 1 0.4642 40 / 47

Wyniki - LVEF OR 95% CI z p Model staªy 3.431 [ 5.691; 1.171] 2.976 0.0029 Model losowy 2.774 [ 10.023; 4.477] 0.750 0.4533 Test niejednorodno±ci Q d.f. p 9.89 1 0.0017 41 / 47

PAKIET R 42 / 47

Pakiet R 1 library(meta) 2 death=read.table("death.csv",sep=";",header=t) 3 m.death=metabin(event.e, n.e, event.c, n.c,data=death,sm="or",method="i",comb.xed=f) 4 summary(m.death) 5 forest(m.death) 43 / 47

Pakiet R 1 death 1 summary(m.death) 44 / 47

Pakiet R 1 NYHA=read.table("NYHAfun.csv",sep=";",header=T) 2 m.nyha=metacont(n.e, event.e, sd.e, n.c, event.c, sd.c,data=nyha,sm="md",comb.xed=f) 3 summary(m.nyha) 4 forest(m.nyha) 45 / 47

Pakiet R 1 NYHA 1 summary(m.nyha) 46 / 47

Bibliograa Wykªad opracowany na podstawie ksi»ki: Mahesh K. B. Parmer i David Machin Survival Analysis - A Practical Approach Burawska Marta i Kolankowski Marcin Model Cox'a. Testowanie zaªo»e«o proporcjonalnym hazardzie. 47 / 47