Metody statystyki medycznej stosowane w badaniach klinicznych

Podobne dokumenty
Rozdział 8. Regresja. Definiowanie modelu

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza współzależności zjawisk

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

KORELACJE I REGRESJA LINIOWA

3. Modele tendencji czasowej w prognozowaniu

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wprowadzenie do analizy korelacji i regresji

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

MODELE LINIOWE. Dr Wioleta Drobik

Analiza autokorelacji

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Kolokwium ze statystyki matematycznej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Analiza Współzależności

5. Model sezonowości i autoregresji zmiennej prognozowanej

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Przykład 2. Stopa bezrobocia

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

ANALIZA REGRESJI SPSS

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

POLITECHNIKA OPOLSKA

Ekonometria. Zajęcia

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

4. Średnia i autoregresja zmiennej prognozowanej

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

t y x y'y x'x y'x x-x śr (x-x śr)^2

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka matematyczna dla leśników

Metody Ilościowe w Socjologii

Testowanie hipotez statystycznych.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

PDF created with FinePrint pdffactory Pro trial version

Spis treści 3 SPIS TREŚCI

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

3. Analiza własności szeregu czasowego i wybór typu modelu

Prognozowanie na podstawie modelu ekonometrycznego

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Etapy modelowania ekonometrycznego

Własności statystyczne regresji liniowej. Wykład 4

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Testowanie hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Przykład 1 ceny mieszkań

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Ćwiczenie 5 PROGNOZOWANIE

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Statystyka i Analiza Danych

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenia IV

Testowanie hipotez statystycznych.

Statystyka matematyczna i ekonometria

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Statystyka Matematyczna Anna Janicka

7.4 Automatyczne stawianie prognoz

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

Wykład 3 Hipotezy statystyczne

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Analiza współzależności dwóch cech I

Ćwiczenia 10. Analiza regresji. Część I.

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Transkrypt:

Metody statystyki medycznej stosowane w badaniach klinicznych Statistics for clinical research & post-marketing surveillance część III

Program szkolenia część III Model regresji liniowej Współczynnik korelacji Pearsona a regresja liniowa dwóch zmiennych. Zmienne w analizie regresji. Założenia modelu regresji. Równanie regresji wielorakiej (wieloczynnikowej). Dobór zmiennych do modelu regresji. Interpretacja parametrów modelu liniowego. Testowanie hipotez o współczynnikach regresji. Analiza dopasowania modelu regresji. Analiza własności rozkładu reszt. Graficzna prezentacja równania regresji oraz zależności korelacyjnej. Analiza modeli regresji nieliniowej. Graficzna prezentacja równania regresji bazującego na postaci nieliniowej. 2

Program szkolenia część III cd. Analiza dynamiki zjawisk Podstawowe zagadnienia związane z analizą dynamiki. Indeksy dynamiki: Indeksy o podstawie stałej. Indeksy o podstawie zmiennej. Średnie tempo wzrostu. Modele trendu oparte na analizie regresji Analiza trendu liniowego (regresja liniowa względem czasu). Model przeżywalności Kaplan-Meier 3

(linear regression model) y = a1x + a0 +ξ Gdzie: x - zmienna niezależna; y zmienna zależna; α 1 parametr kierunkowy; α 0 - wyraz wolny; ξ - składnik losowy (teoretyczny twór w modelu) Modelowanie oznacza wyznaczenie odpowiedniego opisu matematycznego (modelu) będącego odzwierciedleniem badanego procesu. Model tworzy się za pomocą równań różnego typu: liniowych lub nieliniowych, statycznych lub dynamicznych, ciągłych lub dyskretnych. 4

Wyznaczenie modelu oznacza: 1. Wybór typu równania (należy ocenić typ zależności) 2. Wybór jego struktury (rzędu równania) 3. Obliczenie wartości współczynników równania (parametrów modelu α i ) 4. Przeprowadzenie weryfikacji modelu (sprawdzenie jego poprawności). Praktyczna funkcja modelowania: na podstawie modelu możliwe jest oszacowanie wartości zmiennej y na podstawie znanych wartości zmiennej x. 5

Wykres korelacyjny (wykres rozrzutu punktów empirycznych) Przykład Zbadano zależność pomiędzy wiekiem respondentów a osiąganymi przez nich dochodami. y : skala SF 36 służąca do oceny jakości życia-zmienna zależna (dependent variable) x : skala BECK do oceny stopnia depresji - zmienna niezależna (independent variable) 160 140 120 SF 36 100 80 60 40 20 0 y = 2,28x + 54 R 2 = 0,19 0 10 20 30 40 BECK 6

Konieczne jest wyznaczenie parametrów a 1 oraz a o tej funkcji. Wzory: a 1 = ( x i x)( y ( x i i x) 2 y) a0 = y a1 x Aby obliczyć a 1 z funkcji statystycznych użyj funkcji statystycznych nachylenie Aby obliczyć a o z funkcji statystycznych użyj funkcji statystycznych odcięta Powyższe formuły dotyczą metody najmniejszych kwadratów do szacowania funkcji liniowych. Uwagi: współczynnik korelacji r oraz parametr kierunkowy są zawsze tych samych znaków. 7

Przykład Model: y = 2,28x + 54 Gdzie: y : skala SF 36 służąca do oceny jakości życia-zmienna zależna (dependent variable) x : skala BECK do oceny stopnia depresji - zmienna niezależna (independent variable) Interpretacja parametrów: Wzrost skali BECK o jednostkę powoduje, średnio rzecz biorąc wzrost skali SF o 2,28. 8

Miary dopasowania modelu: Weryfikacja modelu (regresji liniowej) Współczynnik determinacji (R2) {R Square} Wartość współczynnika determinacji R2 zawiera się w przedziale <0,1> i informuje jaka część zaobserwowanej, całkowitej zmienności y została wyjaśniona przez model. Współczynnik zbieżności (φ2 = 1-R2) Wartość współczynnika zbieżności zawiera się w przedziale <0,1> i informuje jaka część zaobserwowanej, całkowitej zmienności y NIE została wyjaśniona przez model. Odchylenie standardowe reszt (SE) Wielkość odchylenia standardowego reszt interpretujemy jako przeciętne odchylenie zaobserwowanych wartości zmiennej y od odpowiadających im wartości funkcji (wartości teoretycznych) 9

Testy weryfikujące istotność modelu (parametrów modelu) 1. Test istotności modelu 2. Test istotności parametrów Pierwszy z nich zakłada, że wszystkie parametry modelu, poza wyrazem wolnym są równe zero. Hipoteza H 0 zakłada więc, że model nie jest istotny. Sprawdzianem tej hipotezy jest statystyka F. Dla tej statystyki testowej z tablic rozkładu Fishera odczytuje się poziom istotności (p-value). Zakłada się, że p-value niższe od wartości α (zwykle 0,05 lub 0,01) oznacza odrzucenie hipotezy H 0 (model jest istotny). 10

Test istotności parametrów modelu W badaniu istotności modelu możliwe jest także inne podejście. Zakłada ono osobne badanie poszczególnych parametrów. Badanie istotności w tym przypadku sprowadza się do weryfikacji hipotez: Ho: α i = 0 Czyli hipoteza, że i ta zmienna nie wpływa w istotny sposób na zmienną endogeniczną. (w niniejszym opracowaniu badano głównie istotność parametru kierunkowego zmiennej czasowej). Hipoteza alternatywna jest sformułowana następująco: H1: α i 0 11

Test istotności parametrów modelu Sprawdzianem testu jest statystyka t-studenta o n - k stopniach swobody wyznaczana jako: t i = a i i ( i ) D α a Gdzie: a i - ocena i-tego parametru, α i - prawdziwa wartość parametru (zgodnie z hipotezą zerową αi=0), D(a i ) błąd średni szacunku parametru. W obu typach testów istotności modelu trendu zakłada się że wartość poziomu istotności wyznaczonej dla statystyki testowej niższa od α(np. 0,05 lub 0,01) świadczy o istotności parametru (lub inaczej mówiąc o istotnym wpływie zmiennej X na zmienną Y). 12

Przykład Model prognozujący przeżycie po operacji kardiologicznej w zależności od Zmienna zależna: Y przeżywalność (0-wypis; 1-zgon) Zmienne niezależne: X 1 chirurgia aorty X 2 powikłania neurologiczne X3 - pozawałowe VSD Współczynniki Przecięcie 0,019 X1 - chirurgia aorty 0,116 x2 powikłania neurologiczne 0,262 x3 - pozawałowe VSD 0,613 Interpretacja parametrów: Częstsza chirurgia aorty powoduje wyższe ryzyko zgonu pooperacyjnego (dodatni parametr 0,116); Powikłania neurologiczne im częstsze powikłania neurologiczne tym wyższe ryzyko zgonu pooperacyjnego. 13

R2 = 0,13 ; 13% zmienności zgonów pooperacyjnych jest wyjaśnione przez model Su = 0,16 Odchylenie standardowe reszt: wartości teoretyczne (modelowe) odchylają się od wartości empirycznych średnio o +/-0,16. Test istotności modelu: Badanie istotności parametrów modelu liniowego H 0 : R=0 (lub, α i =0, dla i=1,2) H 1 : R > 0 (lub przynajmniej jedno α i 0) Statystyka testowa: F=205 Poziom istotności statystyki : p-value < 0,001 Wniosek: Należy odrzucić hipotezę zerową. Model jest statystycznie istotny. 14

Test istotności poszczególnych parametrów modelu Hipotezy H 0 : α 1 = 0 H 1 : α 1 0 Współczynnik i t Stat Wartość-p Przecięcie 0,019 7,153 p<0,001 x1-chirurgia_aorty 0,116 8,925 p<0,001 x2 - powikłania_neurologiczne 0,262 14,554 p<0,001 x3 - pozawałowe VSD 0,613 13,790 p<0,001 Dla wyniku statystyki testowej t 1 =8,92 wyznaczany jest poziom istotności p-value. Jest on w tym przypadku niższy niż 0,001. Wynik ten pozwala na odrzucenie hipotezy H 0. można zatem twierdzić, że parametr α 1 jest istotny (zmienna x 1 istotnie wpływa na zmienną y. Można uznać zmienną X1 za niezależny czynnik ryzyka zgonu. 15

Przykład Na podstawie danych oszacuj stosując opcję Regresja model zależności zmiennej Y od zmiennych x1, x2, x3 Narzędzia Analiza danych Regresja Statystyki regresji Wielokrotność R 0,37 R kwadrat 0,13 Dopasowany R kwadrat 0,13 Błąd standardowy 0,16 Obserwacje 3999 16

Należy zwrócić uwagę, na przedziały ufności dla parametrów (dolne i górne 95%). Interpretacja : z prawdopodobieństwem 95% przedział ufności o końcach 0,09 oaz 0,141 pokrywa rzeczywistą nieznaną wartość parametru α 1. Współczynniki Dolne 95% Górne 95% Przecięcie 0,019 0,014 0,024 x1 - chirurgia_aorty 0,116 0,090 0,141 x2 - powikłania_neurologiczne 0,262 0,227 0,298 x3 - pozawałowe VSD 0,613 0,526 0,700 Istnieje możliwość zdefiniowania również przedziałów i innym prawdopodobieństwie (wybór w opcji regresja innej wartości poziom ufności ) Dane tego modelu doskonale nadają się do analizy modelem regresji logistycznej 17

Zadanie 1. Dysponując danymi w arkuszu CRF zbuduj model regresji zależności poziomu Hb od wieku pacjenta. Czy model jest statystycznie istotny? (poziom istotności 0,05). Zadanie 2. Dysponując danymi w arkuszu CRF zbuduj model regresji zależności poziomu Hb od wagi pacjenta. Czy model jest statystycznie istotny? (poziom istotności 0,05). Czy zastosowana dawka leku na wizycie 3 wpływa liniowo na poziomy Hb i Ferrytyny na wizycie 4? 18

W przypadku, gdy model regresji budowany jest na podstawie danych szeregu czasowego należy dodatkowo zbadać własności rozkładu reszt modelu. Własności: Rozkład reszt powinien być niezautokorelowany Rozkład reszt powinien być losowy Rozkład reszt powinien być symetryczny Rozkład reszt powinien mieć rozkład normalny Na podstawie rzetelnie opracowanego modelu regresji możliwe jest symulowanie zachowań. Czyli np.: Jaka będzie teoretyczna wartość zmiennej Y jeżeli zmienna X osiągnie wartość 15? Po podstawieniu do modelu regresji za X wartości 15 uzyskamy odpowiedź na tak zadane pytanie badawcze. 19

Analiza dynamiki zjawisk Podstawowe zagadnienia związane z analizą dynamiki. Indeksy dynamiki: Indeksy o podstawie stałej (informują o % przyroście w stosunku do jednego okresu bazowego) Indeksy o podstawie zmiennej, indeksy łańcuchowe (informują o % przyroście w stosunku do okresu poprzedzającego). Średnie tempo wzrostu jest to średnia geometryczna, obliczana zgodnie z formułą: = n 1 Prognozowanie na przyszłe okresy na podstawie średniego tempa zmian: i y y y y t+ n = t n 1 i n 1 20

Analiza dynamiki zjawisk Zadanie 3. Dysponujemy danymi dotyczącymi poziomu Hb u pacjenta (pomiary wykonywane co tydzień przez okres 2 miesięcy). Wyznacz indeks o podstawie stałej (podstawa z tygodnia 1) Wyznacz indeks o podstawie stałej (podstawa z tygodnia 5) Wyznacz indeks łańcuchowy Wyznacz średnie tempo zmian Wyznacz przewidywany poziom Hb w tygodniach: 11 oraz 14. Zadanie 4. Zbadaj za pomocą indeksów dynamiki zmiany poziomu Ferrytyny u pacjenta oznaczonego jako lp. 5. 21

Modele trendu Time series analysis Model szeregu czasowego, w którym występuje tendencja rozwojowa, wahania sezonowe oraz wahania przypadkowe, a rolę zmiennej objaśniającej odgrywa zmienna czasowa nazywamy modelem tendencji rozwojowej (modele trendu). Zapis modelu jest następujący: y t = f(t) +g(t) + ε t Gdzie: t = 1, 2,...,n f(t) - funkcja czasu, charakteryzująca tendencję rozwojową szeregu, nazywana funkcją trendu, g(t) - funkcja opisująca wahania sezonowe, ε t - zmienna losowa, charakteryzująca efekty oddziaływania wahań przypadkowych. 22

Modele trendu Najczęściej spotykanymi postaciami analitycznymi funkcji trendu są: trend liniowy y t = a+b*t Jest to najczęściej wykorzystywana w praktyce postać funkcji trendu, stosowana zawsze w przypadku, gdy można przyjąć założenie o stałych przyrostach wartości zmiennej y w jednostce czasu. Parametry funkcji zostały oszacowane metodą najmniejszych kwadratów. trend logarytmiczny y t = a + b * log t Ten typ trendu wybieramy gdy wzrost badanej zmiennej jest coraz wolniejszy. Można ten typ modelu oszacować podstawieniem t = log t otrzymujemy równanie liniowe: y t = a + b t trend wielomianowy yt = at 2 + bt + c 23

Modele trendu Zadanie 5. Oszacuj i zbadaj dopasowanie poszczególnych modeli trendu na podstawie danych liczby ludności Polski Bazując na tych samych danych oszacuj model liniowy i zbadaj istotność parametrów modelu. Wyznacz średnie tempo zmian. 24

Model przeżywalności Kaplan-Meier Kaplan Meier Survival Analysis Przykład. Założenia metody: 100 pacjentów obserwowano poprzez okres 5 lat. obserwowano zgony pacjentów. w trakcie badania część pacjentów odchodzi (Became Unavailable (Censored)). Time At Risk Became_Una vailable Died Survived Time At Risk Became Unavailable Died Survived Year 1 100 3 5 Year 2 3 10 Year 3 3 15 Year 4 3 20 Year 5 3 25 Year 1 100 3 5 95 Year 2 92 3 10 82 Year 3 79 3 15 64 Year 4 61 3 20 41 Year 5 38 3 25 13 25

Model przeżywalności Kaplan-Meier Time At Risk Became Unavailable Died Survived Year 1 100 3 5 95 Year 2 92 3 10 82 Year 3 79 3 15 64 Year 4 61 3 20 41 Year 5 38 3 25 13 26

Model przeżywalności Kaplan-Meier Became Time Period At Risk Unavailable (Censored) Died Survived Kaplan-Meier Survival Probability Estimate Year 1 100 3 5 95 (95/100)=0.95 Year 2 92 3 10 82 (95/100)x(82/92)=0.8467 Year 3 79 3 15 64 Year 4 61 3 20 41 (95/100)x(82/92)x(64/79)= 0.70 (95/100)x(82/92)x(64/79)x (41/61)=0.4611 Year 5 38 3 25 13 (95/100)x(82/92)x(64/79)x (41/61)x(13/38)=0.1577 27

Model przeżywalności Kaplan-Meier Model Kaplan Meier jest powszechnie stosowany również do porównania przeżywalności dwóch lub więcej metod leczenia. Testy stosowane w modelu Kaplana Meiera do porównania przeżywalności: Log Rank (Mantel-Cox) Breslow (Generalized Wilcoxon) Tarone-Ware 28

Model przeżywalności Kaplan-Meier Wyniki testu: Oszacowana średnia przeżycia Błąd Standardow y 95% przedział ufności Wielkość guza Dolna Granica Górna granica <= 2 cm 126,7 1,3 124,2 129,2 2-5 cm 108,5 3,2 102,1 114,8 > 5 cm 63,2 9,7 44,1 82,3 Całkowite 123,0 1,3 120,4 125,6 29

Model przeżywalności Kaplan-Meier Wyniki testów porównujących przeżywalność w grupach Chi-kwadrat df Istotność Log Rank (Mantel-Cox) 32,995 2 Breslow (Generalized Wilcoxon) 31,763 2 Tarone-Ware 33,575 2 0,000 (p<0,001) 0,000 (p<0,001) 0,000 (p<0,001) Wniosek: testy wskazują na istotność różnic w przeżywalności pomiędzy grupami pacjentów z małym (do 2cm), średnim (2-5cm) oraz dużym rozmiarem nowotworu (powyżej 5cm). 30

Model przeżywalności Kaplan-Meier Funkcja hazardu (ryzyka) - przeciwnie do funkcji przeżycia skupia się na pojawieniu niekorzystnego zdarzenia, na przykład śmierci. Przedstawia jakby "negatywne" uzupełnienie informacji niesionej przez funkcję przeżycia. Wartość funkcji hazardu w momencie t traktujemy jako chwilowy potencjał pojawiającego się zdarzenia (np. śmierci lub choroby), pod warunkiem że osoba dożyła czasu t. 31