Cel pracy. Copyright StatSoft Polska 2011,

Podobne dokumenty
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

KREATOR REGRESJI LOGISTYCZNEJ

OCENA JAKOŚCI PROGRAMU JEDNOCZASOWEJ TRANSPLANTACJI TRZUSTKI I NERKI ZA POMOCĄ WAŻONEJ RYZYKIEM METODY CUSUM

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

Wprowadzenie do analizy korelacji i regresji

Regresja logistyczna (LOGISTIC)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Regresja linearyzowalna

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Przemysław Pyda. Przeszczepianie trzustki

Metoda Automatycznej Detekcji Interakcji CHAID

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

Informator dla Pacjenta. Przeszczepienie nerki od dawcy żywego

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

PRZESZCZEPIANIE TRZUSTKI

Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość

NOWOŚCI W ZESTAWIE MEDYCZNYM STATISTICA

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

S T R E S Z C Z E N I E

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

PRZYKŁAD WYKORZYSTANIA MODELI SKORINGOWYCH W MEDYCYNIE

Rozdział 8. Regresja. Definiowanie modelu

Testowanie hipotez statystycznych

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Weryfikacja hipotez statystycznych

Statystyka i Analiza Danych

PDF created with FinePrint pdffactory Pro trial version

WYKORZYSTANIE MODELU LOGITOWEGO DO ANALIZY BEZROBOCIA WŚRÓD OSÓB NIEPEŁNOSPRAWNYCH W POLSCE W 2010 ROKU

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Ekonometria, lista zadań nr 6 Zadanie 5 H X 1, X 2, X 3

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

W1. Wprowadzenie. Statystyka opisowa

ANALIZA REGRESJI SPSS

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

Testowanie hipotez statystycznych

MODELE LINIOWE. Dr Wioleta Drobik

Dr Stanisław Szela. Dr Stanisław Szela

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Program konferencji. 13:00-15:40 Sesja pielęgniarska - Rola pielęgniarki w opiece nad pacjentem dializowanym

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Elementarne metody statystyczne 9

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Badanie zależności skala nominalna

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

PROGRAM NAUCZANIA PRZEDMIOTU OBOWIĄZKOWEGO NA WYDZIALE LEKARSKIM I ROK AKADEMICKI 2014/2015 PRZEWODNIK DYDAKTYCZNY dla STUDENTÓW IV ROKU STUDIÓW

Szkolenie Regresja liniowa

Metody komputerowe statystyki Computer Methods in Statistics. Matematyka. Poziom kwalifikacji: II stopnia. Liczba godzin/tydzień: 2W, 3L

Regresja logistyczna. Regresja logistyczna. Wymagania. Przykłady DV

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VII: Regresja logistyczna

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Wydział Matematyki. Testy zgodności. Wykład 03

Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

1.1 Wstęp Literatura... 1

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Analiza danych ilościowych i jakościowych

Regresja i Korelacja

Ocena rozprawy doktorskiej lekarz Sławomira Milczarka. pt.: Polimorfizmy AIF-1 a częstość występowania ostrego odrzucania, opóźnienia

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

Analiza przeżycia. Czym zajmuje się analiza przeżycia? Jest to analiza czasu trwania, zaprojektowana do analizy tzw.

166 Wstęp do statystyki matematycznej

Analiza regresji - weryfikacja założeń

Analiza wariancji - ANOVA

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Modelowanie glikemii w procesie insulinoterapii

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Wydział Medyczny, Uniwersytet Rzeszowski

lek. Olga Możeńska Ocena wybranych parametrów gospodarki wapniowo-fosforanowej w populacji chorych z istotną niedomykalnością zastawki mitralnej

ZAKRES I ZASADY UDZIELANIA POZWOLEŃ MINISTRA ZDROWIA NA POBIERANIE, POZYSKIWANIE, PRZECHOWYWANIE I PRZESZCZEPIANIE NARZĄDÓW

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Zafascynowany samą operacją, jak i związaną z nią atmosferą: specyficzny nastrój mający. właśnie robi się coś ważnego i niezwykłego.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA

Metody statystyki medycznej stosowane w badaniach klinicznych

Sylabus. Opis przedmiotu kształcenia. Nazwa modułu/przedmiotu Statystyka medyczna Grupa szczegółowych efektów kształcenia

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

1 Analizy zmiennych jakościowych

ROZPORZĄDZENIE MINISTRA ZDROWIA 1) z dnia 30 marca 2010 r.

STATYSTYKA MATEMATYCZNA

Testowanie modeli predykcyjnych

1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Własności statystyczne regresji liniowej. Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

3. Modele tendencji czasowej w prognozowaniu

Zalecany Algorytm Poszukiwania i Doboru Niespokrewnionych Dawców Komórek Krwiotwórczych w okresie od 1 października 2018 r. do 30 września 2019 roku.

Transkrypt:

ZASTOSOWANIE REGRESJI LOGISTYCZNEJ DO IDENTYFIKACJI CZYNNIKÓW RYZYKA WYSTĄPIENIA POWIKŁAŃ POOPERACYJNYCH PO JEDNOCZASOWEJ TRANSPLANTACJI TRZUSTKI I NERKI Tadeusz Grochowiecki, Katedra i Klinika Chirurgii Ogólnej, Naczyniowej i Transplantacyjnej, Warszawski Uniwersytet Medyczny Grzegorz Migut, StatSoft Polska Sp. z o.o. Jednoczasowe przeszczepienie trzustki i nerki jest najczęściej wykonywaną transplantacją wielonarządową. Wykonuję się ją celem leczenia chorych z cukrzycą i niewydolnością nerek. Trzustkę i nerkę przeszczepia się podczas jednej, skomplikowanej operacji, która trwa zwykle 7 godzin. Po tej operacji chory nie musi brać insuliny i być podłączany do sztucznej nerki. Jednakże, jak z każdą operacją, i z tą wiąże się ryzyko wystąpienia powikłań. Do identyfikacji i oceny czynników ryzyka związanego z wystąpieniem powikłań chirurgicznych występujących po przeszczepie wykorzystano regresję logistyczną. Przedstawiono proces czyszczenia danych, budowę modeli jednoczynnikowych oraz modelu wieloczynnikowego. Wykonano również analizy oceniające dobroć dopasowania modelu do danych, a także przedstawiono możliwości praktycznego wykorzystania zbudowanego modelu. Cel pracy Celem pracy była identyfikacja czynników ryzyka, które wpływają na wystąpienie powikłań chirurgicznych po jednoczasowej transplantacji trzustki i nerki. Przeanalizowano przebieg pooperacyjny 112 biorców trzustki i nerki pod kątem wystąpienia powikłań. Powikłania podzielono na trzy grupy: pochodzące z przeszczepionej trzustki (PTX) 66 powikłań, pochodzące z przeszczepionej nerki (KTX) 23 powikłania, ogólnochirurgiczne (OGÓLNE) 31 powikłań. Do oceny natężenia powikłania chirurgicznego, które wystąpiło po jednoczasowej transplantacji trzustki i nerki zastosowano skalę prof. Claviena. Natężenie powikłania oceniane jest sposobem leczenia, jakie zastosowano, by powikłanie opanować. Im wyższy stopień, 28

` tym powikłanie poważniejsze. Najwyższy IV stopień to brak opanowania powikłania i zgon chorego (tabela 1). Natężenie powikłań wg Claviena u 112 biorców jednoczasowej transplantacji trzustki i nerki dla poszczególnych grup powikłań przedstawiono w tabeli 2. Tabela 1. Skala natężenia powikłania wg Claviena Stopień natężenia powikłania I (1) II (2) III (3) IIIA (4) IIIB (5) IV (6) IVA (7) IVB (8) Definicja Brak powikłania Zmiana leczenia farmakologicznego np. zmiana antybiotykoterapii, leczenia immunosupresyjnego, wprowadzenie żywienia pozajelitowego, przetoczenie krwi Potrzeba interwencji chirurgicznej oraz inwazyjnej interwencji radiologicznej, endoskopowej Interwencja bez znieczulenia ogólnego Interwencja ze znieczuleniem ogólnym Zaburzenia czynności narządów lub/i zagrożenie życia biorcy Czasowy lub stały brak czynności przeszczepionego narządu Dodatkowo niewydolność innych narządów niż przeszczepione lub/i śmierć biorcy Tabela 2. Natężenie powikłań wg Claviena u 112 biorców jednoczasowej transplantacji trzustki i nerki w poszczególnych grupach powikłań. Natężenie powikłań wg Claviena Powikłania pochodzące z przeszczepionej trzustki (PTX) Powikłania pochodzące z przeszczepionej nerki (KTX) Powikłania ogólnochirurgiczne (OGOLNE) II 7 8 6 IIIA 3 1 3 IIIB 13 6 20 IVA 29 6 0 IVB 14 2 2 Razem 66 23 31 Dla poszczególnych grup powikłań sporządzono listę potencjalnych czynników ryzyka, które przedstawiono w tabeli 3. Natężenia powikłań dla poszczególnych źródeł stanowiły grupę potencjalnych zmiennych zależnych. Jako potencjalne zmienne niezależne wzięto pod uwagę czynniki związane z dawcą, biorcą, techniką chirurgiczną oraz immunosupresją. 29

Tabela 3. Potencjalne czynniki ryzyka wpływające na natężenie powikłań dla każdej grupy. Powikłania związane z: Czynniki związane z dawcą Czynniki związane z biorcą Czynniki związane z techniką chirurgiczną Czynniki związane z immunosupresją przeszczepioną trzustką przeszczepioną nerką ogólnochirurgiczne wiek, płeć, rodzaj śmierci (uraz vs krwawienie podpajęczynówkowe), całkowity czas niedokrwienia przeszczepionej trzustki wiek, płeć, czas trwania cukrzycy, czas dializoterapii, rodzaj dializoterapii, wyprzedzający przeszczep nerki czas zespoleń naczyniowych trzustki, rodzaj rekonstrukcji i zespolenia tętniczego, rodzaj rekonstrukcji i zespolenia żylnego, rodzaj zespolenia jelitowego, wykonanie sfinkterotomii takrolimus vs cyclosporyna; przeciwciała monoklonalne vs poliklonalne wiek, płeć, rodzaj śmierci (uraz vs krwawienie podpajęczynówkowe), całkowity czas niedokrwienia przeszczepionej nerki wiek, płeć, czas trwania cukrzycy, czas dializoterapii, rodzaj dializoterapii, wyprzedzający przeszczep nerki czas zespoleń naczyniowych nerki, rodzaj rekonstrukcji i zespolenia tętniczego takrolimus vs cyclosporyna; przeciwciała monoklonalne vs poliklonalne wiek, płeć, rodzaj śmierci (uraz vs krwawienie podpajęczynówkowe) wiek, płeć, czas trwania cukrzycy, czas dializoterapii, rodzaj dializoterapii, wyprzedzający przeszczep nerki takrolimus vs cyclosporyna; przeciwciała monoklonalne vs poliklonalne Modelowanie ryzyka powikłań Najbardziej popularną i ogólnie przyjętą w zastosowaniach medycznych metodą modelowania zjawisk, gdzie prognozowana jest zmienna jakościowa (mogąca przyjmować jedynie dwie możliwe wartości), jest regresja logistyczna. Swoją popularność zawdzięcza z jednej strony intuicyjnej interpretacji ocen parametrów regresji, które po prostym przekształceniu możemy interpretować jako iloraz szans zajścia modelowanego zjawiska. Obok możliwości opisu modelowanego zjawiska regresja może być wykorzystana jako narzędzie predykcyjne, umożliwiając obliczenie ryzyka wystąpienia komplikacji u konkretnej osoby. Niewątpliwą zaletą tej metody jest również niewielka liczba założeń formalnych ograniczających się de facto do wymogu liniowości predyktorów ilościowych względem logarytmu szansy modelowanego zjawiska [5]. 30

` Regresja logistyczna założenia Model logistyczny bazuje na funkcji logistycznej o postaci: z e f ( z) 1 e Przebieg funkcji logistycznej przedstawia poniższy wykres. z Funkcja logistyczna 1,0 0,8 0,6 0,4 0,2 0,0-10 -8-6 -4-2 0 2 4 6 8 10 Jak widzimy, funkcja logistyczna przyjmuje wartości od 0 do 1. Obserwując zmiany wartości funkcji logistycznej, możemy wyróżnić trzy etapy: dla początkowych wartości argumentu funkcja przyjmuje wartości bliskie 0, od pewnego momentu, po osiągnięciu wartości progowej, następuje nagły wzrost wartości funkcji, następnie, po osiągnięciu pewnej wartości, dla kolejnych wartości argumentów funkcja przyjmuje wartości bliskie 1. Dzięki takiemu kształtowi funkcja pozwala modelować zjawiska, które charakteryzują się zmianą natężenia występowania po osiągnięciu pewnej wartości progowej. Początkowo zmiany wartości funkcji są minimalne i oscylują blisko 0, po osiągnięciu wartości progowej gwałtownie wzrastają do 1. Na podstawie powyższej funkcji definiujemy model logistyczny: exp( 0 1x) P( x) 1 exp( x) 0 1 31

gdzie P(X) oznacza warunkowe prawdopodobieństwo, że prognozowana zmienna przyjmie wartość 1. Prognozowaną zmienną definiujemy w zależności od modelowanego zjawiska jako skłonność wystąpienia powikłań, zapadalność na chorobę itp. lub skłonność odwrotną. Skłonności tej nie jesteśmy jednak w stanie ocenić na podstawie obserwacji historycznego zbioru. Możemy powiedzieć, że jest to cecha nieobserwowalna, ukryta (latent variable). To, co obserwujemy, to pewna realizacja tej skłonności, objawiająca się faktem wystąpienia (lub niewystąpienia) danego zjawiska (np. powikłań). Zmienna ta jest zmienną dyskretną, którą możemy określić mianem zmiennej zastępczej (proxy variable), i ta właśnie zmienna pełni podczas budowy modelu rolę zmiennej zależnej. Podczas budowy modelu za pomocą regresji logistycznej jeden ze stanów zmiennej zależnej kodowany jest jako 0, a drugi jako 1. Zwykle jako wartość 1 kodujemy stan, który bardziej nas interesuje, bądź jest przez nas pożądany, choć nie jest to przyjętą regułą. Jedyną konsekwencją odwrócenia kodowania zmiennej zależnej są odwrotne wartości współczynników regresji, a co za tym idzie, w wyniku otrzymujemy wartość prawdopodobieństwa zajścia zdarzenia przeciwnego w stosunku do pierwotnego kodowania. Jeśli model ten przedstawimy w odniesieniu do szansy zajścia modelowanego zdarzenia, jego postać przedstawia się następująco: P( x) exp( 0 1x) 1 P( x) Obustronne zlogarytmowanie powyższego wzoru sprowadza model do postaci liniowej względem parametrów. Metodyka budowy i walidacji modelu P( x) log 0 1x 1 P( x) Przeprowadzając analizę za pomocą regresji logistycznej, kierowano się zaleceniami opublikowanymi w [2], gdzie zaprezentowano zestaw dobrych praktyk raportowania wyników analizy. Do najważniejszych elementów zawartych tam zaleceń należy zaliczyć: prezentacja wzoru modelu wieloczynnikowego, uzasadnienie uwzględnienia interakcji podczas budowy modelu, przedstawienie poziomu istotności ocen parametrów, przedziałów ufności oraz ilorazu szans, dbałość o dostateczną relację pomiędzy liczbą parametrów modelu a liczebnością mniej licznej z modelowanych klas zmiennej zależnej, zbadanie dobroci dopasowania, np. za pomocą krzywej ROC i testu Hosmera- Lemeshowa, zbadanie wzajemnej korelacji pomiędzy predyktorami, 32

` walidacja modelu za pomocą sprawdzianu krzyżowego lub techniki jacknife lub bootstrap. Powyższe zalecenia były punktem odniesienia dla zaprezentowanych poniżej kroków analizy. Uzupełniono je dodatkowymi analizami, kierując się zaleceniami literatury przedmiotu oraz doświadczeniem autorów. Operacjonalizacja modelowanego ryzyka Regresja logistyczna wymaga, aby modelowane ryzyko powikłań było określone za pomocą zmiennej dychotomicznej przyjmującej dwa stany (wystąpiło\nie wystąpiło powikłanie) 16. Dlatego też pierwszym krokiem przeprowadzonej analizy była operacjonalizacja zmiennej zależnej. Przedstawiona powyżej skala Claviena, oceniająca stopień natężenia dla poszczególnych grup powikłań, była podstawą do zdefiniowania zmiennej zależnej, będącej obiektem modelowania. O wyborze zmiennej zależnej zadecydowała merytoryczna ocena nasilenia stopnia powikłań oraz analiza liczebności powikłań w poszczególnych stopniach natężenia. Po rozważeniu tych uwarunkowań ustalono, że można przeanalizować jedynie grupę biorców, u których wystąpiło śmiertelne powikłanie po transplantacji z powodu przeszczepionej trzustki. Liczba powikłań ogólnochirurgicznych oraz ze strony nerki była niewystarczająca, aby umożliwić przeprowadzenie miarodajnej analizy statystycznej. Wstępna analiza danych Kolejnym etapem analizy było ocena jakości potencjalnych predyktorów wyszczególnionych w analizie (tabela 3). Część zmiennych ilościowych zawierała braki danych, najczęściej wynikające bądź z niedostępności informacji, bądź z nieadekwatności sytuacji danego pacjenta w odniesieniu do analizowanej cechy. Ponieważ usunięcie przypadków ze zbioru danych mogło uniemożliwić przeprowadzenie analizy, podjęto decyzję o ich imputacji. Spośród dostępnych technik imputacji danych wybrano strategię polegającą na dyskretyzacji zmiennych (podziale zakresu wartości na kategorie); przypadki zawierające braki danych stanowiły osobną kategorię, co umożliwiało dodatkową ocenę losowości wpływu braku danych na analizowane zjawisko. Granice przedziałów dla kategorii określane były na podstawie wiedzy eksperckiej przy wsparciu modułu Dyskretyzacja zmiennych zawartego w programie STATSITICA Zestaw Skoringowy. Poniżej zamieszczono przykładowy wykres dyskretyzacji zmiennej Czas dializ. Zmienna Czas dializ zawierała około 30% braków danych, które utworzyły kategorię BD, pozostałe wartości zmiennej podzielono ekspercko na dwie grupy: na osoby, dla których czas dializ wynosił do 24 miesięcy, oraz osoby, dla których czas dializ wynosił powyżej 24 miesięcy. Poniższy wykres przedstawia ryzyko zgonu dla poszczególnych kategorii, wyrażone za 16 Istnieje możliwość modelowania więcej niż dwóch stanów zmiennej zależnej za pomocą wielomianowej regresji logistycznej, podejście to jednak nie jest powszechnie stosowane. 33

pomocą miary Weight of Evidence 17. Analizując poniższy wykres, możemy zauważyć, że krótszy czas dializ pociąga za sobą niższe ryzyko śmierci; osoby, dla których czas dializ był nieznany, generują ryzyko bardziej zbliżone do kategorii osób dializowanych powyżej 24 miesięcy. Analiza jednoczynnikowa Kolejnym krokiem analizy było wyróżnienie czynników ryzyka istotnie wpływających na wystąpienie powikłań lub zgonu pacjentów. W tym celu dla wszystkich wyróżnionych czynników rokowniczych przeprowadzono jednoczynnikową analizę logistyczną, uzyskując zestaw ocen parametrów regresji wraz z oceną ich istotności, a także obliczone na ich podstawie wartości ilorazu szans. Poniżej zamieszczono wyniki analizy jednoczynnikowej dla wybranych czynników ryzyka. 17 Weight of Evidence nazywany niekiedy w polskiej nomenklaturze wagą dowodu jest obliczany jako logarytm szansy na wystąpienie zgonu w danej kategorii pomnożony razy 100. 34

` Budowa modelu wieloczynnikowego Budowę modelu wieloczynnikowego oparto jedynie na zmiennych niezależnych, których poziom istotności p w analizie jednoczynnikowej był nie większy niż 0,2. Kryterium to zostało uzupełnione oceną współwystępowania czynników ryzyka i eliminacją cech nadmiernie skorelowanych z innymi cechami prognostycznymi. Przykładowo wykonanie sfinkterktomii w 98% pociągało za sobą utworzenie łaty z dwunastnicy. Wprowadzenie obydwóch tych zmiennych do modelu, poza uwzględnieniem w modelu redundantnej informacji, mogło prowadzić do zawyżenia błędów standardowych ocen parametrów regresji, a tym samym prowadzić do błędnej oceny ich istotności. Ze względu na niewielką liczbę przypadków oraz brak merytorycznych przesłanek dotyczących występowania interakcji podjęto decyzję o nieuwzględnianiu ich w modelowaniu. Proces doboru optymalnego zestawu czynników prognostycznych do modelu przeprowadzono za pomocą strategii krokowej wstecznej, rozpoczynając od modelu z wszystkimi potencjalnymi czynnikami prognostycznymi i eliminując w kolejnych krokach nieistotne zmienne. Szczegółowy opis wykonanej procedury można znaleźć w [4]. W wyniku analizy uzyskano model zawierający zmienne objaśniające: wiek dawcy, zespolenie powyżej 35 minut oraz czas dializ poniżej 24 miesięcy. Szczegółowe informacje na temat ocen parametrów regresji zawiera poniższa tabela: Wiek dawcy (lata) oraz Czas zespolenia pow. 35 minut działają stymulująco na ryzyko powikłań ze strony przeszczepionej trzustki. Czas dializ poniżej 24 miesięcy zmniejsza ryzyko wystąpienia powikłań. W modelu zostały zawarte czynniki prognostyczne związane z dawcą: wiek dawcy, z techniką operacyjną: czas zespolenia naczyniowego trzustki przeszczepionej oraz z biorcą: czas dializ. Leczenie immunosupresyjne nie miało znaczenia prognostycznego w tym modelu. Funkcja logistyczna dla modelu przyjęła formę: e 1 e 4,083 0,064* wiek _ dawcy 1,371* czas_ zespolen_ pow_ 35min 1,937* dializy_ pon_ 24mies P( x) 4,083 0,064* wiek _ dawcy 1,371* czas_ zespolen_ pow_ 35min 1,937* dializy_ pon_ 24mies Liczba parametrów zbudowanego modelu przekraczała zalecaną proporcję 10 przypadków rzadszej klasy na jeden parametr regresji, stąd też ważnym elementem oceny modelu było sprawdzenie, czy model nie jest nadmiernie dopasowany do danych. 35

Ocena modelu Ze względu na małą liczność analizowanego zbioru, podczas budowy modelu nie zastosowano podziału na próbę uczącą i próbę testową. Taki podział mógłby znacząco uszczuplić zakres informacji dostępnej podczas modelowania. Model regresji zbudowano więc na całym zbiorze danych. Aby oszacować poziom dopasowania modelu przyjęto technikę walidacji opartą na v-krotnym sprawdzianie krzyżowym. Polega ona na podziale analizowanego zbioru danych na v podzbiorów oraz budowie v modeli dla każdego modelu próbą uczącą było łącznie v-1 prób, próbą testową był kolejny podzbiór danych. Wynik działania modeli na v próbach testowych był podstawą do oceny dobroci dopasowania finalnego modelu. Dzięki tej strategii istniała możliwość oceny jakości dopasowania modelu bez konieczności tworzenia odłożonej próby testowej. Na podstawie analizy powierzchni pod krzywą ROC (Receiver Operating Characteristic curve) możemy stwierdzić, iż model jest dosyć dobrze dopasowany do danych (pole powierzchni wynosi 0,77) i nie jest przeuczony (pola powierzchni krzywych ROC dla próby uczącej i v-krotnej oceny krzyżowej nie różnią się zasadniczo). Test Hosmera-Lemeshowa badający dobroć dopasowania modelu do danych nie daje podstaw do odrzucenia hipotezy o dobrym dopasowaniu modelu. 36

` Praktyczne wykorzystanie modelu Po weryfikacji modelu możemy wykorzystać go w praktyce, oceniając ryzyka wystąpienia śmiertelnego powikłania ze strony trzustki przeszczepionej dla konkretnego biorcy oraz ocenić jakość programu przeszczepiania trzustki w danym szpitalu. Ocena ryzyka wystąpienia śmiertelnego powikłania Ocena ryzyka wystąpienia śmiertelnego powikłania ze strony trzustki przeszczepionej dla konkretnego biorcy daje precyzyjniejszy wgląd w rokowanie. Weźmy pod uwagę biorcę w wieku lat 39, który był dializowany 14 miesięcy, a czas zespolenia naczyniowego trzustki przeszczepionej wynosił 43 minuty. Wartości podstawiamy do wzoru funkcji uzyskanego modelu. P e 1 e 4,083 0,064*39 1,371*1 1,937*1 ( x) 4,083 0,064*39 1,371*1 1,937*1 U analizowanego biorcy prawdopodobieństwo wystąpienia śmiertelnego powikłania z powodu przeszczepionej trzustki wynosi 0,13. Ocena jakości programu przeszczepienia trzustki w danym ośrodku W tym przykładzie chcemy ocenić wyniki przeszczepiania trzustki w danym szpitalu w aspekcie historycznym. Wyróżniono trzy okresy: I okres 1988-1998 25 transplantacji, II okres1999-2003 24 transplantacje, III okres 2004-2010 63 transplantacje. Do oceny wyników, czyli jakości programu przeszczepiania trzustki, zastosowano metodykę stosowaną przez American College of Surgeons. Metodyka ta jest powszechnie uznana w ocenie jakości w chirurgii [3]. Polega na obliczeniu stosunku (O/E ratio) śmiertelności rzeczywistej (O - observed) do śmiertelności oczekiwanej (E - expected). W tym przykładzie z powodu śmiertelnych powikłań, które powstały ze strony przeszczepionej trzustki (wzór poniżej). O/ E O - śmiertelnośćrzeczywista wynikająca ze zgromadzonych danych E - śmiertelnośćoczekiwanaobliczonaz równaniaregresji Interpretacja wyników polega na tym, że jeżeli otrzymamy wartość powyżej 1, ośrodek ma wyższą śmiertelność niż wynikałoby to z ryzyka przedoperacyjnego chorego i typu operacji. Natomiast wynik poniżej 1 świadczy, że ośrodek ma niższą śmiertelność niż wynikałoby z ryzyka przedoperacyjnego chorego i typu operacji. Dla każdego ze 112 biorców wyliczono jego indywidualne prawdopodobieństwa zgonu z powodu powikłań ze strony trzustki przeszczepionej. Można to zrobić, podstawiając do wzoru regresji indywidualne wartości. Prościej można te wartości wyliczyć z programu STATISTICA. 37

Wartości O, E oraz stosunek O/E dla poszczególnych okresów programu transplantacji trzustki podano tabeli 4. Tabela 4. Ocena jakości poszczególnych okresów programu transplantacji trzustki za pomocą wskaźnika O/E. Okres trwania programu I okres 1988-1998 II okres 1999-2003 III okres 2004-2010 lp biorcy liczba biorców w grupie śmiertelność obserwowana (liczba zgonów w grupie) (O) śmiertelność oczekiwana (E) Wskaźnik O/E od 1 do 25 25 6 6,68 0,90 od 26 do 49 24 3 1,77 1,70 od 50 do 112 63 6 6,5 0,92 15 14,95 1,00 W II okresie trwania programu stwierdzono pogorszenie się jakości programu przeszczepiania trzustki, co skorygowano w latach 2004-2010. Literatura 1. Hosmer D., Lemeshow S., Applied Logistic Regression second edition, John Wiley & Sons, Inc, 2000. 2. Kalil A.C. et al., Recommendations for the Assessment and Reporting of Multivariable Logistic Regression in Transplantation Literature, American Journal of Transplantation 2010; 10: 1695 1703, Wiley Periodicals Inc. 3. Khuri, S.F. et al. J Am Coll Surg 1997; 185: 328-338. 4. Stanisz A., Przystępny kurs statystyki z zastosowaniem STATISTICA PL na przykładach z medycyny, StatSoft Polska Sp. z o.o., Kraków 2007. 5. Vittinghoff E., Regression Methods in Biostatistics, Springer-Verlag New York, Inc. 2005. 38