Testowanie hipotez binarnych przy u yciu krzywych ROC

Wielkość: px
Rozpocząć pokaz od strony:

Download "Testowanie hipotez binarnych przy u yciu krzywych ROC"

Transkrypt

1 PRACE ORYGINALNE Jerzy A. MOCZKO Testowanie hipotez binarnych przy u yciu krzywych ROC Binary hypothesis testing with ROC curves Katedra i Zak³ad Informatyki i Statystyki, Uniwersytet Medyczny im. Karola Marcinkowskiego w Poznaniu Kierownik: Prof. zw. dr hab. Jerzy A. Moczko Dodatkowe s³owa kluczowe: krzywa ROC narzêdzia diagnostyczne metody nieparametryczne Additional key words: ROC curve diagnostic tools nonparametric methods Wielokrotnie w badaniach medycznych istnieje potrzeba wyznaczenie pewnych obszarów dla mierzonych parametrów, na podstawie których chcemy podj¹æ decyzjê o wystêpowaniu lub braku jakiejœ nieprawid³owoœci. Artyku³ opisuje wykorzystanie krzywych ROC oraz odnosi uzyskane wyniki do wyników uzyskanych metodami: logistyczn¹, drzew decyzyjnych i przedzia³ów referencyjnych. Podstawowe za³o enia teorii testowania hipotez binarnych Jednym z najbardziej efektywnych i obiektywnych narzêdzi s³u ¹cych do oceny jakoœci techniki pomiarowej bazuj¹cej na testowaniu hipotez binarnych jest analiza krzywych ROC. U ycie tego narzêdzia wymaga spe³nienia dwóch za³o eñ: 1. prawdziwy stan badanego obiektu wyra ony jest w dychotomicznej skali nominalnej 2. pomiar wielkoœci diagnozuj¹cej ten stan realizowany jest w skali interwa³owej Pierwsze za³o enie prowadzi do sytuacji, w której mamy do czynienia z dwoma wykluczaj¹cymi siê kategoriami np. patologia - norma, pozytywny - negatywny, yje - zgon itp. Wynik takiego pomiaru i jego porównanie z rzeczywistoœci¹ mo na przedstawiæ przy pomocy prostej tablicy kontyngencji 2 2 uwidocznionej w tabeli I. Wiersze tej tablicy odpowiadaj¹ uzyskanej wartoœci pomiarowej ( wynik przeprowadzonego testu np. pozytywny lub negatywny), kolumny zaœ przedstawiaj¹ sytuacjê rzeczywist¹. W tym miejscu nale y podkreœliæ, e struktura tabeli bêdzie œciœle zale- eæ od przyjêtej definicji pozytywnego wyniku testu: czy wynik pozytywny oznacza istnienie nieprawid³owoœci (np. istnienie choroby), czy te odwrotnie wynik pozytywny wyra a brak nieprawid³owoœci (np. choroba nie wystêpuje). W tabeli I przyjêto pierwsz¹ In medical research we frequently need to delimit some areas of the measured parameters to use them in diagnosing existence of some kind of abnormality. The usage of ROC curves and comparison of obtained results to the outcomes of logistic analysis, decision trees and reference intervals is described. z mo liwoœci. Jak widaæ, pozytywny wynik testu mo e pojawiæ siê zarówno w obiektach, w których w rzeczywistoœci wystêpuje nieprawid³owoœæ (wynik prawdziwie pozytywny TP), jak i w obiektach, w których w rzeczywistoœci brak jest nieprawid³owoœci (wynik fa³szywie pozytywny FP). Podobnie, wynik negatywny mo e wyst¹piæ w przypadku, gdy obiekt rzeczywiœcie nie posiada nieprawid³owoœci (prawdziwie negatywny TN), jak i w sytuacji, gdy nieprawid³owoœæ wystêpuje (fa³szywie negatywny - FN). Liczby przypadków wystêpuj¹cych w poszczególnych kategoriach pozwalaj¹ nam na ocenê jakoœci wykonywanego testu. Wprowadza siê dwie definicje: 1. czu³oœæ - miara okreœlaj¹ca frakcjê obiektów, u których rzeczywiœcie wystêpuje nieprawid³owoœæ spoœród wszystkich obiektów a test da³ wynik pozytywny CZU OŒÆ = TP / (TP + FN) 2. swoistoœæ - miara okreœlaj¹ca frakcjê obiektów, u których w rzeczywistoœci brak jest nieprawid³owoœci a test da³ wynik negatywny. SWOISTOŒÆ = TN / (TN + FP) Jak widaæ z definicji, obie miary mog¹ przyjmowaæ wartoœci z przedzia³u domkniêtego <0,1> Adres do korespondencji: Prof. dr hab. Jerzy A. Moczko Katedra i Zak³ad Informatyki i Statystyki Uniwersytet Medyczny im. Karola Marcinkowskiego Poznañ, ul. D¹browskiego 79 Tel.;/Fax: (+61) Tabela I Definicje liczby przypadków prawdziwie pozytywnych, prawdziwie negatywnych, fa³szywie pozytywnych i fa³szywie negatywnych. Definitions of numbers of true positive, true negative, false positive and false negative cases. Wynik testu Pozytywny (nieprawid³owoœæ wystêpuje) Negatywny (brak nieprawid³owoœci) Nieprawid³owoœæ wystêpuje Rzeczywistoœæ Brak nieprawid³owoœci P rawdziwie pozytywny (TP) Fa³szywie pozytywny (FP) F a³szywie negatywny (FN) Prawdziwie negatywny (TN) 671

2 Tabela II Wyniki analizy ROC dla predyktorów BMI i WAIST. Results of ROC analysis for BMI and WAIST predictors. Najwy sza jakoœæ testu wystêpuje, gdy obie miary osi¹gaj¹ wartoœæ graniczn¹ równ¹ jeden. Poniewa dla ustalonego kryterium definiuj¹cego stan nieprawid³owy od prawid³owego wzrost czu³oœci testu powoduje spadek swoistoœci (i vice versa), w zale noœci od konkretnej sytuacji stosuje siê rozmaite strategie. W przypadku chorób groÿnych dla ycia lub nieuleczalnych wybiera siê z regu³y wysok¹ swoistoœæ testu (kosztem czu³oœci), aby unikaæ postawienia diagnozy fa³szywie dodatniej. W przypadku chorób ³atwo poddaj¹cych siê leczeniu tendencj¹ staje siê wybór testu o maksymalnej czu³oœci. Nale y jednak pamiêtaæ, e ani czu³oœæ ani swoistoœæ testu nie odpowie na pytanie: je eli test jest dodatni, to jaka jest szansa tego, e obiekt ma nieprawid³owoœæ? Podobnie, wartoœci te nie okreœlaj¹ szansy tego, e je eli test jest ujemny, to obiekt nie ma nieprawid³owoœci. Tabela III Liczby przypadków prawdziwie pozytywnych, prawdziwie negatywnych, fa³szywie pozytywnych i fa³szywie negatywnych dla rozmaitych wartoœci odciêcia parametru BMI. Number of true positive, true negative, false positive and false negative cases for different cutoff levels for BMI. Predykcyjna wartoœæ testu Na podstawie definicji z tabeli I mo emy równie wyznaczyæ wartoœci predykcyjne okreœlaj¹ce prawdopodobieñstwo tego, czy osobnik ma badan¹ nieprawid³owoœæ czy te nie, na podstawie takich a nie innych wyników stosowanego testu. Do wartoœci predykcyjnych nale ¹: 1. dodatnia wartoœæ predykcyjna - frakcja obiektów z pozytywnym wynikiem testu, u których rzeczywiœcie wystêpuje nieprawid³owoœæ DODATNIA WARTOŒÆ PREDYKCYJ- NA = TP / (TP + FP) 2. ujemna wartoœæ predykcyjna - frakcja obiektów z negatywnym wynikiem testu, które rzeczywiœcie nie maj¹ nieprawid³owoœci. UJEMNA WARTOŒÆ PREDYKCYJNA = TN / (TN + FN) Podobnie, jak czu³oœæ i swoistoœæ, dodatnia i ujemna wartoœæ predykcyjna przybieraj¹ wartoœci z przedzia³u domkniêtego <0,1>. Mo na dla nich wyznaczyæ przedzia³y ufnoœci zgodnie ze wzorem gdzie u a to wartoœæ krytyczna rozk³adu p (1- p) { p -[ ua ], p + [ ua n p (1- p) ]} n normalnego na poziomie istotnoœci a, p - oznacza wartoœæ prawdopodobieñstwa (dodatni¹ lub ujemn¹ wartoœæ predykcyjn¹), zaœ n jest odpowiednio równe (TP + FP) lub (TN + FN). W przypadku, gdy iloczyn n * p lub n * (1-p) jest mniejszy od 5, do wyznaczenia dok³adnych przedzia³ów ufnoœci wykorzystuje siê rozk³ad dwumianowy. Nale y pamiêtaæ o fakcie, e wartoœci predykcyjne s¹ œciœle zale ne od rozpowszechnienia nieprawid³owoœci w badanej populacji, tzw. prewalencji. Zgodnie z notacj¹ przyjêt¹ w tabeli I PREWALENCJA = ( TP + FN) / ( TP + TN + FP + FN ) Im ni sza jest prewalencja nieprawid³o- 672 J.A. Moczko

3 woœci, tym ni szy jest stosunek TP / FP. W trakcie badañ nad nowo wprowadzanym testem dobiera siê zazwyczaj liczebnoœæ obiektów z nieprawid³owoœci¹ i bez niej w sposób zbalansowany. Jednak e w rzeczywistej populacji prewalencja nieprawid³owoœci mo e siê istotnie ró niæ od tej u ytej w próbie. W literaturze przedmiotu stosowana jest nastêpuj¹ca regu³a mnemoniczna: 1. wykluczenie nieprawid³owoœci - poniewa chcemy mieæ wysoki stopieñ pewnoœci, e wynik ujemny testu jest rzeczywiœcie ujemnym, musimy d¹ yæ do jak najmniejszej liczby przypadków fa³szywie ujemnych (FN). Wysoka czu³oœæ testu u³atwia wykluczenie obiektu przy negatywnym wyniku badania (regu³a SNOUT - sensitive => OUT) 2. potwierdzenie wystêpowania nieprawid³owoœci - test pozytywny powinien wskazywaæ na rzeczywiste istnienie nieprawid³owoœci. Wysoka swoistoœæ testu pomaga na w³¹czenie obiektu do grupy obiektów z nieprawid³owoœci¹ przy za³o eniu otrzymania pozytywnego wyniku testu (regu³a SPIN - specific => IN) Ocena osi¹gów testu iloœciowego Zdecydowana wiêkszoœæ testów laboratoryjnych opiera siê o pomiary wykonane w skali interwa³owej. Z regu³y cechuje je bardzo wysoka dok³adnoœæ. Zawsze pojawia siê jednak problem w³aœciwej oceny punktu odciêcia lub przedzia³u referencyjnego kwalifikuj¹cego pomiar jako prawid³owy lub nieprawid³owy. Jak ³atwo zauwa yæ na podstawie definicji zamieszczonych w tabeli I liczebnoœci TP, FN, FP i TN œciœle zale ¹ od wartoœci kryterium odciêcia oddzielaj¹cego stan prawid³owy od nieprawid³owego. Na rycinach 1 i 2 przedstawiono ilustracjê dwóch mo liwych sytuacji: jednoznacznego i niejednoznacznego rozdzielenia obszarów, do których mo e nale eæ badany obiekt. Zmiana tej wartoœci wp³ywa zatem na czu³oœæ i swoistoœæ stosowanego testu. Nale y zbadaæ zatem, jak zmieniaj¹ siê osi¹gi testu diagnostycznego (the performance of a diagnostic test) w ca³ym zakresie zmiennoœci mierzonego parametru. W tym celu konstruowane s¹ krzywe ROC (Receiver Operating Characteristic) [2]. Wykreœlona zostaje zale noœæ czu³oœci testu ( oœ wertykalna) w funkcji (1 swoistoœci) (oœ horyzontalna). Rycina 3 przedstawia przyk³adowy kszta³t krzywej ROC dla testu wykrywaj¹cego stan cukrzycowy na podstawie poziomu glukozy. Poniewa zarówno maksymalne wartoœci czu³oœci, jak i swoistoœci wynosz¹ 1, ca³kowite pole utworzonego przez osie kwadratu wynosi 1. Je eli przebieg krzywej ROC nastêpuje dok³adnie po osiach lewej i górnej, pole zawarte pod t¹ krzyw¹ (bêdziemy je oznaczaæ symbolem AUC Area Under Curve) wynosi 1, co interpretujemy jako pe³n¹ 100% zdolnoœæ dyskryminacyjn¹ testu. W praktyce sytuacja ta zdarza siê niezwykle rzadko i zazwyczaj krzywa ROC przebiega powy ej diagonalnej ³¹cz¹cej punkty o wspó³rzêdnych (0,0) oraz (1,1). W przypadku, gdy krzywa ROC le y dok³adnie na diagonalnej moc dyskryminacyjna testu jest zerowa. Wa n¹ w³aœciwoœci¹ Rycina 1 Krzywa ROC ilustruj¹ca osi¹gi testu opartego na pomiarze poziomu cukru we krwi w dyskryminacji cukrzycy - przypadek pe³nej dyskryminacji. ROC curve for analysis of performance of diagnostic test detecting diabetes based on glucose level in blood - the case of total discrimination. Rycina 2 Krzywa ROC ilustruj¹ca osi¹gi testu opartego na pomiarze poziomu cukru we krwi w dyskryminacji cukrzycy - przypadek czêœciowej dyskryminacji. ROC curve for analysis of performance of diagnostic test detecting diabetes based on glucose level in blood - the case of partial discrimination. krzywych ROC jest ich ca³kowita niezale - noœæ od u ytych jednostek. Jako miarê mocy dyskryminacyjnej przyjmuje siê zatem wielkoœæ pola pod krzyw¹ ROC. Do jego wyznaczenia stosowane s¹ dwie metody: 1. teoretyczna bazuj¹ca na za³o eniu binormalnoœci rozk³adu mierzonego parametru; 2. empiryczna nie zak³adaj¹ca a priori adnego szczególnego kszta³tu rozk³adu. Metoda pierwsza, opracowana przez Metza [3,4] daje g³adkie przebiegi krzywych ROC, jednak e silne za³o enie co do kszta³tu rozk³adu danych w podgrupach powoduje, e dobrze dzia³a dla stosunkowo du ych liczebnoœci próby lub wymaga stosowania odpowiednich transformacji danych. Dlatego metoda empiryczna opracowana przez Delonga i wsp. [1], nie zak³adaj¹ca adnego rozk³adu zdobywa coraz wiêksze powodzenie. Nale y jednak e pamiêtaæ, e do prawid³owego oszacowania AUC trzeba dokonaæ wyznaczenia czu³oœci i swoistoœci dla co najmniej 8 ró nych progów odciêcia. Jak wykazano, mniejsza progów prowadzi do istotnego zani enia wartoœci pola pod krzyw¹ ROC. Dla obu testów stosuje siê z-test do odpowiedzi na pytanie, czy uzyskane pole ró ni siê od wartoœci 0,5 istotnie statystycznie. Aby ten test dawa³ prawid³owe 673

4 Rycina 3 Krzywa ROC ilustruj¹ca osi¹gi testu opartego na pomiarze poziomu cukru we krwi w dyskryminacji cukrzycy - przypadek czêœciowej dyskryminacji. ROC curve for analysis of performance of diagnostic test detecting diabetes based on glucose level in blood - the case of partial discrimination. Rycina 4 Krzywe ROC dla predyktorów BMI i WAIST. ROC curves for BMI and WAIST predictors. Rycina 5 Ocena progu referencyjnego dla parametru BMI na podstawie wykresu zale noœci krzywych czu³oœci i swoistoœci w funkcji wartoœci BMI. Estimation of reference threshold level for BMI based on chart of dependence of sensitivity and specificity as a function of BMI value. oszacowania, w ka dej z obu grup ( z nieprawid³owoœci¹ i bez niej) musimy mieæ co najmniej 30 pomiarów. Czêsto samo wyznaczenie AUC nie jest wystarczaj¹ce samo w sobie i chcemy dokonywaæ porównañ osi¹gów dwóch lub wiêkszej liczby testów [6]. Dla przyk³adu, obok istniej¹cej metody uwa anej za z³oty standard w wykrywaniu zatoru krwi w mózgu (angiografii) próbujemy wprowadziæ now¹, nieinwazyjn¹ technikê opart¹ o tomografiê PET. Musimy dokonaæ weryfikacji hipotezy H 0 : AUC ANGIO = AUC PET. Wiêkszoœæ profesjonalnych programów statystycznych ma wbudowane procedury do przeprowadzenia tych obliczeñ. Poniewa wiele z omówionych do tej pory zagadnieñ sprawia pocz¹tkuj¹cym eksperymentatorom trudnoœæ, jako œwietny materia³ referencyjny mo na poleciæ e-artyku³ Alana Schwarza na temat EBM and Decision Tools zamieszczony na stronie internetowej ~alansz/tools.html Iloraz wiarygodnoœci Iloraz wiarygodnoœci (LR likelihood ratio) dla wyniku dodatniego definiujemy jako stosunek szansy wyniku pozytywnego u obiektu posiadaj¹cego nieprawid³owoœæ do szansy wyniku pozytywnego u obiektu nie maj¹cego tej nieprawid³owoœci. LR + = LR dla wyniku dodatniego = CZU OŒÆ / (1 - SWOISTOŒÆ) Wyra a on szansê, ile razy czêœciej taki a nie inny wynik testu wystêpuje u obiektów z nieprawid³owoœci¹ w stosunku do obiektów bez tej nieprawid³owoœci. Wysoka wartoœæ ilorazu wiarygodnoœci dla wyników pozytywnych œwiadczy o tym, e test dostarcza istotnej informacji klasyfikacyjnej. Przemno enie LR + przez aprioryczn¹ szansê wyst¹pienia nieprawid³owoœci daje w wyniku szansê typu post-hoc dla testu dodatniego. Przyk³ad analizy danych metod¹ ROC Wprowadzone w poprzednich rozdzia- ³ach definicje zastosujemy w praktyce wykorzystuj¹c fragment bazy danych opracowanej w ramach programu badawczego HERS (Heart and Estrogen/progestin Replacement Study Research Group). Jest on dostêpny pod adresem internetowym /www.biostat.ucsf.edu/vgsm/data.html i zawiera 40 predyktorów opisuj¹cych stan 2763 pacjentek. Na podstawie tych danych spróbujemy odpowiedzieæ na pytanie, czy wskaÿnik BMI i obwód w pasie mog¹ byæ czynnikami prognostycznymi w wystêpowaniu cukrzycy. Obliczeñ dokonamy przy u yciu programu Analyse-it for Microsoft Excel v.2.11 ( Analyse-it Software, Ltd). Dychotomiczna zmienna DIABETES okreœla wystêpowanie (kod 1) lub brak (kod 0) cukrzycy. Predyktory BMI oraz WAIST pomierzone s¹ w skali interwa³owej. Wyniki analiz zosta³y zamieszczone na kolejnych rycinach i tabelach. W badanej próbie oko³o dwie trzecie stanowi¹ osoby bez cukrzycy (2072), jedn¹ trzeci¹ osoby ze zdiagnozowan¹ cukrzyc¹ (731). Pozwala to na oszacowanie prewalencji cukrzycy na wartoœæ 0,265 (aprioryczne prawdopodobieñstwo wystêpowania cukrzycy w badanej populacji nie uwzglêdniaj¹ce wystêpowania jakiegokol- 674 J.A. Moczko

5 Rycina 6 Ocena progu referencyjnego dla parametru BMI na podstawie wykresu zale noœci krzywych czu³oœci i swoistoœci w funkcji wartoœci BMI. Estimation of reference threshold level for BMI based on chart of dependence of sensitivity and specificity as a function of BMI value. Rycina 7 Wyniki analizy przeprowadzonej metod¹ interaktywn¹ konstrukcji drzew C&RT dla danych HERS. The results of analysis with interactive trees C&RT method of HERS data. wiek objawu). Z tabeli II wynika, e oba predyktory wykazuj¹ istotn¹ przydatnoœæ dyskryminacyjn¹ (p<0,0001). Poniewa pole pod krzyw¹ ROC dla WAIST jest wiêksze (AUC=0,71) ni dla BMI (AUC=0,68) a ró nica pól 0.03 jest równie istotna statystycznie (p< 0,0001), 95% przedzia³ istotnoœci dla ró nicy (-0,04; -0,02) nie zawiera zera) mo emy wnioskowaæ, e lepsze wartoœci dyskryminuj¹ce posiada parametr WAIST (rycina 4). B³¹d, którym obarczony jest pomiar pola dla obu krzywych jest jednakowy i wynosi SE=0,011. W tabeli III zestawiono liczby przypadków prawdziwie pozytywnych, prawdziwie negatywnych, fa³szywie pozytywnych i fa³szywie negatywnych dla rozmaitych wartoœci odciêcia parametru BMI, przy u yciu których wyznaczane s¹ czu³oœæ i swoistoœæ badanego testu. Wartoœci tych ostatnich zestawiono w tabeli IV a dla ka dej wartoœci wyznaczono 95% przedzia³ ufnoœci pozwalaj¹cy na okreœlenie wartoœci danego parametru w populacji. Analogiczne obliczenia przeprowadzane s¹ dla parametru WAIST. Reprezentacjê graficzn¹ uzyskanych wyników przedstawiono na rycinie 4 w postaci dwóch krzywych ROC. Jak widaæ, krzywa WAIST le y zawsze ponad krzyw¹ BMI potwierdzaj¹c wy sz¹ przydatnoœæ dyskryminacyjn¹ pierwszego predykatora. Pozostaje problem wyboru punktu odciêcia wartoœci referencyjnej parametru, powy ej której pomiar bêdziemy klasyfikowaæ, jako potencjalny prognostyk stanu cukrzycy. Istnieje kilka sposobów podejœcia do tego zagadnienia. Pierwszy z nich ilustruje rycina 5 dla parametru BMI. Przedstawiamy przebieg krzywej czu- ³oœci i swoistoœci w funkcji wartoœci parametru BMI. Punkt przeciêcia obu krzywych (BMI=28) stanowi poszukiwan¹ wartoœæ referencyjn¹ i oznacza miejsce, w którym wystêpuje maksymalna liczba przypadków prawid³owo zidentyfikowanych jako prawid³owe b¹dÿ nieprawid³owe. Mo emy zatem przyj¹æ, e wartoœci BMI > 28 mog¹ byæ potencjalnym wskaÿnikiem wskazuj¹cym na mo liwoœæ wyst¹pienia cukrzycy. Pamiêtajmy jednak, e jest to jedynie wskaÿnik probabilistyczny, gdy w punkcie BMI=28 czu- ³oœæ testu wynosi 0,644 a jego swoistoœæ 0,626. Oznacza to w przybli eniu, e na ka dych trzech pacjentów z cukrzyc¹ parametr BMI > 28 pozwala prawid³owo wykryæ cukrzycê (bez jakichkolwiek innych badañ) u dwóch z nich, jeden z nich zostanie b³êdnie uznany za osobnika bez cukrzycy. Podobna analiza dla obwodu w pasie daje próg referencyjny WAIST > 94 cm. Opisana procedura bazuje na za³o eniu w przybli eniu jednakowego prawdopodobieñstwa pope³nienia b³êdu I i II rodzaju. Nale y jednak pamiêtaæ, e w badaniach przesiewowych to za³o enie nie jest optymalne, bo bardziej nam zale y na wysokiej czu³oœci metody nawet kosztem zwiêkszenia liczby przypadków fa³szywie pozytywnych. Druga metoda wyznaczenia progu referencyjnego bazuje na analizie ilorazu wiarygodnoœci dla wyniku dodatniego. W tabeli V zamieszczono obliczone wartoœci tego ilorazu (zarówno dla wyniku pozytywnego, jak i negatywnego) w funkcji wartoœci parametru odciêcia. Graficznie wyniki te przedstawiono na rycinie 6. Jak widaæ, najwy sza wartoœæ LR + wynosz¹ca 4,82 otrzymana jest dla BMI=41. Oznacza to, e wynik dodatni jest niemal 5 razy bardziej prawdopodobny u osobnika maj¹cego cukrzycê ni u osobnika niechoruj¹cego na tê chorobê. Oba wyniki znacznie siê od siebie ró - ni¹, gdy ró ne s¹ ostateczne cele optymalizacji. Dla przyk³adu, stosuje siê optymalizacjê opart¹ o tzw. funkcjê kosztu (np. koszt leczenia). Nie istnieje jedno, bezwzglêdnie prawid³owe kryterium. 675

6 Tabela IV Wartoœci czu³oœci i swoistoœci testu wykorzystuj¹cego predyktor BMI do detekcji cukrzycy. Sensitivity and specificity of test based on BMI predictor in diabetes detection Tabela V Ocena progu referencyjnego dla parametru BMI - obliczenie ilorazów wiarygodnoœci dla wyniku dodatniego i ujemnego. Estimation of reference threshold level for BMI - likelihood ratio for positive and negative result. Tabela VI Wyniki analizy logistycznej dla danych HERS. The results of logistic analysis of HERS data. 676 J.A. Moczko

7 Rycina 8a Analiza przedzia³ów referencyjnych metod¹ Solberga dla parametru BMI (osoby bez cukrzycy). Reference intervals estimated with Solberg method for BMI ( non diabetes cases). Rycina 8b Analiza przedzia³ów referencyjnych metod¹ Solberga dla parametru WAIST (osoby bez cukrzycy). Reference intervals estimated with Solberg method for WAIST ( non diabetes cases). 677

8 Rycina 9a Analiza przedzia³ów referencyjnych metod¹ Solberga dla parametru BMI (osoby z cukrzyc¹). Reference intervals estimated with Solberg method for BMI (diabetes cases). Rycina 9b Analiza przedzia³ów referencyjnych metod¹ Solberga dla parametru WAIST (osoby z cukrzyc¹). Reference intervals estimated with Solberg method for WAIST (diabetes cases). 678 J.A. Moczko

9 Porównanie z wynikami otrzymanymi innymi metodami Na zakoñczenie spróbujmy porównaæ uzyskane wyniki z innymi podejœciami do rozwi¹zania naszego problemu. Czy na podstawie u ytych danych mo emy próbowaæ prognozowaæ na podstawie parametru BMI i/lub WAIST na temat wystêpowania u danego osobnika cukrzycy? Najpierw u yjemy do tego analizy logistycznej a obliczeñ dokonamy pakietem STATISTICA v.8.0. Z wyników przedstawionych w tabeli VI widaæ, e próba dopasowania modelu logistycznego zakoñczy³a siê eliminacj¹ wskaÿnika BMI jako nieistotnego statystycznie a uzyskany model bazuj¹cy wy³¹cznie na bazie parametru WAIST oraz sta³ej B0 prawid³owo wyklucza osoby nie maj¹ce cukrzycy (1932 przypadki, 95,2 % w³aœciwych wskazañ), natomiast bardzo s³abo radzi sobie z wykrywaniem przypadków z cukrzyc¹ (121 przypadków, 16,6% w³aœciwych wskazañ). Co wiêcej, s¹ to wyniki uzyskane na zbiorze ucz¹cym, wiêc wtórna weryfikacja na zbiorze testuj¹cym lub kroswalidacja da jeszcze s³absze rezultaty. Wykluczenie parametru BMI nast¹pi³o, dlatego i oba parametry s¹ ze sob¹ silnie skorelowane i dlatego do wyt³umaczenia zmiennoœci zmiennej zale nej ca³kowicie wystarczy jeden z nich ( i podobnie, jak to wykazano analiz¹ krzywych ROC lepsze w³aœciwoœci dyskryminuj¹ce wykazuje parametr WAIST). Z kolei zastosujmy jedn¹ z technik zg³êbiania danych (data mining) interakcyjne drzewa klasyfikacyjne. Podobnie jak przy u yciu poprzednich metod potwierdzona zostaje przewaga zdolnoœci dyskryminacyjnej parametru WAIST nad BMI. Podzia³ pierwszego poziomu nastêpuje dla wartoœci odciêcia WAIST=94,5 cm, co niemal idealnie pokrywa siê z wynikiem uzyskanym metod¹ ROC. Uzyskane wêz³y terminalne nie s¹ czyste (nie prowadz¹ do jednoznacznej klasyfikacji) i dlatego wygenerowano kolejny poziom. Jak widaæ, poziom WA- IST=107,5 cm pozwala wytworzyæ wêze³ ID=7 o przewadze przypadków z rozpoznaniem cukrzycy. Poziom poprawnej klasyfikacji dla zbioru ucz¹cego jest niemal identyczny, jak w przypadku analizy logistycznej i wynosi 74,6%. Zwraca uwagê znaczna poprawa wykrywania przypadków z istniej¹c¹ cukrzyc¹ (26,4% w porównaniu do 16,6% metod¹ analizy logistycznej). Wyniki analizy prezentuje rycina 7. Spróbujemy na koniec znaleÿæ wartoœci referencyjne nieparametryczn¹ metod¹ Solberga [5]. Ryciny 8a i 8b przedstawiaj¹ wartoœci referencyjne obu parametrów dla osób bez cukrzycy, ryciny 9a i 9b dla osób z cukrzyc¹. Równie ta metoda pozwala wnioskowaæ o przewadze dyskryminacyjnej parametru WAIST (wspólny obszar przedzia³ów referencyjnych osób z cukrzyc¹ i bez cukrzycy dla WAIST wynosi oko³o 7%, podczas gdy dla BMI a 79%). Podsumowuj¹c, po przeprowadzeniu powy szych obliczeñ nale y sk³oniæ siê do koñcowego stwierdzenia, e nie istnieje jednoznaczna norma progowa dla analizowanych parametrów jako wartoœci granicznej separuj¹cej jednoznacznie grupê osób z cukrzyc¹ i bez niej. Nale y j¹ zast¹piæ norm¹ przedzia³ow¹ okreœlaj¹c¹ trzy obszary: z nieprawid³owoœci¹, bez nieprawid³owoœci oraz obszar niejednoznaczny wymagaj¹cy dodatkowej analizy. Parametry BMI i WA- IST z oczywistych wzglêdów nie mog¹ byæ jedynymi wyznacznikami wystêpowania stanu cukrzycowego i prawid³owy model dyskryminacyjny musi zawieraæ dodatkowe predyktory (np. poziom glukozy). Jednak e zarówno BMI, jak i WAIST nios¹ przydatn¹ w ró nicowaniu analizowanego stanu informacjê i mog¹ byæ traktowane jako istotne, uzupe³niaj¹ce i podwy szaj¹ce jego jakoœæ elementy modelu dyskryminacyjnego. Piœmiennictwo 1. DeLong E.R., DeLong D.M., Clarke-Pearson D.L.: Comparing the areas under two or more correlated receiver operating characteristic curves: A non-parametric approach. Biometrics. 1988, 44, Hanley J.A., McNeil B.J.: Meaning and use of the area under an ROC curve. Diag. Radiol. 1982, 143, Metz C.E.: ROC methodology in radiologic imaging. Invest. Radiol. 1986, 21, Metz C.E.: Some practical issues of experimental design and data analysis in radiological ROC studies. Invest. Radiol. 1989, 24, Solberg H.E.: Statistical treatment of collected references values. Determination of reference limits (Part 5). J. Clin. Chem. Clin. Biochem. 1987, 25, Xiao-Hua Zhou, Obuchowski N.A., McClish D.K.: Statistical methods in diagnostic Medicine, John Wiley & Sons,

Mikromacierze DNA analiza danych

Mikromacierze DNA analiza danych PRACE PRZEGL DOWE Mikromacierze DNA analiza danych Piotr Stêpniak 1, Luiza Handschuh 1,2, Marek Figlerowicz 1 1 Centrum Doskona³oœci CENAT, Instytut Chemii Bioorganicznej, Polska Akademia Nauk, Poznañ

Bardziej szczegółowo

Statistical issues significantly important in medical research

Statistical issues significantly important in medical research Alergia Astma Immunologia, 2003, Gellerstedt 8(1), 25-32 M. Istotne znaczenie statystyki w badaniach medycznych 25 Istotne znaczenie statystyki w badaniach medycznych Statistical issues significantly important

Bardziej szczegółowo

Adaptacja kluczowych miar efektywnoœci strategii TPM w warunkach kopalni wêgla kamiennego

Adaptacja kluczowych miar efektywnoœci strategii TPM w warunkach kopalni wêgla kamiennego Zeszyty Naukowe Instytutu Gospodarki Surowcami Mineralnymi i Energi¹ Polskiej Akademii Nauk nr 87, rok 2014 Rafa³ POLAK* Adaptacja kluczowych miar efektywnoœci strategii TPM w warunkach kopalni wêgla kamiennego

Bardziej szczegółowo

OBIEKTOWA ANALIZA OBRAZÓW OBJECT-BASED IMAGE ANALYSIS. Wstêp

OBIEKTOWA ANALIZA OBRAZÓW OBJECT-BASED IMAGE ANALYSIS. Wstêp POLSKIE TOWARZYSTWO Obiektowa analiza INFORMACJI obrazów PRZESTRZENNEJ ROCZNIKI GEOMATYKI 2006 m TOM IV m ZESZYT 3 11 OBIEKTOWA ANALIZA OBRAZÓW OBJECT-BASED IMAGE ANALYSIS Joanna Adamczyk Katedra Urz¹dzania

Bardziej szczegółowo

ACTA SCIENTIARUM POLONORUM

ACTA SCIENTIARUM POLONORUM ACTA SCIENTIARUM POLONORUM Czasopismo naukowe za³o one w 2001 roku przez polskie uczelnie rolnicze Administratio Locorum Gospodarka Przestrzenna 8(4) 2009 Bydgoszcz Kraków Lublin Olsztyn Poznañ Siedlce

Bardziej szczegółowo

Ocena przydatnoœci diagnostycznej oznaczeñ amylazy, lipazy i elastazy trzustkowej (E1) u chorych z ostrym zapaleniem trzustki

Ocena przydatnoœci diagnostycznej oznaczeñ amylazy, lipazy i elastazy trzustkowej (E1) u chorych z ostrym zapaleniem trzustki PRACE ORYGINALNE ORIGINAL PAPERS Beata Kuœnierz-Cabala Anna Gurda-Duda 2 Józefa Panek Bogdan Solnica Paulina Dumnicka 4 Jan Kulig 2 Ocena przydatnoœci diagnostycznej oznaczeñ amylazy, lipazy i elastazy

Bardziej szczegółowo

Wyýsza Szkoùa Ekonomii i Informatyki w Krakowie ZESZYTY NAUKOWE. Zeszyt nr 8

Wyýsza Szkoùa Ekonomii i Informatyki w Krakowie ZESZYTY NAUKOWE. Zeszyt nr 8 Wyýsza Szkoùa Ekonomii i Informatyki w Krakowie ZESZYTY NAUKOWE Zeszyt nr 8 Kraków 2012 Redaktor Naukowy: prof. dr hab. Henryk Gurgul Sekretarz: mgr Krzysztof K³êk Recenzenci: prof. dr hab. Stanis³aw Belniak

Bardziej szczegółowo

wh e paper budowanie korzystnych relacji z klientami wykorzystanie technik dr¹ enia danych (data mining)

wh e paper budowanie korzystnych relacji z klientami wykorzystanie technik dr¹ enia danych (data mining) budowanie korzystnych relacji z klientami wykorzystanie technik dr¹ enia danych (data mining) Hurtownia zawieraj¹ca dane o klientach i dane marketingowe zosta³a ju zbudowana. Powstaje teraz pytanie, jak

Bardziej szczegółowo

Zastosowanie regresji logistycznej w badaniach eksperymentalnych

Zastosowanie regresji logistycznej w badaniach eksperymentalnych Psychologia Spo eczna 2010 tom 5 2 3 (14) 199 216 ISSN 1896-1800 Zastosowanie regresji logistycznej w badaniach eksperymentalnych Barnaba Danieluk Instytut Psychologii UMCS, Lublin W praktyce badawczej

Bardziej szczegółowo

PRACE ORYGINALNE. Monika MIKLASZEWSKA 1. Przemys³aw KOROHODA 2. Katarzyna ZACHWIEJA 1. Tomasz MROCZEK 3. Dorota DRO D 1. Krystyna SZTEFKO 4

PRACE ORYGINALNE. Monika MIKLASZEWSKA 1. Przemys³aw KOROHODA 2. Katarzyna ZACHWIEJA 1. Tomasz MROCZEK 3. Dorota DRO D 1. Krystyna SZTEFKO 4 Ocena przydatnoœci klinicznej ró nych wzorów, stosowanych do wyliczania filtracji k³êbuszkowej oraz stê enia kreatyniny w surowicy u dzieci po zabiegach w kr¹ eniu pozaustrojowym, do oceny ryzyka wyst¹pienia

Bardziej szczegółowo

PRACE POGL DOWE. piœmiennictwa

PRACE POGL DOWE. piœmiennictwa PRACE POGL DOWE Kinga KISZKA 1 Jerzy HADUCH 1,2 Mieczys³aw PASOWICZ 1 Zastosowanie automatycznych metod wspomagania detekcji (CAD) w radiologii klinicznej. Znaczenie i kierunki rozwoju CAD w ró nych technikach

Bardziej szczegółowo

Wybór efektywnego systemu zarz¹dzania jakoœci¹ w przedsiêbiorstwach na przyk³adzie przemys³u spo ywczego

Wybór efektywnego systemu zarz¹dzania jakoœci¹ w przedsiêbiorstwach na przyk³adzie przemys³u spo ywczego Anna GRÊDA WYBÓR EFEKTYWNEGO SYSTEMU ZARZ DZANIA JAKOŒCI W PRZEDSIÊBIORSTWACH NA PRZYK ADZIE PRZEMYS U SPO YWCZEGO 1 1. Wprowadzenie Jakoœæ jest obecnie traktowana jako niezbêdny element, który powinien

Bardziej szczegółowo

Redakcja: Redaktor naczelna Monika Dziachan PZ Cormay SA Redakcja i korekta Agape

Redakcja: Redaktor naczelna Monika Dziachan PZ Cormay SA Redakcja i korekta Agape SPIS TREŚCI AKTUALNOŚCI Nasz cel 3 proc. światowego rynku Kilka faktów o Orphée Notowania 4 5 CORMAY CORMAY & Orphée Orphée DIAGNOSTYKA NA ŚWIECIE emoglobina A1c w rozpoznawaniu i monitorowaniu cukrzycy

Bardziej szczegółowo

Robert Olszewski, Anna Fiedukowicz. Politechnika Warszawska, Wydzia³ Geodezji i Kartografii, Zak³ad Kartografii

Robert Olszewski, Anna Fiedukowicz. Politechnika Warszawska, Wydzia³ Geodezji i Kartografii, Zak³ad Kartografii EWALUACJA METODYKI POLSKIE PROWADZENIA TOWARZYSTWO ANALIZ PRZESTRZENNYCH INFORMACJI W PRZESTRZENNEJ WIELOREPREZENTACYJNEJ... ROCZNIKI GEOMATYKI 2013 m TOM XI m ZESZYT 5(62) 87 EWALUACJA METODYKI PROWADZENIA

Bardziej szczegółowo

Aspekty metodologiczne u ycia skal jako instrumentów pomiarowych w badaniach epidemiologicznych

Aspekty metodologiczne u ycia skal jako instrumentów pomiarowych w badaniach epidemiologicznych PRACE PG DWE Piotr BRZYSKI Aspekty metodologiczne u ycia skal jako instrumentów pomiarowych w badaniach epidemiologicznych Methodological aspects of use of scales as measurement instruments in epidemiological

Bardziej szczegółowo

Badanie ultrasonograficzne między 11 +0 13 +6 tygodniem ciąży

Badanie ultrasonograficzne między 11 +0 13 +6 tygodniem ciąży Badanie ultrasonograficzne między 11 +0 13 +6 tygodniem ciąży Fetal Medicine Foundation, London 2004 Badanie ultrasonograficzne miêdzy 11 + 0 13 + 6 tygodniem ci¹ y Kypros H. Nicolaides, Piotr Wêgrzyn

Bardziej szczegółowo

ECDA proces bezpoœredniej oceny zewnêtrznej korozji ruroci¹gów

ECDA proces bezpoœredniej oceny zewnêtrznej korozji ruroci¹gów WOJCIECH SOKÓLSKI SPZP Corrpol, Gdañsk Wprowadzenie ECDA proces bezpoœredniej oceny zewnêtrznej korozji ruroci¹gów Przedstawiono podstawowe aspekty wprowadzonego w roku 2002 przez NACE International nadzoru

Bardziej szczegółowo

analityce biznesowej [1]: strony, umiejêtne wykorzystanie posiadanych informacji formu³owanie propozycji umo liwiaj¹cych efektywne

analityce biznesowej [1]: strony, umiejêtne wykorzystanie posiadanych informacji formu³owanie propozycji umo liwiaj¹cych efektywne Katarzyna ROSTEK, Micha³ WITEK ZNACZENIE ANALIZY I RAPORTOWANIA DANYCH W PROCESIE ZARZ DZANIA PRZEDSIÊBIORSTWEM 1. Wprowadzenie W sytuacji dynamicznych zmian gospodarczych brak odpowiednich systemów raportowania

Bardziej szczegółowo

oraz pragmatyczne badania kliniczne

oraz pragmatyczne badania kliniczne PRACE POGL DOWE ukasz KACZYÑSKI 1 Bogdan SOLNICA 1 Pragmatyczne badania kliniczne z randomizacj¹ jako Ÿród³o danych w ocenie efektywnoœci praktycznej technologii medycznych Pragmatic randomized controlled

Bardziej szczegółowo

MESsenger. W tym numerze miêdzy innymi: Optymalizacja konstrukcji DesignSpace i DesignXplorer. Analizy dynamiczne w programach CAD Dynamic Designer

MESsenger. W tym numerze miêdzy innymi: Optymalizacja konstrukcji DesignSpace i DesignXplorer. Analizy dynamiczne w programach CAD Dynamic Designer MESsenger numer 2 I oto mamy drugi numer MESsenger-a. Reakcje czytelników po pierwszym numerze by³y jednoznacznie pozytywne. Dostaliœmy sporo poczty zachêcaj¹cej nas do kontynuacji. To dodaje otuchy. Tym

Bardziej szczegółowo

Dynamika sektora MSP na Pomorzu. Raport z badania ma³ych i œrednich przedsiêbiorstw w ramach Pomorskiego Obserwatorium Gospodarczego II

Dynamika sektora MSP na Pomorzu. Raport z badania ma³ych i œrednich przedsiêbiorstw w ramach Pomorskiego Obserwatorium Gospodarczego II Dynamika sektora MSP na Pomorzu Raport z badania ma³ych i œrednich przedsiêbiorstw w ramach Pomorskiego Obserwatorium Gospodarczego II Gdañsk 2008 Autorzy Piotr Dominiak, Julita Wasilczuk, Nelly Daszkiewicz,

Bardziej szczegółowo

WYBRANE METODY ANALIZY DANYCH JAKOŚCIOWYCH NA PRZYKŁADZIE WYNIKÓW BADAŃ KARDIOLOGICZNYCH

WYBRANE METODY ANALIZY DANYCH JAKOŚCIOWYCH NA PRZYKŁADZIE WYNIKÓW BADAŃ KARDIOLOGICZNYCH WYBRANE METODY ANALIZY DANYCH JAKOŚCIOWYCH NA PRZYKŁADZIE WYNIKÓW BADAŃ KARDIOLOGICZNYCH Jerzy A. Moczko, Uniwersytet Medyczny im. Karola Marcinkowskiego w Poznaniu, Katedra Informatyki i Statystyki Wprowadzenie

Bardziej szczegółowo

ZESZYTY NAUKOWE MA OPOLSKIEJ WY SZEJ SZKO Y EKONOMICZNEJ W TARNOWIE PRACE Z ZAKRESU ZARZ DZANIA ZESZYT 3 LESZKA KOZIO A POD REDAKCJ

ZESZYTY NAUKOWE MA OPOLSKIEJ WY SZEJ SZKO Y EKONOMICZNEJ W TARNOWIE PRACE Z ZAKRESU ZARZ DZANIA ZESZYT 3 LESZKA KOZIO A POD REDAKCJ ZESZYTY NAUKOWE MA OPOLSKIEJ WY SZEJ SZKO Y EKONOMICZNEJ W TARNOWIE ZESZYT 3 PRACE Z ZAKRESU ZARZ DZANIA POD REDAKCJ LESZKA KOZIO A TARNÓW 2000 KOMISJA SENACKA DO SPRAW NAUKI I WYDAWNICTW Józefa Famielec,

Bardziej szczegółowo

Ocena metaboliczna terapii substytucyjnej hydrokortyzonem u pacjentów z pierwotn¹ niedoczynnoœci¹ kory nadnerczy

Ocena metaboliczna terapii substytucyjnej hydrokortyzonem u pacjentów z pierwotn¹ niedoczynnoœci¹ kory nadnerczy PRACE ORYGINALNE Marta FICHNA 1, Maria GRYCZYÑSKA 1 Anna SOWIÑSKA 3 Jerzy SOWIÑSKI 1 Ocena metaboliczna terapii substytucyjnej hydrokortyzonem u pacjentów z pierwotn¹ niedoczynnoœci¹ kory nadnerczy Metabolic

Bardziej szczegółowo

Optymalizacja i walidacja metody ADSRRS-fingerprinting konstrukcja zestawu diagnostycznego do ró nicowania genetycznego drobnoustrojów

Optymalizacja i walidacja metody ADSRRS-fingerprinting konstrukcja zestawu diagnostycznego do ró nicowania genetycznego drobnoustrojów PRACE PRZEGL DOWE Optymalizacja i walidacja metody ADSRRS-fingerprinting konstrukcja zestawu diagnostycznego do ró nicowania genetycznego drobnoustrojów Beata Krawczyk, Krzysztof Lewandowski Katedra Mikrobiologii,

Bardziej szczegółowo

Zastosowanie informatyki wspó³czesnej ISBN 83-61389-00-2. seria wydawnicza Pañstwowej Wy szej Szko³y Zawodowej im. Witelona w Legnicy

Zastosowanie informatyki wspó³czesnej ISBN 83-61389-00-2. seria wydawnicza Pañstwowej Wy szej Szko³y Zawodowej im. Witelona w Legnicy Zastosowanie informatyki wspó³czesnej Zastosowanie informatyki wspó³czesnej ISBN 83-61389-00-2 9 788361 389002 seria wydawnicza Pañstwowej Wy szej Szko³y Zawodowej im. Witelona w Legnicy Seria wydawnicza

Bardziej szczegółowo

KOMPUTEROWE GENEROWANIE DYNAMICZNYCH MAP PERFUZJI MÓZGU, ICH ANALIZA I ZNACZENIE W NEURORADIOLOGII

KOMPUTEROWE GENEROWANIE DYNAMICZNYCH MAP PERFUZJI MÓZGU, ICH ANALIZA I ZNACZENIE W NEURORADIOLOGII ELEKTROTECHNIKA I ELEKTRONIKA TOM 27. ZESZYT 1, 28 Tomasz HACHAJ * KOMPUTEROWE GENEROWANIE DYNAMICZNYCH MAP PERFUZJI MÓZGU, ICH ANALIZA I ZNACZENIE W NEURORADIOLOGII STRESZCZENIE W artykule szczegó³owo

Bardziej szczegółowo

ZMIENNOŒÆ CZASOWA STRUKTURY PRZESTRZENNEJ MAKSYMALNYCH SUM DOBOWYCH OPADÓW. Alfred Stach

ZMIENNOŒÆ CZASOWA STRUKTURY PRZESTRZENNEJ MAKSYMALNYCH SUM DOBOWYCH OPADÓW. Alfred Stach ZMIENNOŒÆ CZASOWA STRUKTURY PRZESTRZENNEJ MAKSYMALNYCH SUM DOBOWYCH OPADÓW Alfred Stach Stach A., 2007: Zmiennoœæ czasowa struktury przestrzennej maksymalnych sum dobowych opadów (Temporal variability

Bardziej szczegółowo

ZNACZENIE PODA Y PIENI DZA W DZIA ALNOŒCI KREDYTOWEJ BANKÓW KOMERCYJNYCH. Emilia Stola

ZNACZENIE PODA Y PIENI DZA W DZIA ALNOŒCI KREDYTOWEJ BANKÓW KOMERCYJNYCH. Emilia Stola ZNACZENIE PODA Y ROCZNIKI PIENI DZA NAUK W DZIA ALNOŒCI ROLNICZYCH, KREDYTOWEJ SERIA G, T. 96, BANKÓW z. 3, 2009KOMERCYJNYCH 41 ZNACZENIE PODA Y PIENI DZA W DZIA ALNOŒCI KREDYTOWEJ BANKÓW KOMERCYJNYCH

Bardziej szczegółowo

4 / 2008 ISSN 1643-1618 ROCZNIK 7

4 / 2008 ISSN 1643-1618 ROCZNIK 7 4 / 2008 ISSN 1643-1618 ROCZNIK 7 W kwartalniku DROGI i MOSTY drukowane s¹ prace naukowe, naukowo techniczne i studialne z dziedziny in ynierii l¹dowej, obejmuj¹ce zagadnienia z zakresu projektowania,

Bardziej szczegółowo