MIARY OCENY RYZYKA. zatem

Podobne dokumenty
TABELE WIELODZIELCZE

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

10/15/2016. Reguła. Czułość PV(+) Bayesa. Swoistość PV(-)

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Sposoby prezentacji problemów w statystyce

statystyka badania epidemiologiczne

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Baza dla predykcji medycznej

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Szkice rozwiązań z R:

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Testy nieparametryczne

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Analiza zależności liniowych

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Badania obserwacyjne 1

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

TEMAT: Pozytywny wynik testu diagnostycznego czy zawsze wyrok?

Wprowadzenie do analizy korelacji i regresji

Wnioskowanie statystyczne. Statystyka w 5

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład 3 Hipotezy statystyczne

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Fetuina i osteopontyna u pacjentów z zespołem metabolicznym

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Testowanie hipotez statystycznych.

Regresja linearyzowalna

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Grupowanie materiału statystycznego

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Zadania ze statystyki, cz.6

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

WYKŁAD TRZECI: OCENA ZWIĄZK PRZYCZYNOWO-SKUTKOWYCH W EPIDEMIOLOGII

Rozkład Gaussa i test χ2

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Zapadalność (epidemiologia)

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM

Badanie zależności skala nominalna

Ocena dokładności diagnozy

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

Wprowadzenie do analizy dyskryminacyjnej

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Wydział Matematyki. Testy zgodności. Wykład 03

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Metody Statystyczne. Metody Statystyczne

WNIOSKOWANIE STATYSTYCZNE

Porównanie dwóch rozkładów normalnych

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VII: Regresja logistyczna

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Analiza współzależności dwóch cech I

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez statystycznych.

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Analiza korespondencji

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Zależność cech (wersja 1.01)

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Jak przekształcać zmienne jakościowe?

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Rozkłady statystyk z próby. Statystyka

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Zadanie 3 Oblicz jeżeli wiadomo, że liczby 8 2,, 1, , tworzą ciąg arytmetyczny. Wyznacz różnicę ciągu. Rozwiązanie:

Transkrypt:

MIARY OCENY RYZYKA Samą wartość statystyki 2 i powiązaną z nią wartość p nie możemy przyjąć, jako miarę siły powiązania i wielkości efektu, zależy ona bowiem od liczebności próby N. Im większe N tym większa wartość 2 i mniejsza wartość p. Natomiast wielkość efektu nie powinna się zmieniać, gdy dowolnie zwiększamy N. Dla tabel 22 mamy trzy miary powiązania związane z pojęciem ryzyka różnica proporcji, ryzyko względne oraz iloraz szans. Dlatego w sprawozdaniach z analizy oprócz wartości 2 i p powinniśmy podawać wartości tych statystyk. Mówią nam one bardzo dużo o kierunku i wielkości obserwowanego efektu. Warto przyjrzeć się bliżej tym proponowanym statystykom. Nasze teoretyczne rozważania zilustrujemy konkretnym przykładem. Przykład 1. Rozważmy dane klasyfikujące pewną grupę psów w zależności od tego czy chorowały na nosówkę i czy były szczepione przeciwko tej chorobie. Zebrane dane przedstawia poniższa tabelka. Lek (X) Nosówka (Y) Wystąpiło (1) Nie wystąpiło (0) Bez szczepienia (0) 40 (a) 90 (b) Szczepienie (1) 20 (c) 120 (d) Po zastosowaniu testu chi-kwadrat otrzymujemy wartość p = 0,0011, która upoważnia do odrzucenia hipotezy zerowej o braku powiązania między analizowanymi zmiennymi. Tym samym wnioskujemy, że istnieje istotne powiazanie między szczepieniem a wystąpieniem nosówki. Interesuje nas kształt tego powiązania. Pokażemy jak wyliczyć i zinterpretować miary wielkości powiązania. Różnica proporcji. Różnica w proporcjach porównuje względne częstości występowania pewnych cech w dwóch grupach. W powyższym przykładzie dotyczącym nosówki interesuje nas, czy prawdopodobieństwo wystąpienia nosówki u psów nieszczepionych jest takie samo jak dla psów szczepionych. Dla powyższej tabeli z danymi interesująca nas różnica przyjmuje postać: d = P(Y = Nosówka X = Brak szczepienia ) P(Y = Nosówka X = Szczepienie ) = P(Y = 1 X = 0) P(Y = 1 X = 1) = 1 0-1 1 gdzie 1 0 to ryzyko (prawdopodobieństwo warunkowe) wystąpienia nosówki dla pierwszego wiersza tabeli (brak szczepienia), a 1 1 to ryzyko wystąpienia nosówki dla drugiego wiersza (szczepienie). Wyliczamy je według prostego wzoru: Ryzyko nosówki dla nieszczepionych: a/(a+b) = 40/130 = 0,308 Ryzyko nosówki dla szczepionych: c/(c+d) = 20/140=0,143 zatem a c d a b c d Statystyka d przyjmuje wartości od - 1 do +1 i jest równa zero, gdy zmienne są niezależne. Hipoteza zerowa H 0 : d = 0 jest równoważna hipotezie niezależności. Zatem możemy ją zweryfikować za pomocą zwykłego testu niezależności 2. Otrzymujemy zatem istotność różnicy proporcji na poziomie = 0,05. 40 20 Dla naszych przykładowych danych mamy d 0,3079 0,1429 0, 1650. 130 140

Oznacza to, że w grupie nieszczepionych mamy o 16,5% więcej psów z nosówka niż w grupie szczepionych. W badaniach medycznych i epidemiologicznych najczęściej porównujemy grupę kontrolną z grupą eksperymentalną, w której stosuje się ocenianą interwencję (lek, zabieg lub inny eksperymentalny czynnik). W zależności od sposobu oddziaływania analizowanego czynnika, definiuje się następujące miary wywodzące się z różnicy proporcji: ARI (absolute risk increase, bezwzględne zwiększenie ryzyka): Definiujemy, gdy badany czynnik zwiększa prawdopodobieństwo wystąpienia niekorzystnego punktu końcowego. Jest to bezwzględna arytmetyczna różnica pomiędzy ryzykiem w grupie kontrolnej i w grupie eksperymentalnej (ARR = ). ARI określa, o ile zwiększyło się ryzyko wystąpienia niekorzystnego punktu końcowego. ARR (absolute risk reduction, bezwzględne zmniejszenie ryzyka): Definiujemy, gdy czynnik zmniejsza prawdopodobieństwo wystąpienia niekorzystnego punktu końcowego. Jest to bezwzględna arytmetyczna różnica pomiędzy ryzykiem w grupie kontrolnej i w grupie eksperymentalnej (ARR = ). ARR określa bezwzględną wielkość "usuniętego" ryzyka. Ryzyko względne. Ryzyko względne jest stosunkiem dwóch ryzyk (prawdopodobieństw warunkowych) postaci: P Y 1 X 1 RR P Y 1 X 0 W liczniku mamy ryzyko wystąpienia nosówki w grupie szczepionych, a w mianowniku mamy ryzyko wystąpienia nosówki w grupie nieszczepionych. RR (relative risk, ryzyko względne) w badaniach dotyczących związków przyczynowo-skutkowych (np. wpływ szczepienia) jest to, stosunek prawdopodobieństwa wystąpienia danego punktu końcowego w grupie, w której występuje dany czynnik lub cecha (u nas szczepienie), do prawdopodobieństwa wystąpienia tego punktu w grupie kontrolnej (brak szczepienia). Wartość ryzyka względnego wyliczamy według wzoru: RR = c( a b). a( c d) Dla naszych danych mamy RR = 0,4643. A zatem możemy powiedzieć, że psy szczepione mają o połowę mniejsze ryzyko wystąpienia nosówki niż psy nieszczepione. Możemy również 1 powiedzieć, że psy nieszczepione mają dwukrotne większe 2, 1538 0,4643 prawdopodobieństwo wystąpienia nosówki. Dodatkowo przypominamy, że hipoteza zerowa H 0 RR = 1 jest równoważna hipotezie niezależności. Zatem możemy ją zweryfikować za pomocą zwykłego testu niezależności 2. Iloraz szans. Iloraz szans dwóch grup porównywanych A (brak szczepienia) i B (szczepienie) definiujemy, jako stosunek szansy wystąpienia zdarzenia dla grupy A do szansy wystąpienia zdarzenia dla grupy B. Od dwóch początkowych liter nazwy angielskiej (odds ratio) iloraz szans dwóch grup A i B zapisywać będziemy jako OR AxB. Przy tak przyjętym oznaczeniu iloraz szans możemy zapisać w postaci następującej równości: OR AxB = S( A) S( B) p( A) p( B) : 1 p( A) 1 p( B) Wyliczamy go według wzoru ad OR bc Dla naszych danych otrzymujemy OR = 2,6667. Zatem szansa wystąpienia nosówki u psów nieszczepionych jest 2,67 razy większa niż szansa wystąpienia nosówki u psów szczepionych.

Iloraz szans równy jeden oznacza równoważność ryzyka porównywanych grup. W powyższym przykładzie mówiłoby to, że szczepienie nie ma wpływu na wystąpienie nosówki. Iloraz szans większy od 1 wskazuje, że szansa wystąpienia danego zdarzenia zdrowotnego (np. zachorowania, zgonu) w grupie A jest większa niż w grupie B. Odwrotnie, iloraz szans poniżej jedności wskazuje, że w grupie A szansa wystąpienia badanego zdarzenia zdrowotnego jest mniejsza niż w grupie B. Opisywany współczynnik OR jest przedmiotem zmienności losowej. Obliczony dla grupy losowej różni się od prawdziwej wartości w całej populacji. Dlatego powinniśmy zweryfikować istotność tej statystyki. Podobnie jak poprzednio hipoteza zerowa H 0 OR = 1 jest równoważna hipotezie niezależności. Zatem możemy ją zweryfikować za pomocą zwykłego testu niezależności 2. CZUŁOŚĆ I SWOISTOŚĆ W statystyce medycznej jednym z nurtów badań jest ocena trafności testu diagnostycznego. Chodzi oto, by podział na chorych i zdrowych był podziałem realnym. Oznacza to, że po weryfikacji innymi testami i różnorodnymi badaniami lekarskimi w obu grupach było jak najmniej fałszywie chorych (sklasyfikowanie zdrowych, jako chorych) i jak najmniej fałszywie zdrowych (tj. sklasyfikowanie chorych jako zdrowych). Wartość testu zależy od jego rzetelności i trafności. Test jest rzetelny, gdy dostajemy dużą dokładność wyników. O rzetelności testu decyduje: Powtarzalność (repeatability), czyli otrzymanie takich samych wyników przez tego samego badacza Odtwarzalność (reproducibility), czyli otrzymanie takich samych wyników przez innych badaczy. Trafność to zdolność testu do mierzenia danej cechy zgodnie z rzeczywistością. Stosowane są dwie miary oceny trafności testu, tj.: czułość (sensitivity) - opisuje zdolność wykrywania wszystkich osobników rzeczywiście chorych (mających daną cechę). Inaczej mówiąc test czuły powinien dawać małą liczbę osób z wynikami fałszywie ujemnymi. Czułość 100% oznaczałaby, że wszystkie osoby chore lub ogólnie z konkretnymi poszukiwanymi zaburzeniami zostaną rozpoznane. Pojęcie interpretuje się, jako zdolność testu do prawidłowego rozpoznania choroby tam, gdzie ona występuje. swoistość (specificity) - opisuje zdolność wykrywania osobników rzeczywiście zdrowych (bez danej cechy). Swoistość odpowiada odsetkowi osób zdrowych, które miały ujemny wynik testu, a zatem za pomocą ocenianego testu poprawnie wykluczono chorobę. Inaczej mówiąc test swoisty powinien dawać mała liczbę osób z wynikami fałszywie dodatnimi. Zbiór wartości prawidłowych dla substancji, których stężenia są badane w laboratorium klinicznym cechuje rozproszenie (dyspersja). Ponieważ przy przejściu od stanu zdrowia do stanu choroby najczęściej obserwuje się stopniowe zmiany wartości prawidłowych do nieprawidłowych, zatem rozgraniczenie wartości mierzonych na właściwe dla grupy chorych i grupy zdrowych musi mieć charakter umowny. Przyjętym kryterium podziału to wartość graniczna (wartość odcięcia) rozdzielająca wyniki prawidłowe od wyników uznanych za nieprawidłowe. Jednak wobec zachodzenia na siebie rozkładów zawsze pewna ilość osób zdrowych będzie mieć wartości mierzonego parametru poza wartością graniczną, natomiast w grupie osób chorych pewna ilość badanych będzie mieć wartości mierzone poniżej wartości granicznej, a więc mieszczące się w zakresie referencyjnym.

Wystąpienie wartości prawidłowej w próbce pochodzącej od osoby chorej jest określane jako wynik fałszywie ujemny (FU). Podobnie wystąpienie wyniku nieprawidłowego w próbce pochodzącej od osoby zdrowej jest określane jako wynik fałszywie dodatni (FD). Podobnie wyniki prawidłowe u osób zdrowych klasyfikuje się jako prawdziwie ujemne (PU) i wyniki nieprawidłowe u osób chorych jako prawdziwie dodatnie (PD). Przykładowo porównano wyniki pewnego testu z wynikami uzyskanymi na podstawie testu referencyjnego, czyli tzw. złotego standardu. Załóżmy, że dane zostały zebrane w tablicy 2x2 przedstawionej na poniższym rysunku: Wynik diagnozy klinicznej lub testu Suma określonego, jako złoty standard Chorzy Zdrowi Prawdziwie dodatni Fałszywie dodatni Dodatni Wynik testu (PD) (FD) PD + FD przesiewowego Fałszywie ujemni Prawdziwie ujemni Ujemny (FU) (PU) FU + PU Suma PD + FU FD + PU N Poprzez ilość wyników sklasyfikowanych jako PD, FD, PU i FU definiuje się pojęcia czułości i swoistości diagnostycznej testu. Czułość i swoistość wyrażają się wówczas wzorami: Przykład 2. PD Czułość = 100% PD FU PU Swoistość = 100% FD PU Jedną z metod serologicznych wykorzystywanych w badaniach brucelozy jest aglutynacja próbówkowa. Przeprowadzono ocenę tej metody diagnostycznej w populacji 10000 krów. Wiadomo, że w populacji tej było 300 zwierząt zakażonych, z których test wykrył jedynie 186. Test dał ogółem 234 wyniki dodatnie. Wówczas tabela wynikowa 2x2 przyjmuje postać: Rys. 1 Tabela liczebności dla danych z przykładu 2 Czułość i swoistość to odpowiednie procenty z kolumn. Z otrzymanej tablicy odczytujemy, że czułość = 62% i swoistość = 99,5%.Wynika stąd, że rezultaty testu nie są zachęcające. Test jest wysoce swoisty, ale mało czuły. Z ogólnej liczby 300 chorych test ma wartości dodatnie tylko w 62%. Przykład 3 Załóżmy, że przyczyną dolegliwości grupy kotów jest zakażenie wirusem białaczki kotów. Firma opracowuje nowy test ELISA (wykrywania wirusa białaczki). Przeprowadzając standaryzację zbadano nim surowice pochodzące od zwierząt, których stan zdrowia był znany. Wyniki zebrano w tabeli:

wyniki testu ELISA liczba zwierząt rzeczywiście EU zakażonych niezakażonych 0-10 0 30 11-20 6 11 21-30 8 3 31-40 12 1 40-50 7 0 >51 60 1 Zastanawiamy się jak ocenić wartość nowego testu diagnostycznego ELISA i czy wynikom płynącym z tego porównania można zaufać. Moglibyśmy wówczas zlecić to badanie naszym zwierzętom. Ocenę wartości nowego testu zaczniemy od wyliczenia czułości i swoistości. Napotykamy jednak na pierwszy problem. Jaką przyjąć wartość progową? Warunkiem bowiem wyliczenia czułości i swoistości jest określenie, który z wyników uznajemy za wynik prawidłowy, a który za wynik nieprawidłowy. Jak wynika z powyższej tabeli mamy przynajmniej 5 możliwości 10, 20, 30, 40, 50. Dla każdego z tych progów możemy wyliczyć czułość i swoistość. Otrzymane wyniki przedstawia poniższa tabela. Próg Czułość Swoistość 1 - Swoistość 10 100% 65% 35% 20 94% 89% 11% 30 85% 96% 4% 40 72% 97,8% 2,2% 50 65% 97,8% 2,2% Jak widzimy zwiększenie czułości powoduje zmniejszenie wartości swoistości. Graficznie sytuacja ta została przedstawiona na rysunku 2. Zwiększenie wartości progowej (przesunięcie linii normy na prawo) powoduje zmniejszenie obszaru c (wyników fałszywie ujemnych). Tym PD samym zwiększamy ułamek 100% czyli wartość czułości. Przesunięciu linii normy PD FU na prawo towarzyszy jednak powiększenie się obszaru d (wyników fałszywie dodatnich). PU Oznacza to zmniejszenie ułamka 100% FD PU czyli spadek wartości. swoistości. Podobnie wzrost swoistości (zmniejszenie obszaru b) powoduje powiększenie się obszaru c, czyli spadek czułości testu. Norma Strefa wątpliwości Rys. 2 Powiązanie wartości czułości i swoistości

Jeśli więc wybierzemy test bardziej czuły, to będzie on na ogół mało swoisty. Odwrotnie wybór testu wysoce swoisty będzie na ogół mało czuły. Z tych rozważań wynika konieczność wyboru między testem bardziej czułym lub bardziej swoistym. Test czuły rzadko pomija osoby naprawdę chore. Wybieramy go, jeżeli naszym zadaniem jest wykrycie wszystkich przypadków chorobowych. Z kolei test swoisty rzadko kwalifikuje osoby naprawdę zdrowe jako chore. Wybieramy go, jeżeli naszym zadaniem jest wykryciem tylko niebudzących zastrzeżeń zachorowań. Jak zatem wyznaczyć wartość progową w sytuacji, gdy wyniki testów mierzone są na skali ciągłej? Wybór najlepszej wartości progowej to wynik kompromisu pomiędzy wysoką czułością i wysoką swoistością. Wybór takiej najlepszej wartości progowej ułatwia wykres krzywej ROC (receiver operating curve). Na wykresie tym na osi rzędnych podana jest czułość, a na osi odciętych 1 swoistość (odsetek wyników fałszywie dodatnich). Następnie nanosimy na wykres wszystkie uzyskane wartości czułości i dopełnienia swoistości dla kolejnych progów. Uzyskana w wyniku połączenia naniesionych punktów krzywa łamana pokazana jest na rysunku 3. Wykres ROC Współczynnik kierunkowy =0,49 Proponowany punkt odcięcia: 21-30 oznaczony symbolem 3 1,0 3 10-20 0,8 31-40 41-50 Czułość 0,6 0,4 >50 0,2 0,0 0,0 0,2 0,4 0,6 0,8 1,0 1-Specyficzność Rys. 3 Krzywa ROC dla danych z przykładu 2 Pole powierzchni pod tą krzywą (przybierające wartości od 0 do 1) jest miarą zdolności testu do dokładnego rozgraniczenia wyników prawidłowych i nieprawidłowych. Im większa jest powierzchnia pod krzywą ROC (ang: Area under curve AUC), tym większa moc diagnostyczna testu. Większość testów używanych w diagnostyce reprezentuje moc diagnostyczną wyrażającą się wielkościami AUC pomiędzy 0,8 i 0,95. Z postaci krzywej wyciągamy wniosek, że im bardziej krzywa ta jest wygięta w kierunku lewego górnego rogu, tym test jest bardziej dokładny. Z drugiej strony im bardziej krzywa ta zbliża się do przekątnej, tym mniej dokładny jest test. W praktyce najczęściej jako najlepszą wartość progową przyjmujemy tę najbardziej zbliżoną do lewego górnego rogu. Dla danych z naszego przykładu jest to wartość 45. Przesuwanie wartości granicznej wpłynie na moc diagnostyczną testu (czasem tłumaczoną również jako dokładność testu) można wyliczyć stosunek wyników poprawnych do wszystkich uzyskanych wyników, czyli wiarygodność: Wiarygodność = PU PD PU FU PD FD Czułość i swoistość to miary, które są ważne przy wyborze testu. Decydują, czy będziemy stosować dany test. W momencie jednak, gdy decyzja zapadła, ich miejsce zajmują inne miary

wartość predykcyjna dodatnia i wartość predykcyjna ujemna. Miary te pomogą ocenić czy pacjent jest chory, gdy znane są wyniki testu. Wartość predykcyjna dodatnia (PPV) to prawdopodobieństwo choroby, gdy wyniki testu są dodatnie. Wyliczamy ją za pomocą wzoru: Wartość predykcyjna ujemna (NPV) to prawdopodobieństwo, że pacjent jest zdrowy, gdy wyniki testu są ujemne Oznacza to, że wartości predykcyjne dają nam odpowiedź na pytanie: jeżeli wynik testu dla pacjenta jest dodatni (ujemny) to jakie jest prawdopodobieństwo, że pacjent jest chory? Przykład 3 PD WP( ) 100% PD FD PU WP( ) 100% FU PU Załóżmy, że badaliśmy dwie populacje o różnej częstości danej choroby. Zebrane wyniki przedstawiają poniższe tabele. Choroba Choroba - Suma Choroba + Choroba - + Suma Test + 60 30 90 Test + 60 60 120 Test - 10 185 195 Test - 10 370 380 Suma 70 215 285 Suma 70 430 500 Przykładowe wyniki dla drugiej tabeli przedstawia poniższy rysunek. WP( ) WP(+) Rys. 4 Arkusz wyników wyliczający wartości predykcyjne Łącznie dla obu tabel otrzymujemy następujące wyniki: Tabela 1 Tabela2 WP( ) 5,13% 97,37% WP(+) 66,67% 50,00% Czułość 85,71% 85,71% Swoistość 13,95% 13,95% Jak widzimy czułość i swoistość nie uległy zmianie, natomiast wartości predykcji zmieniły się. Wynika to z faktu, że wartość predykcyjna zależy od częstości występowania danej choroby w populacji, z której pochodzi badany pacjent. Musimy o tym pamiętać czytając artykuły kliniczne publikowane w czołowych czasopismach. Opracowywane są one w większych ośrodkach miejskich, gdzie częstości zachorowań są na ogół większe.

Obliczenia w pakiecie STATISTICA Jak wspomniano wcześniej czułość i swoistość to odpowiednie procenty z kolumn. Oto kolejne kroki dla ich otrzymania. 1. Po otwarciu zbioru danych z menu Statystyka wybieramy opcję Statystyki opisowe i tabele. Następnie w otwierającym się oknie wybieramy opcję Tabele wielodzielcze. 2. W oknie Tabele wielodzielcze przechodzimy na kartę Zbiorcza i klikamy przycisk Określ tabelę (wybierz zmienne) dla określenia odpowiednich zmiennych. W lewym oknie wybieramy zmienną dla wierszy Test1 (wyniki testu diagnostycznego) a w drugim zmienną dla kolumn Żylaki1 (wynik diagnozy klinicznej lub złotego standardu). Klikając na przycisk OK kończymy wybór zmiennej. Opisana sytuacja pokazana jest na poniższym rysunku. Rys.5 Okno określające postać tabeli wielodzielczej 3. Klikamy przycisk OK. Przywołany zostanie okno Wyniki tabelaryzacji, w którym na karcie Opcja w lewym polu Oblicz tabelę wybieramy opcje Procenty w kolumnach. Następnie klikamy Podsumowanie. Otwierające się arkusze wynikowe pokazane są na poniższym rysunku. Z otrzymanej tablicy odczytujemy, że czułość = 62% i swoistość = 99,5%. Z kolei wartość predykcyjna dodatnia i wartość predykcyjna ujemna to odpowiednie procenty z wierszy. Oto kolejne kroki dla ich otrzymania. 1. Po otwarciu zbioru danych z menu Statystyka wybieramy opcję Statystyki opisowe i tabele. Następnie w otwierającym się oknie wybieramy opcję Tabele wielodzielcze. 2. W oknie Tabele wielodzielcze przechodzimy na kartę Zbiorcza i klikamy przycisk Określ tabelę (wybierz zmienne) dla określenia odpowiednich zmiennych. W lewym oknie wybieramy zmienną dla wierszy Test1 (wyniki testu diagnostycznego) a w drugim zmienną dla kolumn Żylaki1 (wynik diagnozy klinicznej lub złotego standardu). Klikając na przycisk OK kończymy wybór zmiennej.

3. Klikamy przycisk OK. Przywołany zostanie okno Wyniki tabelaryzacji, w którym na karcie Opcja w lewym polu Oblicz tabelę wybieramy opcje Procenty w wierszach. Następnie klikamy Podsumowanie. Otwierające się arkusze wynikowe pokazane są na poniższym rysunku. Z otrzymanej tablicy odczytujemy, że WP(+) = 79,32% i WP(-) = 398,83%.