1 rof. Danuta Makowiec Instytut Fizyki Teoretycznej i Astrofizyki UG Kontakt: pok. 353 tel.: 58 523 2466 e-mail danuta.makowiec at gmail.com http://www.fizdm.strony.ug.edu.pl/me/biostatystyka.html Reguła Bayesa pozwala odwrócić warunek ale musi być znane D.Makowiec: Biostatystka 38 Baza dla predykcji medycznej Własność prawdopodobieństwa łącznego
Test przesiewowy: rodzaj strategicznego badania prowadzonego wśród osób nieposiadających objawów danej choroby w celu jej wykrycia i wczesnego leczenia. rzewidywanie w oparciu o wynik testu przesiewowego: Wartością predykcyjną dodatnią V+ testu nazywamy prawdopodobieństwo tego ze osoba jest chora jeśli wynik testu jest dodatni: V+ = chory test+ Wartością predykcyjną ujemną V- testu nazywamy prawdopodobieństwo tego ze osoba nie jest chora jeśli wynik testu jest ujemny: V- = nie chory test- rzykład z mammografii: V+=rak piersi w przeciągu 2 lat mammografia+= BA=0.1 V-=nie ma raka piersi w przeciągu 2 lat mammografia-= ~B~A= 1- B~A =.9998 Im V- wyższe test jest lepszy!!! D.Makowiec: Biostatystka 39 Symptom zestaw symptomów może wyznaczać test przesiewowy V+ = jest chory jest symptom V- = nie jest chory brak symptomu Idealne testy: V+ i V- bliskie 1 V+ wyższe to test jest lepszy Czułość symptomu zestawu symptomów to prawdopodobieństwo że ten symptom jest obecny gdy osoba jest chora. Czyli jest symptom jest chory Specyficzność symptomu zestawu symptomów to prawdopodobieństwo że ten symptom nie jest obecny gdy osoba jest nie chora. Czyli brak symptomu nie jest chory D.Makowiec: Biostatystka 40 2
A=symptom B= choroba Czułość Specyficzność AB ~A~B Reguła Bayesa BA ~B~A V+ V- V + = B A = A B B A B B + A ~B ~B V + = V = sensitivityab B sensitivity A B B + 1 specificity A B ~B specificityab B specificity A B B + 1 sensitivity A B ~B D.Makowiec: Biostatystka 41 Maszyna stwierdziła nadciśnienie u 84% osób z nadciśnieniem a także stwierdziła nadciśnienie u 23% osób z normalnym ciśnieniem. Nadciśnienie w populacji występuje z prawdopodobieństwem 20%. Jaka jest wartość diagnozy tej maszyny? Ω1 Ω2 A: zmierzono nadciśnienie B: chory na nadciśnienie Czułość =nadciśnienie chory na nadciśnienie = AB = 0.84 Specyficzność =brak nadciśnienia ciśnienie normalne = ~A ~B = 0.77 A B B V B A A B B A~ B ~ B V+= 0.84*0.20/0.84*0.20 + 0.23* 0.80= 0.48 V-= 0.77*0.80/0.16*0.20 + 0.77* 0.80= 0.95 Mamy 48% pewność że osoba z pozytywnym wynikiem z tej maszyny ma nadciśnienie Mamy 95% pewność że osoba z negatywnym wynikiem z D.Makowiec: Biostatystka tej maszyny ma ciśnienie normalne 42 3
Niech B 1 B2... B K to zestaw chorób wzajemnie się wykluczających oraz wyczerpujących możliwe choroby które mogą występować jednocześnie. Niech A oznacza obecność symptomu zbioru symptomów. Wówczas B A i A Bi Bi A B B j1.. K j j Kluczem do sukcesu tego obliczenia jest wiedza ogólna o populacji : jak często występują poszczególne choroby D.Makowiec: Biostatystka 43 60-ciolatek nigdy niepalący papierosów ma objawy: chroniczny kaszel czasami duszności Lekarz zleca wykonanie biopsji płuc. Załóżmy że dodatni wynik biopsji oznacza albo nowotwór płuc albo sakroidozę. Jakie jest prawdopodobieństwo wystąpienia poszczególnych chorób? Matematyzacja danych plus wiedza z eksperymentu i tablic statystycznych Zależność do wyznaczenia Obliczenia A={chroniczny kaszel dodatnia biopsja} B= { B1 zdrowy B2 rak płuc B3 sakroidoza} AB1 =0.001 AB2 = 0.9 AB3 = 0.9 B1=0.99 B2=0.001 B3= 0.009 dla 60-ciolatka niepalącego B1A = AB1*B1 / [AB1*B1+AB2*B2+AB3*B3 ] B2A = AB2*B2 / [ AB1*B1+AB2*B2+AB3*B3 ] B3A = AB3*B3 / [ AB1*B1+AB2*B2+AB3*B3] B1A = 0.099 B2A = 0.090 B3A = 0.810 D.Makowiec: Biostatystka 44 4
Jak ustalić co jest normą dla DB a co już nadciśnieniem? punkt odcięcia rzesunięcie odcięcia w lewo wzrasta czułość DB: 70 80 90 100 110 rzeprowadza się obliczenia czułości i specyficzności symptomu dla choroby przy różnych możliwych wartościach punktu odcięcia. Wykreśla się zależność : 1- specyficzność czułość. rzesunięcie odcięcia w prawo wzrasta specyficzność rawdopodobieństwo rawdopodobieństwo dobrej błędnej klasyfikacji: zdrowy klasyfikacji: chory jest zostanie sklasyfikowany jako sklasyfikowany jako chory chory D.Makowiec: Biostatystka 45 rzypadek idealny czułość Krzywa ROC 1-specyficzność rzypadek najgorszy czułość 1-specyficzność D.Makowiec: Biostatystka 46 5
Dane z obrazów tomografii komputerowej są oceniane i klasyfikowane przez radiologa. Oceniany jest stan neurologiczny pacjenta: normalny albo anormalny. Znamy stan poszczególnych pacjentów możemy więc wyniki przeprowadzonej klasyfikacji zweryfikować. OK! OK????? NOK? NOK! Załóżmy : CT jest pozytywne jeśli osoba jest rozpoznana jako NOK? lub z NOK! Czułość = test+ chory = 11+33 /51= 0.86 Specyficzność= test- zdrowy = 33+6+6 /58 =0.78 Ilość ocenianych pacjentów D.Makowiec: Biostatystka 47 Definicja Krzywą ROC receiver operating characteristics : odbioru charakterystyki pracy nazywamy wykres czułości względem 1-specyficzności danego testu przesiewowego gdzie różne punktu wykresu odpowiadają rożnym punktom odcięcia przyjętym w celu oznaczenia pozytywnego wyniku testu. 1-specyficznośc 1 0.43 0.33 0.22 0.03 0 D.Makowiec: Biostatystka 48 6
ole powierzchni pod tą krzywą SROC okazuje się być dobrą miarą dokładności testu. 90-1 = wyśmienity A.80-.90 = dobry B.70-.80 = w porządku C.60-.70 = słaby D.50-.60 = zły F ole pod krzywą opisuje prawdopodobieństwo że losowa para osób o których wiadomo ze jedna jest chora a druga nie jest chora zostanie dobrze zdiagnozowana. D.Makowiec: Biostatystka 49 Epidemiologia: Współczynnik chorobowości prevalence to prawdopodobieństwo występowania danej choroby w określonej grupie społecznej- liczba wszystkich chorujących na daną chorobę do ilości ludności. Współczynnik zapadalności incidence to prawdopodobieństwo zachorowania na daną chorobę - liczba nowych przypadków zachorowań w danym okresie do ilości ludności. D.Makowiec: Biostatystka 50 7