Jakość procedury klasyfikacyjnej:

Podobne dokumenty
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA MATEMATYCZNA

Analiza przeżycia. Wprowadzenie

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

METODY STATYSTYCZNE W BIOLOGII

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Ważne rozkłady i twierdzenia c.d.

WYKŁAD 7. Testowanie jakości modeli klasyfikacyjnych metodyka i kryteria

Weryfikacja hipotez statystycznych

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Indukowane Reguły Decyzyjne I. Wykład 8

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka i Analiza Danych

Testowanie hipotez statystycznych.

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

Estymacja przedziałowa. Przedział ufności

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

WYKŁAD 5 TEORIA ESTYMACJI II

Statystyka matematyczna i ekonometria

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

Wnioskowanie statystyczne. Statystyka w 5

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA MATEMATYCZNA

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

WYKŁAD 8 ANALIZA REGRESJI

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

PDF created with FinePrint pdffactory Pro trial version

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Analiza regresji - weryfikacja założeń

Pobieranie prób i rozkład z próby

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Rozdział 8. Regresja. Definiowanie modelu

Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących

Spis treści 3 SPIS TREŚCI

Z poprzedniego wykładu

Algorytmy, które estymują wprost rozkłady czy też mapowania z nazywamy algorytmami dyskryminacyjnymi.

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

KORELACJE I REGRESJA LINIOWA

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

MODELE LINIOWE. Dr Wioleta Drobik

WNIOSKOWANIE STATYSTYCZNE

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

9. Praktyczna ocena jakości klasyfikacji

Statystyka matematyczna dla leśników

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Metody probabilistyczne

166 Wstęp do statystyki matematycznej

Ćwiczenia 3 ROZKŁAD ZMIENNEJ LOSOWEJ JEDNOWYMIAROWEJ

Stanisław Cichocki. Natalia Nehrebecka

... prognozowanie nie jest celem samym w sobie a jedynie narzędziem do celu...

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Elementy statystyki wielowymiarowej

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Statystyka w pracy badawczej nauczyciela

STATYSTYKA MATEMATYCZNA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Zawartość. Zawartość

POLITECHNIKA OPOLSKA

Analiza niepewności pomiarów

Komputerowa Analiza Danych Doświadczalnych

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Rozkłady statystyk z próby. Statystyka

Oszacowanie i rozkład t

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Wykład 3 Hipotezy statystyczne

Analiza danych. TEMATYKA PRZEDMIOTU

2. Empiryczna wersja klasyfikatora bayesowskiego

Systemy uczące się wykład 2

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Stanisław Cichocki. Natalia Nehrebecka

Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: F(x) = sin(x),

Regresja i Korelacja

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

STATYSTYKA MATEMATYCZNA

Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak

Rozkłady zmiennych losowych

STATYSTYKA

Transkrypt:

Jakość procedury klasyfikacyjnej: poglądowa interpretacja i szacowanie możliwości poprawy na podstawie charakterystyki ROC Maciej Górkiewicz mygorkie@cyf-kr.edu.pl Uniwersytet Jagielloński w Krakowie Collegium Medicum: Wydział Nauk o Zdrowiu Instytut Zdrowia Publicznego Dyrektor: Prof. dr hab. med. Andrzej Pająk

Tematy prezentacji: 1. Klasyfikacja binarna: Positive vs. Negative 2. Założenie o zmiennej ukrytej Z R 1, Z R 2 3. Błąd pomiarowy: Z cechy X zmienna Y 4. Szacowanie możliwości poprawy 5. Wnioski i dyskusja

1. Klasyfikacja binarna: Positive vs. Negative TPR = TP / N Pos ; FPR = FP / N Neg ; ROC: TPR = f(fpr) Rozpoznanie Positive Rozpoznanie Negative Weryfikacja klasyfikacji Positive: faktycznie TP (true Pos.)... = N Pos Negative: faktycznie FP (false Pos.)... = N Neg

1. Klasyfikacja binarna: Positive vs. Negative Wynik klasyfikacji: informacja o przewidywanej klasie obiektu... To jeszcze nie efekt! To jeszcze nie korzyść! O efekcie, o korzyści można mówić (warunek sine qua non) dopiero wtedy, kiedy: 1: Potrafimy spożytkować tę informację w celu uzyskania określonych korzyści, oraz: 2: Uzyskanie tych korzyści może być trudniejsze / ograniczone bez informacji o przewidywanej klasie obiektu. Przykładowe korzyści: Prewencja indywidualna: osoba o klasyfikacji Positive (prognoza? znaczne ryzyko?) podejmuje odpowiednie działania... Prewencja społeczna: prognoza liczby osób o klasyfikacji Positive możność zapobiegania wystąpieniu / skutkom wystąpienia...

2. Założenie o zmiennej ukrytej Z...... Jest taka właściwość Z klasyfikowanych obiektów; bezpośrednio niemierzalna, że istnieje dystrybuanta: Pr(Pos. Z) W praktyce częściej posługujemy się gęstościami rozkładu zmiennej Z w klasach Pos. i Neg. 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0-6 -4-2 0 2 4 f(zn) f(zp) Podstawowe pojęcie: PRÓG DECYZYJNY: Pr 0 (Pos.) Reguła klasyfikacji: Jeśli Pr(Pos. Z) < Pr 0 (Pos.) Rozpoznanie.Negative; przeciwnie: Jeśli Pr(Pos. Z) Pr 0 (Pos.) Rozpoznanie.Positive; W praktyce częściej próg Z 0 ; powyżej próg Z 0 = 0 FPR = 0,5; Z 0 = -2 TPR = 0,5;

2. Założenie o zmiennej ukrytej Z... W wielu zastosowaniach, na przykład w badaniach przesiewowych, wygodnie jest rozgraniczyć to, na co osoby korzystające z wyników klasyfikacji już nie mają wpływu, na przykład stan zdrowia badanej osoby w chwili wykonywania pomiarów, od tego, co jeszcze można modyfikować: wybór terapii, wybór trybu życia. Z1: Stan obecny i jego możliwe przyczyny przeszłość Stan obecny przyszłość Z2: stan obecny i jego możliwe następstwa Przy takim podejściu mamy do czynienia ze zmienną ukrytą dwuwymiarową (lub, w innym ujęciu, z dwoma zmiennymi jednowymiarowymi): Z R 2 ; z założenia istnieje mapowanie [Z 1, Z 2 ] Pr(niepożądane zdarzenie)

3. Błąd pomiarowy: Z cechy X zmienna Y Legenda: {X 1 } {Y1} Pr(Pos Y1, Y20) Z1: past Pr(Pos Z 10,Z 20 ) {X 12 } {Y12} Pr(Pos Y1, Y2) Z2: future Kolor niebieski: zmienne nie-obserwowalne: mierzalne cechy {X} klasyfikowanych obiektów Kolor zielony: zmienne kryterialne {Y} w przypadku subiektywnych opinii (na przykład klasyfikowania pacjentów przez klinicystów) może być znana tylko ostateczna diagnoza, np. ostateczna klasyfikacja obiektów na Przewidywane.Positive vs. Przewidywane.Negative; Kolor żółty: zmienne mierzalne, lub dające się estymować na podstawie obserwacji, Prawdopodobieństwo wystąpienia w badanej populacji obiektu klasy Positive Pr(Pos Z 10,Z 20 ) estymowalne na podstawie obserwowanych liczności klas w badanej próbie losowej; prawdopodobieństwa warunkowe Pr(Pos Y...) estymowalne na podstawie próby: na przykład metodą ogólnej regresji logistycznej, Pr(Pos Y...) = f( X); Y* = b*x*; lub jako rozkłady empiryczne wartości Y w klasach Positive i Negative. {X 2 } {Y2} Pr(Pos Y2, Y10)

3. Błąd pomiarowy: Z cechy X zmienna Y Błąd pomiarowy może być wyrażony w kategoriach rozkładu zmiennej kryterialnej Y* w klasach obiektów Positive i Negativie (faktycznie, a nie według prognozy!): Mierzone Y*^ = Y* + * ; dla rozkładów normalnych wariancja V^ = V Y + V * - błąd pomiarowy zmiennej Y*; gdzie indeks * = 1; 2; 12; pomiar idealny: * = 0. Jeśli * ma rozkład normalny N(0; V ), to SD może być estymowane na podstawie wyników powtórnych pomiarów; bardzo orientacyjne (Excel) wyniki modelowania: Yp1 - Yp2 = f(yp1 + Yp2)/2; N = 500; d = 0,074 y = -0,0075x + 1,1622 R 2 6 = 4E-05 5 4 3 2 1 0-4 -2 0 2 4 1,20 1,10 1,00 0,00 0,05 0,10 0,15 0,20 korelacja Yp1-Yp2 z (Yp1+Yp2)/2; N = 500 średnia deltay 95%CI 95%CI Dla próby N = 60 szerokość przedziału 95%CI jest 3 razy większa; nadal optymistycznie można szacować SD według dolnej granicy 95%CI dla średniej Ypomiar1-Ypomiar2

3. Błąd pomiarowy: Z cechy X zmienna Y Błąd pomiarowy może być wyrażony w kategoriach rozkładu zmiennej kryterialnej Y* w klasach obiektów Positive i Negativie (faktycznie, a nie według prognozy!): Mierzone Y*^ = Y* + * ; ale, mierzone Y*^ tylko odzwierciedla zmienną ukrytą Z, czyli: Y* = Z* + *; zatem: Mierzone Y*^ = Z* + * + * ; a z drugiej strony, Y* = b*x*; * - błąd wyrażania zmiennej Z* poprzez Y*; gdzie indeks * = 1 (past); 2 (future); 12; Kiedy porównujemy 2 sposoby pomiaru tak samo zdefiniowanej zmiennej Y, to jest na przykład za pomocą takiego samego równania regresji (te same X y, te same b y) to badamy możliwość zmniejszenia składowej * błędu pomiarowego; Kiedy, trwając przy tak samo pomyślanej (zdefiniowanej nieformalnie) zmiennej Z, porównujemy 2 sposoby wyrażenia jej poprzez różnie zdefiniowane zmienne Y, to badamy możliwość zmniejszenia składowej * błędu pomiarowego; przy różnych * Kiedy porównujemy dwie różnie pomyślane (zdefiniowane nieformalnie) zmienne Z, na przykład Z1 i Z2, lub Z1 i Z12, wyrażane poprzez różne, odpowiednio zdefiniowane zmienne Y, to badamy skutki zamiany typu składowej * błędu pomiarowego; na przykład *=1 na *=2, lub *=1 na *=12; przy różnych * Dwie ostatnie sytuacje rozróżniamy raczej według kryteriów heurystycznych...

3. Błąd pomiarowy: Z cechy X zmienna Y Pojęcie <Błąd pomiarowy> jest wygodne dla projektanta procedur pomiarowych; dla projektanta procedury klasyfikacyjnej bardziej dogodne jest pojęcie: <Jakość zmiennej kryterialnej >, na przykład zmiennej Y, lub zmiennej Z Jakość ta może być definiowana za pomocą prawdopodobieństwa: Pr[(Yi Pos) > [(Yj Neg); gdzie i-ty obiekt wylosowano z Positive, a j-ty z Negative Należy zwrócić uwagę, że jak dotąd, pojęcia błędu pomiarowego, jakości zmiennej kryterialnej, były dyskutowane bez nakładania jakichkolwiek warunków na wybór progu decyzyjnego, w szczególności bez zakładania jakiejś jednej określonej wartości progu! Przy takim podejściu, mając na uwadze późniejsze zdefiniowanie kryteriów wyboru progu decyzyjnego procedury klasyfikacyjnej, wygodnie jest posługiwać się charakterystyką ROC, to jest zależnością między % poprawnie klasyfikowanych obiektów Positive (true positive ratio) TPR a % błędnie klasyfikowanych obiektów klasy Negative (false positive ratio) FPR dla wszystkich możliwych progów Y 0 : W szczególności, jakość zmiennej Y, definiowana za pomocą prawdopodobieństwa: Pr[(Yi Pos) > [(Yj Neg); gdzie i-ty obiekt wylosowano z Positive, a j-ty z Negative, może być estymowana jako pole powierzchni AUC pod krzywą ROC

3. Błąd pomiarowy: Z cechy X zmienna Y Konstruowanie charakterystyki ROC jest oczywiste, kiedy znane są rozkłady zmiennej kryterialnej Y w rozpatrywanych klasach; kiedy dostępne są tylko rozkłady empiryczne, zastosowanie mają odpowiednie metody estymacji... 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 f(zn) f(zp) 1 0,8 0,6 0,4 0,2 0 TPR przekątna -6-4 -2 0 2 4 0 0,2 0,4 0,6 0,8 1 Podstawowa zaleta charakterystyki ROC polega na tym, że liczne rozsądne kryteria doboru progu decyzyjnego Y 0 zmiennej Y można definiować za pomocą tych samych pojęć TPR i FPR, i przedstawić jako linie ciągłe na płaszczyźnie ROC; ponieważ krzywa ROC jest krzywą parametryczną, z parametrem Y 0, to punkt przecięcia optymalne Y 0... Z drugiej strony, kiedy dla zadanej wartości AUC założymy określoną postać rozkładu zmiennej Y, to możemy badać, jakie wartości parametrów rozkładu odpowiadają temu założeniu : procedury kalkulator1.xls Kalkulator _1: Niezbędna różnica średnich zmiennej klasyfikacyjnej kalkulator11.xls Przykładowe obliczenia wpływu dokładności pomiaru na AUC przesłane uprzednio...

4. Szacowanie możliwości poprawy...... dwa aspekty ulepszania procedury klasyfikacji: korzyści, a koszty Korzyści : większy % poprawnych klasyfikacji; w krótszym czasie... koszty : koszty estymowania i korygowania (aktualizowania), potem: co, i jak mierzymy; jak przetwarzamy zgromadzone dane...... trzy podstawowe sposoby poprawiania charakterystyki ROC: 1: wykorzystanie kryterium Pareto + wykorzystanie możliwości loterii 2: złożone procedury: ciąg zmiennych Y stosowanych warunkowo w określonej kolejności (drzewa decyzyjne, odsiewanie) ; zazwyczaj prosta postać zależności Y = f(x) 3: złożona zależność Y = f(x); często tylko jedna funkcja kryterialna Y... Koszty estymowania: Kalkulator _2: Niezbędna wielkość próby 1:Pareto: Kalkulator_4: Sprawdzenie, czy charakterystyka ROC poprawna (proper ROC) 2: złożone procedury: Kalkulator _3: Oszacowanie efektów wstępnego odsiewania obiektów praktycznie na pewno nie-pozytywne W razie potrzeby proszę o uwagi (e-mail: mygorkie@cyf-kr.edu.pl)

5. Wnioski i dyskusja...... Zdaję sobie sprawę, że to tylko wprowadzenie do zastosowań ROC; ale mam nadzieję, że (+ przesłane uprzednio kalkulatory w Excel) nie bez praktycznej przydatności... Metoda ROC ma znane, dyskutowane w literaturze ograniczenia:... że w praktyce często wiele klas: nie ma większego problemy, jeśli klasy uporządkowane hierarchicznie...... że w praktyce często mamy do czynienia z sekwencją decyzji, a nie z jednorazowym wyborem np.. Sposoby prowadzenia terapii przy czym granice między klasami nieostre...... że w praktyce często informacja o faktycznych klasach klasyfikowanych obiektów nieosiągalna nawet post factum; np.. Rozpoznano.ciąża... Po 2-3 tygodniach gołym okiem widać: nie ma ciązy; ale co było w chwili klasyfikowania nigdy się nie dowiemy: Rozpoznanie OK., ale samoistne poronienie, czy rozpoznanie błędne... Analogicznie: wpływ terapii, wpływ profilaktyki: Rozpoznanie.Pos po czasie nie ma Pos...

Jakość procedury klasyfikacyjnej: poglądowa interpretacja i szacowanie możliwości poprawy na podstawie charakterystyki ROC Dziękuję za uwagę! I C A E A.D. M C C C L X I C I U N IVERSITATIS JAGIELL O N E D F A C U LTATES MEDICAE COLL E G I I M I V F U N D ATA Maciej Górkiewicz e-mail mygorkie@cyf-kr.edu.pl Uniwersytet Jagielloński w Krakowie Collegium Medicum: Wydział Nauk o Zdrowiu Instytut Zdrowia Publicznego ul. Grzegórzecka 20 31-531 Kraków