Metody oceny wiedzy klasyfikacyjnej odkrytej z danych Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska

Podobne dokumenty
Zaawansowana eksploracja danych: Metody oceny wiedzy klasyfikacyjnej odkrytej z danych Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska

Data Mining Wykład 4. Plan wykładu

9. Praktyczna ocena jakości klasyfikacji

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

WYKŁAD 7. Testowanie jakości modeli klasyfikacyjnych metodyka i kryteria

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Indukowane Reguły Decyzyjne I. Wykład 8

Systemy uczące się wykład 2

ALGORYTM RANDOM FOREST

Eksploracja danych OCENA KLASYFIKATORÓW. Wojciech Waloszek. Teresa Zawadzka.

Ocena dokładności diagnozy

Laboratorium 4. Naiwny klasyfikator Bayesa.

Laboratorium 6. Indukcja drzew decyzyjnych.

Jakość uczenia i generalizacja

Wprowadzenie do uczenia maszynowego

ZeroR. Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 1 5 T 1 7 T 1 5 T 1 5 F 2 7 F

Testowanie modeli predykcyjnych

Wprowadzenie do uczenia maszynowego

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Metody klasyfikacji danych - część 1 p.1/24

Elementy modelowania matematycznego

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

Krzywe ROC i inne techniki oceny jakości klasyfikatorów

Klasyfikacja LDA + walidacja

METODY INŻYNIERII WIEDZY

Wprowadzenie do klasyfikacji

Laboratorium 5. Adaptatywna sieć Bayesa.

Wstęp do sieci neuronowych, wykład 09, Walidacja jakości uczenia. Metody statystyczne.

A Zadanie

2. Ocena dokładności modelu klasyfikacji:

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

Ćwiczenie 12. Metody eksploracji danych

Optymalizacja ciągła

Identyfikacja istotnych atrybutów za pomocą Baysowskich miar konfirmacji

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Wstęp do sieci neuronowych, wykład 13-14, Walidacja jakości uczenia. Metody statystyczne.

Analiza danych. TEMATYKA PRZEDMIOTU

Kombinacja jądrowych estymatorów gęstości w klasyfikacji wstępne wyniki

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Odkrywanie wiedzy klasyfikacyjnej inne metody oraz metodyka oceny

Mail: Pokój 214, II piętro

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 5 Kwadratowa analiza dyskryminacyjna QDA. Metody klasyfikacji oparte na rozkładach prawdopodobieństwa.

Wprowadzenie. Data Science Uczenie się pod nadzorem

Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec

KLASYFIKACJA. Słownik języka polskiego

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

data mining machine learning data science

Widzenie komputerowe (computer vision)

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Klasyfikacja. Sformułowanie problemu Metody klasyfikacji Kryteria oceny metod klasyfikacji. Eksploracja danych. Klasyfikacja wykład 1

Agnieszka Nowak Brzezińska Wykład III

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

Wybór modelu i ocena jakości klasyfikatora

Metody klasyfikacji i rozpoznawania wzorców. Najważniejsze rodzaje klasyfikatorów

Sieci neuronowe w Statistica

Zapytanie ofertowe nr 1/2017 z dnia 20 grudnia

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

Technologie Informacyjne

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.

Stanisław Cichocki. Natalia Nehrebecka

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Metody Sztucznej Inteligencji II

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Budowa modeli klasyfikacyjnych o skośnych warunkach

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)

Drzewa decyzyjne i lasy losowe

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

Statystyczna analiza Danych

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

Systemy uczące się wykład 1

Stanisław Cichocki. Natalia Nehrebecka

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - testy na sztucznych danych

Generowanie zbioru reguł asocjacyjnych i decyzyjnych ze statystycznie reprezentatywnym wsparciem i anty-wsparciem

Laboratorium 11. Regresja SVM.

Popularne klasyfikatory w pakietach komputerowych

Modelowanie interakcji helis transmembranowych

METODY STATYSTYCZNE W BIOLOGII

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska


Adrian Horzyk

Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Ćwiczenie 6 - Hurtownie danych i metody eksploracje danych. Regresja logistyczna i jej zastosowanie

Algorytmy klasyfikacji

Wprowadzenie. Metody bayesowskie Drzewa klasyfikacyjne i lasy losowe Sieci neuronowe SVM. Klasyfikacja. Wstęp

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Prof. Stanisław Jankowski

Transkrypt:

Metody oceny wiedzy klasyfikacyjnej odkrytej z danych Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska Wykład dla spec. Mgr TWO Poznań 2010 dodatek 1

Ocena wiedzy klasyfikacyjnej wykład dla TPD (2008/9) 1. Wprowadzenie: co to jest klasyfikacja nadzorowana. 2. Różne metody odkrywania wiedzy klasyfikacyjnej 3. Metody oceny wiedzy o klasyfikacji obiektów przegląd miar. 4. Eksperymentalna ocena klasyfikatorów. 5. Porównanie wielu klasyfikatorów. 6. Miary oceny w perspektywie opisowej na przykładzie reguł. 7. Uwagi o realizacji procesu odkrywania wiedzy klasyfikacyjnej. 2

Uwagi do źródeł Przygotowując wykład korzystałem m.in. z książek: S.Weiss, C.Kulikowski: Computer Systems That Learn: Classification and Prediction Methods from Statistics, Neural Nets, Machine Learning and Expert Systems, Morgan Kaufmann 1991. K.Krawiec, J.Stefanowski: Uczenie maszynowe i sieci neuronowe, WPP 2004. J.Han, M.Kember: Data mining. Opis pakietu WEKA oraz inspiracji ze slajdów wykładów nt. data mining następujących osób: J.Han; G.Piatetsky-Shapiro; Materiały związane z WEKA i prezentacji W.Kotłowski nt. oceny systemów uczących się. 3

Wiedza o klasyfikacji obserwacji Problem określania zasad przydziału obiektów / obserwacji do znanych wstępnie klas na podstawie analizy danych o przykładach klasyfikacji. Wiek 21 Zawód Prac. fiz. dochód 1220 Decyzja Nie kupi Algorytm eksploracji 26 Menedżer 2900 Kupuje 44 Inżynier 2600 Kupuje 23 Student 1100 Kupuje 56 45 25 Nauczyciel Lekarz Student 1700 2200 800 Nie kupi Nie kupi Kupuje Reprezentacja wiedzy: np. reguły R1. Jeżeli student to kupuje komputer R2. Jeżeli dochód > 2400 Przykłady uczące 4

Klasyfikacja Typowe zastosowania przydział kredytów, analiza danych finansowych, diagnoza i dobór terapii w medycynie, target marketing, diagnostyka techniczna i systemy sterowania, klasyfikacja dokumentów, wiadomości, przewidywanie struktur drugorzędowych w biologii, oraz wiele innych 5

Podstawowe metody (klasyfikacyjne) metody symboliczne (drzewa i reguły decyzyjne), metody oparte na logice matematycznej (ILP), sztuczne sieci neuronowe, metody k-najbliższych sąsiadów, klasyfikacja bayesowska (Naive Bayes), analiza dyskryminacyjna (statystyczna), metody wektorów wspierających, regresja logistyczna, klasyfikatory genetyczne.... 6

Drzewa decyzyjne Age Car Type Risk 20 Combi High 18 Sports High 40 Sports High 50 Family Low 35 Minivan Low 30 Combi High 32 Family Low 40 Combi Low High Age < 31 Car Type is sports High Low 7

Reguły decyzyjne training data Classification / Learning algorithm Age Car Type Risk 20 Combi High 18 Sports High 40 Sports High 50 Family Low 35 Minivan Low 30 Combi High 32 Family Low 40 Combi Low if age < 31 or Car Type =Sports then Risk = High 8

Klasyfikacja podejście statystyczne Binarna klasyfikacja x x x x o x x x x x o o o o o o o x o o o o o Poszukiwanie przybliżenia granicy decyzyjnej ang. decision boundary Obserwacje ponad linią przydziel do klasy x Obserwacje pod linią przydziel do klasy o Przykłady: Fisher analiza dyskryminacyjna, SVM, ANN 9

WEKA Classifier panel 10

Poszukiwanie i ocena wiedzy klasyfikacyjnej Perspektywy odkrywania wiedzy Predykcja klasy (-fikacji) przewidywanie przydziału nowych obiektów do klas / reprezentacja wiedzy wykorzystywana jako tzw. klasyfikator (ocena zdolności klasyfikacyjnej na ogół jedno wybrane kryterium). Opis klasyfikacji obiektów wyszukiwanie wzorców charakteryzujących właściwości danych i prezentacja ich użytkownikowi w zrozumiałej formie (ocena wielokryterialna i bardziej subiektywna). 11

Tworzenie i ocena klasyfikatorów Jest procesem trzyetapowym: 1. Konstrukcja modelu w oparciu o zbiór danych wejściowych (przykłady uczące). Przykładowe modele - klasyfikatory: drzewa decyzyjne, reguły (IF.. THEN..), sieci neuronowe. 2. Ocena modelu (przykłady testujące) 3. Użycie modelu (np. klasyfikowanie nowych faktów lub interpretacja regularności) 12

Kryteria oceny metod klasyfikacyjnych Trafność klasyfikacji (Classification / Predictive accuracy) Szybkość i skalowalność: czas uczenia się, szybkość samego klasyfikowania Odporność (Robustness) szum (noise), missing values, Zdolności wyjaśniania: np. drzewa decyzyjne vs. sieci neuronowe Złożoność struktury, np. rozmiar drzew decyzyjnego, miary oceny reguły 13

Trafność klasyfikowania Użyj przykładów testowych nie wykorzystanych w fazie indukcji klasyfikatora: N t liczba przykładów testowych N c liczba poprawnie sklasyfikowanych przykładów testowych Trafność klasyfikowania (classification accuracy): η = Ν N Alternatywnie błąd klasyfikowania. Inne możliwości analizy: macierz pomyłek (ang. confusion matrix), koszty pomyłek i klasyfikacja binarna, miary Sensitivity i Specificity / krzywa ROC c t ε = N t N t Ν c 14

Macierz pomyłek Analiza pomyłek w przydziale do różnych klas przy pomocy tzw. macierz pomyłek (ang. confusion matrix) Macierz r r, gdzie wiersze odpowiadają poprawnym klasom decyzyjnym, a kolumny decyzjom przewidywanym przez klasyfikator; na przecięciu wiersza i oraz kolumny j - liczba przykładów n-ij należących oryginalnie do klasy i-tej, a zaliczonej do klasy j-tej Przykład: Oryginalne klasy Przewidywane klasy decyzyjne K 1 K 2 K 1 0 50 0 K 3 K 2 0 48 2 K 3 0 4 46 15

Klasyfikacja binarna Niektóre zastosowania jedna z klas posiada szczególne znaczenie, np. diagnozowanie poważnej choroby. Problem klasyfikacja binarna. Oryginalne klasy Przewidywane klasy decyzyjne Pozytywna Pozytywna TP Negatywna FN Negatywna FP Nazewnictwo (inspirowane medycznie): TP (ang. true positive) liczba poprawnie sklasyfikowanych przykładów z wybranej klasy (ang. hit), FN (ang. false negative) liczba błędnie sklasyfikowanych przykładów z tej klasy, tj. decyzja negatywna podczas gdy przykład w rzeczywistości jest pozytywny (błąd pominięcia - z ang. miss), TN (ang. true negative) liczba przykładów poprawnie nie przydzielonych do wybranej klasy (poprawnie odrzuconych z ang. correct rejection), FP (ang. false positive) liczba przykładów błędnie przydzielonych do wybranej klasy, podczas gdy w rzeczywistości do niej nie należą (ang. false alarm). TN 16

Miary stosowane w analizie klasyfikacji binarnej Dodatkowe miary oceny rozpoznawania wybranej klasy: Wrażliwość / czułość (ang. sensitivity) / TPR = TP /(TP+FN), Specyficzność (ang. specificity)=tn /(FP+TN). Inne miary: False-positive rate = FP /(FP+TN), czyli 1 specyficzność. Wnikliwszą analizę działania klasyfikatorów binarnych dokonuje się w oparciu o analizę krzywej ROC, ang. Receiver Operating Characteristic). Oryginalne klasy Przewidywane klasy decyzyjne Pozytywna Negatywna Pozytywna TP FP Negatywna FN TN 17

Analiza macierzy spróbuj rozwiązać TP Sensitivity = =? TP+FN TN Specificity = =? TN+FP Co przewidywano 1 0 Rzeczywista Klasa 1 0 60 30 80 20 60+30 = 90 przykładów w danych należało do Klasy 1 80+20 = 100 przykładów było w Klasy 0 90+100 = 190 łączna liczba przykładów 18

Jak szacować wiarygodnie? Zależy od perspektywy użycia wiedzy: Predykcja klasyfikacji albo opisowa Ocena na zbiorze uczącym nie jest wiarygodna jeśli rozważamy predykcję nowych faktów! Nowe obserwacje najprawdopodobniej nie będą takie same jak dane uczące! Choć zasada reprezentatywności próbki uczącej Problem przeuczenia (ang. overfiting) Nadmierne dopasowanie do specyfiki danych uczących powiązane jest najczęściej z utratą zdolności uogólniania (ang. generalization) i predykcji nowych faktów! 19

Podejście empiryczne Zasada Train and test Gdy nie ma podziału zadanego przez nauczyciela, to wykorzystaj losowe podziały. Nadal pytanie jak szacować wiarygodnie? 20

Empiryczne metody estymacji Techniki podziału: hold-out Użyj dwóch niezależnych zbiorów: uczącego (2/3), testowego (1/3) Jednokrotny podział losowy stosuje się dla dużych zbiorów (hold-out) Cross-validation - Ocena krzyżowa Podziel losowo dane w k podzbiorów (równomierne lub warstwowe) Użyj k-1 podzbiorów jako części uczącej i pozostałej jako testującej ( k-fold cross-validation). Oblicz wynik średni. Stosowane dla danych o średnich rozmiarach (najczęściej k = 10) Uwaga opcja losowania warstwowego (ang. stratified sampling). Bootstrapping i leaving-one-out Dla małych rozmiarów danych. Leaving-one-out jest szczególnym przypadkiem, dla którego liczba iteracji jest równa liczbie przykładów 21

Jednokrotny podział (hold-out) duża liczba przykładów (> tysięcy) Wszystkie przykłady 66.7% Podziel losowo 33.3% Training Set Buduj klasyfikator Testing Set Oszacowanie miar, np. trafności 22

Mniejsza liczba przykładów (od 100 do kilku tysięcy) * cross-validation Powtórz k razy Dostępne przykłady Np. 90% (k=10) 10% Zbiór uczący Zbuduj k niezależnych klasyfikatorów Zbiór testowy Estymuj średnią ocenę 23

24

Uwagi o 10 fold cross-validation Stosuj wersję: stratified ten-fold cross-validation Dlaczego 10? Doświadczenie badaczy głównie eksperymentalne (zwłaszcza związane CART) Stratification warstwowość ogranicza wariancje estymaty błędy! Lepsza wersja: repeated stratified cross-validation np. 10-fold cross-validation is powtórzone kilka razy (z innym ziarnem rozkładu prawdopodobieństwa) i wynik średni z wielu powtórzeń. 25

Uwaga na zaawansowane strojenie parametrów algorytmu podejście Train, Validation, Test split Results Known Data + + -- + Training set Model Builder Evaluate Predictions Model Builder Validation set Y N + - + - Final Test Set Final Model + - + - Final Evaluation 26

Krzywe uczenia się - learning curve Klasyfikacja tekstów przez Naive Bayes 20 Newsgroups dataset - [McCallum & Nigam, 1998] 27

Porównywanie wielu klasyfikatorów Często należy porównać dwa klasyfikatory Uwaga: porównanie z niezależnością od danych? Generatory losowe Rzeczywiste dane (problem dependent) Oszacuj 10-fold CV estimates. Trudność: wariancja oszacowania. Możesz oczywiście zastosować repeated CV. Ale jak wiarygodnie ustalić konkluzję który jest lepszy? 28

Porównywanie klasyfikatorów Jak oceniać skuteczność klasyfikacyjną dwóch różnych klasyfikatorów na tych samych danych? Ograniczamy zainteresowanie wyłącznie do trafności klasyfikacyjnej oszacowanie techniką 10-krotnej oceny krzyżowej (ang. k-fold cross validation). Zastosowano dwa różne algorytmy uczące AL1 i AL2 do tego samego zbioru przykładów, otrzymując dwa różne klasyfikatory KL1 i KL2. Oszacowanie ich trafności klasyfikacyjnej (10-fcv): klasyfikator KL1 86,98% klasyfikator KL2 87,43%. Czy uzasadnione jest stwierdzenie, że klasyfikator KL2 jest skuteczniejszy niż klasyfikator KL1? 29

Analiza wyniku oszacowania trafności klasyfikowania Podział Kl_1 Kl_2 1 87,45 88,4 2 86,5 88,1 3 86,4 87,2 4 86,8 86 5 87,8 87,6 6 86,6 86,4 7 87,3 87 8 87,2 87,4 9 88 89 10 85,8 87,2 Srednia 86,98 87,43 Odchylenie 0,65 0,85 Test statystyczny (t-studenta dla par zmiennych/zależnych) H0 :? temp = 1,733 (p = 0,117)??? ALE!!! W art. naukowych zastosuj odpowiednie poprawki przy wykonaniu testu (kwestia naruszenia założeń co do rozkładu t). Nadeau i Bengio 2003 proponują modyfikacje testu. 30

Perspektywa opisowa Trudniejsza niż ocena zdolności klasyfikacyjnych. Rozważmy przykład reguł: Klasyfikacyjne (decyzyjne). Asocjacyjne. Pojedyncza reguła oceniana jako potencjalny reprezentant interesującego wzorca z danych W literaturze propozycje tzw. ilościowych miar oceny reguł oraz sposoby definiowania interesujących reguł, także na podstawie wymagań podawanych przez użytkownika. 31

Opisowe miary oceny reguł Miary dla reguły r (jeżeli P to Q) definiowane na podstawie zbioru przykładów U, z którego została wygenerowana. Tablica kontyngencji dla reguły jeżeli P to Q : Q Q P n PQ n P Q n P P n PQ n P Q n P n Q n Q n Przegląd różnych miar, np.: Yao Y.Y, Zhong N.: An analysis of quantitative measures associated with rules, w: Proc. of the Third Pacific-Asia Conference on Knowledge Discovery and Data Mining, LNAI 1574, Springer, 1999, s. 479-488. Także rozprawa habilitacyjna J.Stefanowski: Algorytmy indukcji reguł w odkrywaniu wiedzy. 32

Popularne miary oceny reguł Wsparcie reguły (ang. support) zdefiniowane jako: G( P Q) = n PQ n Dokładność (ang. accuracy) / wiarygodność (ang. confidence) reguły (bezwzględne wsparcie konkluzji Q przez przesłankę P): npq AS ( Q P) = np Względne pokrycie (ang. coverage) reguły zdefiniowane jako: = AS ( P Q) = n n PQ Q 33

Zaawansowane miary oceny reguł Change of support rodzaj konfirmacji wsparcia hipotezy Q przez wystąpienie przesłanki P (propozyjca Piatetsky-Shapiro) gdzie G( Q) = n n Zakres wartości od -1 do +1 ; Interpretacja: różnica między prawdopodobieństwami a prior i a posterior; dodatnie wartości wystąpienie przesłanki P powoduje konkluzję Q; ujemna wartość wskazuje że nie ma wpływu. Degree of independence: CS( Q P) = AS( Q P) G( Q) Q IND( Q, P) = G( P Q) G( P) G( Q) 34

Złożone miary oceny reguł Połączenie miar podstawowych Significance of a rule (propozycja Yao i Liu) Klosgen s measure of interest Michalski s weighted sum WSC The relative risk (Ali, Srikant): S( Q P) = AS( Q P) IND( Q, P) α K( Q P) = G( P) ( AS( Q P) G( Q)) ( Q 2 P) = w1 AS( Q P) + w AS( P Q) r( Q P) = AS( Q P) AS( Q P) 35

No i na razie wystarczy O innych zagadnieniach procesu odkrywania wiedzy jeszcze porozmawiamy! 36