Wprowadzenie do programu RapidMiner, część 2 Michał Bereta 1. Wykorzystanie wykresu ROC do porównania modeli klasyfikatorów

Podobne dokumenty
Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów

Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta

Wprowadzenie do programu RapidMiner, część 4 Michał Bereta

Hard-Margin Support Vector Machines

Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora.

Reguły asocjacyjne w programie RapidMiner Michał Bereta

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

OpenPoland.net API Documentation

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Wprowadzenie do programu RapidMiner, część 3 Michał Bereta

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.

Instrukcja obsługi User s manual

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Tychy, plan miasta: Skala 1: (Polish Edition)

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Wprowadzenie do programu RapidMiner, część 5 Michał Bereta

Wprowadzenie do programu RapidMiner, częśd 1 Michał Bereta Program RapidMiner (RM) ma trzy główne widoki (perspektywy):

Laboratorium 4. Naiwny klasyfikator Bayesa.

Stargard Szczecinski i okolice (Polish Edition)

ANKIETA ŚWIAT BAJEK MOJEGO DZIECKA

Machine Learning for Data Science (CS4786) Lecture 24. Differential Privacy and Re-useable Holdout

Testy jednostkowe - zastosowanie oprogramowania JUNIT 4.0 Zofia Kruczkiewicz

Previously on CSCI 4622

Zmiany techniczne wprowadzone w wersji Comarch ERP Altum

9. Praktyczna ocena jakości klasyfikacji

SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Camspot 4.4 Camspot 4.5

Wprowadzenie do programu RapidMiner, część 3 Michał Bereta


Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Estimation and planing. Marek Majchrzak, Andrzej Bednarz Wroclaw,

Patients price acceptance SELECTED FINDINGS

Wprowadzenie do programu RapidMiner Studio 7.6, część 9 Modele liniowe Michał Bereta

Data Mining Wykład 4. Plan wykładu

Installation of EuroCert software for qualified electronic signature

Revenue Maximization. Sept. 25, 2018

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

EXAMPLES OF CABRI GEOMETRE II APPLICATION IN GEOMETRIC SCIENTIFIC RESEARCH

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

Linear Classification and Logistic Regression. Pascal Fua IC-CVLab

Analysis of Movie Profitability STAT 469 IN CLASS ANALYSIS #2

Laboratorium 6. Indukcja drzew decyzyjnych.

FORMULARZ REKLAMACJI Complaint Form

Agenda. WEKA Podstawowe pojęcia. Przykład danych

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

POLITYKA PRYWATNOŚCI / PRIVACY POLICY

Laboratorium 5. Adaptatywna sieć Bayesa.

Surname. Other Names. For Examiner s Use Centre Number. Candidate Number. Candidate Signature

Financial support for start-uppres. Where to get money? - Equity. - Credit. - Local Labor Office - Six times the national average wage (22000 zł)

Testowanie modeli predykcyjnych

Rev Źródło:

Extraclass. Football Men. Season 2009/10 - Autumn round

kdpw_stream Struktura komunikatu: Status komunikatu z danymi uzupełniającymi na potrzeby ARM (auth.ste ) Data utworzenia: r.


Katowice, plan miasta: Skala 1: = City map = Stadtplan (Polish Edition)

tum.de/fall2018/ in2357

Wyk lad 8: Leniwe metody klasyfikacji

Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2)

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

Knovel Math: Jakość produktu

Dominika Janik-Hornik (Uniwersytet Ekonomiczny w Katowicach) Kornelia Kamińska (ESN Akademia Górniczo-Hutnicza) Dorota Rytwińska (FRSE)

CPX Cisco Partner Excellence CSPP program partnerski

PLSH1 (JUN14PLSH101) General Certificate of Education Advanced Subsidiary Examination June Reading and Writing TOTAL

Wykaz linii kolejowych, które są wyposażone w urządzenia systemu ETCS

SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS

Test sprawdzający znajomość języka angielskiego

LEARNING AGREEMENT FOR STUDIES

Jak zasada Pareto może pomóc Ci w nauce języków obcych?

Wykaz linii kolejowych, które są wyposażone w urzadzenia systemu ETCS

Fig 5 Spectrograms of the original signal (top) extracted shaft-related GAD components (middle) and

Klasyfikacja Support Vector Machines

Zarządzanie sieciami telekomunikacyjnymi

HAPPY ANIMALS L01 HAPPY ANIMALS L03 HAPPY ANIMALS L05 HAPPY ANIMALS L07

HAPPY ANIMALS L02 HAPPY ANIMALS L04 HAPPY ANIMALS L06 HAPPY ANIMALS L08

Warsztaty Ocena wiarygodności badania z randomizacją

Dolny Slask 1: , mapa turystycznosamochodowa: Plan Wroclawia (Polish Edition)

RADIO DISTURBANCE Zakłócenia radioelektryczne

DUAL SIMILARITY OF VOLTAGE TO CURRENT AND CURRENT TO VOLTAGE TRANSFER FUNCTION OF HYBRID ACTIVE TWO- PORTS WITH CONVERSION

Polska Szkoła Weekendowa, Arklow, Co. Wicklow KWESTIONRIUSZ OSOBOWY DZIECKA CHILD RECORD FORM

photo graphic Jan Witkowski Project for exhibition compositions typography colors : : janwi@janwi.com

SG-MICRO... SPRĘŻYNY GAZOWE P.103

Automatyczne generowanie testów z modeli. Bogdan Bereza Automatyczne generowanie testów z modeli

TEST FOR SOBRIETY KONTROLA STANU TRZEŹWOŚCI

U3000/U3100 Mini (Dla Komputera Eee na systemie operacyjnym Linux) Krótka Instrukcja

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

Instrukcja konfiguracji usługi Wirtualnej Sieci Prywatnej w systemie Mac OSX

Pielgrzymka do Ojczyzny: Przemowienia i homilie Ojca Swietego Jana Pawla II (Jan Pawel II-- pierwszy Polak na Stolicy Piotrowej) (Polish Edition)

Agnostic Learning and VC dimension

DODATKOWE ĆWICZENIA EGZAMINACYJNE

RADIO DISTURBANCE Zakłócenia radioelektryczne

Eksploracja danych OCENA KLASYFIKATORÓW. Wojciech Waloszek. Teresa Zawadzka.

Realizacja systemów wbudowanych (embeded systems) w strukturach PSoC (Programmable System on Chip)

INSTRUKCJE JAK AKTYWOWAĆ SWOJE KONTO PAYLUTION

17-18 września 2016 Spółka Limited w UK. Jako Wehikuł Inwestycyjny. Marek Niedźwiedź. InvestCamp 2016 PL

Ilona B. Miles website Terms of Use (ewentualnie: Service)

A Zadanie

Transkrypt:

Wprowadzenie do programu RapidMiner, część 2 Michał Bereta www.michalbereta.pl 1. Wykorzystanie wykresu ROC do porównania modeli klasyfikatorów Zaimportuj dane pima-indians-diabetes.csv. (Baza danych poświęcona diagnozowaniu cukrzycy). Jest to problem klasyfikacji dwuklasowej. Podczas importu danych bądź pewny, że pierwsza linijka nie jest wzięta jako opis atrybutów (wybierz - ): Upewnij się również, że wszystkie atrybuty są typu real a ostatnia kolumna jako label i nominal : 1

Użyjemy operatora Compare ROCs : Jest to proces zagnieżdżony i możemy dodad do niego podprocesy, np. proces uczenia naiwnego klasyfikatora Bayesa oraz drzewo decyzyjne: Po uruchomieniu: 2

Jakie są parametry Compare ROCs? Z dokumentacji: The comparison is based on the average values of a k-fold cross validation. Please study the documentation of the X-Validation operator for more information about cross validation. Alternatively, this operator can use an internal split into a test and a training set from the given data set in this case the operator behaves like the Split Validation operator. Please note that any former predicted label of the given ExampleSet will be removed during the application of this operator. Co oznacza podejście optymistyczne, pesymistyczne i neutralne? Z dokumentacji: ROC curves are calculated by first ordering the classified examples by confidence. Afterwards all the examples are taken into account with decreasing confidence to plot the false positive rate on the x- axis and the true positive rate on the y-axis. With optimistic, neutral and pessimistic there are three possibilities to calculate ROC curves. If there is more than one example for a confidence with optimistic ROC calculation the correct classified examples are taken into account before looking at the false classification. With pessimistic calculation it is the other way round: wrong classifications are taken into account before looking at correct classifications. Neutral calculation is a mix of both calculation methods described above. Here correct and false classifications are taken into account alternately. If there are no examples with equal confidence or all examples with equal confidence are assigned to the same class the optimistic, neutral and pessimistic ROC curves will be the same. 3

Zwród uwagę, że analiza ROC jest możliwa (w swojej oryginalnej postaci) dla problemów dwuklasowych. Próba użycia bazy Iris, gdzie są trzy klasy, zakooczy się niepowodzeniem: Aby sprawdzid wartośd AUC (Area under Curve), można skorzystad ze znanego już operatora Performance. Z dokumentacji: Przykładowo: 4

Otrzymujemy: 5

Zadanie: Wykonaj analizy ROC oraz AUC dla innych klasyfikatorów i innych danych. 6

2. Wykorzystanie metody bootstrap do estymacji błędu modelu RapidMiner udostępnia operator Sample (Bootstrapping), który może wygenerowad pseudopróbę na podstawie dostępnego zbioru przykładów. Np. W wyniku, z oryginalnego zbioru: 7

dostaniemy: Zwród uwagę, że pseudopróba może mied większy rozmiar niż oryginalny zbiór dostępnych przykładów (uwzględniane są duplikaty - wynik losowania ze zwracaniem). Nas jednak bardziej interesuje operator Bootstrapping Validation. Z dokumentacji: This operator performs validation after bootstrapping a sampling of training data set in order to estimate the statistical performance of a learning operator (usually on unseen data sets). It is mainly used to estimate how accurately a model (learnt by a particular learning operator) will perform in practice. Możemy użyd go zamiast kroswalidacji do estymacji spodziewanego błędu. 8

Z dokumentacji: Bootstrapping sampling is sampling with replacement. In sampling with replacement, at every step all examples have equal probability of being selected. Once an example has been selected for the sample, it remains candidate for selection and it can be selected again in any other coming steps. Thus a sample with replacement can have the same example multiple number of times. More importantly, a sample with replacement can be used to generate a sample that is greater in size than the original ExampleSet. Zwród uwagę na to co oznacza parametr sample ratio : sample ratio This parameter specifies the relative size of the training set. In other validation schemes this parameter should be between 1 and 0, where 1 means that the entire ExampleSet will be used as training set. In this operator its value can be greater than 1 because bootstrapping sampling can generate an ExampleSet with a number of examples greater than the original ExampleSet. All examples that are not selected for the training set are automatically selected for the test set. Wygenerowane ID pozwoli sprawdzid, że rzeczywiście przykłady w pseudoprobie się powtarzają (lecz nie w testowej części wszystkich dostępnych danych). Aby to zobaczyd, ustaw break point before na etapie trenowania: 9

oraz na etapie testowania: Przykładowo (trenujące powtarzanie się id): 10

Testowe (bez powtórzeo): Wynik: Powyższe wartości podlegają podobnej interpretacji jak np. accuracy otrzymane z kros walidacji. Pytanie: co lepiej szacuje spodziewany błąd predykcji: kros walidacja czy metoda bootstrap? 11

Zadanie: 1. Dla danych Pima przygotuj podział na dane trenujące i testowe (podobnie jak to miało miejsce na kolokwium) w proporcji np. 60% / 40%. 2. Wybierz konkretny model klasyfikatora, np. drzewo decyzyjne. 3. Wykorzystując dane trenujące oszacuj poziom spodziewanego błędu na danych testowych za pomocą zarówno Split validation, kros walidacji jak i metody bootstrap. 4. Wytrenuj klasyfikator na całości zbioru trenującego i wygeneruj odpowiedzi dla danych testowych i sprawdź jaki jest rzeczywisty poziom błędu. Która metoda szacowania błędu była najbliżej? 12