Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów

Podobne dokumenty
Wprowadzenie do programu RapidMiner, część 2 Michał Bereta 1. Wykorzystanie wykresu ROC do porównania modeli klasyfikatorów

Hard-Margin Support Vector Machines

Wprowadzenie do programu RapidMiner, część 5 Michał Bereta

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

Testy jednostkowe - zastosowanie oprogramowania JUNIT 4.0 Zofia Kruczkiewicz

Algorytm k-średnich. Źródło: LaroseD.T., Okrywanie wiedzy w danych.wprowadzenie do eksploracji danych, PWN, Warszawa 2005.

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

Wprowadzenie do programu RapidMiner, część 4 Michał Bereta

Analysis of Movie Profitability STAT 469 IN CLASS ANALYSIS #2

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Zmiany techniczne wprowadzone w wersji Comarch ERP Altum

Zarządzanie sieciami telekomunikacyjnymi

Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta

Reguły asocjacyjne w programie RapidMiner Michał Bereta

Convolution semigroups with linear Jacobi parameters

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

y = The Chain Rule Show all work. No calculator unless otherwise stated. If asked to Explain your answer, write in complete sentences.

OpenPoland.net API Documentation

Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora.

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Linear Classification and Logistic Regression. Pascal Fua IC-CVLab

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS

Wprowadzenie do programu RapidMiner, część 3 Michał Bereta

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

ALHE Jarosław Arabas Testowanie metod optymalizacji

POLITECHNIKA ŚLĄSKA INSTYTUT AUTOMATYKI ZAKŁAD SYSTEMÓW POMIAROWYCH

Wprowadzenie do programu RapidMiner Studio 7.6, część 9 Modele liniowe Michał Bereta

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Instrukcja obsługi User s manual

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

HAPPY ANIMALS L01 HAPPY ANIMALS L03 HAPPY ANIMALS L05 HAPPY ANIMALS L07

HAPPY ANIMALS L02 HAPPY ANIMALS L04 HAPPY ANIMALS L06 HAPPY ANIMALS L08

Installation of EuroCert software for qualified electronic signature

EXAMPLES OF CABRI GEOMETRE II APPLICATION IN GEOMETRIC SCIENTIFIC RESEARCH

Revenue Maximization. Sept. 25, 2018

kdpw_stream Struktura komunikatu: Status komunikatu z danymi uzupełniającymi na potrzeby ARM (auth.ste ) Data utworzenia: r.

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich

Katowice, plan miasta: Skala 1: = City map = Stadtplan (Polish Edition)

POLITYKA PRYWATNOŚCI / PRIVACY POLICY

Tychy, plan miasta: Skala 1: (Polish Edition)

Wykaz linii kolejowych, które są wyposażone w urządzenia systemu ETCS

European Crime Prevention Award (ECPA) Annex I - new version 2014

Zestawienie czasów angielskich

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

Wykaz linii kolejowych, które są wyposażone w urzadzenia systemu ETCS

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

RADIO DISTURBANCE Zakłócenia radioelektryczne


Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2)

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

RADIO DISTURBANCE Zakłócenia radioelektryczne

Few-fermion thermometry

Wprowadzenie do programu RapidMiner, część 3 Michał Bereta

Ilona B. Miles website Terms of Use (ewentualnie: Service)

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

STATISTICAL METHODS IN BIOLOGY

Raport bieżący: 44/2018 Data: g. 21:03 Skrócona nazwa emitenta: SERINUS ENERGY plc

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Rev Źródło:

Matematyka i statystyka matematyczna dla rolników w SGGW

ITIL 4 Certification

A Zadanie

Czego się nie dowiemy z NHST? Efekt size, stupid!1. Null Hypothesis Significance Testing

Towards Stability Analysis of Data Transport Mechanisms: a Fluid Model and an Application

Knovel Math: Jakość produktu

DUAL SIMILARITY OF VOLTAGE TO CURRENT AND CURRENT TO VOLTAGE TRANSFER FUNCTION OF HYBRID ACTIVE TWO- PORTS WITH CONVERSION

Stargard Szczecinski i okolice (Polish Edition)

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

JĘZYK ANGIELSKI ĆWICZENIA ORAZ REPETYTORIUM GRAMATYCZNE

Egzamin maturalny z języka angielskiego na poziomie dwujęzycznym Rozmowa wstępna (wyłącznie dla egzaminującego)

ELF. system: pokój młodzieżowy / teenagers room MEBLE MŁODZIEŻOWE / YOUTH ROOM FURNITURE ELF

DO MONTAŻU POTRZEBNE SĄ DWIE OSOBY! INSTALLATION REQUIRES TWO PEOPLE!

18. Przydatne zwroty podczas egzaminu ustnego. 19. Mo liwe pytania egzaminatora i przyk³adowe odpowiedzi egzaminowanego


EGARA Adam Małyszko FORS. POLAND - KRAKÓW r

Pielgrzymka do Ojczyzny: Przemowienia i homilie Ojca Swietego Jana Pawla II (Jan Pawel II-- pierwszy Polak na Stolicy Piotrowej) (Polish Edition)

Patients price acceptance SELECTED FINDINGS

Instrukcja konfiguracji usługi Wirtualnej Sieci Prywatnej w systemie Mac OSX

S t a t y s t y k a, część 3. Michał Żmihorski

FORMULARZ REKLAMACJI Complaint Form

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Formularz recenzji magazynu. Journal of Corporate Responsibility and Leadership Review Form

Bardzo formalny, odbiorca posiada specjalny tytuł, który jest używany zamiast nazwiska

Zestawienie czasów angielskich

Wykład 12 Testowanie hipotez dla współczynnika korelacji

deep learning for NLP (5 lectures)

Jak działa grawitacja?

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Transkrypt:

Rozpoznawanie twarzy metodą PCA Michał Bereta www.michalbereta.pl 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów Wiemy, że możemy porównywad klasyfikatory np. za pomocą kroswalidacji. Czasami jednak obserwowane różnice są dośd małe pytanie zatem czy są istotne? Do odpowiedzi na to pytanie mogą służyd różne testy statystyczne. W RM dostępne są w tym celu operatory T-Test oraz ANOVA. Procedura (w dużym uproszczeniu) składa się następujących kroków (T-Test): a. Załóż (hipoteza zerowa), że nie ma żadnej różnicy między średnim wynikiem działania dwóch klasyfikatorów, a obserwowane różnice (np. w PerformanceVectors) są wynikiem losowych fluktuacji. b. Zakładając pewien model statystyczny, który, jak przyjmujemy, odpowiada za te fluktuacje, obliczamy prawdopodobieostwo, że możemy natrafid na właśnie takie wartości. c. Jeśli to prawdopodobieostwo jest odpowiednio małe (np. <5%) to na takim poziomie istotności odrzucamy hipotezę o braku różnicy między klasyfikatorami, tzn. uznajemy, że lepsza jakośd jednego z nich jest statystycznie istotna (nie jest przypadkiem). W powyższym narażamy się na błąd tzw. pierwszego rodzaju, czy odrzucenie hipotezy zerowej, kiedy jest ona prawdziwa. W tym przypadku znaczy to, że rzeczywiście nie ma istotnych różnic między klasyfikatorami. Aby porównad więcej niż dwa klasyfikatory, można parami wielokrotnie wykonad T-Test. Wtedy jednak więcej razy mamy szansę na popełnienie błędu pierwszego rodzaju. Lepiej wykorzystad test ANOVA, który w jednym teście uwzględnid może wiele klasyfikatorów. Porównaj z dokumentacją RM: T-Test (RapidMiner Core) Synopsis This operator is used for comparison of performance vectors. This operator performs a t-test to determine the probability for the null hypothesis i.e. 'the actual means are the same'. 1

Description The T-Test operator determines if the null hypothesis (i.e. all actual mean values are the same) holds for the given performance vectors. This operator uses a simple paired t-test to determine the probability that the null hypothesis is wrong. Since a t-test can only be applied on two performance vectors this test will be applied to all possible pairs. The result is a significance matrix. Paired t-test is a test of the null hypothesis that the difference between two responses measured on the same statistical unit has a mean value of zero. For example, suppose we measure the size of a cancer patient's tumor before and after a treatment. If the treatment is effective, we expect the tumor size for many of the patients to be smaller following the treatment. This is often referred to as the 'paired' or 'repeated measures' t-test. In case of this operator the dependent samples (or 'paired') t-tests consist of a pair of performance vectors. Doing multiple paired t-tests would result in an increased chance of committing a type I error. 'False positive' or Type I error is defined as the probability that a decision to reject the null hypothesis will be made when it is in fact true and should not have been rejected. It is recommended to apply an additional ANOVA test to determine if the null hypothesis is wrong at all. Please use the ANOVA operator for performing the ANOVA test. ANOVA (RapidMiner Core) Synopsis This operator is used for comparison of performance vectors. It performs an analysis of variance (ANOVA) test to determine the probability for the null hypothesis i.e. 'the actual means are the same'. Description ANalysis Of VAriance (ANOVA) is a statistical model in which the observed variance in a particular variable is partitioned into components attributable to different sources of variation. In its simplest form, ANOVA provides a statistical test of whether or not the means of several groups are all equal, and therefore generalizes t-test to more than two groups. Doing multiple two-sample t-tests would result in an increased chance of committing a type I error. For this reason, ANOVA is useful in comparing two, three, or more means. 'False positive' or Type I error is defined as the probability that a decision to reject the null hypothesis will be made when it is in fact true and should not have been rejected. RapidMiner provides the T-Test operator for performing the t-test. Paired t-test is a test of the null hypothesis that the difference between two responses measured on the same statistical unit has a mean value of zero. Doing multiple two-sample t-tests would result in an increased chance of committing a type I error. For this reason, ANOVA is useful in comparing two, three, or more means. 2

Przykład: Czy jest statystycznie istotna różnica między drzewem decyzyjnym i perceptronem przy klasyfikacji danych pima/ionosphere? Dla kroswalidacji drzewa: Dla kroswalidacji perceptronu: 3

Poziom istotności T-Testu ustawiamy na: Oznacza to, że jeśli prawdopodobieostwo wystąpienia danej sytuacji jako całkowicie losowej będzie ocenione poniżej alpha, to hipoteza zerowa zostanie odrzucona i klasyfikatory zostaną uznane za statystycznie różne na danym poziomie istotności (5%). Wyniki: Perceptron Drzewo 4

T-Test Wartośd 0.009 jest mniejsza niż 0.05 więc odrzucamy hipotezę o braku istotnych różnic między tymi klasyfikatorami. Dla Pima: Dla perceptronu 5

Dla drzewa T-Test Tutaj jak widad, nie ma wystarczających przesłanek (zgodnie z przyjętym modelem) aby odrzucid hipotezę zerową o braku istotnych różnic. Wypróbuj również test ANOVA: 6

Dla ionosphere: 7

Różnica między operatorami T-Test i ANOVA jest wyraźna, kiedy porównujemy więcej niż dwa klasyfikatory. Wtedy T-Test jest uruchamiany wielokrotnie dla każdej pary, lecz ANOVA to jeden test uruchamiany raz dla wszystkich porównywanych klasyfikatorów (hipoteza zerowa to założenie, że nie ma między nimi wszystkimi istotnej równicy). Zadanie: Dodaj do przykładu klasyfikator NaiveBayes. Perceptron: Tree: 8

Bayes: T-Test sugeruje, że nie można założyd braku różnicy między drzewem i perceptronem. ANOVA pozwala wnioskowad, że nie można założyd braku istotnych różnic między trzema analizowanymi klasyfikatorami. 9