Klasyfikatory liniowe Linear classifiers

Podobne dokumenty
Pattern Classification

Grupowanie. Wprowadzenie. Metody hierarchiczne. Modele mieszane (mixture models) Metody najmniejszych kwadratów. Zastosowania

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup


5. Analiza dyskryminacyjna: FLD, LDA, QDA

Weryfikacja hipotez dla wielu populacji

SYSTEMY UCZĄCE SIĘ WYKŁAD 5. LINIOWE METODY KLASYFIKACJI. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

n liczba zmiennych decyzyjnych c współczynniki funkcji celu a współczynniki przy zmienych decyzyjnych w warunkach

Podstawy teorii falek (Wavelets)

System Przeciwdziałania Powstawaniu Bezrobocia na Terenach Słabo Zurbanizowanych SPRAWOZDANIE Z BADAŃ Autor: Joanna Wójcik

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Prawdopodobieństwo i statystyka r.

u u u( x) u, x METODA RÓŻNIC SKOŃCZONYCH, METODA ELEMENTÓW BRZEGOWYCH i METODA ELEMENTÓW SKOŃCZONYCH

Funkcje i charakterystyki zmiennych losowych

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

ANALIZA PREFERENCJI SŁUCHACZY UNIWERSYTETU TRZECIEGO WIEKU Z WYKORZYSTANIEM WYBRANYCH METOD NIESYMETRYCZNEGO SKALOWANIA WIELOWYMIAROWEGO

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Natalia Nehrebecka. Wykład 2

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Badania operacyjne w logistyce i zarządzaniu produkcją

Wykład 1 Zagadnienie brzegowe liniowej teorii sprężystości. Metody rozwiązywania, metody wytrzymałości materiałów. Zestawienie wzorów i określeń.

Procedura normalizacji

Sztuczne sieci neuronowe

OGÓLNE PODSTAWY SPEKTROSKOPII

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

Plan wykładu. Sztuczne sieci neuronowe. Neuronu dyskretny. Neuron dyskretny (perceptron prosty)

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Statystyka. Zmienne losowe

SVM Support Vector Machines Metoda wektorów nośnych

Natalia Nehrebecka. Dariusz Szymański

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

Metody predykcji analiza regresji

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

SZTUCZNA INTELIGENCJA

Zarządzanie ryzykiem w przedsiębiorstwie i jego wpływ na analizę opłacalności przedsięwzięć inwestycyjnych

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

MATERIAŁY I STUDIA. Zeszyt nr 286. Analiza dyskryminacyjna i regresja logistyczna w procesie oceny zdolności kredytowej przedsiębiorstw

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

ANALIZA HARMONOGRAMÓW POWYKONAWCZYCH W BUDOWNICTWIE

Analiza porównawcza rozwoju wybranych banków komercyjnych w latach

Komputerowa analiza danych doświadczalnych

Prawdopodobieństwo i statystyka r.

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

ANALIZA WARIANCJI (ANOVA) Spis treści

Prawdopodobieństwo i statystyka

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Statystyka i eksploracja danych

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Pattern Classification

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

ZASTOSOWANIE METODY CZĄSTKOWYCH NAJMNIEJSZYCH KWADRATÓW (PLS) DO KLASYFIKACJI DANYCH MIKROMACIERZOWYCH

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Ważne rozkłady i twierdzenia c.d.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

KRÓTKIE WPROWADZENIE DO WIZUALIZACJI I ANALIZY FUNKCJONALNEJ DANYCH EKONOMICZNYCH

ELEKTROCHEMIA. ( i = i ) Wykład II b. Nadnapięcie Równanie Buttlera-Volmera Równania Tafela. Wykład II. Równowaga dynamiczna i prąd wymiany

Komputerowa analiza danych doświadczalnych

Krzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

Rola informatyki w naukach ekonomicznych i społecznych Innowacje i implikacje interdyscyplinarne. redakcja ZBIGNIEW E. ZIELIŃSKI

Krzysztof Borowski Zastosowanie metody wideł cenowych w analizie technicznej

RÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.

-Macierz gęstości: stany czyste i mieszane (przykłady) -równanie ruchu dla macierzy gęstości -granica klasyczna rozkładów kwantowych

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

7. Maszyny wektorów podpierajacych SVMs

Instrukcja do ćwiczeń laboratoryjnych z przedmiotu: Badania operacyjne. Temat ćwiczenia: Problemy rozkroju materiałowego, zagadnienia dualne

ZASTOSOWANIE WYBRANYCH ELEMENTÓW ANALIZY FUNDAMENTALNEJ DO WYZNACZANIA PORTFELI OPTYMALNYCH

WYKŁAD 3. Klasyfikacja: modele probabilistyczne

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Rozpoznawanie obrazów

SZTUCZNA INTELIGENCJA

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Zastosowanie wielowymiarowej analizy porównawczej w doborze spó³ek do portfela inwestycyjnego Zastosowanie wielowymiarowej analizy porównawczej...

ZASTOSOWANIE METOD ANALIZY WRAŻLIWOŚCI DO MODELOWANIA KONSTRUKCJI Z PRZEDZIAŁOWYMI PARAMETRAMI. 1 Wprowadzenie

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

7. Wykład VII: Warunki Kuhna-Tuckera

Dobór procesora sygnałowego w konstrukcji regulatora optymalnego

Statystyka. Wykład 2. Krzysztof Topolski. Wrocław, 11 października 2012

WYKŁAD I: PROBLEM KLASYFIKACJI POD NADZOREM, LINIOWA ANALIZA DYSKRYMINACYJNA. Wydział Matematyki i Nauk Informacyjnych PW

WPŁYW PARAMETRÓW DYSKRETYZACJI NA NIEPEWNOŚĆ WYNIKÓW POMIARU OBIEKTÓW OBRAZU CYFROWEGO

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

ZAJĘCIA X. Zasada największej wiarygodności

Analiza zależności zmiennych ilościowych korelacja i regresja

Grupowanie dokumentów XML ze względu na ich strukturę, z wykorzystaniem XQuery

( ) L 1. θ θ = M. Przybycień Rachunek prawdopodobieństwa i statystyka. = θ. min

Matematyka ubezpieczeń majątkowych r.

Kier. MTR Programowanie w MATLABie Laboratorium Ćw. 12

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Rozpoznawanie obrazów

Transkrypt:

Klasyfkatory lnowe Lnear classfers JERZY STEFANOWSKI Insttute of Computng Scences, Poznań Unversty of Technology UMSN slady wykładu Wersa 2010

Plan 1. Lnowe klasyfkatory 2. Klasyczne lnowa analza dyskrymnacyna 3. Podeśca probablstyczne 4. Inne zagadnena 5. Oprogramowane

Formalzaca problemu klasyfkac W przestrzen danych (ang. measurement space) Ω znaduą sę wektory danych x stanowące próbkę uczącą D, należące do dwóch lub węce K klas Klasyfkaca est dokonywana na podstawe funkc będące lnową kombnacą p cech parametrów Dążymy do sytuac {( ) p } N c x R, c { C1,... Ck} D = x, = 1 y = f ( x, w) y = f ( x, w) = /lub mnmalzac błędów klasyfkac y c c

Lnowa funkca separuąca (granczna) y Szukamy klasyfkatora pozwalaącego na podzał całe przestrzen na obszary odpowadaące klasom (dwe lub węce) oraz pozwalaącego ak nalepe klasyfkować nowe obekty x do klas Podeśce opera sę na znalezenu tzw. grancy decyzyne mędzy klasam f(x)=wt x x y = f f ( x ( x ) ) > T < T x x C C 1 2

Różne podeśca do budowy klasyfkatorów lnowych Podeśca generatywne (probablstyczne) Analza dyskrymnacyna (zwąz. z rozkładem normalnym) Wersa klasyfkac Bayesowske (dwumanowy rozkład) Podeśca wykorzystuące własnośc zboru uczącego Perceptron lnowy Rosenblata (teracyne poprawk wag) Metoda wektorów nośnych (max. margnesu klasyfkatora) Regresa logstyczna (EM estymaca)

Co est celem analzy dyskrymnacyne Podeśce statystyczne do problemów klasyfkowana obektów (term. ang. Dscrmnant Analyss) Orygnalne wprowadzona przez R.A.Fshera (1936) dla funkc lnowych (2 klasy), Metody probablstyczne B.Welch. Dostępna w welu programach, np. SAS, SPSS, R lub Statstca, Lczne zastosowana

Lnowa analza dyskrymnacyna Problem wprowadzony przez R.A.Fshera w 1936 dla welowymarowe przestrzen atrybutów (zmennych lczbowych) dyskrymnaca 2 klas Fsher orygnalne zaproponował poszukwane kerunku proekc, na którym można dobrze rozdzelć zrzutowane obe klasy Średne w klasach są dostateczne oddalone od sebe Obszary rozrzutu (rozproszena, zmennośc) obu klas ne nakładaą sę zbyt mocno.

Intuca proekc w Fsher s Lnear Dscrmnant [EST} From tranng set we want to fnd out a drecton where the separaton between the class means s hgh and overlap between the classes s small 8

Trochę uwag matem. o proekc Dysponuemy przykładam uczącym opsanym p -cecham x=[x 1,x 2,,x p ] T należącym do dwóch klas C 1 C 2 (odpowedno n 1 n 2 ) Wektory p-wymarowe x są zrzutowane na prostą (kerunek zwązany z parametram w). Algebraczne odpowada to zastąpenu ch skalarem z = w T x. Celem est tak dobór w aby na podstawe nowe zmenne z przykłady z obu klas były ak nalepe rozdzelone.

Założena co do danych Fsher dość ogranczone założena: wektor p wartośc oczekwanych E(x) oraz rozproszene charakteryzowane przez macerz kowaranc Σ=Cov(x)=E[(x-E(x)) [(x-e(x)) T ] Estymatory 1 n x = n = 1 x S = 1 n 1 n T = ( x x) ( x x) 1 Waranca po rzutowanu x na prosta o wektorze kerunkowym w Var ( w T x) = w T Σw

Sformułowane problemu Fsher LDA Cel Maksymalzu odległość zrzutowanych średnch klas Mnmalzu warance wewnątrz klasową Odległość mędzy rzutam średnch T T 2 1 w 2) ( w x x Fsher założył, że obe klasy maą taką samą macerz kowaranc S=S 1 +S 2. Dlatego wskaźnk zmennośc wewnątrzgrupowe (wspólne dla obu klas) zdefnowany est ako: 1 2 SW = k n = 2 ( n 1 k 1) S k Pamęta, że po rzutowanu mamy w T S W w

Co optymalzować? Czy różnca mędzy rzutam średnch wystarcza?

Sformułowane problemu Fsheran LDA W celu maksymalzac odległośc rzutów średnch klas mnmalzac waranc wewnątrzklasowe należy poszukwać wektora w który maksymalzue następuące wyrażene: T T J ( w) = ( w x w x ) 2 Po znalezenu kerunku maksymalzuące J(w) można stosować zasadę klasyfkac na rzutowane proste. Przydzel x do klasy dla które T T T T w ~ x w~ x < w~ x w~ x Można wykazać, że ten wektor est proporconalny w~ S 1 W w 1 T ( x S W 1 w x 2 2 ) k

Uwag o konstrukc wskaźnka Zwększane J(w) ma gwarantować dobrą separace klas ch rzutów

Hperpłaszczyzna separuąca Wyraz wolny to środek odcnka mędzy rzutam średnch 1 T T 1 T 1 m = ( w x1 w x2) = ( x1 x2) SW ( x1 + x2) 2 2 Stąd lnowa funkca dyskrymnacyna Fshera y = 1 1 x x2) T S W [ x ( x1 + 2 ( 1 x2 )] Węce nformac, np. J.Koronack, J.Cwk: Statystyczne systemy uczące sę M.Krzyśko et al.: Systemy uczące sę

Przypadek welu klas (K > 2) Rozwązane Fshera uogólnono dla wększe lczby K klas (C.Rao 1948) Średna w próbe uczące = K 1 Macerz zmennośc wewnątrzklasowe S 1 W = x n K ) K ( x x )( x = 1 C Macerz zmennośc mędzyklasowe 1 n x = 1 K S B = n ( x x)( x x) 1 K 1 = Poszuku wektora w maksymalzuącego x T T J ( w) = w w T T S S B W w w

O autorze Ronald A. Fsher, 1890-1962 The elaborate mechansm bult on the theory of nfntely large samples s not accurate enough for smple laboratory data. Only by systematcally tacklng small sample problems on ther merts does t seem possble to apply accurate tests to practcal data. 1936

Podeśca opsowe probablstyczne Stochastyczne / probablstyczne Zbór obserwac est próbą losową pobraną z k podpopulac π1,π2,,πk; celem est tak podzał aby podpopulace odpowadały właścwym k klasom C1,C2,,Ck Opsowe Ne rozważa sę losowośc próby, zakłada sę że posadany zbór zawera przykłady z k klas C1,C2,,Ck ; zadane polega na poprawnym podzale zboru na klasy

Sformułowane probablstyczne z Tw. Bayesa Obekty x R p welowymarowy rozkład prawdopodobeństwa funkca gęstośc f(x C ) Każda klasa C opsana prawdopodobeństwa apror p Bayesowska reguła klasyfkowana Przydzel nowy obekt x do te klasy C dla które prawdopodobeństwo a posteror est nawększe: = = K C x f p C x f p x C P 1 ) ( ) ( ) ( ) ( ) ( ) ( ) ( x P C P C x P x C P =

Rozwązane probablstyczne reguły klasyfkac Załóżmy, że rozkłady wektora x w poszczególnych klasach są p-wymarowym rozkładam normalnym: 0,5 p 0,5 [ T 1 ] 0,5( x µ ) Σ ( x ) f ( x C ) = (2π ) Σ exp µ Wykorzystuąc logarytmczne przekształcene twerdzena Bayesa, obekt x est przydzelany do te klasy C dla które funkca dyskrymnuąca osąga maksmum: δ ( x) = 0,5( x µ ) T Σ 1 ( x µ ) 0,5 log Σ + log p Jest to kwadratowa funkca dyskrymnuąca (QDA)

Lnowa funkca Założene równośc macerzy kowaranc Σ δ ( x) = x T Σ 1 µ 0,5µ T Σ 1 µ + log p Dla dwóch klas przekształcene log-rato Węce w Krzyśko lub Haste et al. Elements of Statstcal Learnng

Porównane rozwązań LDA QDA Wybrany zbór danych (za Haste et al. Elements of Statstcal Learnng)

Wymog stosowana model AD Zmenne wyrażone na skalach lczbowych Specalne podeśca dla zmennych akoścowych (bnaryzaca, model lokacyny, ) Zmenne maą welowymarowy rozkład normalnych Macerze kowaranc dla poszczególnych klas są równe eśl ne, to bardze złożone funkce kwadratowe dyskrymnuące. Problem doboru właścwych zmennych.

Selekca zmennych W funkc dyskrymnuące uwzględna zmenne o dobrych właścwoścach dyskrymnuących Przykład kryterum akośc dyskrymnac: λ = S W S w + S B gdze macerz zmennośc wewnątrzklasowe S 1 W = x n k ) k ( x x )( x = 1 C a macerz zmennośc mędzyklasowe 1 k S B = n ( x x)( x x) 1 k 1 = T T

Inne zagadnena Poęce zmennych kanoncznych kerunk które dobrze separuą k klasy (także ch wzualzaca) Dyskrymnaca oparta na regres lnowe logstyczne Uogólnene model lnowych elastyczna dyskrymnaca (FDA) Ad a metoda wektorów nośnych (SVM) Powązane z metodą PCA Odnesena do Analzy Korespondenc

Typowe obszary zastosowań Analza danych fnansowych (zwłaszcza bank, poltyka kredytowa, predykca bankructw) Badana marketngowe Także dentyfkaca czynnków różncuących klasy klentów Badana danych medycznych, bologcznych lub nnych powązanych nauk Rozpoznawana twarzy na obrazach

Implementace np. Statstca

Węce Przeczyta lteraturę T.Haste, R.Tbshran, J.Fredman: The Elements of Statstcal Learnng. Sprnger (zwłaszcza rozdz. 4) poszuka wers elektronczne pdf J.Koronack, J.Ćwk: Statystyczne systemy uczące sę (rozdz. 1 oraz o FDA w rozdz. 6) M.Krzyśko, W.Wołyńsk, T.Góreck,M.Skorzybut: Systemy uczące sę. + wcześnesze prace M.Krzyśko o analze dyskrymnacyne Angelska Wkpeda Lnear dscrmnant analyss McLachlan, G. J. (2004). Dscrmnant Analyss and Statstcal Pattern Recognton. Wley. Duda, R. O.; Hart, P. E.; Stork, D. H. (2000). Pattern Classfcaton (2nd ed.). Wley