Statystyczne metody przetwarzania danych

Podobne dokumenty
Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)


Pattern Classification

Weryfikacja hipotez dla wielu populacji

Zaawansowane metody numeryczne

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.

Proces narodzin i śmierci

System Przeciwdziałania Powstawaniu Bezrobocia na Terenach Słabo Zurbanizowanych SPRAWOZDANIE Z BADAŃ Autor: Joanna Wójcik

Macierz prawdopodobieństw przejścia w pojedynczym kroku dla łańcucha Markowa jest postaci

± Δ. Podstawowe pojęcia procesu pomiarowego. x rzeczywiste. Określenie jakości poznania rzeczywistości

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Natalia Nehrebecka. Wykład 2

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Diagonalizacja macierzy kwadratowej

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311

SYSTEMY UCZĄCE SIĘ WYKŁAD 15. ANALIZA DANYCH WYKRYWANIE OBSERWACJI. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Modelowanie i obliczenia techniczne. Metody numeryczne w modelowaniu: Optymalizacja

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

WYKRYWANIE WYJĄTKÓW PRZY UŻYCIU WEKTORÓW NOŚNYCH

SZTUCZNA INTELIGENCJA

Karta (sylabus) modułu/przedmiotu

Plan wykładu. Sztuczne sieci neuronowe. Problem dwuklasowy (N=1) Problem klasyfikacji. Wykład 6: Ocena jakoci sieci neuronowej Sieci RBF KLASYFIKATOR

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

WIELOKRYTERIALNY DOBÓR PARAMETRÓW OPERATORA MUTACJI W ALGORYTMIE EWOLUCYJNYM UCZENIA SIECI NEURONOWEJ

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Plan wykładu. Sztuczne sieci neuronowe. Problem dwuklasowy (N=1) Problem klasyfikacji. Wykład 4-5: Ocena jakości sieci neuronowej Sieci RBF

WOJSKOWA AKADEMIA TECHNICZNA im. Jar osława Dąbr owskiego ZAKŁAD AWIONIKI I UZBROJENIA LOTNICZEGO

Elementy modelowania matematycznego

P 1, P 2 - wektory sił wewnętrznych w punktach powierzchni F wokół punktu A

Dla dzielnej X (dividend) i dzielnika D 0 (divisor) liczby Q oraz R takie, Ŝe

Nowoczesne technk nformatyczne - Ćwczene 2: PERCEPTRON str. 2 Potencjał membranowy u wyznaczany jest klasyczne: gdze: w waga -tego wejśca neuronu b ba

PROGRAM BADAŃ BIEGŁOŚCI SILESIALAB 2018

Prawdopodobieństwo i statystyka r.

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

Natalia Nehrebecka. Zajęcia 4

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Korekcja liniowych układów regulacji automatycznej

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Prawdziwa ortofotomapa

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

SZTUCZNA INTELIGENCJA

Konstrukcja gier sprawiedliwych i niesprawiedliwych poprzez. określanie prawdopodobieństwa.

MIKROEKONOMIA Prof. nadzw. dr hab. Jacek Prokop

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Metody systemowe i decyzyjne w informatyce

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Karta (sylabus) modułu/przedmiotu

Zakres zagadnienia. Pojęcia podstawowe. Pojęcia podstawowe. Do czego słuŝą modele deformowalne. Pojęcia podstawowe

Laboratorium z Podstaw Automatyki. Laboratorium nr 4. Działanie układu automatycznej regulacji. Rodzaje regulatorów.

KLASYFIKACJA. Słownik języka polskiego

Metody gradientowe poszukiwania ekstremum. , U Ŝądana wartość napięcia,

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Sztuczne sieci neuronowe

Wykłady Jacka Osiewalskiego. z Ekonometrii. CZĘŚĆ PIERWSZA: Modele Regresji. zebrane ku pouczeniu i przestrodze

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Markowa. ZałoŜenia schematu Gaussa-

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

ZAJĘCIA X. Zasada największej wiarygodności

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Specjalnościowy Obowiązkowy Polski Semestr VI

Rozpoznawanie obrazów

Wykład 2: Uczenie nadzorowane sieci neuronowych - I

Rachunek niepewności pomiaru opracowanie danych pomiarowych

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Neural networks. Krótka historia rozpoznawanie znaków alfanumerycznych.

Układy równań liniowych. Krzysztof Patan

MIARY ZACHOWANIA STRUKTURY TOPOLOGICZNEJ ZBIORU I ICH UŻYCIE W PROBLEMACH WIELOWYMIAROWEJ ANALIZY DANYCH

EKONOMIA MENEDŻERSKA. Wykład 3 Funkcje produkcji 1 FUNKCJE PRODUKCJI. ANALIZA KOSZTÓW I KORZYŚCI SKALI. MINIMALIZACJA KOSZTÓW PRODUKCJI.

Badania suwnicy pomostowej natorowej dwudźwigarowej

Sieci Neuronowe 1 Michał Bereta

Zastosowanie Inteligentnego Systemu Nauczającego (ISN) w procesie nauczania ODL (Open and Distance Learning) badania ISN

Minimalizacja globalna, algorytmy genetyczne i zastosowanie w geotechnice

Ćwiczenie nr 1. Oznaczanie porowatości otwartej, gęstości pozornej i nasiąkliwości wodnej biomateriałów ceramicznych

WikiWS For Business Sharks

Systemy Inteligentnego Przetwarzania wykład 3: sieci rekurencyjne, sieci samoorganizujące się

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Optymalizacja ciągła

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

RÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH

Metody analizy obwodów

Wprowadzenie. Support vector machines (maszyny wektorów wspierających, maszyny wektorów nośnych) SVM służy do: Zalety metody SVM

ADAPTACYJNE PODEJŚCIE DO TWORZENIA STRATEGII INWESTYCYJNYCH NA RYNKACH KAPITAŁOWYCH WRAZ Z ZASTOSOWANIEM WAŻONEGO UŚREDNIANIA

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Instytut Łączności. Praca statutowa nr







Transkrypt:

Artfcal Intellgence Krzysztof Ślot, 2008 Statystyczne metody rzetwarzana danych Klasyfkacja mnmalnoodległoścowa Krzysztof Ślot Instytut Informatyk Stosowanej Poltechnka Łódzka

Artfcal Intellgence Krzysztof Ślot, 2008 Etay rocedury rozoznawana Wrowadzene Przetwarzane wstęne, obejmuje ekstrakcję obektu z tla Projektowane systemu rozoznawana Klasyfkacja, wykorzystująca wybrane cechy zbudowane modele klas Przygotowane danych Projektowane systemu Określ rerezentację loścową obektów Określ sosób modelowana klas Określene strateg klasyfkacj Zebrane etyketowane rzykładów Określene zborów: trenngowego testowego Przedmot wykładu Oblcz cechy renuj klasyfkator Klasyfkuj Imlementacja

Artfcal Intellgence Krzysztof Ślot, 2008 Klasyfkacja danych Przysane róbce etykety klasy Próbka jest rerezentowana rzez wektor cech (w odowednej rzestrzen cech Modele klas muszą być zbudowane w oarcu o rzykłady (defncje klas są neznane Przykłady mogą ne osadać etykety klasy (klasyfkacja nenadzorowana Dane, C C, C... C wyznacz: : C Podstawa klasyfkacj Maksymalzacja odbeństwa mędzy róbką a klasą (mnmalzacja różncy Posadane określonych właścwośc Stratega ostęowana Zbuduj loścowe modele klas oceń rzynależność róbk

Artfcal Intellgence Krzysztof Ślot, 2008 Stratege klasyfkacj Klasyfkacja danych Ocena odobeństwa: Klasyfkacja mnmalnoodległoścowa Klasyfkacja robablstyczna Posadane określonych właścwośc Klasyfkacja rzy użycu owerzchn decyzyjnych Etay budowy klasyfkatora renng Budowa model klas estymacja ch arametrów (zbór trenngowy estowane Ocena skutecznośc klasyfkacj rzy użycu róbek zboru testowego Proces klasyfkacj (rozoznawana Wyznaczane rzynależnośc neznanej róbk dokonywane rzy użycu zbudowanego klasyfkatora

Artfcal Intellgence Krzysztof Ślot, 2008 Podstawy Klasyfkacja mnmalno-odległoścowa Próbk są unktam w rzestrzen metrycznej Podobeństwo ocenane rzez określane odległośc mędzy róbką klasą Zwycęża klasa najblższa Stratege klasyfkacj mnmalnoodległoścowej Metoda najblższego sąsada (Nearest-Neghbor - NN Metoda najblższej średnej (Nearest-Mean - NM Klasyfkacja k-nn Rerezentacja welomodalna / metoda najblższego modu Problemy budowy klasyfkatora Postać modelu klasy trenng modelu Defncja odległośc mędzy róbką a klasą Zasada wyboru zwycęskej klasy

Artfcal Intellgence Krzysztof Ślot, 2008 Klasyfkacja NN Defncja komonentów metody Model (rototy klasy: zaamętane wszystke róbk zboru trenngowego (brak rocedury uczena klasyfkatora Odległość róbk od klasy: najmnejsza z odległośc mędzy róbką a elementam klasy k = arg j mn d(,c, d(,c = mn d(,c j C A d(,c B d(,c B < d(,c B C B d(,c A C B

Artfcal Intellgence Krzysztof Ślot, 2008 Klasyfkacja NN Właścwośc Prostota koncecyjna Brak rocedury uczena klasyfkatora Kosztowny oblczenowo roces klasyfkacj Wymagana duża amęć do składowana model klas Wrażlwość na złe rzykłady (neuchronne obecne w dużych zborach C A d(,c B CB d(,c A d (, C d (, C B A C A

Artfcal Intellgence Krzysztof Ślot, 2008 Klasyfkacja NM Defncja komonentów metody Model klasy: odstawowe właścwośc statystyczne zboru róbek średna, macerz kowarancj (rosty trenng Odległość róbk od klasy: odległość róbk do wartośc średnej/ odległość Machalobobsa (wyrażona w jednostkach odchylena k = arg d(, C = d(, M d(,, = mn M M 1 N N j= 1 j C A M A d(,m A d(, M d(, M C B d(,m B A C B MB B Odległość uwzględnająca rozrzuty (Machalonobsa d(, C d(, μ, Σ d(, C ( μ Σ 1 ( μ

Artfcal Intellgence Krzysztof Ślot, 2008 y 1 2 Właścwośc Prosty trenng Szybka klasyfkacja Mała wrażlwość na błędne rzykłady (efekt uśrednena Małe zasoby wymagane do zaamętana model klas Nejawne założene Gaussowskego modelu klasy: klasyfkacja lnowa d 1 1 1 1 1 1 2, ( d d 2 2 2 2 2 2 2, ( d NM klasyfkator lnowy 0 C 0 ( 2, (, ( 2 2 1 1 1 2 2 1 d d Klasyfkacja NM

Artfcal Intellgence Krzysztof Ślot, 2008 Klasyfkacja NM Rozkłady welomodalne Rozkład jednomodalny: roblemy trywalne Rzeczywste roblemy rozoznawana: welomodalna rerezentacja klasy NM błędna klasyfkacja M A C A C A M B C B d (, M d(, M C B A A

Artfcal Intellgence Krzysztof Ślot, 2008 Metoda k-nn Defncja komonentów metody Model klasy : zaamętane wszystke róbk zboru trenngowego (brak rocedury uczena klasyfkatora Odległość róbk od klasy: klasa najlcznej rerezentowana wśród k- zwycęzców (k-najblższych róbek Parametr modelu: k wartość otymalna arametru mus być określona w faze trenngu r r C A C A C B C B r : k 1 C A r : k 3 C B

Artfcal Intellgence Krzysztof Ślot, 2008 Metoda k-nn Właścwośc Prosty trenng (wybór k dającego najleszą skuteczność rozoznawana na zborze trenngowym Arbtralne kształty owerzchn searujących klasy: możlwość rozwązana roblemów searowalnych nelnowo (trudnych Mała wrażlwość na błędne rzykłady (tym mnejsza m wększe k Złożoność oblczenowa Duża zajętość amęc rzez modele klas Przyśeszane metody k-nn Motywacja rac: duża skuteczność metody Sosób realzacj: ndeksowane róbek odowedne zawężane zboru testowanych kandydatów Metody: gruowane róbek, drzewa k-wymarowe

Artfcal Intellgence Krzysztof Ślot, 2008 Gruowane Metoda k-nn Zgrubna kwantyzacja rzestrzen cech (hersześcany Etyketa róbk: ndeks hersześcanu Krok 1 klasyfkacj: określ ndeks hersześcanu zawerającego srawdzaną róbkę Oblczaj odległośc tylko do rototyów zawartych wewnątrz znalezonego hersześcanu jego sąsadów 0 1 2 0 1 2 0 1 2 0 1 2

Artfcal Intellgence Krzysztof Ślot, 2008 Drzewa k-wymarowe Metoda k-nn Zgrubna kwantyzacja rzestrzen cech (adatacyjna Określane herłaszczyzn dzelących zbory na równe częśc (głębokość rocedury odzału: k Przysywane rototyom etyket obszarów Srawdzane odległośc tylko dla róbek z obszarów rzyległych LUL LUP RUL RUR L R LUL LUP RUL RUR U D U D L R L R L R L R LDL LDR RDL RDR LDL LDR RDL RDR Właścwośc Efektywność oblczenowa

Artfcal Intellgence Krzysztof Ślot, 2008 Welomodalna rerezentacja klas Defncja komonentów metody Model klasy: odstawowe właścwośc statystyczne modów klasy Odległość róbk od klasy: odległość do najblższego modu Odległość ownna uwzględnać rozrzuty: macerz kowarancj Prototy klasy: zbór modów rerezentowanych rzez arametry statystyczne k arg mn j j 1 d(, M, M C, j 1... m N N j1 j

Artfcal Intellgence Krzysztof Ślot, 2008 renng klasyfkatora Welomodalna rerezentacja klas Określene modów dla każdej z klas Lczba modów zwykle neznana z góry (mus być odkryta rzez rocedurę Algorytm k-średnch Iteracyjne owtarzane dwóch faz: Przysane róbk do modu (kandydata Reestymacja ołożeń modów Do uzyskana zbeżnośc Kryterum: średna odległość róbek od modów Powtarzane rocesu dla kolejnych wartośc k, wybór k otymalnego Przykład Założene: k=2, oczątkowe arametry modów m1=(0,1 m2 = (1,0 Próbk trenngowe: (0,2, (1,1, (2,0,(3,5,(4,4,(5,3

Artfcal Intellgence Krzysztof Ślot, 2008 Metoda k-średnch określana modów k=3 k=4 k=5 Kryterum k=6 k=7 Otymalna wartość k Właścwośc Umarkowane złożony trenng Arbtralne owerzchne decyzyjne rozwązywane trudnych roblemów Mała wrażlwość na złe rzykłady, szybka klasyfkacja, małe zasoby

Artfcal Intellgence Krzysztof Ślot, 2008 Cechy Meszanny model Gaussowskch (GMM Rozwnęce k-nm (można traktować w kategorach robablstycznych Lesze modelowane modów (orócz wartośc średnej nformacje o rozrzuce Mody są rerezentowane funkcjam Gaussa renng: Algorytm EM (Eectaton Mamzaton Analogczny do algorytmu k-średnch: dwe narzemenne fazy Faza 1: wyznaczene arametrów Gaussody (wektora średnego macerzy kowarancj, Faza 2: onowne etyketowane róbek (odstawa: orównane odległośc Machalonobsa Właścwośc metody Jedna z najskutecznejszych obecne metod klasyfkacj