Podobne dokumenty

Pattern Classification

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

MATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Natalia Nehrebecka. Wykład 2

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

Statystyczne metody przetwarzania danych

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Metody gradientowe poszukiwania ekstremum. , U Ŝądana wartość napięcia,

Nowoczesne technk nformatyczne - Ćwczene 2: PERCEPTRON str. 2 Potencjał membranowy u wyznaczany jest klasyczne: gdze: w waga -tego wejśca neuronu b ba

SZTUCZNA INTELIGENCJA

Kier. MTR Programowanie w MATLABie Laboratorium Ćw. 12

TEORIA PORTFELA MARKOWITZA

= σ σ. 5. CML Capital Market Line, Rynkowa Linia Kapitału

Natalia Nehrebecka. Zajęcia 4

Weryfikacja hipotez dla wielu populacji

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Podstawy teorii falek (Wavelets)

liniowym w przeciwnym przypadku mówimy o programowaniu nieliniowym.

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

SYSTEMY UCZĄCE SIĘ WYKŁAD 5. LINIOWE METODY KLASYFIKACJI. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Zaawansowane metody numeryczne

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego

SZTUCZNA INTELIGENCJA

65120/ / / /200

Dobór zmiennych objaśniających

Prawdopodobieństwo i statystyka r.

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Wstęp do metod numerycznych Faktoryzacja SVD Metody iteracyjne. P. F. Góra

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Procedura normalizacji

Markowa. ZałoŜenia schematu Gaussa-

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

5. CHARAKTERYSTYKI CZĘSTOTLIWOŚCIOWE

Metody predykcji analiza regresji

Sprawozdanie powinno zawierać:

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

WikiWS For Business Sharks

Statystyka. Zmienne losowe

Neuron liniowy. Najprostsza sieć warstwa elementów liniowych

ELEKTROCHEMIA. ( i = i ) Wykład II b. Nadnapięcie Równanie Buttlera-Volmera Równania Tafela. Wykład II. Równowaga dynamiczna i prąd wymiany

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Statystyczna analiza danych

Minimalizacja globalna, algorytmy genetyczne i zastosowanie w geotechnice

Modelowanie i obliczenia techniczne. Metody numeryczne w modelowaniu: Optymalizacja

Rachunek niepewności pomiaru opracowanie danych pomiarowych

OGÓLNE PODSTAWY SPEKTROSKOPII

Zadanie na wykonanie Projektu Zespołowego

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Minimalizacja globalna. Algorytmy genetyczne i ewolucyjne.

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

MODELE OPTYMALNEGO PRZETWARZANIA SYGNAŁÓW LOSOWYCH

Diagonalizacja macierzy kwadratowej

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

8. Optymalizacja decyzji inwestycyjnych

I. Elementy analizy matematycznej

Zastosowanie technik sztucznej inteligencji w analizie odwrotnej

Funkcje i charakterystyki zmiennych losowych


u u u( x) u, x METODA RÓŻNIC SKOŃCZONYCH, METODA ELEMENTÓW BRZEGOWYCH i METODA ELEMENTÓW SKOŃCZONYCH

Proces narodzin i śmierci

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Natalia Nehrebecka. Zajęcia 3

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

SYSTEMY UCZĄCE SIĘ WYKŁAD 15. ANALIZA DANYCH WYKRYWANIE OBSERWACJI. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Analiza korelacji i regresji

IID = 2. i i i i. x nx nx nx

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

XLI OLIMPIADA FIZYCZNA ETAP WSTĘPNY Zadanie teoretyczne

RACHUNEK NIEPEWNOŚCI POMIARU

Odtworzenie wywodu metodą wstępującą (bottom up)

Optymalizacja ciągła

Zapis informacji, systemy pozycyjne 1. Literatura Jerzy Grębosz, Symfonia C++ standard. Harvey M. Deitl, Paul J. Deitl, Arkana C++. Programowanie.

EKONOMETRIA I Spotkanie 1, dn

Różniczkowalność, pochodne, ekstremum funkcji. x 2 1 x x 2 k

System Przeciwdziałania Powstawaniu Bezrobocia na Terenach Słabo Zurbanizowanych SPRAWOZDANIE Z BADAŃ Autor: Joanna Wójcik

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

dy dx stąd w przybliżeniu: y

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Wykład 1 Zagadnienie brzegowe liniowej teorii sprężystości. Metody rozwiązywania, metody wytrzymałości materiałów. Zestawienie wzorów i określeń.

APROKSYMACJA QUASIJEDNOSTAJNA

Przykład 5.1. Kratownica dwukrotnie statycznie niewyznaczalna

-Macierz gęstości: stany czyste i mieszane (przykłady) -równanie ruchu dla macierzy gęstości -granica klasyczna rozkładów kwantowych

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Transkrypt:

Klasyfkator lnowy Wstęp Klasyfkator lnowy jest najprostszym możlwym klasyfkatorem. Zakłada on lnową separację lnowy podzał dwóch klas mędzy sobą. Przedstawa to ponższy rysunek: 5 4 3 1 0-1 - -3-4 -5-5 -4-3 - -1 0 1 3 4 Gdze dwe klasy oddzelone są hperpłaszczyzną, która dla przestawonego przypadku redukuje sę do ln prostej w n-wymarowej przestrzen. Funkcje taką nazywamy funkcją decyzyjną g x = wx = w 1 x 1 + w x + + w n x n Gdze w szukany wektor wag x wektor wejścowy/wektor sygnału wejścowego Funkcja decyzyjna rozdzela węc obydwe klasy określa wyjśce modelu wg. zależnośc g x > 0 - klasa c1 g x < 0 - klasa c

W pewnych sytuacjach dyskrymnacja lnowa ne jest możlwa do osągnęca, jak na ponższym obrazku, 8 6 4 0 - -4-6 -8-6 -4-0 4 6 dlatego też częśd model lnowych uwzględna taką możlwośd poprzez mnmalzację lczby popełnanych błędów. Do typowych model dyskrymnacj lnowej można zalczyd: algorytm Rosenblatta algorytm Fshera algorytm mnmalzacj MSE czyl wykorzystane regresj lnowej Algorytm Rosenblatta Algorytm Rosenblatta zakłada lnową separowalnośd klas. Stara sę on mnmalzowad funkcję kosztu zdefnowaną jako: J( w) ( w x) x Gdze - zbór wektorów błędne klasyfkowanych. Algorytm Rosenblatta można opsad w postac mnkodu

t numer teracj w wektor wag C(x) funkcja zwracająca etyketę klasy dla wektora x m lczba wektorów uczących t = 0 w = generuj losowo w początkowe b = generuj losowo repeat t 0 =t; for =1:m g = w x +b; f (C(x )=1) and (g<0) => w=w+x ; t=t+1 b = b g; f (C(x )=-1) and (g>0) => w=w-x ; t=t+1 b = b g; untl t 0 =t lub z dorbną modyfkacja zapewnającą lepszą zbeżnośd procesu optymalzacj. t numer teracj w wektor wag C(x) funkcja zwracająca etyketę klasy dla wektora x m lczba wektorów uczących (j) współczynnk uczena -> funkcja malejąca w czase np. () t 1 t 1 t = 0 w = generuj losowo b = generuj losowo for t=1:max_ter for =1:m g = w x +b; f (C(x )=1) and (g<0) => w=w+(t)x b = b (t)*g; f (C(x )=-1) and (g>0) => w=w-(t)x b = b (t)*g; Algorytm Fshera Algorytm Fshera jest klasyfkatorem wywodzącym sę z metod statystycznych. Zakłada on, że rozkłady poszczególnych klas mają rozkład Gaussa. Przyjmując oznaczena

- wektor opsujący średne poszczególnych klas (środk rozkładów Gaussa) Σ y = 0,Σ y = 1 - macerze kowarancj poszczególnych klas I defnując funkcje kosztu jako loraz rozproszeo mędzyklasowych w stosunku do rozproszeo wewnątrz klasowych jako: można pokazad że optymalnym rozwązanem tak postawonego problemu jest hperpłaszczyzna w określona zależnoścą: Gdze wartośd wyrazu wolnego wynos UWAGA Uwaga na znak we wzorze na w!!! b = µ y =1+µ y =0 w Wykorzystane regresj lnowej Jednym z często stosowanych algorytmów jest wykorzystane regresj lnowej. W tym przypadku funkcja celu zdefnowana jest jako mnmalzacja błędu średnokwadratowego opsanego zależnoścą: Gdze J x w x y w x y m 1 y por zadane wyjśce Wówczas szukając mnmum tak zdefnowanej funkcj celu uzyskujemy pochodną: Którą mnmalzując ze względu na w uzyskujemy rozwązane: Gdze w = X X 1 X y = X y X = X X 1 X - macerz pseudoodwrotna Zadana Zad 1) Zamplementuj klasyfkator lnowy Rosenblatta. m w x y x X Xw Y J 1

Zad ) Zamplementuj klasyfkator lnowy Fshera, pamętaj o wyraze wolnym. W tym celu doklej go do kooca wektora w jako w = [w b] Przydatne funkcje C = cov(x) zwraca macerz kowarancj macerzy x M = mean(x) zwraca wartośd średną dla każdej kolumny macerzy x S = std(x) zwraca odchylene standardowe dla każdej kolumny macerzy x V = var(x) zwraca warancję dla każdej kolumny macerzy x Zad 3) Zamplementuj klasyfkator lnowy w oparcu o regresję lnową Uwaga: Pamętaj o wyraze wolnym. Wykorzystując metodę regresj do zboru danych uczących doklej kolejną kolumnę wypełnoną wartoścam 1, pełnącą rolę wyrazu wolnego. Np. x- dane trenngowe wejścowe Y etykety klas nx = [x ones(sze(x,1),1)]; wówczas po wyznaczenu wektora w podczas klasyfkacj danych testowych równeż mussz dokled kolumnę z wartoścam 1. Zad 4) Zwzualzuj uzyskane wynk na przykładze zboru Gaus1 oraz Gaus. Zad 5) Porównaj dokładnośd zamplementowanych metod na zborach danych WBC Wsconsn Brest Cancer Pma - Pma Indan Dabetes Ionosphere W tym celu podzel każdy zbór danych wcześnej przygotowanym algorytmem podzel, dokonaj uczena modelu na zborze trenngowym, a następne wykonaj testowane wyznaczając błąd na zborze testowym. UWAGA Każdy z Algorytmów zamplementuj jako nową funkcję: Rozenblatt_ucz, Fsher_Ucz oraz Reg_ln_ucz Każda z funkcj pownna zwrócd parametr w opsujący równane prostej, Uzyskany wynk przekaż do jednej funkcj ln_test dokonaj klasyfkacj.