Wprowadzenie do uczenia maszynowego

Podobne dokumenty
Wprowadzenie do uczenia maszynowego

Systemy uczące się wykład 2

9. Praktyczna ocena jakości klasyfikacji

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Data Mining Wykład 4. Plan wykładu

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

Podstawy Sztucznej Inteligencji (PSZT)

WYKŁAD 7. Testowanie jakości modeli klasyfikacyjnych metodyka i kryteria

Sieci neuronowe w Statistica

SZTUCZNA INTELIGENCJA

TEORETYCZNE PODSTAWY INFORMATYKI

Wprowadzenie do klasyfikacji


Metody Sztucznej Inteligencji II

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

ALGORYTM RANDOM FOREST

Systemy agentowe. Uwagi organizacyjne. Jędrzej Potoniec

Elementy inteligencji obliczeniowej

Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec

ZeroR. Odpowiada zawsze tak samo Decyzja to klasa większościowa ze zbioru uczącego A B X 1 5 T 1 7 T 1 5 T 1 5 F 2 7 F

Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec

Projekt Sieci neuronowe

Optymalizacja ciągła

Indukowane Reguły Decyzyjne I. Wykład 8

Jakość uczenia i generalizacja

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Klasyfikacja LDA + walidacja

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Testowanie modeli predykcyjnych

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Agnieszka Nowak Brzezińska Wykład III

Aproksymacja funkcji a regresja symboliczna

Uczenie sieci neuronowych i bayesowskich

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

Podstawy sztucznej inteligencji

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)

Agnieszka Nowak Brzezińska

Metody systemowe i decyzyjne w informatyce

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

Uczenie sieci radialnych (RBF)

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.

Rozpoznawanie obrazów

Optymalizacja systemów

Rozpoznawanie obrazów

Laboratorium 4. Naiwny klasyfikator Bayesa.

Agnieszka Nowak Brzezińska Wykład III

Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010

Laboratorium 6. Indukcja drzew decyzyjnych.

Metody eksploracji danych 4. Klasyfikacja

Technologie Informacyjne

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Inteligentne systemy przeciw atakom sieciowym

Metody systemowe i decyzyjne w informatyce

ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH

Metody systemowe i decyzyjne w informatyce

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Widzenie komputerowe (computer vision)

Metody eksploracji danych 2. Metody regresji. Piotr Szwed Katedra Informatyki Stosowanej AGH 2017

Wprowadzenie do programu RapidMiner Studio 7.6, część 4 Michał Bereta

Algorytmy klasyfikacji

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Reguły asocjacyjne w programie RapidMiner Michał Bereta

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

Ocena dokładności diagnozy

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Sztuczne sieci neuronowe (SNN)

Rozpoznawanie obrazów

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Uczenie ze wzmocnieniem aplikacje

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Zrównoleglona optymalizacja stochastyczna na dużych zbiorach danych

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Wstęp do sieci neuronowych, wykład 13-14, Walidacja jakości uczenia. Metody statystyczne.

Drzewa decyzyjne i lasy losowe

WEKA klasyfikacja z użyciem sztucznych sieci neuronowych

Wybrane zagadnienia uczenia maszynowego

Systemy uczące się wykład 1

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Barycentryczny układ współrzędnych

Lekcja 5: Sieć Kohonena i sieć ART

Wstęp do sieci neuronowych, wykład 09, Walidacja jakości uczenia. Metody statystyczne.

Hierarchiczna analiza skupień

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy

Metody systemowe i decyzyjne w informatyce

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Indukowane Reguły Decyzyjne I. Wykład 3

A Zadanie

3. Podaj elementy składowe jakie powinna uwzględniać definicja informatyki.

Transkrypt:

Wprowadzenie do uczenia maszynowego Agnieszka Ławrynowicz 12 stycznia 2017

Co to jest uczenie maszynowe? dziedzina nauki, która zajmuje się sprawianiem aby komputery mogły uczyć się bez ich zaprogramowania wprost (Arthur Samuel) program komputerowy uczy się na podstawie doświadczenia (E) w odniesieniu do pewnej klasy zadań (T) i miary efektywności (P), jeśli jego efektywność wykonywania zadania T (mierzona za pomocą P) poprawia się wraz z doświadczeniem E (Tom Mitchell)

Uproszczony schemat uczenia maszynowego Zadanie/Cel Dane trenujące Algorytm uczenia maszynowego Model Dane testowe Model Predykcja

Uczenie nadzorowane Każdy przykład ze zbioru trenującego składa się ze: zbioru cech/atrybutów wejściowych (typowo wektora #» x ), wartości wyjściowej f( #» x ), tzw. atrybutu decyzyjnego. Mając na wejściu poprawnie zaetykietowany (wartościami wyjściowymi) zbiór przykładów o postaci ( #» x, f( #» x )), system uczy się modelu (funkcji h), która ma jak najlepiej aproksymować funkcję f w celu poprawnej predykcji etykiet nowych (nie widzianych wcześniej) przykładów.

Uczenie nadzorowane: regresja i klasyfikacja Najpopularniejsze zadania uczenia nadzorowanego to regresja i klasyfikacja. Ich celem jest predykcja wartości atrybutu decyzyjnego na podstawie wartości pozostałych atrybutów. Regresja: atrybut decyzyjny jest liczą rzeczywistą. Klasyfikacja: atrybut decyzyjny ma wartość dyskretną (binarną, nominalną). Jest to tzw. klasa.

Example Przykład Rodzeństwo, trojaczki Ania, Michał i Paweł od nowego roku akademickiego rozpoczynają studia w Poznaniu. Szukają studenckiego mieszkania i muszą uwzględnić koszt wynajmu w swoim budżecie. Doszli do wniosku, że kluczową cechą jaka wpływa na koszt wynajmu jest metraż mieszkania. Przyjrzeli się ofertom wynajmu zamieszczonym na portalu internetowym i zanotowali sobie ich dane w tabeli: Metraż (m 2 ) Cena (PLN) 71 2 500 38 1 600 31 1 190 40 1 800 26 1 000 62 2 000

Przykład c.d.

Przykład c.d.

Example Przykład c.d. Ania, Michał i Paweł przypuszczają, że odpowiednie dla nich mogłoby być mieszkanie o metrażu około 50m 2.

Uczenie nienadzorowane Każdy przykład ze zbioru trenującego składa się ze zbioru cech wejściowych (typowo wektora #» x ). Mając na wejściu zbiór przykładów o postaci ( #» x ), system uczy się modelu (funkcji h), która opisuje dane wejściowe (np. generuje wzorce pojawiające się w danych lub analizuje skupienia danych).

Jak reprezentujemy model h? Regresja liniowa: h(x)=a 1 x + a 0 (z jedną zmienną) h( #» x )= a #» T #» n x + a0 (z n zmiennych) a #» i to parametry modelu a zadanie regresji liniowej polega na ich wyznaczeniu tak aby h #» a (x i ) była jak najbliższa f( x #» i ) dla naszych przykładów trenujących ( x #» i, f( x #» i ))

Funkcja kosztu Na ile nasz model się myli? Błąd średniokwadratowy: J( #» a, a 0 )= 1 2m m i=1 ( #» a T x i + a 0 y i ) 2

Funkcja kosztu

Funkcja kosztu

Funkcja kosztu

Funkcja kosztu

Regresja liniowa Model (hipoteza): h( #» x )= #» a n T #» x + a0 Parametry: #» a i, a 0 Funkcja kosztu: J( #» a, a 0 )= 1 2m m i=1 ( #» a T x i + a 0 y i ) 2 Cel: minimalizacja funkcji kosztu J( #» a, a 0 )

Algorytm spadku gradientowego Minimalizacja wybranej funkcji kosztu J( #» a, a 0 ) Przypisz początkowe wagi #» a, a 0 (np. #» a 0, a 0 = 0 iteracyjnie podążaj w kierunku minimum funkcji, zmieniając wagi aż osiągniesz minimum Dla regresji liniowej z jednym atrybutem, wagi aktualizowane są według wzorów (obie naraz w każdym kroku): a 1 = a 1 α 1 m a 0 = a 0 α 1 m m i=1 m i=1 (a 1 x i + a 0 y i )x i (a 1 x i + a 0 y i )

α - parametr szybkości uczenia za mały: uczenie jest wolne za duży: algorytm nie trafia w minimum, a nawet nie zbiega się

Regresja wielomianowa

Regresja wielomianowa Model liniowy nie zawsze dobrze aproksymuje dane. W takim przypadku można posłużyć się funkcją wielomianową: k-stopień wielomianu y = a 1 x 1 + a 2 x 2 +... + a k x k + a 0

Laboratorium 1 Przeuczenie

Laboratorium 1 Regularyzacja

Example Klasyfikacja Ania, Michał i Paweł od pewnego czasu już studiują. Ania pracuje dorywczo jako programistka gier. Jej średnie miesięczne zarobki kształtują się na poziomie 2 200PLN. Postanowiła wziąć pożyczkę na wyjazd na narty. Zastanawia się czy na podstawie jej zarobków zostanie jej udzielona pożyczka. Analiza sytuacji na rynku pokazuje aktualny trend. Miesięczne zarobki (PLN) Pożyczka 1 500 nie 2 100 nie 2 600 tak 1 900 tak 2 400 tak 1 100 nie 1 700 nie

Klasyfikacja Przykładowy klasyfikator: jeśli h a (x) 1800 odpowiedź=1 (tak) jeśli h a (x) < 1800 odpowiedź=0 (nie)

Regresja logistyczna - model Chcielibyśmy mieć: 0 h #» a ( #» x ) 1 funkcja sigmoidalna h #» a ( #» x ) = g( #» a T #»x ) g( #» 1 a ) = 1 + e #» a T #» x

Regresja logistyczna - model

Granica klas (decision boundary)

Granica klas (decision boundary)

Regresja logistyczna - funkcja kosztu log(h #» a ( #» x )) gdy y = 1 koszt(h #» a, y) = log(1 h #» a ( #» x )) gdy y = 0 h 0 ( #» x ) 0, koszt

Funkcje oceny klasyfikatora trafność klasyfikacji L(i, j)-koszt błędnej klasyfikacji 1 gdy i j L(i, j) = 0 gdy i = j trafność= 1 m m i=1 L(y i, f(x i ))

Macierz pomyłek: Precision/Recall Rzeczywista wartość T F Przewidywana T True positive (TP) False positive (FP) wartość F False negative (FN) True negative (TN) Precision (precyzja): T P T P + F P Recall (czułość): T P T P + F N

Walidacja krzyżowa - na przykładzie RapidMiner

Drzewa decyzyjne (model symboliczny) Przegląd modeli (klasyfikacja) Przykład z RapidMiner

Przegląd modeli (klasyfikacja) Reguły (model symboliczny) Przykład z RapidMiner

Przegląd modeli (klasyfikacja) Regresja logistyczna Przykład z RapidMiner

Dziękuję za uwagę!