Jakość uczenia i generalizacja



Podobne dokumenty
Testowanie modeli predykcyjnych

9. Praktyczna ocena jakości klasyfikacji

Stan dotychczasowy. OCENA KLASYFIKACJI w diagnostyce. Metody 6/10/2013. Weryfikacja. Testowanie skuteczności metody uczenia Weryfikacja prosta

Wybór modelu i ocena jakości klasyfikatora

Wstęp do sieci neuronowych, wykład 09, Walidacja jakości uczenia. Metody statystyczne.

WYKŁAD 7. Testowanie jakości modeli klasyfikacyjnych metodyka i kryteria

Wstęp do sieci neuronowych, wykład 13-14, Walidacja jakości uczenia. Metody statystyczne.

Optymalizacja ciągła

Zastosowania sieci neuronowych

Data Mining Wykład 4. Plan wykładu

Uczenie sieci radialnych (RBF)

Matlab podstawy + testowanie dokładności modeli inteligencji obliczeniowej

Eksploracja danych OCENA KLASYFIKATORÓW. Wojciech Waloszek. Teresa Zawadzka.

Wprowadzenie do uczenia maszynowego

Uczenie sieci typu MLP

Widzenie komputerowe

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Metody klasyfikacji danych - część 1 p.1/24

ALGORYTM RANDOM FOREST

Automatyczne wyodrębnianie reguł

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

METODY INŻYNIERII WIEDZY

Systemy uczące się wykład 2

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Pattern Classification

Monte Carlo, bootstrap, jacknife

SZTUCZNA INTELIGENCJA

Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Kombinacja jądrowych estymatorów gęstości w klasyfikacji wstępne wyniki

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Uczenie z nauczycielem. Przykładowy zbiór uczący. Istota algorytmu uczenia Schemat uczenia sieci neuronowej

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

sieci jednowarstwowe w MATLABie LABORKA Piotr Ciskowski

Rozpoznawanie obrazów

Konwersatorium Matematyczne Metody Ekonomii narzędzia matematyczne w eksploracji danych. Podstawowe pojęcia


Wstęp do sieci neuronowych, wykład 6 Wsteczna propagacja błędu - cz. 3

Sztuczne sieci neuronowe (SNN)

Ogólna idea procesu uczenia. Najważniejszy element wiedzy o sieciach neuronowych uczenie sieci. Uczenie z nauczycielem

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

Systemy agentowe. Uwagi organizacyjne. Jędrzej Potoniec

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

Testowanie hipotez statystycznych

Metody systemowe i decyzyjne w informatyce

Metody oceny wiedzy klasyfikacyjnej odkrytej z danych Jerzy Stefanowski Instytut Informatyki Politechnika Poznańska

Algorytm grupowania danych typu kwantyzacji wektorów

Przykładowa analiza danych

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Elementy modelowania matematycznego

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Najważniejszy element wiedzy o sieciach neuronowych. uczenie sieci

8. Drzewa decyzyjne, bagging, boosting i lasy losowe

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Ocena dokładności diagnozy

Spis treści 3 SPIS TREŚCI

Klasyfikacja LDA + walidacja

Metody eksploracji danych 3. Ocena modeli. Piotr Szwed Katedra Informatyki Stosowanej AGH 2017

Rozpoznawanie obrazów

Zastosowania sieci neuronowych

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

STATYSTYKA MAŁYCH OBSZARÓW IV. EMPIRYCZNY NAJLEPSZY PREDYKTOR

Wprowadzenie do uczenia maszynowego

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

PRZEWODNIK PO PRZEDMIOCIE

Elementy statystyki wielowymiarowej

ANALIZA PORÓWNAWCZA WYBRANYCH METOD SZACOWANIA BŁĘDU PREDYKCJI KLASYFIKATORA

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Co to jest grupowanie

I EKSPLORACJA DANYCH

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Metody systemowe i decyzyjne w informatyce

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Metody selekcji cech

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH. Wykład 5 Kwadratowa analiza dyskryminacyjna QDA. Metody klasyfikacji oparte na rozkładach prawdopodobieństwa.

Co to są drzewa decyzji

Sztuczne sieci neuronowe. Uczenie, zastosowania

Machine learning Lecture 5

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Motto. Czy to nie zabawne, że ci sami ludzie, którzy śmieją się z science fiction, słuchają prognoz pogody oraz ekonomistów? (K.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Laboratorium 6. Indukcja drzew decyzyjnych.

wiedzy Sieci neuronowe (c.d.)

Metody sztucznej inteligencji

Elementy inteligencji obliczeniowej

Sieci neuronowe w Statistica

Konstrukcja biortogonalnych baz dyskryminacyjnych dla problemu klasyfikacji sygnałów. Wit Jakuczun

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

SZTUCZNA INTELIGENCJA

Metody Statystyczne. Metody Statystyczne.

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Metody eksploracji danych 2. Metody regresji. Piotr Szwed Katedra Informatyki Stosowanej AGH 2017

Wprowadzenie. Data Science Uczenie się pod nadzorem

Transkrypt:

Jakość uczenia i generalizacja

Dokładność uczenia Jest koncepcją miary w jakim stopniu nasza sieć nauczyła się rozwiązywać określone zadanie Dokładność mówi na ile nauczyliśmy się rozwiązywać zadania które już znamy, a generalizacja na ile potrafimy rozwiązywać nowe zadania podobne do tych które znamy ale mogą też być inne

Miary dokładności uczenia dla problemów klasyfikacyjnych Macierz konfuzji parametr (ang. true positive) TP parametr (ang. false positive) FP

Miary dokładności uczenia dla problemów klasyfikacyjnych cd. Dokładność (ang. accuracy) Dokładność zbalansowana (ang. Balanced accuracy)

Miary dokładności uczenia krzywa ROC i AUC

Miary dokładności uczenia dla problemów regresyjnych Błąd średniokwadratowy (MSE) 1 n i i n i 1 2 e y d (RMSE) 1 n i i n i 1 2 e y d Błąd średni (ME) e i y i n d i Znormalizowany błąd średniokwadratowy (NMSE) e 1 n i i n i 1 y d 2 y d

Co to jest generalizacja Generalizacja zdolność do uogólniania zdobytej wiedzy Jeśli wszyscy uczyliby się do egzaminu równy okres czasu to i tak będą rozbieżności w ocenach. Dlaczego? Gdyż jedni uczą się szybciej a inni wolniej, jedni uczą się z przyjemnością fizyki, a inni wolą uczyć się na temat malarstwa. To samo zjawisko występuje w SSN i inteligencji obliczeniowej Generalizacja jest więc koncepcją określającą zdolnością do zastosowania zdobytej wiedzy w nowych sytuacjach, z którymi system nie spotkał się dotychczas.

Co to jest generalizacja Generalizacja Dokładność

Generalizacja a dokładność Poziom uogólnienia w funkcji VCdim Im model bardziej złożony tym bardziej maleje generalizacja Krzywa reprezentująca zależność pomiędzy dokładnością a generalizacją Błąd uczenia w funkcji VCdim (złożoności modelu) Im model bardziej złożony tym większy błąd (*) Sieci neuronowe w ujęciu algorytmicznym, Ossowski

Dokładność a generalizacja Zbyt duża generalizacja

Dokładność a generalizacja Przeuczenie (*) Pattern classification Duda, Hart, Stork

Dokładność a generalizacja Dobra generalizacja

Dokładność a generalizacja (*) Sieci neuronowe w ujęciu algorytmicznym, Ossowski

Problem rozmiaru sieci Im mamy bardziej pojemną sieć tym dłużej musimy się uczyć i tym więcej przypadków musimy przeanalizować Problem Jeżeli mamy bardzo dużą sieć to może dojść do niedouczenia sieci, jak i do przeuczenia się danego problemu Przykład Jeżeli mamy do rozwiązania zadanie z fizyki aby określić drogę jaką przebył kamień spadając przez 10s to można zadanie rozwiązać: 2 a) s g t 2 b) wyliczyć z definicji przyspieszenia iż jest to druga pochodna z drogi po czasie, robiąc odpowiednie przekształcenia i uwzględniając tarcie powietrza itp..

Metody oceny generalizacji Zasada minimalnej długości opisu (ang. Minimal description length) - bazuje na analizie rozmiaru zbioru oraz stopnia złożoności modelu h wyrażonego w bitach Gdzie: - jest długością opisu modelu h pod warunkiem kodowania C - jest długością opisu zbioru X pod warunkiem modelu h oraz kodowania C.

Metody oceny generalizacji cd. Zasada minimalizacji ryzyka strukturalnego (ang. structural risk minimization, SRM) - Idea współczynnika SRM polega na uwzględnieniu obok dokładności modelu h drugiego czynnika opisującego jego złożoność, tym samym wariancję modelu - Rzeczywisty koszt popełnienia błędu - Empiryczny koszt popełnienia błędu - Współczynnik Vapnika-Czervonenkisa - Pewna stała

Empiryczne metody oceny generalizacji Podział trening/test Kroswalidacja (ang cross validation) lub test krzyżowy Test typu jeden pozostaw Test typu bootstrap

Podział trening test Wydzielenie ze zbioru danych części na której będzie dokonywane uczenie i części na której będzie dokonywana ocena (testowanie) modelu Wada łatwo może dojść do przeuczenia modelu lub dostosowania modelu do zbioru testowego!!! Zbiór danych Zbiór Uczący Zbiór walidujący Zbiór treningowy Zbiór testowy

Test krzyżowy Podziel zbiór danych X na N równych niezależnych części R(i), i=1..n (losowanie bez zwracania) For i=1:n Ucz model na zbiorze X / R(i) Testuj model na R(i) Dwa typy testu krzyżowego: normalny losowo podział zbioru danych Stratyfikowany losowy podział ale zapewniający stały rozkład punktów w poszczególnych klasach

Jeden pozostaw Test jeden pozostaw (ang. Leave one out) jest szczególną wersją testu krzyżowego, gdzie zawsze tylko 1 wektor pozostawiany jest do testowania, a proces uczenia odbywa się M razy, gdzie M liczba wektorów w zbiorze uczącym Zalety test nie obciążony Wady duża złożoność obliczeniowa (znane są różne uproszczenia testu LOO)

Bootstrap (by Efron) Mając zbiór X o M wektorach Ze zbioru danych X wylosuj ze zwracaniem M wektorów aby powstał zbiór R j Naucz model H j na zbiorze R j i wyznacz błąd modelu na tym zbiorze RE j Wyznacz błąd XE j modelu H j na całym zbiorze danych X Wyznacz optymizm opt j =XE j -Re j Powtórz kroki 1:4 J krotnie Wyznacz średni optymizm opt Wyznacz błąd na zbiorze uczącym E (trening modelu i jego testowanie odbywa się na zbiorze X) Na tej podstawie estymatę błędu generalizacji (e) wynosi e = E + opt