SPOTKANIE 2: Wprowadzenie cz. I

Podobne dokumenty
Wrocław University of Technology. Wprowadzenie cz. I. Adam Gonczarek. Rozpoznawanie Obrazów, Lato 2015/2016

SPOTKANIE 1: Wprowadzenie do uczenia maszynowego

WYKŁAD 1. Wprowadzenie w tematykę kursu

WYKŁAD 2. Problem regresji - modele liniowe

WYKŁAD 3. Klasyfikacja: modele probabilistyczne

SPOTKANIE 9: Metody redukcji wymiarów

Pattern Classification

Metody systemowe i decyzyjne w informatyce

Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej. Adam Meissner. Elementy uczenia maszynowego

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Rozpoznawanie obrazów

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010

Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej. Adam Meissner. Elementy uczenia maszynowego

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Widzenie komputerowe (computer vision)

TEORETYCZNE PODSTAWY INFORMATYKI

Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec

Algorytm grupowania danych typu kwantyzacji wektorów

Prof. Stanisław Jankowski

Rozpoznawanie obrazów

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Ćwiczenie 12. Metody eksploracji danych

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

ALGORYTM RANDOM FOREST

Metody systemowe i decyzyjne w informatyce

Metody zbiorów przybliżonych w uczeniu się podobieństwa z wielowymiarowych zbiorów danych

data mining machine learning data science

Sieci Kohonena Grupowanie

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

Wrocław University of Technology. Uczenie głębokie. Maciej Zięba

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Text mining w programie RapidMiner Michał Bereta

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization

ANALIZA DANYCH KONCEPCJE I METODY

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

Selekcja modelu liniowego i predykcja metodami losowych podprzestrzeni

Rozpoznawanie obrazów

Metody systemowe i decyzyjne w informatyce

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Wprowadzenie do uczenia maszynowego

CLUSTERING. Metody grupowania danych

Rozpoznawanie obrazów

Optymalizacja systemów

TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON 3

Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec

Meta-uczenie co to jest?

Dariusz Brzeziński Instytut Informatyki, Politechnika Poznańska

SYSTEMY UCZĄCE SIĘ WYKŁAD 1. INFORMACJE WSTĘPNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Wstęp do sieci neuronowych, wykład 03 Warstwy RBF, jednostka Adaline.

UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji

Ewolucja sieci Sztuczna inteligencja i uczenie maszynowe

tum.de/fall2018/ in2357

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Rozpoznawanie obrazów

Przybliżone algorytmy analizy ekspresji genów.

Metody klasyfikacji danych - część 1 p.1/24

Metody systemowe i decyzyjne w informatyce

koniec punkt zatrzymania przepływów sterowania na diagramie czynności

Machine learning Lecture 6

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

A Zadanie

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

Technologie Informacyjne

SPOTKANIE 11: Reinforcement learning

Algorytmy immunologiczne. Dr inż. Michał Bereta p. 144 / 10, Instytut Informatyki

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

SPOTKANIE 7: Redukcja wymiarów: PCA, Probabilistic PCA

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Elementy modelowania matematycznego

Ewolucja sieci Sztuczna inteligencja i uczenie maszynowe

Co to jest grupowanie

Algorytmy, które estymują wprost rozkłady czy też mapowania z nazywamy algorytmami dyskryminacyjnymi.

Laboratorium 11. Regresja SVM.

Metody klasyfikacji dla nielicznej próbki wektorów o wielkim wymiarze

Testowanie modeli predykcyjnych

Algorytm grupowania danych typu kwantyzacji wektorów

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

Systemy uczące się wykład 2

SZTUCZNA INTELIGENCJA

Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Kognitywne hierarchiczne aktywne podziały. Arkadiusz Tomczyk.

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.

WYKŁAD 6. Reguły decyzyjne

Wprowadzenie. Data Science Uczenie się pod nadzorem

Systemy uczące się Lab 4

Agnieszka Nowak Brzezińska

Transkrypt:

Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016

UCZENIE MASZYNOWE 2/27

UCZENIE MASZYNOWE = Konstruowanie algorytmów, które uczą się i wnioskują na podstawie danych 2/27

1. Uczenie z nadzorem (ang. supervised learning) Regresja (ang. regression) Klasyfikacja (ang. classification) 2. Uczenie bez nadzoru (ang. unsupervised learning) Klasteryzacja (ang. clustering) Redukcja wymiarów (ang. dimensionality reduction) Uzupełnianie wartości (ang. matrix completion) 3. Uczenie ze wzmocnieniem (ang. reinforcement learning) 3/27

Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. 4/27

Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. 4/27

Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. 4/27

Uczenie z nadzorem: Regresja Regresja (ang. Regression): Dysponujemy obserwacjami z odpowiadającymi im wartościami ciągłymi. Celem uczenia jest skonstruowanie modelu regresji na podstawie danych. 4/27

Regresja: Śledzenie ruchu Cel: Dane: Wyznaczenie następnego położenia obiektu. Sekwencja obrazów z poruszającymi się obiektami. 5/27

Regresja: Predykcja notowań giełdowych Cel: Dane: Wycena akcji. Notowania akcji z poprzednich okresów oraz inne czynniki wpływające na cenę akcji. Model aktualizowany jest z wykorzystaniem bieżących notowań. 6/27

Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami) o wartościach dyskretnych. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. 7/27

Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami) o wartościach dyskretnych. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. 7/27

Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami) o wartościach dyskretnych. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. 7/27

Uczenie z nadzorem: Klasyfikacja Klasyfikacja (ang. Classification): Dysponujemy obserwacjami z etykietami (klasami) o wartościach dyskretnych. Celem uczenia jest skonstruowanie klasyfikatora separującego obiekty należące do różnych klas. 7/27

Klasyfikacja: Detekcja obiektów Cel: Dane: Wykrycie obiektu na obrazie. Zestaw obrazów treningowych przedstawiających dany obiekt. Do analizy obrazu wykorzystuje się okno przesuwne. W każdym kroku obraz z okna przesuwnego klasyfikowany jest jako obiekt poszukiwany lub nie. 8/27

Klasyfikacja: Detekcja SPAMU Cel: Dane: Zbadać, czy dana wiadomość jest SPAMEM. Zestaw zawierający zaetykietowane wiadomości mailowe. Wydobywane są cechy (występowanie słów) różnicujące SPAM od zwykłej poczty. 9/27

Klasyfikacja: Rozpoznawanie mowy Cel: Dane: Interpretacja wybranych słów na podstawie wypowiedzi. Próbki dźwięków wraz z ich znaczeniem. Wydobywane są cechy dźwięku charakterystyczne dla danego słowa, głoski, bądź zestawu słów. 10/27

Uczenie bez nadzoru: Klasteryzacja Klasteryzacja (ang. Clustering): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie grup (klastrów), w których skupione są dane. Inne nazwy: grupowanie, analiza skupień. 11/27

Uczenie bez nadzoru: Klasteryzacja Klasteryzacja (ang. Clustering): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie grup (klastrów), w których skupione są dane. Inne nazwy: grupowanie, analiza skupień. 11/27

Klateryzacja: Kompresja obrazu Cel: Dane: Kodowanie pikseli wartościami z mniejszego zakresu. Obraz. Zakłada się, że każdy piksel może przyjąć K wartości. Podobne piksele trafiają do tego samego klastra. Piksel kodowany jest poprzez numer klastra. 12/27

Klateryzacja: Grupowanie słów Cel: Dane: Wyodrębnienie grup słów w tytułach artykułów. Artykuły prasowe. Grupowaniu podlegają słowa, które pojawiły się w tytule artykułu. Słowa z jednej grupy zazwyczaj opisują to samo zdarzenie. 13/27

Uczenie bez nadzoru: Redukcja wymiarów Redukcja wymiarów (ang. Dimensionality Reduction): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie niskowymiarowej podprzestrzeni (rozmaitości), na której leżą dane. 14/27

Uczenie bez nadzoru: Redukcja wymiarów Redukcja wymiarów (ang. Dimensionality Reduction): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie niskowymiarowej podprzestrzeni (rozmaitości), na której leżą dane. 14/27

Redukcja wymiarów: Kodowanie i kompresja zdjęć Cel: Dane: Znalezienie twarzy bazowych rozpinających niskowymiarową przestrzeń. Zdjęcia twarzy. Wyróżnione M twarzy bazowych rozpina M-wymiarową podprzestrzeń w przestrzeni twarzy. Twarze mogą być kodowane poprzez położenie na niskowymiarowej przestrzeni. 15/27

Redukcja wymiarów: Wizualizacja danych Cel: Dane: Wizualizacja 2D lub 3D wysokowymiarowych danych. Dowolne dane, np. zdjęcia. Redukcja wymiarów pozwala na wizualizację struktury wysokowymiarowych danych. Podobne obserwacje znajdują się blisko siebie w niskowymiarowej przestrzeni. 16/27

Uczenie bez nadzoru: Uzupełnianie wartości Uzupełnianie wartości (ang. Matrix completion): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie brakujących wartości dla niekompletnych obserwacji. 17/27

Uczenie bez nadzoru: Uzupełnianie wartości Uzupełnianie wartości (ang. Matrix completion): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie brakujących wartości dla niekompletnych obserwacji. 17/27

Uczenie bez nadzoru: Uzupełnianie wartości Uzupełnianie wartości (ang. Matrix completion): Dysponujemy obserwacjami bez etykiet. Celem uczenia jest znalezienie brakujących wartości dla niekompletnych obserwacji. 17/27

Uzupełnianie wartości: Rekonstrukcja obrazu Cel: Dane: Odtworzyć zakłócony obraz. Zestaw niezakłóconych zdjęć, oraz zakłócony obraz do rekonstrukcji. W oparciu o niezakłócone zdjęcia wyuczany jest model. Na podstawie modelu uzupełniane są brakujące wartości pikseli. 18/27

Uzupełnianie wartości: Rekomendacja produktów Cel: Dane: Zaproponować klientowi produkty, które skłonny jest kupić. Produkty do tej pory kupione przez klienta i transakcje zrealizowane przez innych klientów. W oparciu o zakupiony koszyk produktów nabytych przez klienta i zestaw transakcji uczony jest model. Na podstawie modelu wybierane są produkty do rekomendacji. 19/27

Uczenie ze wzmocnieniem Uczenie ze wzocnieniem (ang. Reinforcement Learning): Maszyna (agent) wchodzi w interakcje z otoczeniem (środowiskiem), w którym chce osiągnąć określony cel. Maszyna podejmuje akcje aby osiągnąć cel, które są ocenianie przez otoczenie (nagradzane lub karane). 20/27

Uczenie ze wzmocnieniem Uczenie ze wzocnieniem (ang. Reinforcement Learning): Maszyna (agent) wchodzi w interakcje z otoczeniem (środowiskiem), w którym chce osiągnąć określony cel. Maszyna podejmuje akcje aby osiągnąć cel, które są ocenianie przez otoczenie (nagradzane lub karane). 20/27

Uczenie ze wzmocnieniem Uczenie ze wzocnieniem (ang. Reinforcement Learning): Maszyna (agent) wchodzi w interakcje z otoczeniem (środowiskiem), w którym chce osiągnąć określony cel. Maszyna podejmuje akcje aby osiągnąć cel, które są ocenianie przez otoczenie (nagradzane lub karane). 20/27

Uczenie ze wzmocnieniem Uczenie ze wzocnieniem (ang. Reinforcement Learning): Maszyna (agent) wchodzi w interakcje z otoczeniem (środowiskiem), w którym chce osiągnąć określony cel. Maszyna podejmuje akcje aby osiągnąć cel, które są ocenianie przez otoczenie (nagradzane lub karane). 20/27

Uczenie ze wzmocnieniem Uczenie ze wzocnieniem (ang. Reinforcement Learning): Maszyna (agent) wchodzi w interakcje z otoczeniem (środowiskiem), w którym chce osiągnąć określony cel. Maszyna podejmuje akcje aby osiągnąć cel, które są ocenianie przez otoczenie (nagradzane lub karane). 20/27

Uczenie ze wzmocnieniem: Sterowanie helikopterem Cel: Dane: Wyuczyć algorytm sterowania helikopterem. Sterowanie helikopterem przez pilota (operatora). Dynamika helikoptera została użyta do określenia funkcji nagrody. Uczenie ze wzocnieniem użyto do nauki sterowania helikopterem. Projekt wykonano na Stanford University (http://heli.stanford.edu/). 21/27

Elementy zadania uczenia maszynowego 1. Ekstrakcja cech (ang. feature extraction) 2. Modelowanie (ang. modeling) 3. Wnioskowanie (ang. inference) 4. Uczenie (ang. learning) 5. Selekcja modelu (ang. model selection) 6. Predykcja (ang. prediction) 7. Ocena jakości (ang. evaluation) 22/27

Elementy zadania uczenia maszynowego 1. Ekstrakcja cech (ang. feature extraction) 2. Modelowanie (ang. modeling) 3. Wnioskowanie (ang. inference) 4. Uczenie (ang. learning) 5. Selekcja modelu (ang. model selection) 6. Predykcja (ang. prediction) 7. Ocena jakości (ang. evaluation) 22/27

Ekstrakcja cech Dane wejściowe Model? Obraz Średnia pikseli Predykcja 23/27

Ekstrakcja cech Dane wejściowe Ekstrakcja cech Model Obraz Cechy (filtry) Predykcja 24/27

Ekstrakcja cech z obrazu Z prezentacji Honglaka Lee 25/27

Ekstrakcja cech audio Z prezentacji Ruslana Salakhutdinova 26/27

Ekstrakcja cech z tekstu To be or not to be... to: 1 be: 1 or: 1 not: 1 this: 0 Bag-of-words tf-idf = tf x idf TF-IDF to: 2 be: 2 or: 1 not: 1 Term frequency (TF) to: 0 to: be: 0 to: 2 1 be: or: 0 be: 2 0 or: not: 1 or: 1 1 not: 1 not: 1 to: log(1+3/2) be: log(1+3/3) or: log(1+3/2) not: log(1+3/3) Inverse document frequency (IDF) 27/27