TEORETYCZNE PODSTAWY INFORMATYKI

Podobne dokumenty
Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Wprowadzenie do uczenia maszynowego

Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010

Zastosowania sieci neuronowych

AUTOMATYKA INFORMATYKA

8. Neuron z ciągłą funkcją aktywacji.

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Zastosowania sieci neuronowych

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.

1 Wprowadzenie do algorytmiki

Elementy statystyki wielowymiarowej

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Agnieszka Nowak Brzezińska Wykład III

Wprowadzenie do uczenia maszynowego

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Agnieszka Nowak Brzezińska

Agnieszka Nowak Brzezińska Wykład III

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

Drzewa decyzyjne. Inteligentne Obliczenia. Wydział Mechatroniki Politechniki Warszawskiej. Anna Sztyber

Klasyfikacja LDA + walidacja

UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

Wykład 10 Skalowanie wielowymiarowe

SPOTKANIE 2: Wprowadzenie cz. I

Sieci neuronowe w Statistica

Wstęp do przetwarzania języka naturalnego

ALGORYTM RANDOM FOREST

Sieci neuronowe w Statistica. Agnieszka Nowak - Brzezioska

Wstęp do teorii sztucznej inteligencji Wykład III. Modele sieci neuronowych.

Algorytm wstecznej propagacji błędów dla sieci RBF Michał Bereta

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Opis efektów kształcenia dla modułu zajęć

Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec

Systemy uczące się wykład 2

Tomasz Pawlak. Zastosowania Metod Inteligencji Obliczeniowej

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.


Metody eksploracji danych Laboratorium 2. Weka + Python + regresja

Widzenie komputerowe (computer vision)

1. Logika, funkcje logiczne, preceptron.

Wstęp do sieci neuronowych, wykład 03 Warstwy RBF, jednostka Adaline.

Metody systemowe i decyzyjne w informatyce

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Rok akademicki: 2012/2013 Kod: JFM s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne

Malware + Machine Learning (ML) - czy to ma sens? Kamil Frankowicz

Przykładowa analiza danych

Zmienne zależne i niezależne

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Rozpoznawanie obrazów

Optymalizacja ciągła

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335

Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec

SZTUCZNA INTELIGENCJA

Hierarchiczna analiza skupień

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

SPIS TREŚCI WSTĘP LICZBY RZECZYWISTE 2. WYRAŻENIA ALGEBRAICZNE 3. RÓWNANIA I NIERÓWNOŚCI

Stosowana Analiza Regresji

Skalowanie wielowymiarowe idea

Metody systemowe i decyzyjne w informatyce

Kurs Chemometrii Poznań 28 listopad 2006

Metody selekcji cech

ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.

Literatura. Sztuczne sieci neuronowe. Przepływ informacji w systemie nerwowym. Budowa i działanie mózgu

PROGNOZOWANIE PORÓWNAWCZE ENERGII PROCESOWEJ ZESTAWÓW MASZYN DO ROBÓT ZIEMNYCH JAKO CZYNNIKA RYZYKA EMISYJNOŚCI CO2

Zastosowania metod odkrywania wiedzy do diagnostyki maszyn i procesów

Inteligentne systemy informacyjne

Sieci neuronowe i algorytmy uczenia Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Ćwiczenie 12. Metody eksploracji danych

Techniki uczenia maszynowego nazwa przedmiotu SYLABUS

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Wrocław University of Technology. Uczenie głębokie. Maciej Zięba

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Regresyjne metody łączenia klasyfikatorów

Inteligentne systemy informacyjne

Ćwiczenie 5 PROGNOZOWANIE

Hybrydowa metoda rekomendacji dokumentów w środowisku hipertekstowym

Analiza składowych głównych. Wprowadzenie

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

STATYSTYKA MATEMATYCZNA

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Ontogeniczne sieci neuronowe. O sieciach zmieniających swoją strukturę

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Wycena nieruchomości za pomocą wyboru wielokryterialnego w warunkach niepewności rozmytej oraz klasycznie: metodą pp i kcś

Inteligentne systemy decyzyjne: Uczenie maszynowe sztuczne sieci neuronowe

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SYSTEMY UCZĄCE SIĘ WYKŁAD 1. INFORMACJE WSTĘPNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Temat: ANFIS + TS w zadaniach. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

Transkrypt:

1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień

Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering i wybor podzbioru System do rekomendacji Wykład na podstawie materiałów: E. Fox & C. Guestrin, Univeristy of Waschington, Machine Learning Specialization http://www.coursera.org./learn/ml-foundations

Uczenie maszynowe 3 Metody uczenia maszynowego (machine learning) rewolucjonizują obecnie podejście do różnych problemów związanych z analizą danych. Jeszcze kilka lat temu był to bardziej akademicki problem z zakresu numeryki i algorytmiki.

Uczenie maszynowe 4 Obecnie, bardzo szybko staje sie kluczową techniką dla wielu wiodących firm komercyjnych

Uczenie maszynowe: cel 5 Uzyskać odpowiedź dla różnej klasy pytań na podstawie informacji zawartej w danych, bez potrzeby budowy modelu zjawiska. ML metod = np. klasyfikacja, regresja liniowa, sieci neuronowe

Uczenie maszynowe: przykład 6 Przewidywanie ceny domu na podstawie zebranych danych dotyczących ceny innych

Uczenie maszynowe: przykład 7 Ranking restauracji

Uczenie maszynowe: przykład 8 Znajdowanie podobnych dokumentów

Uczenie maszynowe: przykład 9 Rekomendowanie podobnego produktu

Uczenie maszynowe: przykład 10 Rekomendowanie podobnego produktu na podstawie jego charakterystycznych cech

Uczenie maszynowe: przykład 11 Rekomendowanie podobnego produktu: na podstawie jego charakterystyki graficznej

Regresja 12 Uczenie maszynowe: Regresja Przewidywanie odpowiedzi na podstawie informacji wejściowej

Cena akcji na giełdzie 13

Tweet popularność 14

Przykład: przewidywana cena domu 15

Data, model 16

Data, model 17 Jaki model dla f(x)?

Przewidywanie 18 A potem chcielibyśmy przewidzieć odpowiedź

Pętla iteracyjna? 19

Simple linear regression model 20 Co to znaczy simple? 1 input x, fitujemy zależność liniową do danych

Simple linear regression model 21 Co to znaczy simple? 1 input x, fitujemy zależność liniową do danych

Simple linear regression model 22 Co to znaczy simple? 1 input x, fitujemy zależność liniową do danych

Pętla iteracyjna 23

Funkcja kosztu 24

Minimalizacja funkcji kosztu 25

Pętla iteracyjna 26

Minimalizacja funkcji kosztu 27

Asymetryczny błąd kosztu 28

Polynomial regression 29

Multiple regression 30

31 Regresja: przewidywanie na podstawie danych

Klasyfikacja 32 Uczenie maszynowe: Klasyfikacja Inteligentny system rankingu restauracji

Klasyfikacja 33 Uczenie maszynowe: Klasyfikacja Inteligentny system rankingu restauracji

Prosta klasyfikacja 34

Dane trenujące 35 Używamy danych trenujących aby przypisać prawdopodobieństwo (wagę) dla każdego słowa Waga całego zdania (score) to będzie prosta sumą tych wag

Uczenie klasyfikatora 36

Jak wygląda nasz model 37

Zmiana współczynników 38

Jak wygląda nasz model? 39

Czy jesteś pewny swojej klasyfikacji 40

Interpretacja 41

Interpretacja 42 Link funkcja

Logistic regression model 43 Sigmoid funkcja

Logistic regression model 44 Effekt współczynników na kształt funkcji sigmoidalnej

Jak pewny jesteś swojej klasyfikacji 45

Zmienne opisowe 46 Nadajemy numeryczne wartości

Klasyfikacja: ranking restauracji 47

Klastrowanie i wybór podobnych 48 Uczenie maszynowe: Klasyfikacja i wyszukiwanie podobnych obiektów Poszukiwanie podobnych obiektów

Wyszukaj podobny tekst 49 Musimy zdefiniować co to znaczy podobny

Wyszukaj podobny tekst 50 Musimy zdefiniować co to znaczy podobny

51 Technika może być stosowana do wielu zagadnień

Odkryj grupę podobnych obiektów 52

Pogrupuj wg. tematów dokumenty 53

Pogrupuj obrazki 54

Przykład: dokument na podobny temat 55 Jak mierzymy podobieństwo? Jak szukamy podobieństw?

Najbliższy sąsiad 56

Reprezentacja dokumentu 57 Dokument = zbiór słów Nieistotna kolejność występowania Zliczaj ilość wystąpień i zaznaczaj

Reprezentacja dokumentów : TF-IDF 58 Słowa mogą być rzadko występujące, te rzadko występujące są bardziej charakterystyczne.

Ważymy cechy charakterystyczne 59 Niektóre cechy są bardziej ważne niż inne Niektóre różnice (absolutna wartość) są bardziej istotne niż inne. Liczy się rozmycie całego zbioru dla danej cechy.

60 Skalowana Euclidesowa miara odległości

Naturalna miara odległości 61

Cosine miara odległości 62

Klastering: poszukiwanie dokumentu 63

System rekomendujący 64 Uczenie maszynowe: system rekomendujący Personalizacja

Rekomendacja: filmy 65

Rekomendacja: producty 66

System rekomendujacy: popularność 67 Popularność? Ranking wg. liczba oglądań Nie ma personalizacji

System rekomendujacy: klasyfikacja 68 Klasyfikacja? Jakie prawdopodobieństwo że kupie ten product. Personalizacja: patrzy na historie zakupów, koreluje z pora roku, pora dnia, etc.

System rekomendujacy: korelacje 69 Patrzy na korelacje. Osoby które kupiły A kupiły również B Utwórzmy macierz korelacji

System rekomendujacy: korelacje 70 Patrzy na korelacje. Osoby które kupiły A kupiły również B Macierz korelacji może należy znormalizować? A może wprowadzić jakąś miarę co znaczy podobne? Ograniczenie: Nie patrzy na historię w czasie Co zrobić z nowym użytkownikiem systemu?

System rekomendujący: filmy 71

System rekomendujący: filmy 72

System rekomendujący: filmy 73

System rekomendujący: sprawność 74

System rekomendujący: sprawność 75

System rekomendujący: sprawność 76

System rekomendujący: sprawność 77

System rekomendujący: sprawność 78

System rekomendujący: sprawność 79

80 Macierz podobieństw: rekomendacja produktu