Co to jest klasyfikacja? Klasyfikacja a grupowanie Naiwny klasyfikator Bayesa

Podobne dokumenty
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Agnieszka Nowak Brzezińska Wykład III

Analiza i wizualizacja danych Data analysis and visualization

Prawdopodobieństwo czerwonych = = 0.33

Agnieszka Nowak Brzezińska Wykład III

Klasyfikacja metodą Bayesa

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Elementy modelowania matematycznego

Analiza danych. TEMATYKA PRZEDMIOTU

Mail: Pokój 214, II piętro

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Naiwny klasyfikator Bayesa brał pod uwagę jedynie najbliższe otoczenie. Lecz czym jest otoczenie? Jak je zdefiniować?

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining

Analiza danych i data mining.

Sztuczna inteligencja : Algorytm KNN

Systemy uczące się wykład 1

Metody probabilistyczne klasyfikatory bayesowskie

Szczegółowy opis przedmiotu zamówienia

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Algorytmy klasyfikacji

Wybór / ocena atrybutów na podstawie oceny jakości działania wybranego klasyfikatora.

Systemy uczące się Lab 4

Wprowadzenie do technologii informacyjnej.

Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0

Jednostka modułowa: m3.j1 Podejmowanie i prowadzenie działalności w gastronomii

Hurtownie danych - opis przedmiotu

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

Opis efektów kształcenia dla modułu zajęć

Rodzaje badań statystycznych

ALGORYTM RANDOM FOREST

Techniki uczenia maszynowego nazwa przedmiotu SYLABUS

KURS PRAWDOPODOBIEŃSTWO

data mining machine learning data science

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

KURS STATYSTYKA. Lekcja 5 Analiza współzależności ZADANIE DOMOWE. Strona 1

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU

Metody Sztucznej Inteligencji II

Klasyfikacja bayesowska

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

Materiały: kartki papieru (5 x 5 kolorów), piłeczki pingpongowe (5 x 5 kolorów), worek (nieprzeźroczysty).

Wymagania edukacyjne z matematyki w klasie III gimnazjum

Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek

Metody systemowe i decyzyjne w informatyce


Technologie Informacyjne

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Wybrane rozkłady zmiennych losowych. Statystyka

Uwaga: szarych kropek po pokolorowaniu nie uwzględniaj w klasyfikowaniu kolejnych szarych.

TEORETYCZNE PODSTAWY INFORMATYKI

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

KP, Tele i foto, wykład 3 1

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA REALIZACJA W ROKU AKADEMICKIM 2016/2017

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Głównym celem opracowania jest próba określenia znaczenia i wpływu struktury kapitału na działalność przedsiębiorstwa.

DODATKOWA PULA ZADAŃ DO EGZAMINU. Rozważmy ciąg zdefiniowany tak: s 0 = a. s n+1 = 2s n +b (dla n=0,1,2 ) Pokaż, że s n = 2 n a +(2 n =1)b

Wydawnictwo Politechniki Poznanskiej

Wprowadzenie do uczenia maszynowego

Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010

Elementy Sztucznej Inteligencji. Sztuczne sieci neuronowe cz. 2

Zarządzenie nr 7 Rektora Uniwersytetu Jagiellońskiego z 14 stycznia 2015 roku

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

STUDENCI UCZELNI PUBLICZNYCH I NIEPUBLICZNYCH

Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS

Testowanie modeli predykcyjnych

Analiza metod wykrywania przekazów steganograficznych. Magdalena Pejas Wydział EiTI PW

Eksploracja Danych. podstawy

Metody doboru próby do badań. Dr Kalina Grzesiuk

KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3

SPRAWOZDANIE Z PŁATNOŚCI NA RZECZ ADMINISTRACJI PUBLICZNEJ JASTRZĘBSKIEJ SPÓŁKI WĘGLOWEJ S.A. ZA ROK OBROTOWY ZAKOŃCZONY 31 GRUDNIA 2016 ROKU

Projekt przejściowy 2015/2016 BARTOSZ JABŁOŃSKI, TOMASZ JANICZEK

Informatyka I stopień (I stopień / II stopień) ogólno akademicki (ogólno akademicki / praktyczny) podstawowy (podstawowy / kierunkowy / inny HES)

Wybrane rozkłady zmiennych losowych. Statystyka

Wymagania edukacyjne z przedmiotu "Projektowanie i montaż lokalnych sieci komputerowych "

Budowanie drzewa filogenetycznego

Widzenie komputerowe (computer vision)

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Inżynierii Produkcji Dr Małgorzata Lucińska

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

Numeryczne rozwiązanie równania Schrodingera

WYMAGANIA Z WIEDZY I UMIEJĘTNOŚCI NA POSZCZEGÓLNE STOPNIE SZKOLNE DLA KLASY CZWARTEJ H. zakres rozszerzony. Wiadomości i umiejętności

Systemy uczące się wykład 2

a)dane są wartości zmiennej losowej: 2, 4, 2, 1, 1, 3, 2, 1. Obliczyć wartość średnią i wariancję.

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Wyznaczanie długości fali świetlnej metodą pierścieni Newtona

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Eksploracja logów procesów. Process mining

Laboratorium 4. Naiwny klasyfikator Bayesa.

Sposoby prezentacji problemów w statystyce

WYMAGANIA EDUKACYJNE Z MATEMATYKI DLA KLASY III

Eksploracja danych PROCES EKSPLORACJI DANYCH. Wojciech Waloszek. Teresa Zawadzka.

Zakres pytań obowiązujący w roku akad. 2015/2016

PRZEDMIOTOWY SYSTEM OCENIANIA NA LEKCJACH MATEMATYKI W SZKOLE PODSTAWOWEJ NR 1 W SULECHOWIE

Podstawy sztucznej inteligencji

Dział I FUNKCJE TRYGONOMETRYCZNE

ALGORYTMY SZTUCZNEJ INTELIGENCJI

WYKSZTAŁCENIE I KWALIFIKACJE KOBIET A ICH SYTUACJA NA RYNKU PRACY. Redakcja naukowa Grażyna Firlit-Fesnak

Transkrypt:

Co to jest klasyfikacja? Klasyfikacja a grupowanie Naiwny klasyfikator Bayesa

Odkrywanie asocjacji Wzorce sekwencji Analiza koszykowa Podobieństwo szeregów temporalnych Klasyfikacja Wykrywanie odchyleń

Jest jednym z głównych celów eksploracji danych. Służy do rozdzielenia obiektów w grupy, z których każda ma coś ze sobą wspólnego.

Klasy: Żółty, Niebieski, Zielony

Do tego przydają się klasyfikatory, czyli algorytmy które na podstawie jakichś znanych wcześniej przypadków, potrafią zaklasyfikować nowe obiekty (przypadki) do wcześniej zdefiniowanych i utworzonych grup. Co wynika z powyższego: klasyfikatory można uczyć: Uczenie nienadzorowane Uczenie nadzorowane

Prosty, propablistyczny klasyfikator Zakłada, że predyktory są niezależne Wywodzi się z Twierdzenia Bayesa Można go uczyć w trybie z nadzorem Pomimo ich naiwnego projektowania i bardzo uproszczonych założeń, naiwne klasyfikatory Bayesa często pracują dużo lepiej w wielu rzeczywistych sytuacjach niż można było tego oczekiwać.

Liczba kobiet: 5 Liczba mężczyzn: 3 A więc panowie do dzieła

Liczba kobiet: 5 Liczba mężczyzn: 3 A więc panowie do dzieła Gaśnie światło. Przychodzi nowa osoba na dyskotekę. Czy będzie to kobieta czy mężczyzna?

Liczba kobiet: 5 Liczba mężczyzn: 3 Gaśnie światło. Przychodzi nowa osoba na dyskotekę. Czy będzie to dziewczyna czy chłopak? Prawd. chłopaka = 3/8 Prawd. dziewczyny =5/8 W otoczeniu jest 1 chłopak i 3 dziewczyny

Liczba kobiet: 5 Liczba mężczyzn: 3 Prawd. chłopaka = 3/8 Prawd. dziewczyny =5/8 W otoczeniu jest 1 chłopak i 3 dziewczyny Prawd. chłopaka w sąsiedztwie = 1/3 Prawd. dziewczyny w sąsiedztwie = 3/5

Prawdopodobieństwo, że nowa osoba jest dziewczyną = Prawdopodobieństwo, że jest dziewczyna w sąsiedztwie * Prawdopodobieństwo, że dziewczyna w ogóle Prawdopodobieństwo, że nowa osoba jest chłopakiem = Prawdopodobieństwo, że jest chłopak w sąsiedztwie * Prawdopodobieństwo, że chłopak w ogóle

Prawdopodobieństwo, że nowa osoba jest dziewczyną = Prawdopodobieństwo, że jest dziewczyna w sąsiedztwie * Prawdopodobieństwo, że dziewczyna w ogóle P(chłopak) = 1/3 * 3/8 = 1/8 P(dziewczyna) = 3/5 * 5/8 = 3/8 Prawdopodobieństwo, że nowa osoba jest chłopakiem = Prawdopodobieństwo, że jest chłopak w sąsiedztwie * Prawdopodobieństwo, że chłopak w ogóle

Poniższy plan odzwierciedla strukturę demograficzną właścicieli działek. Zielony emeryt, Niebieski w średnim wieku, Żółty dwudziestokilkulatek. Wprowadza się nowa osoba (czerwony). Kto to będzie najpewniej? Zanalizuj sąsiedztwo najbliższe, potem o 1 dalsze.

Poniższy plan odzwierciedla strukturę demograficzną właścicieli działek. Zielony emeryt, Niebieski w średnim wieku, Żółty dwudziestokilkulatek. Wprowadza się nowa osoba (czerwony). Kto to będzie najpewniej? Zanalizuj sąsiedztwo najbliższe, potem o 1 dalsze.

Poniższy plan odzwierciedla strukturę demograficzną właścicieli działek. Zielony emeryt, Niebieski w średnim wieku, Żółty dwudziestokilkulatek. Wprowadza się nowa osoba (czerwony). Kto to będzie najpewniej? Zanalizuj sąsiedztwo najbliższe, potem o 1 dalsze.

Jak wszystkim wiadomo, w akademikach mieszkają różni studenci Wiadomo również, że poszczególne domy studenckie znacznie różnią się między sobą stopniem zimprezowania. Wiadomo też, że osoby z różnych wydziałów wybierają różne akademiki. Mając dane te dwa kryteria sporządź mapę akademikową: uwzględnij dwa poziomy numer domu studenta oraz piętro. Tak przygotowaną mapę (skoro mamy dwie cechy, to może mapy?) zwizualizuj graficznie. Technika dowolna, byleby czytelna z punktu widzenia klasyfikatora Bayesa. Mając dany taki aparat statystyczny wprowadź nowego mieszkańca i określ prawdopodobieństwo należności do wydziału i do grupy imprezowej. Podobnie określ przynależność do wydziału nowego studenta. Całość oddaj w formie sprawozdania na za 2 tygodnie (w sprawozdaniu ma się znaleźć również podbudowa teoretyczna o naiwnym klasyfikatorze bayesa oraz bibliografia).