AI 1: Wprowadzenie do uczenia maszynowego

Podobne dokumenty
Eksploracja Danych. Wprowadzenie. (c) Marcin Sydow

Uczenie Maszynowe: Wprowadzenie. (c) Marcin Sydow

Metody numeryczne i statystyka dla in»ynierów

Jednowarstwowe Sieci Neuronowe jako. klasykatory do wielu klas. (c) Marcin Sydow

Eksploracja Danych. (c) Marcin Sydow. Wst p. Data Science. Wprowadzenie. Cykl eksperymentu. Uczenie maszynowe. Zasoby.

data mining machine learning data science

Wprowadzenie do teorii systemów ekspertowych

Uczenie Maszynowe: reprezentacja wiedzy, wybór i ocena modelu, drzewa decyzjne

Uczenie Wielowarstwowych Sieci Neuronów o

Zastosowania matematyki

Specjalizacja Web Mining

przewidywania zapotrzebowania na moc elektryczn

Wzorce projektowe kreacyjne

W zadaniach na procenty wyró»niamy trzy typy czynno±ci: obliczanie, jakim procentem jednej liczby jest druga liczba,

Wst p. Elementy systemów decyzyjnych Sprawy organizacyjne. Wprowadzenie Przegl d metod klasykacji

Baza danych - Access. 2 Budowa bazy danych

Systemy decyzyjne Wprowadzenie

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Lab. 02: Algorytm Schrage

Podstawy modelowania w j zyku UML

Wnioskowanie Boolowskie i teoria zbiorów przybli»onych

Widzenie komputerowe (computer vision)

AUTO-ENKODER JAKO SKŠADNIK ARCHITEKTURY DEEP LEARNING

Metody numeryczne. Wst p do metod numerycznych. Dawid Rasaªa. January 9, Dawid Rasaªa Metody numeryczne 1 / 9

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

i, lub, nie Cegieªki buduj ce wspóªczesne procesory. Piotr Fulma«ski 5 kwietnia 2017

Metody numeryczne i statystyka dla in»ynierów

ALGORYTMIKA Wprowadzenie do algorytmów

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Podstawy modelowania w j zyku UML

Maszyny Turinga i problemy nierozstrzygalne. Maszyny Turinga i problemy nierozstrzygalne

Ewolucja Ró»nicowa - Wprowadzenie

Listy i operacje pytania

MiASI. Modelowanie analityczne. Piotr Fulma«ski. 18 stycznia Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

Systemy decyzyjne Wykªad 5: Drzewa decyzyjne

Wykorzystanie lokalnej geometrii danych w Maszynie Wektorów No±nych

Algorytm grupowania K-Means Reprezentacja wiedzy Selekcja i ocena modeli

Aplikacje bazodanowe. Laboratorium 1. Dawid Poªap Aplikacje bazodanowe - laboratorium 1 Luty, 22, / 37

Eksploracja danych w środowisku R

POLITECHNIKA WROCŠAWSKA WYDZIAŠ ELEKTRONIKI PRACA DYPLOMOWA MAGISTERSKA

Szeregowanie zada« Przedmiot fakultatywny 15h wykªadu + 15h wicze« dr Hanna Furma«czyk. 7 pa¹dziernika 2013

WYKŁAD 4 PLAN WYKŁADU. Sieci neuronowe: Algorytmy uczenia & Dalsze zastosowania. Metody uczenia sieci: Zastosowania

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Zastosowanie eliptycznych równa«ró»niczkowych

1 Metody iteracyjne rozwi zywania równania f(x)=0

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

ALGORYTM RANDOM FOREST

Projekt konceptualny z Baz Danych "Centralny system zarz dzania salami na AGH"

SPOTKANIE 1: Wprowadzenie do uczenia maszynowego

Modelowanie i analiza systemów informatycznych

Subversion - jak dziaªa

JAO - J zyki, Automaty i Obliczenia - Wykªad 1. JAO - J zyki, Automaty i Obliczenia - Wykªad 1

Lekcja 1: Wst p do sztucznej inteligencji i systemów ucz cych si

Zmiany w Podstawie programowej przedmiotów informatycznych

Szeregowanie zada« Wykªad nr 5. dr Hanna Furma«czyk. 4 kwietnia 2013

Propozycja integracji elementów ±wiata gry przy u»yciu drzew zachowa«

Wst p do sieci neuronowych, wykªad 14 Zespolone sieci neuronowe

Przetwarzanie sygnaªów

Podziaª pracy. Cz ± II. 1 Tablica sortuj ca. Rozwi zanie

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Zarz dzanie rm. Zasada 2: samoorganizuj ce si zespoªy. Piotr Fulma«ski. March 17, 2015

Festiwal Myśli Abstrakcyjnej, Warszawa, Czy SZTUCZNA INTELIGENCJA potrzebuje FILOZOFII?

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Wyznaczanie krzywej rotacji Galaktyki na podstawie danych z teleskopu RT3

Laboratorium 11. Regresja SVM.

w ekonomii, finansach i towaroznawstwie

Wojewódzki Konkurs Matematyczny

Przykªady problemów optymalizacji kombinatorycznej

Modele wielorównaniowe. Problem identykacji

Uniwersalne Maszyny Ucz ce. Tomasz Maszczyk. opiekun naukowy: prof. Wªodzisªaw Duch

Metody bioinformatyki (MBI)

Ukªady równa«liniowych

Analiza danych i data mining.

Portretowanie zdolności i ich rozwój. Projekt współfinansowany z Unii Europejskiej w ramach Europejskiego Funduszu Społecznego

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14

1 Klasy. 1.1 Denicja klasy. 1.2 Skªadniki klasy.

Problemy optymalizacyjne - zastosowania

Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki

I rok. semestr 1 semestr 2 15 tyg. 15 tyg. Razem ECTS. laborat. semin. ECTS. konwer. wykł. I rok. w tym. Razem ECTS. laborat. semin. ECTS. konwer.

Mail: Pokój 214, II piętro

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Podstawa programowa kształcenia ogólnego informatyki w gimnazjum

Makroekonomia Zaawansowana

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

ROCZNY PLAN PRACY SIECI WSPÓŁPRACY I SAMOKSZTAŁCENIA NA ROK SZKOLNY 2013/2014

Wst p do informatyki. Systemy liczbowe. Piotr Fulma«ski. 21 pa¹dziernika Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

Bazy danych. Andrzej Łachwa, UJ, /15

EGZAMIN MATURALNY Z INFORMATYKI CZERWIEC 2011 POZIOM ROZSZERZONY WYBRANE: CZĘŚĆ I. Czas pracy: 90 minut. Liczba punktów do uzyskania: 20

epuap Ogólna instrukcja organizacyjna kroków dla realizacji integracji

Warszawa, r.

MiASI. Modelowanie integracji systemów. Piotr Fulma«ski. 26 stycznia Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska

CAŠKOWANIE METODAMI MONTE CARLO Janusz Adamowski

Ekonometria - wykªad 8

Blockchain. Modelowanie zachowa«oraz odkrywanie wzorców w grae transakcji Ethereum. Mateusz Zaborski

Metodydowodzenia twierdzeń

SPOTKANIE 2: Wprowadzenie cz. I

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

x y x y x y x + y x y

Narzędzia AI. Jakub Wróblewski Pokój SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE)

Transkrypt:

AI 1: do uczenia maszynowego Web Mining Lab, PJWSTK

Plan silna AI/sªaba AI test Turinga aspekty inteligencji zastosowania wspóªczesne AI pozytywne i negatywne aspekty rozwoju AI dla czªowieka do uczenia maszynowego Eksploracja danych i uczenie maszynowe: motywacja Na czym polega uczenie maszynowe Tablice decyzyjne: atrybuty i obserwacje z nadzorem i bez nadzoru Klasykacja i regresja

Sztuczna Inteligencja Gaª ¹ nauki maj ca na celu stworzenie systemu (maszyny, oprogramowania, etc.) posiadaj cego inteligencj co najmniej dorównuj c ludzkiej Wizja obecna w kulturze od wieków: mity i legendy (np. Golem) literatura (np. Cyberiada Stanisªawa Lema) nauka Wspóªczesny rozdziaª tej historii to lata 60-te, kiedy powstaªy odpowiednie komputery

Wiele w tków lozoczny (Czy maszyna mo»e my±le? itp.) teoretyczny (twierdzenie Godela) naturalny (obserwacja natury) praktyczny (rozwi zywanie problemów) algorytmiczny i obliczeniowy

Test Turinga A i B komunikuj si w j zyku naturalnym (tekst) jeden z nich to czªowiek drugi to maszyna udaj ca czªowieka C obserwuje komunikacj czy C potra rozró»ni czªowieka od maszyny?»aden system nie przeszedª testu Turinga (jak dot d)

Krótka subiektywna i uproszczona historia AI pre-historia (przed 1960 - pierwsze nowoczesne komputery) romantyzm (60-65) - optymistyczna wiara,»e sztuczna inteligencja dorówna ludzkiej w 10 lat... ciemno± (65-70) - pesymizm renesans (70-75) - powstaj pierwsze praktyczne systemy eksperckie wspóªpraca (75-80) - badania interdyscyplinarne: nauki ±cisªe, przyrodnicze, humanistyczne; ±rodowiska akademickie i przemysªowe komercjalizacja (80-)

Literatura (przykªady) Neural Networks (e.g.): M. Negnevitsky Articial Intelligence Machine Learning (e.g.): P. Cichosz Ucz ce si Witten et al. Data Mining General AI (e.g.): G. Luger Articial Intelligence NP-completess (e.g.): Cormen et al. Introduction to algorithms Optimisation (e.g.): C.Papadimitriou Combinatorial Optimisation Approximation algorithms: V.Vasirani Approximation algorithms Complexity: C.Papadimitriou Complexity Theory

Silna i sªaba AI sªaba AI (w skie aspekty, konkretne wybrane problemy praktyczne) zdolno± do rozwi zywania zªo»onych problemów adaptacyjno± uczenie silna AI (inteligencja uniwersalna) powy»sze, oraz: ±wiadomo± kreatywno± auto-reeksja (nt. wªasnych ogranicze«, itp.) ewolucja Silna AI jest wci» tylko marzeniem... Tutaj skupiamy si na sªabej AI.

Aspekty AI percepcja (sztuczne zmysªy: systemy widz ce, rozpoznawanie mowy i pisma, etc.) wiedza (reprezentacja wiedzy: reguªy, tabele decyzyjne, drzewa decyzyjne, ontologie) rozumowanie (logika, automatyczne wyci ganie wniosków, dowodzenie twierdze«) uczenie si uczenie maszynowe: (ang. machine learning (ML)): z nadzorem (klasykacja, regresja), bez nadzoru (np. grupowanie)) komunikacja przetwarzanie j zyka naturalnego (natural language processing (NLP)): inteligentne wyszukiwanie informacji tekstowej, text mining, odpowiadanie na zapytania, tªumaczenie maszynowe, automatyczne zdobywanie wiedzy planowanie i rozwi zywanie zada«(przeszukiwanie, heurystyki, systemy wielo-agentowe, ewolucyjne, etc.)

do uczenia maszynowego

Zalew danych W ka»dej sekundzie produkowane s ogromne ilo±ci danych: ceny papierów warto±ciowych ceny towarów na rynku warto±ci transakcji klikni cia (logi serwerów WWW) zamówienia towarów w sklepach internetowych rachunki w elektronicznych kasach sklepowych wyniki pomiarów astronomicznych, zycznych, etc...

Motywacja dla eksploracji danych Obserwacje: 1 te dane s interesuj ce i warte bada«2 s zapisane w formie elektronicznej (ªatwe do automatycznej analizy) 3 jest ich za du»o by mogªy by zanalizowane bez pomocy komputerów

Gªówne cele rozpoznawanie istotnych wzorców w danych wykrywanie trendów w danych (np. wczesne wykrycie kryzysów ekonomicznych, itp.) przewidywanie przyszªo±ci na podstawie poprzednich obserwacji klasykacja nowo-obserwowanych przypadków grupowanie obiektów podobnych W uczeniu maszynowym powy»sze cele realizowane s automatycznie lub przy niewielkim wsparciu czªowieka

Idea uczenia z nadzorem 1 nadzór polega na podawaniu prawidªowych rozwi za«dla danych trenuj cych 2 system uczy si uogólni sposób rozwi zania zadania poprzez automatyczne wykrycie zwi zków pomi dzy danymi a prawidªowymi rozwi zaniami (automatyczne budowanie modelu prawidªowego rozwi zania) 3 automatycznie wyuczony model jest stosowany do nowych przypadków (nie trenuj cych)

Przykªad: pewna gra na powietrzu, mo»liwa tylko przy pewnych specycznych warunkach atmosferycznych (nie wiemy jakich): pogoda temperatura wilgotno± wiatr GRA? sªonecznie ciepªo wysoka brak nie sªonecznie ciepªo wysoka jest nie pochmurno ciepªo wysoka brak tak deszczowo normalnie wysoka brak tak deszczowo chªodno normalna brak tak deszczowo chªodno normalna jest nie pochmurno chªodno normalna jest tak sªonecznie normalnie wysoka brak nie sªonecznie chªodno normalna brak tak deszczowo normalnie normalna brak tak sªonecznie normalnie normalna jest tak pochmurno normalnie wysoka jest tak pochmurno ciepªo normalna brak tak deszczowo normalnie wysoka jest nie

Przykªad, cd Podstawowe pytanie: Przy jakich warunkach gra si w t gr ogólnie? Je±li odpowied¹ nie jest znana mo»na posªu»y si wieloma zaobserwowanymi przypadkami i sprawi aby system wychwyciª ogóln reguª. Je±li uda si w ten automatyczny sposób pozyska wiedz o reguªach gry z obserwacji znanych przypadków mo»na j nast pnie zastosowa do przypadków nieznanych

Nowy przypadek outlook temperature humidity windy PLAY? sªonecznie ciepªo wysoka brak nie sªonecznie ciepªo wysoka jest nie pochmurno ciepªo wysoka brak tak deszczowo normalnie wysoka brak tak deszczowo chªodno normalna brak tak deszczowo chªodno normalna jest nie pochmurno chªodno normalna jest tak sªonecznie normalnie wysoka brak nie sªonecznie chªodno normalna brak tak deszczowo normalnie normalna brak tak sªonecznie normalnie normalna jest tak pochmurno normalnie wysoka jest tak pochmurno ciepªo normalna brak tak deszczowo normalnie wysoka jest nie pochmurno chªodno wysoka jest???

Tablica decyzyjna: obserwacje i atrybuty Wiedza mo»e by budowana w oparciu o poprzednio zaobserwowane dane: Ka»da obserwacja (przypadek) opisana za pomoc atrybutów okre±lonego typu (nominalnego albo numerycznego) Tablica Decyzyjna: wiersze = obserwacje (przypadki) kolumny = atrybuty

Reprezentacja wiedzy: atrybuty nominalne pogoda temperatura wilgotno± wiatr GRA? sªonecznie ciepªo wysoka brak nie sªonecznie ciepªo wysoka jest nie pochmurno ciepªo wysoka brak tak deszczowo normalnie wysoka brak tak deszczowo chªodno normalna brak tak deszczowo chªodno normalna jest nie pochmurno chªodno normalna jest tak sªonecznie normalnie wysoka brak nie sªonecznie chªodno normalna brak tak deszczowo normalnie normalna brak tak sªonecznie normalnie normalna jest tak pochmurno normalnie wysoka jest tak pochmurno ciepªo normalna brak tak deszczowo normalnie wysoka jest nie

Reprezentacja wiedzy: atrybuty numeryczne pogoda temperatura wilgotno± wiatr GRA? sªonecznie 85 85 brak nie sªonecznie 80 90 jest nie pochmurno 83 86 brak tak deszczowo 70 96 brak tak deszczowo 68 80 brak tak deszczowo 65 70 jest nie pochmurno 64 65 jest tak sªonecznie 72 95 brak nie sªonecznie 69 70 brak tak deszczowo 75 80 brak tak sªonecznie 75 70 jest tak pochmurno 72 90 jest tak pochmurno 81 75 brak tak deszczowo 71 91 jest nie (w powy»szej tabeli temperatura: Fahrenheit)

Zadanie: nauczy si relacji pomi dzy warto±ciami atrybutów Dwa gªówne podej±cia: 1 z nadzorem 2 bez nadzoru

z nadzorem 1 atrybut decyzyjny: wyszczególniony atrybut w tabeli decyzyjnej (np. GRA?) 2 Zadanie: przewidzie prawidªow (nieznan ) warto± atrybutu decyzyjnego na podstawie (znanych) warto±ci pozostaªych atrybutów 3 Wykorzysta do tego zbiór treningowy - tj taki zbiór obserwacji (przypadków), dla których prawidªowa warto± atrybutu decyzyjnego (oraz wszystkich pozostaªych atrybutów) jest znana z nadzorem nazywane jest: klasykacj, gdy przewidywany atrybut decyzyjny jest nominalny regresj, gdy przewidywany atrybut decyzyjny jest numeryczny

idei uczenia z nadzorem Cel: input: nowy przypadek (obserwacja) z nieznan warto±ci atrybutu decyzyjnego output: prawidªowa warto± atrybutu decyzyjnego System mo»e uczy si tylko na ograniczonej liczbie znanych przypadków (zbiór treningowy) dodstarczonych przez nadzoruj cego W praktyce: warto±ci niektórych atrybutów mog by nieznane, bª dne albo znieksztaªcone zbiór ucz cy mo»e by cz ±ciowo sprzeczny

Klasykacja, przykªad 2 Botanika: rozpoznawanie gatunków ro±lin Rozpatrzmy 3 ró»ne podgatunki kwiatu o ªac. nazwie Iris: Iris-setosa Iris-versicolor Iris-virginica Task: nauczy si rozpoznawa gatunek ro±liny na podstawie rozmiarów li±ci i pªatków (atrybuty): dªugo± listka (cm) szeroko± listka (cm) dªugo± pªatka (cm) szeroko± pªatka (cm)

Rozpoznawanie ro±lin, cont. Zbiór trenuj cy: 150 znanych przypadków (zmierzone cz ±ci ro±lin i znana prawidªowa klasykacja) System uczy si na zbiorze treningowym Nast pnie, ka»dy nowy (nieznany) przypadek jest klasykowany na podstawie pomiarów pªatków i listków Automatycznie wyuczona wiedza jest stosowana do klasykacji nowych przypadków (dla których prawidªowa odpowied¹ nie musi by znana przez nadzoruj cego proces)

Zbiór danych (fragment) S - iris setosa, V - iris versicolor, VG - iris virginica ll lw pl pw? ll lw pl pw? ll lw pl pw? 5.1 3.5 1.4 0.2 S 7.0 3.2 4.7 1.4 V 6.3 3.3 6.0 2.5 VG 4.9 3.0 1.4 0.2 S 6.4 3.2 4.5 1.5 V 5.8 2.7 5.1 1.9 VG 4.7 3.2 1.3 0.2 S 6.9 3.1 4.9 1.5 V 7.1 3.0 5.9 2.1 VG 4.6 3.1 1.5 0.2 S 5.5 2.3 4.0 1.3 V 6.3 2.9 5.6 1.8 VG 5.0 3.6 1.4 0.2 S 6.5 2.8 4.6 1.5 V 6.5 3.0 5.8 2.2 VG 5.4 3.9 1.7 0.4 S 5.7 2.8 4.5 1.3 V 7.6 3.0 6.6 2.1 VG 4.6 3.4 1.4 0.3 S 6.3 3.3 4.7 1.6 V 4.9 2.5 4.5 1.7 VG 5.0 3.4 1.5 0.2 S 4.9 2.4 3.3 1.0 V 7.3 2.9 6.3 1.8 VG 4.4 2.9 1.4 0.2 S 6.6 2.9 4.6 1.3 V 6.7 2.5 5.8 1.8 VG 4.9 3.1 1.5 0.1 S 5.2 2.7 3.9 1.4 V 7.2 3.6 6.1 2.5 VG 5.4 3.7 1.5 0.2 S 5.0 2.0 3.5 1.0 V 6.5 3.2 5.1 2.0 VG 4.8 3.4 1.6 0.2 S 5.9 3.0 4.2 1.5 V 6.4 2.7 5.3 1.9 VG 4.8 3.0 1.4 0.1 S 6.0 2.2 4.0 1.0 V 6.8 3.0 5.5 2.1 VG 4.3 3.0 1.1 0.1 S 6.1 2.9 4.7 1.4 V 5.7 2.5 5.0 2.0 VG 5.8 4.0 1.2 0.2 S 5.6 2.9 3.6 1.3 V 5.8 2.8 5.1 2.4 VG 5.7 4.4 1.5 0.4 S 6.7 3.1 4.4 1.4 V 6.4 3.2 5.3 2.3 VG 5.4 3.9 1.3 0.4 S 5.6 3.0 4.5 1.5 V 6.5 3.0 5.5 1.8 VG 5.1 3.5 1.4 0.3 S 5.8 2.7 4.1 1.0 V 7.7 3.8 6.7 2.2 VG 5.7 3.8 1.7 0.3 S 6.2 2.2 4.5 1.5 V 7.7 2.6 6.9 2.3 VG 5.1 3.8 1.5 0.3 S 5.6 2.5 3.9 1.1 V 6.0 2.2 5.0 1.5 VG 5.4 3.4 1.7 0.2 S 5.9 3.2 4.8 1.8 V 6.9 3.2 5.7 2.3 VG 5.1 3.7 1.5 0.4 S 6.1 2.8 4.0 1.3 V 5.6 2.8 4.9 2.0 VG 5.0 3.0 1.6 0.2 S 6.6 3.0 4.4 1.4 V 7.2 3.2 6.0 1.8 VG 5.0 3.4 1.6 0.4 S 6.8 2.8 4.8 1.4 V 6.2 2.8 4.8 1.8 VG

Wizualizacja zbioru danych: rzut na pªaszczyzn 2-wym. (zbiór jest 4-wymiarowy) np.: szeroko± /dªugo± listka - nie jest to wystarczaj ca informacja

Inna wizualizacja rzutu na pªaszczyzn 2-wym. szeroko± listka/dªugo± pªatka - niesie du»o wiedzy (tzw. dobry dyskriminant)

W jaki sposób system sam uczy si zale»no±ci? Istnieje wiele podej± /modeli, przykªady: metoda k najbli»szych s siadów (knn) Oparte na reguªach decyzyjnych Drzewa decyzyjne Podej±cie Bayesowskie Regresja liniowa Sztuczne Sieci Neuronowe (Perceptron, sieci wielo-wartswowe) SVM (support vector machines) wiele innych...

Inne przykªady problemu klasykacji rozpoznawanie r cznie pisanych cyfr na formularzach Klasykacja zdolno±ci kredytowej klienta banku Identykacja chªamu pocztowego (ang. e-mail spam) Automatyczne rozró»nianie wycieków oleju z tankowców od ciepªych pr dów na podstawie zdj satelitarnych Maszynowa identykacja j zyka w dokumentach tekstowych (np. portugalski czy hiszpa«ski, itp.) Automatyczna klasykacja tematu dokumentu elektronicznego (do jednej z kilku kategorii) Identykacja tzw. chªamu wyszukiwarkowego (ang. Search Engine Spam)

Zadanie Regresji W zadaniu klasykacji system przewidywaª warto± atrybutu decyzyjnego typu nominalnego. Je±li natomiast przewidujemy atrybut numerycznego mówimy o regresji Przykªady zadania regresji: przewidzie warto± (cen ) papieru warto±ciowego na podstawie poprzednich notowa«i innych czynników (ekonomicznych, politycznych, etc.) oszacowa ilo±ciowe zapotrzebowanie na dany towar (np. woda mineralna) w przyszªym tygodniu w supermarkecie na podstawie bie» cej sprzeda»y, pory roku, pogody, etc. przewidzie temperatur powietrza w nast pnym dniu

Przykªad zadania regresji Przewidywana skuteczno± procesora na podstawie jego parametrów technicznych Przykªadowe atrybuty: MYCT cycle time (ns) MMIN main memory min MMAX main memory max CACH cache CHMIN channels min CHMAX channels max

Example: regression MYCT MMIN MMAX CACH CHMIN CHMAX performance 125 256 6000 256 16 128 199 29 8000 32000 32 8 32 253 29 8000 16000 32 8 16 132 26 8000 32000 64 8 32 290 23 16000 32000 64 16 32 381 23 16000 32000 64 16 32 381 23 16000 64000 64 16 32 749 23 32000 64000 128 32 64 1238 400 1000 3000 0 1 2 23 400 512 3500 4 1 6 24 60 2000 8000 65 1 8 70 50 4000 16000 65 1 8 117 167 524 2000 8 4 15 23 143 512 5000 0 7 32 29 143 1000 2000 0 5 16 22 110 5000 5000 142 8 64 124 143 1500 6300 0 5 32 35 143 3100 6200 0 5 20 39 143 2300 6200 0 6 64 40

bez Nadzoru Nie dajemy systemowi przykªadów (nie dysponujemy). System musi automatycznie odkry zale»no±ci pomi dzy danymi. Podstawowe zadania uczenia bez nadzoru: grupowanie (ang. clustering) wykrywanie przypadków nietypowych (ang. outliers) odkrywanie reguª asocjacyjnych

Grupowanie (ang. clustering) Nale»y podzieli wszystkie badane przypadki na grupy obiektów podobnych do siebie (wewn trz ka»dej grupy), przy czym obiekty z ró»nych grup powinny si jak najbardziej ró»ni mi dzy sob. Nie wiemy jaka jest faktyczna kategoria odpowiadaj ca ka»dej grupie - nie mamy przykªadów. Jest to cz sto wst pny etap analizy danych. Popularny algorytm grupowania: K-means

Wykrywanie przypadków nietypowych (ang. outliers) Nale»y automatycznie wykry obiekty, które z jakich± powodów odstaj od pozostaªych elementów. Mamy tu tylko do dyspozycji same warto±ci atrybutów. Obiekty wyra¹nie odstaj ce od ogóªu s w pewnym sensie podejrzane. Zastosowania: automatyczne wykrywanie wªama«do systemów komputerowych wykrywanie nadu»y (ang. fraud) w handlu elektronicznym wykrywanie prania brudnych pieni dzy na podstawie analizy transferów bankowych wykrywanie bª dów w danych i bª dów urz dze«pomiarowych czyszczenie danych

Problemy kontrolne: silna AI/sªaba AI test Turinga aspekty inteligencji zastosowania wspóªczesne AI pozytywne i negatywne aspekty rozwoju AI dla czªowieka do uczenia maszynowego Reprezentacja danych w Uczeniu Maszynowym Schemat Uczenia go (w krokach) Na czym polega podziaª: z nadzorem i bez nadzoru Co to jest klasykacja a co to jest regresja Przykªady zada«klasykacji i regresji (po 3) Przykªady zada«uczenia bez nadzoru Na czym polega zadanie grupowania (ang. clustering)? Przykªady technik uczenia z nadzorem

Dzi kuj za uwag Dzi kuj za uwag.