WPROWADZENIE DO MASZYNOWEGO UCZENIA SIĘ

Podobne dokumenty
Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

Wprowadzenie do teorii systemów ekspertowych

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

SZTUCZNA INTELIGENCJA

Systemy uczące się wykład 2

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Zagadnienia optymalizacji i aproksymacji. Sieci neuronowe.

Widzenie komputerowe (computer vision)

mgr inż. Magdalena Deckert Poznań, r. Uczenie się klasyfikatorów przy zmieniającej się definicji klas.

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

2

PRZEWODNIK PO PRZEDMIOCIE

Systemy uczące się wykład 1

Sztuczna inteligencja

Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej. Adam Meissner. Elementy uczenia maszynowego

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.

Modelowanie i obliczenia techniczne. dr inż. Paweł Pełczyński

Transformacja wiedzy w budowie i eksploatacji maszyn

Pattern Classification

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

Sztuczna inteligencja

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

Prof. Stanisław Jankowski

Programowanie komputerów

Inteligentne Multimedialne Systemy Uczące

Wprowadzenie do uczenia maszynowego

Wybrane zagadnienia uczenia maszynowego. Zastosowania Informatyki w Informatyce W2 Krzysztof Krawiec

Ontologie, czyli o inteligentnych danych

Systemy ekspertowe. Krzysztof Patan

FIZYKA II STOPNIA. TABELA ODNIESIENIA EFEKTÓW KIERUNKOWYCH DO EFEKTÓW PRK POZIOM 7 Symbol Efekty kształcenia dla kierunku studiów FIZYKA.

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Wstęp do Sztucznej Inteligencji

Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2012/2013

Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD III: Problemy agenta

PRZEDMIOTOWY SYSTEM OCENIANIA - MATEMATYKA

prawda symbol WIEDZA DANE komunikat fałsz liczba INFORMACJA (nie tyko w informatyce) kod znak wiadomość ENTROPIA forma przekaz

SZTUCZNA INTELIGENCJA

WYKŁAD 11 Uczenie maszynowe drzewa decyzyjne

Systemy eksperowe. Agnieszka Nowak Brzezińska Wykład I

Machine Learning Systemy uczące się

Instytut Automatyki i Inżynierii Informatycznej Politechniki Poznańskiej. Adam Meissner. Elementy uczenia maszynowego

Podstawy Sztucznej Inteligencji (PSZT)

Wymagania edukacyjne na poszczególne stopnie z fizyki dla klasy VII:

Zastosowania metod odkrywania wiedzy do diagnostyki maszyn i procesów

Metodologia badań naukowych

SZTUCZNA INTELIGENCJA

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Inżynierii Produkcji Dr Małgorzata Lucińska

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Wstęp do kognitywistyki. Wykład 3: Logiczny neuron. Rachunek sieci neuronowych

Algorytm. Krótka historia algorytmów

Wymagania edukacyjne na poszczególne stopnie z fizyki dla klasy I:

IX KONGRES ZARZĄDZANIA OŚWIATĄ OSKKO - ŁÓDŹ,

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

Systemy agentowe. Uwagi organizacyjne i wprowadzenie. Jędrzej Potoniec

WIEDZA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Analiza danych i data mining.

Narzędzia AI. Jakub Wróblewski Pokój SZTUCZNA INTELIGENCJA (ARTIFICIAL INTELLIGENCE)

Statystyka w pracy badawczej nauczyciela

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

PRZEDMIOTOWY SYSTEM OCENIANIA GEOGRAFIA 2017/2018

Przedmiotowe Zasady Oceniania matematyka, geometria w ćwiczeniach, funkcje w zastosowaniach Sposoby sprawdzania osiągnięć edukacyjnych

Festiwal Myśli Abstrakcyjnej, Warszawa, Czy SZTUCZNA INTELIGENCJA potrzebuje FILOZOFII?

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

ALGORYTM RANDOM FOREST

AUTOMATYKA INFORMATYKA

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Indukowane Reguły Decyzyjne I. Wykład 3

Model procesu dydaktycznego

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Systemy ekspertowe i sztuczna inteligencja. dr Agnieszka Nowak Brzezioska

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Kraków, 14 marca 2013 r.

Wybrane wymagania dla informatyki w gimnazjum i liceum z podstawy programowej

Metody badań w naukach ekonomicznych

Jacek Skorupski pok. 251 tel konsultacje: poniedziałek , sobota zjazdowa

Systemy uczące się Lab 4

Wykład I. Wprowadzenie do baz danych

SYSTEMY UCZĄCE SIĘ WYKŁAD 1. INFORMACJE WSTĘPNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

KARTA KURSU. Kod Punktacja ECTS* 1

RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk

Uczenie ze wzmocnieniem aplikacje

Metodologia badań psychologicznych

Zastosowanie metod eksploracji danych (data mining) do sterowania i diagnostyki procesów w przemyśle spożywczym

Uniwersytet Śląski. Wydział Informatyki i Nauki o Materiałach PROGRAM KSZTAŁCENIA. Studia III stopnia (doktoranckie) kierunek Informatyka

Roman Mocek Zabrze Opracowanie zbiorcze ze źródeł Scholaris i CKE

Informatyka. II stopień. Ogólnoakademicki. Stacjonarne/Niestacjonarne. Kierunkowy efekt kształcenia - opis WIEDZA

Sztuczna inteligencja - wprowadzenie

Sztuczna inteligencja i uczenie maszynowe w robotyce i systemach autonomicznych: AI/ML w robotyce, robotyka w AI/ML

Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.

Optymalizacja ciągła

Poza sztuczną CTO 15 maj, Watson Warsaw Summit 2017

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Efekty kształcenia. Tabela efektów kształcenia

Okręgowa Komisja Egzaminacyjna w Krakowie 1

Transkrypt:

WPROWADZENIE DO MASZYNOWEGO UCZENIA SIĘ 1. Definicja procesu uczenia się 2. Przykłady problemów rozwiązywanych przez systemy uczące się 3. Motywacje dla budowy systemów uczących się 4. Taksonomia metod maszynowego uczenia się 5. Rodzaje nabywanej wiedzy 6. Przegląd zagadnień i kierunków maszynowego uczenia się 7. Rys historyczny 8. Przykłady zastosowań praktycznych. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 1

Co to jest maszynowe uczenie się? Maszynowe uczenie się (ang. Machine Learning) jest analizą procesów uczenia się oraz tworzeniem systemów, które doskonalą swoje działanie na podstawie doświadczeń z przeszłości. Wykład dotyczy dwóch grup metod : symbolicznego/indukcyjnego uczenia się na przykładach (ang. symbolic/inductive learning) sztucznych sieci neuronowych (ang. artificial neural networks) Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 2

Co to jest maszynowe uczenie się? Maszynowe uczenie się (ang. Machine Learning) część sztucznej inteligencji (AI) lub inteligencji obliczeniowej (Computational Intelligence - CI). Systemy uczące się systemy adaptujące się, zmieniające swoje wewnętrzne parametry tak, aby rozpoznać charakter danych. Inspiracje: informatyka, statystyka, rozpoznawanie struktur (ang. pattern recognition), psychologia i kognitywistyka. ML umożliwia pozyskiwanie wiedzy na podstawie analizy zachowań ekspertów lub danych doświadczalnych, tj. przykładów uczących. Często dane są w postaci przykładów. Eksperci opisują sytuacje podając przykłady. Wiedza otrzymana metodami ML może być lepsza niż wiedza bezpośrednio wydedukowana przez ludzi. Czasami jest jedyną drogą budowy modeli, jeśli wiedza nie jest znana lub nie można jej pozyskać. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 3

Dlaczego Maszynowe Uczenie się? Aktualne systemy informacyjne nie posiadają zdolności samokorekcji prostych błędów Rozwój systemów doradczych w wielu dziedzinach - nabywanie wiedzy dla systemów eksperckich czy systemów z bazą wiedzy Poszukiwanie informacji w "powodzi" danych - systemy odkryć wiedzy w bazach danych Wzrost zastosowań techniki analizy danych, teorii decyzji, sztucznej inteligencji w wielu komercyjnych dziedzinach oraz sferze badawczej Budowanie inteligentnych systemów wyszukiwania i udostępniania informacji (także Internet!) Rozwój komputerowych systemów przetwarzania i rozpoznawania obrazów Prace nad rozumieniem ludzkiej mowy i przetwarzaniem języka naturalnego Zastosowania w robotyce i sterowaniu Inteligentne systemy kompresji danych Tworzenie inteligentnych systemów edukacyjnych Postęp w budowie systemów współpracy człowiek - maszyna Rozwój badań nad ludzkim poznawaniem i uczeniem się Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 4

Definicja Procesu Uczenia się (Definicja #1) "Uczenie się oznacza zmiany w systemie, które mają charakter adaptacyjny w tym sensie, że pozwalają systemowi wykonać za następnym razem takie same zadanie lub zadania podobne bardziej efektywnie" - Herbert Simon (1983) (Definicja #2) "System uczący się wykorzystuje zewnętrzne dane empiryczne w celu tworzenia i aktualizacji podstaw dla udoskonalonego działania na podobnych danych w przyszłości oraz wyrażania tych podstaw w zrozumiałej i symbolicznej postaci" - Donald Miche (1991) Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 5

(Definicja #3) "Uczenie sie to konstruowanie i zmiana reprezentacji doświadczanych faktów. W ocenie konstruowanych reprezentacji bierze się pod uwagę: 1. wiarygodność - określa stopień w jakim reprezentacja odpowiada rzeczywistości, 2. efektywność - charakteryzuje przydatność repreze-ntacji do osiągania danego celu. 3. poziom abstrakcji - odpowiada zakresowi szczegółowości i precyzji pojęć używanych w reprezentacji; określa on tzw. moc opisową reprezentacji. Reprezentacja jest rozumiana jako np. opisy symboliczne, algorytmy, modele symulacyjne, plany obrazy." - Ryszard Michalski (1986) Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 6

Wspólne pojęcia w kolejnych definicjach: Wejście: dane empiryczne Zmiany i poprawa działania (miara oceny) Postulat zdobywania wiedzy, reprezentowania jej wewnątrz systemu i stosowania do wykonywania zadania (nacisk na zrozumiałość reprezentacji) Wiedza (ang. knowledge) - definiuje się w kontekście danej metody ; reprezentacja wiedzy. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 7

Przykłady problemów rozwiązywanych przez systemy uczące się Uczenie się rozpoznawania mowy Uczenie się kierowania pojazdem (np. ALVINN) Uczenie się klasyfikacji obiektów astronomicznych (NASA Sky Survey) Uczenie się rozgrywania pewnych gier (np. backgammon) Uczenie się rozpoznawania chorób na podstawie symptomów Uczenie się rozpoznawanie pisma na podstawie przykładów Uczenie się klasyfikowania tekstów do grup tematycznych Uczenie się aproksymacji nieznanej funkcji na podstawie próbek Uczenie się odnajdowania drogi w nieznanym środowisku Automatyczne odkrywanie zależności funkcyjnych w danych Przewidywanie trendów w danych finansowych Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 8

Dobrze zdefiniowane problemy uczenia się, Uczenie = doskonalenie działania dla pewnych zadań na podstawie doświadczenia doskonalenie dla pewnej klasy zadań T, z uwagi na miare oceny P, oparte na doświadczeniu E Proste przykłady Qubic (4x4x4, Tic Tac Toe) T: Gra Kółka przeciwko Krzyżykowi P: % wygranych gier E: Mozliwość gry przeciwko dobremu graczowi przez ponad 100 godzin Rozpoznawanie adresu napisanego na kopercie T: Rozpoznanie adresu odbiorcy napisanego na kopercie P: % sortowanych listów poprawnie przypisanych do miasta odbiorcy E: 100 tysięcy ręcznie napisanych adresów ze znanym adresem przeznaczenia Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 9

Kierowanie pojazdu przez robota T: Prowadzenie przez robota pojazdu po autostradzie P: Prędkość/[(1+liczba_wypadków)1000] E: Duża liczba treningowych zdjęć z kamery, pomiarów z sensorów oraz równoczesnych rejestracji "komend" sterowania Diagnostyka medyczna T: Rozpoznanie pewnej choroby u pacjentów na podstawie symptomów P: % poprawnie zdiagnozowanych pacjentów E: Reprezentatywna liczba pacjentów opisanych za pomocą symptomów, dla których znana jest poprawna decyzja diagnostyczna Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 10

Ocena zainteresowania transportem lotniczym T: Predykcja liczby pasażerów linii lotniczych (dla następnych lat z rocznym wyprzedzeniem) P: Poprawność przewidywania liczby pasażerów E: Trzy podstawowe wskaźniki przewozowe za okres ostatnich 10 lat. Rozpoznawanie mówcy na podstawie jego głosu T: Niezależna od tekstu identyfikacja mówcy na podstawie zapisu jego głosu P: % poprawnych rozpoznań mówców E: Duża liczba przebiegów czasowych z rejestracji 20 mówców wypowiadających po jednym zdaniu Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 11

Motywacje dla budowy systemów uczących się Zadania eksploracji i analizy danych, gdzie duże rozmiary zbiorów danych uniemożliwiają ich analizę w sposób nieautomatyczny (np. ekonomiczne lub medyczne bazy danych) Środowiska gdzie system musi się dynamicznie dostosowywać do zmieniejących się warunków (np. systemy sterowania) Problemy które są złożone, trudne do opisu i czesto nie posiadają wystarczających modeli teoretycznych albo ich uzyskanie jest bardzo kosztowne lub mało wiarygodne. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 12

Realizacja procesu uczenia się Dobrze zdefiniowane zadanie. Wybrane miary oceny (jedno, dobrze zdefiniowane kryterium). Co jest doświadczeniem (przykładami)? Czego należy się nauczyć? Jak reprezentować przykłady uczące? Jak reprezentować hipotezy/wiedzę? Jaki algorytm uczenia należy wybrać? Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 13

Różnice między uczeniem się ludzkim a maszynowym Pytanie: Czy uczenie się maszyn przypomina uczenie się ludzi? Odpowiedź: NIE Ludzkie uczenie się: Uczenie się człowieka jest to wprowadzanie zmian do sposobu pracy jego umysłu, Uczenie się jest procesem pozyskiwania nowej informacji, w którym główna czynnością jest przyswajanie wiedzy, Uczeniem można nazwać zdobywanie wprawy na drodze ponawiania prób z małym lub żadnym udziałem świadości. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 14

Oczekiwania i ograniczenia wobec uczących się Oczekuje się, że systemy powinny uczyć się korzystając z wiedzy fragmentarycznej, doskonalić się w trakcie pracy, gromadzić doświadczenia, tworzyć nowe pojęcia, indukcyjnie wyciągać wnioski. Oczekiwane zadania systemów: - formułowanie nowych pojęć, - wykrywanie nieznanych prawidłowości w danych, - tworzenie reguł decyzyjnych, - przyswajanie nowych pojęć i struktur drogę uogólnienia i analogii, - modyfikowanie, uogólnianie i precyzowanie danych, - zdobywanie wiedzy poprzez kontakt z otoczeniem, - generowanie wiedzy zrozumiałej dla człowieka, - wiele innych. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 15

Ograniczenia systemów uczących się Zależność i niezależność systemu od otoczenia, Wiarygodność i poprawność generowanych wniosków: "wiedza zdobyta w wyniku obserwacji faktów ma charakter tylko domyslny" (Popper) rozumowanie przez indukcję nie zapewnia zachowania "prawdy" (ang. truth preserving), - tzn. nie można w pełni udowodnić prawdziwości wiedzy tworzonej drogą uogólnienia, choć można dowieść jej błedności. problemy wynikające z: - wprowadzenia danych niekompletnych, - wprowadzenia danych częściowo sprzecznych, - niezdefiniowania ograniczeń dziedzinowych. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 16

Postulaty: wszelka wiedza wygenerowana przez maszynę powinna byc oceniana i/lub kontrolowana przez człowieka (lub wg. kryteriów przez niego zdefiniowanych), Systemy powinny być zdolne do udzielana wyjasnień, tworzona wiedza powinna być wyrażana w formie odpowiadającej opisom przyjętym przez człowieka i jego modelom myślowym (postulat zrozumiałości). Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 17

Klasyfikacja metod maszynowego uczenia się W ogólności system zmieniać się może w dwojaki sposób: system nabywa "nową wiedzę" z zewnętrznych źródeł, system modyfikuje się samodzielnie poprzez intensywne wykorzystywanie posiadanej już wiedzy w sposób bardziej efektywny. Stąd typowe metody maszynowego uczenia się dzieli się na: indukcyjne uczenie się (ang. inductive learning), tzw. zdobywanie wprawy (ang. skill acquisition) lub przyspieszone uczenie się (ang. speedup learning) Wnioskowanie Indukcyjne opiera się na zbiorze faktów (obserwacji) oraz ewentualnym zbiorze hipotez a priori dotyczących tych faktów, a w wyniku daję najprawdopodobniejsze uogólnienie wyjaśniające te fakty. Dedukcja - wyprowadzanie wniosków, które są logiczną konsekwencją posiadanej informacji. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 18

Główne pradygmaty badawcze obejmują: modelowanie sieci neuronowych i techniki teoriodecyzyjne, symboliczne przyswajanie pojęć, uczenie się w wąskiej dziedzinie z intensywnym wykorzystaniem wiedzy. Podejścia różnią się pod względem: posiadanej przez system wiedzy a priori sposobu reprezentowania i modyfikowania wiedzy w systemie Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 19

Systemy sztucznych sieci neuronowych : system składa się z sieci wzajemnie powiązanych prostych elementów realizujących pewną funkcje przetwarzania, system uczy się przyrostowo poprzez modyfikacje połączeń między elementami system rozpoczyna uczenie się od niewielkiej wiedzy początkowej (związanej z wyborem elementów oraz struktury połączeń w sieci), charakterystyczne jest wykorzystanie parametrów zmieniających się w trakcie uczenia w sposób ciągły Numeryczny charakter: sygnałów wejściowych i przetwarzanych, metod i algorytmów uczenia się Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 20

Symboliczne przyswajanie pojęć (ang. symbolic concept acquisition) systemy uczą się budując symboliczną reprezentację danego zbioru pojęć, drogą analizy przykładów i kontrprzykładów tych pojęć Tworzone reprezentacje mają postać np.: - wyrażeń logicznych, - reguł produkcji - drzew decyzyjnych - sieci semantycznych charakterystyczna cecha - jakościowa/symboliczna postać przetwarzanej informacji Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 21

Uczenie się w wąskiej dziedzinie z intensywnym wykorzystaniem wiedzy (ang. Knowledge intensive domain-specific learning) system zawiera liczne (zdefiniowane z góry) pojęcia, struktury wiedzy, ograniczenia dziedzinowe, reguły heurystyczne i wbudowane na stałe transformacje odnoszące się do konkretnej dziedziny, Nie wszystkie niezbędne atrybuty i pojęcia są znane - system ma wygenerować nowe pojęcia. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 22

Strategię uczenia się System uczący się transformuje informacje dostarczone przez nauczyciela na nową postać, którą zapamietuje. Sposób tej transformacji określa typ użytej strategii: Podstawowe strategie uczenie się na pamięć, uczenie się przez instrukcję, uczenie się przez dedukcję, uczenie się przez analogię, uczenie się przez indukcję. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 23

Podział metod maszynowego uczenia się Różne kryteria podziału. Podstawowy podział ze względu na sposób reprezentacji wiedzy pozyskiwanej przez system uczący się. Wyróżnia się: metody zorientowane na jawną reprezentację wiedzy (ang. knowledge oriented methods lub symbolic methods), metody, które nie tworzą jawnej reprezentacji wiedzy, tzw. metody nieprzezroczyste (ang. black-box methods lub sub-symbolic methods). Podział ze względu na rodzaj informacji dostarczony w zbiorze przykładów: uczenie nadzorowane (ang. supervised learning), uczenie nienadzorowane (ang. unsupervised learning). Rozszerzenie podziału uwzględniające źródło przykładów: uczenie się na podstawie zapytań (system otrzymuje odpowiedzi na pytania zadane nauczycielowi ), uczenie się przez eksperymentowanie (system gromadzi doświadczenie eksperymentując ze swoim środowiskiem), uczenie się ze wzmocnieniem (system wykonuje pewne akcje i otrzymuje ocenę swojego działania). Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 24

Uczenie się przez indukcję (ang. learning by induction/ inductive learning) Prowadzi od oceny dostarczonych przykładów do ich uogólnienia (generalizacji) na drodze rozumowania indukcyjnego. Obejmuje dwie grupy metod: - uczenie się nadzorowane - uczenie się nienadzorowane Uczenie nadzorowane (ang. supervised learning) - system otrzymuje zbiór przykładów uczących (learning examples) w postaci (xi, yi) i ma na celu nauczyć się funkcji f, takiej że f(xi)= yi dla każdego i. Określona liczba wartości yi - klasy (classes) lub klasy decyzyjne (decision classes). Dla pojedyńczych klas (odnoszących się do pewnych pojęć) - definiuje się przykłady pozytywne (odnoszące się do tej klasy) i negatywne (odnoszące się do innych klas). Uczenie się pojęć (ang. concept learning) - f jest definicją/uogólnieniem pojęcia, które wyjaśnia przykłady pozytywne i wyklucza negatywne. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 25

Reprezentacja przykładów uczących Przykłady zbiór obiektów, których dotyczy nabywana wiedza; mogą to być przedmioty, osoby, obserwacje, Atrybuty to pewne cechy charakteryzujące właściwości rozważanych obiektów. Zbiór przykładów (obiektów) U jest opisany za pomocą skończonego, niepustego zbioru atrybutów A = {a 1,a 2,,a m } i reprezentowany jest w postaci tablicy informacyjnej V a dziedzina atrybutu a A; a(x) V a wartość atrybutu. IT = (U,A). Atrybuty: nominalne, których dziedziny są zbiorami nieuporządkowanymi (tzn. dla dwóch wartości możliwe jest określenie wyłącznie relacji = lub ), porządkowe, których dziedziny są zbiorami uporządkowanymi (tzn. możliwe jest określenie relacji porządku liniowego < na zbiorze wartości), liczbowe, których dziedziny są zdefiniowane na liczbowych skalach pomiarowych (przedziałowych lub ilorazowych). Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 26

Reprezentacja w postaci tablic informacyjnych: Tabela 1. Zbiór przykładów opisujących samochody za pomocą zbioru 4 atrybutów {Typ samochodu, Cena, Prędkość, Zużycie paliwa}; Pierwsza kolumna zawiera numer identyfikujący samochód. lp. Typ Cena Prędkość Zużycie 1 mały akceptowalna przeciętny małe 2 duży akceptowalna szybki średnie 3 kompakt drogi szybki średnie 4 duży drogi szybki wysokie 5 mały drogi wolny średnie 6 kompakt akceptowalna przeciętny średnie 7 kompakt drogi wolny średnie 8 duży drogi przeciętny wysokie 9 duży akceptowalna przeciętny średnie Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 27

Tabela 2 Zbiór przykładów uczących opisujących grupę osób, ubiegających się o kredyt; Pierwsza kolumna zawiera numer identyfikujący osobę. lp. Wiek Sytuacja zawodowa Staż pracy Dochody Cel kredytu Ocena klienta 1 młody uczy się 0 300 K ryzyko 2 średni pracuje 2 1500 S ryzyko 3 młody pracuje 4 2600 M dobra 4 starszy pracuje 16 2300 D dobra 5 średni pracuje 10 1900 M przeciętne 6 młody uczy się 0 700 W ryzyko 7 średni bezrobotny 0 200 D ryzyko 8 młody pracuje 3 1400 K przeciętne 9 średni pracuje 11 1400 D dobra 10 starszy emeryt 0 1100 D przeciętne 11 młody uczy się 0 1500 W przeciętne 12 średni pracuje 17 2500 S przeciętne 13 młody bezrobotny 0 300 D ryzyko 14 starszy pracuje 21 5000 S dobra 15 młody pracuje 5 3700 M dobra Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 28

Uczenie się pojęć Pojęcie (ang. concept) ogólne określenie oznaczające zbiór obiektów posiadających wspólne właściwości, które odróżniają je od innych pojęć. Pojęcie to jedna z postaci wiedzy o świecie, używana do opisywania systemów interpretowania obserwacji oraz abstrakcyjnych idei. Przykłady: Pojęcia krzesła, psa, liter alfabetu, Pojęcia pozwalają na klasyfikowanie pewnych obiektów na zbiory (kategorie / klasy). Pojedyncze pojęcie wyznacza podział zbioru obiektów na przykłady pozytywne oraz przykłady negatywne (kontrprzykłady) tego pojęcia. Pojęcia wielokrotne klasyfikacja Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 29

Uczenie się pojęć, cd. Przykład ilustracyjny opisu samochodów: Rozważane pojęcie - samochód, którym chciałbym jeździ Do przykładów tego pojęcia zaliczmy samochody {2,3,6,9}. Kontrprzykładami, czyli przykładami negatywnymi tego pojęcia, są samochody {1,4,5,7,8}. Wspólne właściwości definiujące pojęcie: (zużycie=średni) ((cena=akceptowalna) (prędkość=szybki)) Definicja znana nauczycielowi niedostępna jawnie systemowi uczącemu się. Cel: system w trakcie procesu uczenia się ma odkryć / znaleźć nieznaną mu definicję pojęcia na podstawie dostarczonych przykładów problemów kontrprzykładów tego pojęcia. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 30

Klasyfikacja przykładów Przykład może być zaliczony do więcej niż dwóch kategorii. Def: klasyfikacji obiektów K = {K j : j = 1,...,r}, gdzie dla każdych i j K i K j = oraz U r K j= 1 j = U. K j jest klasą (klasą decyzyjną lub kategorią). Określenie pojęć / klas decyzyjnych - podane przez nauczyciela lub za pomocą dodatkowego atrybutu (wartości są etykietami klas). Tablica decyzyjna DT jest tablicą informacyjną (U,A {d}), gdzie d A jest wyróżnionym atrybutem decyzyjnym. Elementy zbioru A nazywane są atrybutami warunkowymi. Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 31

Klasyfikacja Dwa znaczenia terminu klasyfikacja: 1. Proces podziału zbioru obiektów (przykładów) na klasy (kategorie,pojęcia), gdzie klasa oznacza zbiór obiektów charakteryzujących się pewnymi wspólnymi własnościami. 2. Zakładając, że struktura klas jest wstępnie znana, celem jest poszukiwanie funkcji/reguły która pozwala klasyfikować nowe obiekty, tj. przypisać je do istniejących kategorii. Inne terminy: 1. taksonomia 2. analiza dyskryminacyjna Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 32

Uczenie nadzorowane Przykład uczący - x A,c(x). Wartości c(x) zdefiniowane na skali liczbowej zadanie aproksymacji funkcji. Wartości c(x) etykiety pojęć lub klas uczenie się pojęć lub klasyfikacji. Uczenie się pojęć Na zbiorze przykładów U określony jest zbiór pojęć C. Pojęcie (docelowe / ang. target concept, target function): funkcja c : U {0,1} Ogólniej jest to funkcja c : U C, C >2 Hipoteza funkcja h przypisująca przykłady do pojęcia lub klasy (h: U C). H przestrzeń hipotez; Zawiera wszystkie dopuszczalne hipotezy jakie może skonstruować system uczący. System uczący się wybiera hipotezę h H, która jest możliwie najlepszym przybliżeniem pojęcia docelowego. Dla każdego x U, h(x) = c(x). Uwaga: dokładne nauczenie się każdego pojęcia docelowego c C jest możliwe tylko wtedy, gdy C H Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 33

Terminologia związana z indukcyjnym uczeniem się Dziedzina X Przykład uczący x X Atrybut a i Klasa, pojęcie docelowe Ci X c: X {0,1} Ci = {x X : c(x)=i} Przykład etykietowany dla uczenia z nadzorem <x,c(x)> Przykład pozytywny dla pojęcia c - taki x X że c(x)=1 Przykład negatywny dla pojęcia c - taki x X że c(x)=0 Hipoteza h - funkcja f : X {0,1} Przestrzeń hipotez Η Zbiór uczący Błąd stosowania hipotezy h dla zbioru treningowego D Indukcyjne ukierunkowanie (inductive bias) Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 34

Typy nabywanej wiedzy reguły decyzyjne drzewa decyzyjne parametry w równaniach algebraicznych gramatyki formalne wyrażenia logiczne grafy i sieci semantyczne programy Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 35

Rys historyczny Okres pionierski (lata 1950-65) wczesne prace nad modelami neuronowymi strategie ewolucyjne "Wieki ciemne" (1962-75) pozyskiwanie wiedzy (Feigenbaum) krytyczna analiza systemów perceptronowych (Minski,Papert 1969) Renesans (1976-1987) uczenie się struktur symbolicznych sukcesy praktyczne nowych systemów META-DENDRAL (Buchanan 1978) AQ (Michalski 1980) ID3 (Quinlan 1983) rozwój systemów wykorzystujących i przekształcających wiedzę powrót zainteresowania sieciami neuronowymi (Rumelhart 1986, Hopfield,...) pojawienie się wielu rożnorodnych metod uczenia się rozwój konferencji naukowych i czasopism Stan obecny (1988-...) intesywne badania nad wieloma metodami eksperymentalne badania porównawcze (Statlog) rozwój metod nie-symbolicznych (sieci neuronowe, algorytmy ewolucyjne) obliczeniowa teoria uczenią się (Valiant) systemy zintegrowane i wielostrategiczne nacisk na zastosowania praktyczne odkrywanie wiedzy w bazach danych Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 36

Instytut Informatyki Politechnika Poznanska 2009 Wyklad 1 Strona 37