Systemy decyzyjne Wprowadzenie

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 1 / 34 Systemy decyzyjne Wprowadzenie Hung Son Nguyen Institute of Mathematics, Warsaw University son@mimuw.edu.pl 2007

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 2 / 34 Spis tre±ci 1 Problem klasyfikacji i teoria uczenia si Wprowadzenie do teorii uczenia si Nie ma nic za darmo czyli Non Free Lunch Theorem 2 Elementy systemów decyzyjnych Systemy informacyjne i tablice decyzyjne Aproksymacja poj 3 Sprawy organizacyjne

Problem uczenia si Kto si uczy? Ograniczymy si do programów komputerowych zwanych algorytmami ucz cymi si. Czego si uczy? poj : np. odró»nienie krzeseª od innych mebli. nieznanych urz dze«np. u»ywanie VCR nieznanych ±rodowisk np. nowe miasto procesów np. pieczenie ciasta rodzin podobnych wzorców np. rozp. mowy, twarzy lub pisma. funkcji: (np. funkcje boolowskie) Wymagania skuteczno±, efektywno±,... Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 4 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 5 / 34 Model uczenia Ka»dy ucze«powinien mie zdolno± uogólnienia, t.j. zdolno± rozpoznawania ró»nych typów tego samego poj cia. Np. je±li uczymy si funkcji, to wa»ne jest aby algorytm uczenia si nie ograniczaª si do jednej konkretnej funkcji. damy aby modele uczenia dziaªaªy skutecznie na klasach funkcji.

ródªo informacji: Ucze«mo»e pozyska informacje o dziedzinie poprzez: 1 Przykªady: Ucze«dostaje pozytywne i/lub negatywne przykªady. Przykªady mog by zdobywane w sposób: 1 losowy: wedªug pewnego znanego lub nieznanego rozkªadu; 2 arbitralny; 3 zªo±liwy: (np. przez kontrolera, który chciaªby pozna najgorsze zachowanie algorytmu uczenia si ); 4 specjalny przez»yczliwego nauczyciela: (np., aby uªatwia proces uczenia si ) 2 Zapytania: ucze«zdobywa informacje o dziedzinie przez zadawanie zapyta«do nauczyciela. 3 Eksperymentowanie: aktywne uczenie si. Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 6 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 7 / 34 Teoria uczenia si Podej±cie indukcyjne: wnioskowanie na podstawie sko«czonego zbioru obserwacji;

Teoria uczenia si Podej±cie indukcyjne: wnioskowanie na podstawie sko«czonego zbioru obserwacji; Np. Pokaza,»e dla ka»dego n N 1 2 + 2 2 +... + n 2 = n(n + 1)(2n + 1) 6 Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 7 / 34

Teoria uczenia si Podej±cie indukcyjne: wnioskowanie na podstawie sko«czonego zbioru obserwacji; Np. Pokaza,»e dla ka»dego n N 1 2 + 2 2 +... + n 2 = n(n + 1)(2n + 1) 6 Jakie prawa rz dz w podej±ciu uczenia indukcyjnego? Szukamy teorii dotycz cej: Prawdopodobie«stwa udanego uczenia si ; Liczby przykªadów treningowych; Zªo»ono±ci przestrzeni hipotez; Skuteczno±ci aproksymacji; Sposób reprezentacji danych treningowych; Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 7 / 34

Kryteria oceny jako±ci: Sk d wiemy, czy ucze«si nauczyª lub jak dobrze si nauczyª? Miary o-line (batch) vs. on-line (interactive). Jako± opisu vs. jako± predykcji Skuteczno± : obliczona na podstawie bª du klasykacji, dokªadno±ci opisu... Efektywno± uczenia: wymagana jest wielomianowa zªo»ono± obliczeniowa. Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 8 / 34

Przykªad Zaªó»my,»e chcemy nauczy si poj cia czªowieka o ±redniej budowie ciaªa. Dane czyli osoby s reprezentowane przez punkty (wzrost(cm), waga(kg)) i s etykietowane przez + dla pozytywnych przykªadów i dla negatywnych. Dodatkowa wiedza: szukane poj cie mo»na wyrazi za pomoc PROSTOK TA Na przykªad dany jest etykietowany zbiór: ((84, 184), +), ((70, 170), +), ((75, 163), ), ((80, 180), +), ((81, 195), ), ((63, 191), ), ((77, 187), ), ((68, 168), +) Znajd¹ etykiet ((79, 183,?) Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 9 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 10 / 34 Problem uczenia si prostok ta Mo»emy deniowa problem jak nast puj co: Cel: Znale¹ w R 2 prostok t R o bokach równolegªych do osi.

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 10 / 34 Problem uczenia si prostok ta Mo»emy deniowa problem jak nast puj co: Cel: Znale¹ w R 2 prostok t R o bokach równolegªych do osi. Wej±cie: Zbiór zawieraj cy przykªady w postaci punktów ((x, y), +/ ). Te punkty zostaªy wygenerowane losowo.

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 10 / 34 Problem uczenia si prostok ta Mo»emy deniowa problem jak nast puj co: Cel: Znale¹ w R 2 prostok t R o bokach równolegªych do osi. Wej±cie: Zbiór zawieraj cy przykªady w postaci punktów ((x, y), +/ ). Te punkty zostaªy wygenerowane losowo. Wyj±cie: hipotetyczny prostok t R b d cy dobr aproksymacj R.

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 10 / 34 Problem uczenia si prostok ta Mo»emy deniowa problem jak nast puj co: Cel: Znale¹ w R 2 prostok t R o bokach równolegªych do osi. Wej±cie: Zbiór zawieraj cy przykªady w postaci punktów ((x, y), +/ ). Te punkty zostaªy wygenerowane losowo. Wyj±cie: hipotetyczny prostok t R b d cy dobr aproksymacj R. Dodatkowe wymagania: Algorytm powinien by efektywny (czasowo) u»ywaj c do uczenia najmniejszej liczby przykªadów.

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 11 / 34 Ogólny model uczenia si Dane s zbiór wszystkich obiektów X (sko«czony lub nie); poj cie c C (funkcja celu); sko«czona próbka D obiektów x 1,..., x m X wraz z warto±ci funkcji c na tych obiektach; przestrze«hipotez H;

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 11 / 34 Ogólny model uczenia si Dane s zbiór wszystkich obiektów X (sko«czony lub nie); poj cie c C (funkcja celu); sko«czona próbka D obiektów x 1,..., x m X wraz z warto±ci funkcji c na tych obiektach; przestrze«hipotez H; Szukane hipoteza h H b d ca dobr aproksymacj poj cia c.

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 11 / 34 Ogólny model uczenia si Dane s zbiór wszystkich obiektów X (sko«czony lub nie); poj cie c C (funkcja celu); sko«czona próbka D obiektów x 1,..., x m X wraz z warto±ci funkcji c na tych obiektach; przestrze«hipotez H; Szukane hipoteza h H b d ca dobr aproksymacj poj cia c. Wymagane dobra jako± aproksymacji szybki czas dziaªania.

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 12 / 34 Inne przykªady Uczenie póªosi (lub dyskretyzacji): X = R; C = H = {[λ, ) : α R} Uczenie hiperpªaszczyzny: X = R n ; H = {f w0,w 1,...,w n : R n {0, 1} } gdzie f w0,...,w n (x 1,..., x n ) = sgn(w 0 + w 1 x 1 +... + w n x n ). Uczenie jednomianów Boolowskich: X = {0, 1} n ; c : {0, 1} n {0, 1}; H = M n = zbiór jednomianów Boolowskich o n zmiennych.

Bª d hipotezy Niech X zbiór wszystkich obiektów. Ω = (X, µ) przestrze«probabilistyczna okre±lona na X. Bª d hipotezy h H wzgl dem poj cia c (funkcji docelowej): er Ω (h, c) = er c Ω(h) = µ{x X h(x) c(x)} Z prawdopodobie«stwem (1 ε) mo»emy oszacowa er c Ω : erω c erd c erd c s (1 erc D ) ε 2 D Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 13 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 14 / 34 Szacowanie bª du Pytanie: Dane jest poj cie c, hipoteza h i zbiór przykladów D. Jak oszacowa rzeczywisty bª d hipotezy h na podstawie jej bª du na zbiorze D? Odp.: Je±li przykªady z D s wybrane zgodnie z miar prawdopodobie«stwa µ niezale»nie od tej hipotezy i niezale»nie od siebie nawzajem oraz D 30, to najbardziej prawdopodobn warto±ci er µ (c, h) jest erd c, z prawdopodobie«stwem (1 ε) erω c erd c erd c s (1 erc D ) ε 2 D

O co chodzi w NFL? Znale¹ optimum nieznanej funkcji f : S W (f F), gdzie S, W s sko«czonymi zbiorami. Dziaªanie algorytmu przeszukiwania A dla funkcji f jest identykowany z wektorem: V A (f, t) = (s 1, f(s 1 )), (s 2, f(s 2 )),..., (s t, f(s t )) Ocena algorytmu: M : {V A (f, t) A, f, t} R; Np. M(V A (f, t)) = min{i f(s i ) = f max } Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 16 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 17 / 34 Warunek NFL: Dla dowolnej funkcji M, i dla dowolnych algorytmów A, A M(V A (f, S )) f F M(V A (f, S )) = f F F jest zamkni ta wzg. permutacji: dla dowolnej funkcji f F i dowolnej permutacji σ P erm(s) mamy σf F Twierdzenie o NFL zachodzi równowa»no± NF L F jest zamkni ta wzg. permutacji Prawdopodobie«stwo wylosowania niepustej klasy funkcji zamkni tej wzg. permutacji wynosi: 1 ( S + W 2 S ) 1 2 S W 1

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 18 / 34 The No Free Lunch Theorem for learning Algorytm L dobrze si uczy poj cia c je±li erω c jest maªy. Niech P(X) = {c : X {0, 1}}. Czy mo»na stwierdzi wiedzie,»e L 1 uczy si wszystkich poj z P(X) lepiej od L 2? No Free Lunch theorem (Wolpert, Schaer) w wersji problemów uczenia si gªosi,»e: aden algorytm nie mo»e by najlepszy w uczeniu wszystkich poj. Ka»dy algorytm jest najlepszy dla takiej samej liczby poj Ale interesuje nas tylko pewna klasa problemów czyli klasa poj C P(X) Wniosek: Nale»y znale¹ odp. algorytm do ka»dego problemu.

Teoria zbiorów przybli»onych Teoria zbiorów przybli»onych jest wprowadzona w latach 80-tych przez prof. Zdzisªawa Pawlaka. Gªównym celem jest dostarczanie narz dzi dla problemu aproksymacji poj (zbiorów). Zastosowania w systemach decyzyjnych: Redukcja danych, selekcja wa»nych atrybutów Generowanie reguª decyzyjnych Odkrywanie wzorców z danych: szablony, reguªy asocjacyjne Odkrywanie zale»no±ci w danych Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 21 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 22 / 34 Systemy informacyjne Przykªad Patient Age Sex Chol. Resting ECG Heart rate Sick p 1 53 M 203 hyp 155 yes p 2 60 M 185 hyp 155 yes p 3 40 M 199 norm 178 no p 4 46 F 243 norm 144 no p 5 62 F 294 norm 162 no p 6 43 M 177 hyp 120 yes p 7 76 F 197 abnorm 116 no p 8 62 M 267 norm 99 yes p 9 57 M 274 norm 88 yes p 10 72 M 200 abnorm 100 no

Tablica decyzyjna Tablica decyzyjna Jest to struktura S = (U, A {dec}), gdzie U jest zbiorem obiektów: A jest zbiorem atrybutów postaci U = {u 1,..., u n } a j : U V j dec jest specjalnym atrybutem zwanym decyzj dec : U {1,..., d} Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 23 / 34

Tablica decyzyjna Tablica decyzyjna powstaje ze zwykªych tablic danych poprzez sprecyzowania: Atrybutów: cechy ªatwo dost pne, np. pomiary, parametry, dane osobowe,... Decyzji, t.j. cecha ukryta za pewn wiedz (poj ciem) nieznan : Decyzja jest znana tylko dla obiektów z (treningowej) tablicy decyzyjnej Jest podana przez eksperta (np. lekarza) lub na podstawie pó¹niejszych obserwacji (np. ocena gieªdy). chcemy j okre±li dla dowolnych obiektów na podstawie atrybutów Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 24 / 34

Przykªad Przedstawiona tablica decyzyjna zawiera: 8 obiektów b d cych opisami pacjentów 3 atrybuty: Headache, Muscle pain, Temp. Decyzj okre±laj c pacjenta jako przezi bionego lub nie Example U Headache Muscle pain Temp. Flu p1 Yes Yes Normal No p2 Yes Yes High Yes p3 Yes Yes Very-high Yes p4 No Yes Normal No p5 No No High No p6 No Yes Very-high Yes p7 No Yes High Yes p8 No No Very-high No Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 25 / 34

Relacja rozró»nialno±ci Dane s obiekty x, y U i zbiór atrybutów B A, mówimy,»e x, y s rozró»nialne przez B wtw, gdy istnieje a B taki,»e a(x) a(y) x, y s nieodró»nialne przez B, je±li one s identyczne na B, tzn. a(x) = a(y) dla ka»dego a B [x] B = zbiór obiektów nieodró»nialnych z x przez B Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 26 / 34

Relacja rozró»nialno±ci Dla ka»dych obiektów x, y: albo [x] B = [y] B albo [x]b [y]b = Relacja x IND B y := x, y s nieodró»nialne przez B jest relacj równowa»no±ci. Ka»dy zbiór atrybutów B A wyznacza podziaª zbioru obiektów na klasy nieodró»nialno±ci Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 27 / 34

Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 28 / 34 Przykªad Dla B = {Headache, M usclepain} obiekty p1, p2, p3 s nierozró»nialne. s 3 klasy nieodró»nialno±ci relacji IND B : [p1] B = {p1, p2, p3} [p4]b = {p4, p6, p7} [p5]b = {p5, p8} Example U Headache Muscle pain Temp. Flu p1 Yes Yes Normal No p2 Yes Yes High Yes p3 Yes Yes Very-high Yes p4 No Yes Normal No p5 No No High No p6 No Yes Very-high Yes p7 No Yes High Yes p8 No No Very-high No

Problemy Aproksymacji Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 30 / 34

Problemy Aproksymacji Aproksymacja funkcji Sztuczna sie neuronowa; Twierdzenie Kolmogorowa; Modele sieci; Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 30 / 34

Problemy Aproksymacji Aproksymacja poj Uczenie indukcyjne; COLT; Metody uczenia si ; Wnioskowanie aproksymacyjne Wnioskowanie rozmyte; Wnioskowanie Boolowskie, teoria zbiorów przybli»onych; Inne: wnioskowanie Bayesowskie, sieci przekona«,... Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 31 / 34

Omówione tematy Klasykatory i metody oceny klasykatorów Metody rozumowania Boolowskiego Teoria zbiorów przybli»onych Reguªy decyzyjne, drzewo decyzyjne i lasy decyzyjne Klasykatory Bayesowskie Sieci neuronowe COLT: Obliczeniowa Teoria Uczenia si Metody przygotowywania danych SVM: Maszyna wektorów podpieraj cych Metody wzmacniania klasykatorów (Boosting) Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 33 / 34

Zaliczenie Obecno± : Projekt: Test: Hung Son Nguyen (UW) Systemy decyzyjne Wprowadzenie 2007 34 / 34