Wnioskowanie Boolowskie i teoria zbiorów przybli»onych

Podobne dokumenty
Wnioskowanie Boolowskie i teoria zbiorów przybli»onych

Systemy decyzyjne. Wykład 3: Wnioskowanie Boolowskie w obliczeniu Redutów i reguł decyzyjnych. Nguyen Hung Son. Nguyen Hung Son () 1 / 61

Granular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY

Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych.

Wyk lad 8: Leniwe metody klasyfikacji

i, lub, nie Cegieªki buduj ce wspóªczesne procesory. Piotr Fulma«ski 5 kwietnia 2017

Metoda tablic semantycznych. 1 Metoda tablic semantycznych

Matematyka stosowana. Systemy decyzyjne. Hung Son Nguyen

Metody dowodzenia twierdze«

Twierdzenie Wainera. Marek Czarnecki. Warszawa, 3 lipca Wydziaª Filozoi i Socjologii Uniwersytet Warszawski

Maªgorzata Murat. Modele matematyczne.

Zdzisªaw Dzedzej, Katedra Analizy Nieliniowej pok. 611 Kontakt:

Zadania z analizy matematycznej - sem. II Rachunek ró»niczkowy funkcji wielu zmiennych

Systemy decyzyjne Wprowadzenie

Podstawy matematyki dla informatyków. Logika formalna. Skªadnia rachunku zda« Skróty i priorytety. Wykªad 10 (Klasyczny rachunek zda«) 15 grudnia 2011

Algebra Boole'a i logika cyfrowa

Wst p. Elementy systemów decyzyjnych Sprawy organizacyjne. Wprowadzenie Przegl d metod klasykacji

ELEMENTARNA TEORIA LICZB. 1. Podzielno±

istnienie elementu neutralnego dodawania (zera): 0 K a K a + 0 = a, istnienie elementu neutralnego mno»enia (jedynki): 1 K a K a 1 = a,

x y x y x y x + y x y

Logika matematyczna (16) (JiNoI I)

Funkcje wielu zmiennych

Metodydowodzenia twierdzeń

det A := a 11, ( 1) 1+j a 1j det A 1j, a 11 a 12 a 21 a 22 Wn. 1 (Wyznacznik macierzy stopnia 2:). = a 11a 22 a 33 +a 12 a 23 a 31 +a 13 a 21 a 32

Macierze i Wyznaczniki

Ciaªa i wielomiany. 1 Denicja ciaªa. Ciaªa i wielomiany 1

Ukªady równa«liniowych

Relacj binarn okre±lon w zbiorze X nazywamy podzbiór ϱ X X.

Informacje pomocnicze

COLT - Obliczeniowa teoria uczenia si

Logika intuicjonistyczna

1 Przypomnienie wiadomo±ci ze szkoªy ±redniej. Rozwi zywanie prostych równa«i nierówno±ci

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14

Podstawy matematyki dla informatyków

Przeksztaªcenia liniowe

JAO - J zyki, Automaty i Obliczenia - Wykªad 1. JAO - J zyki, Automaty i Obliczenia - Wykªad 1

Maszyny Turinga i problemy nierozstrzygalne. Maszyny Turinga i problemy nierozstrzygalne

Lab. 02: Algorytm Schrage

WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14

gdzie wektory α i tworz baz ortonormaln przestrzeni E n

PRZYPOMNIENIE Ka»d przestrze«wektorow V, o wymiarze dim V = n < nad ciaªem F mo»na jednoznacznie odwzorowa na przestrze«f n n-ek uporz dkowanych:

Wybrane poj cia i twierdzenia z wykªadu z teorii liczb

Programowanie funkcyjne. Wykªad 13

Opis matematyczny ukªadów liniowych

Funkcje wielu zmiennych

Model obiektu w JavaScript

Algebra Boole'a i logika cyfrowa

2. L(a u) = al( u) dla dowolnych u U i a R. Uwaga 1. Warunki 1., 2. mo»na zast pi jednym warunkiem: L(a u + b v) = al( u) + bl( v)

Elementy geometrii w przestrzeni R 3

Preliminaria logiczne

A = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy.

Macierz A: macierz problemów liniowych (IIII); Macierz rozszerzona problemów liniowych (IIII): a 11 a 1m b 1 B = a n1 a nm b n

Macierze i Wyznaczniki

Funkcje wielu zmiennych

Matematyka dyskretna

r = x x2 2 + x2 3.

Zbiory i odwzorowania

Funkcje, wielomiany. Informacje pomocnicze

Wyra»enia logicznie równowa»ne

Ekstremalnie maªe zbiory

Podstawy matematyki dla informatyków. Funkcje. Funkcje caªkowite i cz ±ciowe. Deniowanie funkcji. Wykªad pa¹dziernika 2012

Listy i operacje pytania

Matematyka 1. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Elementy geometrii analitycznej w przestrzeni

Optymalizacja wypukªa: wybrane zagadnienia i zastosowania

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Zastosowanie eliptycznych równa«ró»niczkowych

Pewne algorytmy algebry liniowej Andrzej Strojnowski

Zadania z analizy matematycznej - sem. II Ekstrema funkcji wielu zmiennych, twierdzenia o funkcji odwrotnej i funkcji uwikªanej

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Statystyka matematyczna - ZSTA LMO

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Ekonometria - wykªad 8

Macierze. 1 Podstawowe denicje. 2 Rodzaje macierzy. Denicja

ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15

Przykªady problemów optymalizacji kombinatorycznej

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Zbiory ograniczone i kresy zbiorów

Algorytmy zwiazane z gramatykami bezkontekstowymi

W poprzednim odcinku... Podstawy matematyki dla informatyków. Relacje równowa»no±ci. Zbiór (typ) ilorazowy. Klasy abstrakcji

Spl tanie i inne korelacje kwantowe w ukªadach zªo»onych

Matematyka dyskretna dla informatyków

Indeksowane rodziny zbiorów

Podstawy logiki i teorii zbiorów wiczenia

ALGORYTMIKA Wprowadzenie do algorytmów

X WARMI SKO-MAZURSKIE ZAWODY MATEMATYCZNE 18 maja 2012 (szkoªy ponadgimnazjalne)

Geometria Algebraiczna

Równania ró»niczkowe I rz du (RRIR) Twierdzenie Picarda. Anna D browska. WFTiMS. 23 marca 2010

Wst p do sieci neuronowych, wykªad 14 Zespolone sieci neuronowe

AM II /2019 (gr. 2 i 3) zadania przygotowawcze do I kolokwium

Minimalne drzewa rozpinaj ce

Matematyka dyskretna dla informatyków

Metody numeryczne i statystyka dla in»ynierów

Przekroje Dedekinda 1

Rozwi zanie równania ró»niczkowego metod operatorow (zastosowanie transformaty Laplace'a).

Algebra Boole a. Ćwiczenie Sprawdź, czy algebra zbiorów jestrównież algebrą Boole a. Padaj wszystkie elementy takiej realizacji.

1 Granice funkcji wielu zmiennych.

Liniowe równania ró»niczkowe n tego rz du o staªych wspóªczynnikach

Bash i algorytmy. Elwira Wachowicz. 20 lutego

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Materiaªy do Repetytorium z matematyki

Transkrypt:

Wnioskowanie Boolowskie i teoria zbiorów przybli»onych 4 Zbiory przybli»one Wprowadzenie do teorii zbiorów przybli»onych Zªo»ono± problemu szukania reduktów 5 Wnioskowanie Boolowskie w obliczaniu reduktów i reguª decyzyjnych Metody wnioskowa«boolowskich w szukaniu reduktów Systemy decyzyjne oparte o zbiory przybli»one 6 Metoda drzew decyzyjnych Wprowadzenie Konstrukcja drzew decyzyjnych 7 Problem dyskretyzacji Przypomnienia podstawowych poj Problem dyskretyzacji Dyskretyzacja metod wnioskowania Boolowskiego H.S. Nguyen (MIM UW) SYD 30 listopada 2017 92 / 297

Denition Algebra Boola Jest to struktura algebraiczna B = (B, +,, 0, 1) speªniaj ca nast puj ce aksjomaty - Przemienno± : (a + b) = (b + a) oraz (a b) = (b a) - Rozdzielno± : a (b + c) = (a b) + (a c), oraz a + (b c) = (a + b) (a + c) - Elementy neutralne: a + 0 = a oraz a 1 = a - Istnienie elementu komplementarnego: a + a = 1 and a a = 0 *) Czasem negacja jest dodana do sygnatury algebry Boola. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 93 / 297

Przykªady Algebry Boola 1 Algebra zbiorów: P(X ) = (2 X,,,,, X ); 2 Rachunek zda«({zdania logiczne},,,,, ) 3 Binarna algebra Boola B 2 = ({0, 1}, +,, 0, 1) to jest najmniejsza, ale najwa»niejsza algebra Boola w zastosowaniu. x y x + y x y 0 0 0 0 0 1 1 0 1 0 1 0 1 1 1 1 x x 0 1 1 0 Przykªady zastosowa«: projektowanie ukªadów scalonych; rachunek zda«. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 94 / 297

Wªa±ciwo±ci algebr Boola Š czno± (ang. Associative law): (x + y) + z = x + (y + z) oraz (x y) z = x (y z) Idempotence: x + x = x oraz x x = x(dual) Dziaªania z 0 i 1: x + 1 = 1 oraz x 0 = 0(dual) Pochªanienie (ang. Absorption laws): (y x) + x = x oraz (y + x) x = x(dual) Inwolocja (ang. Involution laws): (x) = x Prawa DeMorgana (ang. DeMorgan's laws): (x + y) = x y oraz (x y) = x + y(dual) Prawa konsensusu (ang. Consensus laws): (x + y) (x + z) (y + z) = (x + y) (x + z) oraz (x y) + (x z) + (y z) = (x b) + (x z) Zasada dualno±ci: Ka»da algebraiczna równo± pozostaje prawdziwa je±li zamieniamy operatory + na, na +, 0 na 1 oraz 1 na 0. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 95 / 297

Funkcje Boolowskie Ka»de odwzorowanie f : {0, 1} n {0, 1} nazywamy (zupeªn ) funkcj Boolowsk. Funkcje Boolowskie formuªy Boolowskie: Staªe, zmienne, operatory, + oraz. Literaªy, mintermy (jednomiany), maxtermy,... Kanoniczna posta dyzjunkcyjna (DNF), np. f = xyz + xyz + xyz + xyz; Kanoniczna posta koniunkcyjna (CNF), np. f = (x + y + z)(x + y) Term t = x i1...x im x j1...x jk nazywamy implikantem funkcji f je±li a {0,1} n t(a) = 1 f (a) = 1 Implikant pierwszy: jest to implikant, który przestaje nim by po usuni ciu dowolnego literaªu. Kanoniczna posta Blake'a: ka»d funkcj Boolowsk mo»na przedstawi jako sum wszystkich jej imlikantów pierwszych: f = t 1 + t 2 +... + t k H.S. Nguyen (MIM UW) SYD 30 listopada 2017 96 / 297

Przykªad Wiele formuª reprezentuje t sam funkcj ; φ 1 = xyz + xyz + xyz + xyz φ 2 = (x + y + z)(x + y + z)(x + y + z)(x + y + z) φ 3 = xy + xz + yz xy z jest implikantem xy jest implikantem pierwszym x y z f 0 0 0 0 1 0 0 0 0 1 0 0 1 1 0 1 0 0 1 0 1 0 1 1 0 1 1 1 1 1 1 1 H.S. Nguyen (MIM UW) SYD 30 listopada 2017 97 / 297

Funkcje monotoniczne Niech oznacza relacj cz ±ciowego porz dku w {0, 1} n Funkcja f jest monotoniczna (niemalej ca) wtw, gdy dla ka»dych x, y {0, 1} n je±li x y to f (x) f (y) monotoniczne funkcje Boolowskie mo»na zapisa bez u»ycia negacji. term f = x i1 x i2... x ik monotonicznej f je±li nazywamy implikantem pierwszym funkcji f (x) f (x) dla ka»dego wektora x (jest implikantem) ka»da funkcja wi ksza od f nie jest implikantem Np. funkcja f (x 1, x 2, x 3 ) = (x 1 + x 2 )(x 2 + x3) posiada 2 implikanty pierwsze: f 1 = x 2 i f 2 = x 1 x 3 H.S. Nguyen (MIM UW) SYD 30 listopada 2017 98 / 297

Wnioskowanie Boolowskie 1 Modelowanie: Kodowanie problemu za pomoc ukªadu równa«boolowskich; 2 Redukcja: Sprowadzenie ukªadu równa«do pojedynczego równania postaci f = 0 lub f = 1 3 Konstrukcja: Znalezienie wszystkich implikantów pierwszych funkcji f (konstrukcja kanonicznej postaci Blake'a); 4 Dedukcja: Zastosowanie pewnej sekwencji wnioskowa«transformuj cych implikanty pierwsze do rozwi za«problemu. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 99 / 297

Boolean Reasoning Example Problem: A, B, C, D are considering going to a party. Social constrains: If A goes than B won't go and C will; If B and D go, then either A or C (but not both) will go If C goes and B does not, then D will go but A will not. Problem modeling: A B C A(B + C) = 0... BD(AC + AC) = 0... BC(A + D) = 0 After reduction: f = A(B + C) + BD(AC + AC) + BC(A + D) = 0 Blake Canonical form: f = BCD + BCD + A = 0 Facts: BD C C B D A 0 Reasoning: (theorem proving) e.g., show that nobody can go alone. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 100 / 297

Metoda BR w Sztucznej Inteligencji Problem SAT: czy równanie f (x 1,..., x n ) = 1 posiada rozwi zanie? C B A E D E C A D B SAT odgrywa wa»n rol w teorii zªo»ono±ci (twierdzenie Cooka, dowodzenie NP-zupeªno±ci...) Ka»dy SAT-solver mo»e by u»ywany do rozwi zywania problemu planowania. Blocks world problem: Po redukcji formuªa boolowska nadal zawiera O(tk 2 ) zmiennych i O(tk 3 ) klauzuli (k, t - liczby bloków i kroków). Np. Dla k = 15, t = 14, mamy 3016 zmiennych i 50457 klausuli H.S. Nguyen (MIM UW) SYD 30 listopada 2017 101 / 297

Szukanie reduktów: szkic metody 1 Konstrukcja funkcji odró»nialno±ci: Zmienne boolowskie: atrybuty a 1,..., a k ; Klauzula: φ u,v = {a A : a(u) a(v)} Funkcja rozró»nialno±ci: F S (a 1,..., a k ) = x,y U:dec(x) dec(y) φ x,y (a 1,..., a k ) 2 przeksztaªcenie funkcji rozró»nialno±ci do postaci DNF 3 ka»dy implikant pierwszy odpowiada jednemu reduktowi; H.S. Nguyen (MIM UW) SYD 30 listopada 2017 102 / 297

Przykªad tablicy decyzyjnej Hurt. Jako± obsªugi Jako± towaru Obok autostrady? Centrum? decyzja ID a 1 a 2 a 3 a 4 dec 1 dobra dobra nie nie strata 2 dobra dobra nie tak strata 3 bdb dobra nie nie zysk 4 slaba super nie nie zysk 5 slaba niska tak nie zysk 6 slaba niska tak tak strata 7 bdb niska tak tak zysk 8 dobra super nie nie strata 9 dobra niska tak nie zysk 10 slaba super tak nie zysk 11 dobra super tak tak zysk 12 bdb super nie tak zysk 13 bdb dobra tak nie? 14 slaba super nie tak? H.S. Nguyen (MIM UW) SYD 30 listopada 2017 103 / 297

Macierz i funkcja odró»nialno±ci M 1 2 6 8 3 a 1 a 1, a 4 a 1, a 2, a 3, a 4 a 1, a 2 4 a 1, a 2 a 1, a 2, a 4 a 2, a 3, a 4 a 1 5 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 4 a 1, a 2, a 3 7 a 1, a 2, a 3, a 4 a 1, a 2, a 3 a 1 a 1, a 2, a 3, a 4 9 a 2, a 3 a 2, a 3, a 4 a 1, a 4 a 2, a 3 10 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 2, a 4 a 1, a 3 11 a 2, a 3, a 4 a 2, a 3 a 1, a 2 a 3, a 4 12 a 1, a 2, a 4 a 1, a 2 a 1, a 2, a 3 a 1, a 4 f = (α 1 )(α 1 α 4 )(α 1 α 2 )(α 1 α 2 α 3 α 4 )(α 1 α 2 α 4 ) (α 2 α 3 α 4 )(α 1 α 2 α 3 )(α 4 )(α 2 α 3 )(α 2 α 4 ) (α 1 α 3 )(α 3 α 4 )(α 1 α 2 α 4 ) H.S. Nguyen (MIM UW) SYD 30 listopada 2017 104 / 297

Szukanie reduktów f = (α 1 )(α 1 α 4 )(α 1 α 2 )(α 1 α 2 α 3 α 4 )(α 1 α 2 α 4 ) (α 2 α 3 α 4 )(α 1 α 2 α 3 )(α 4 )(α 2 α 3 )(α 2 α 4 ) (α 1 α 3 )(α 3 α 4 )(α 1 α 2 α 4 ) usuwanie alternatyw reguª pochªaniania (t.j. p (p q) p): f = (α 1 )(α 4 )(α 2 α 3 ) sprowadzanie funkcji f z postaci CNF (koniunkcja alternatyw) do postaci DNF (alternatywa koniunkcji) f = α 1 α 4 α 2 α 1 α 4 α 3 Ka»dy skªadnik jest reduktem! Zatem mamy 2 redukty: R 1 = {A 1, A 2, A 4 } i R 2 = {A 1, A 3, A 4 } H.S. Nguyen (MIM UW) SYD 30 listopada 2017 105 / 297

Heurystyka Johnsona: algorytm zachªanny Atrybut jest wa»niejszy je±li cz ±ciej wyst puje w klauzulach; Selekcja: W ka»dym kroku wybierzmy atrybut, który najcz ±ciej wyst puje w funkcji rozró»nialno±ci; Usuwanie: Usuwamy z tej funkcji te klauzule, które zawieraj wybrany atrybut; Powtarzamy Selekcja i Usuwanie dopóty, póki funkcja rozró»nialno±ci zawiera jeszcze jak ± klazul. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 106 / 297

Heurystyka zachªanna Heurystyka Johnsona 1 Znale¹ atrybut, który wyst puje najcz ±ciej w macierzy rozró»nialno±ci; 2 Usuwn wszystkie pola zawieraj ce wybrany atrybut; 3 Powtarzamy kroki 1 i 2 dopóki wszystkie pola macierzy s puste. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 107 / 297

Przykªad dziaªania M 1 2 6 8 3 a 1 a 1, a 4 a 1, a 2, a 3, a 4 a 1, a 2 4 a 1, a 2 a 1, a 2, a 4 a 2, a 3, a 4 a 1 5 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 4 a 1, a 2, a 3 7 a 1, a 2, a 3, a 4 a 1, a 2, a 3 a 1 a 1, a 2, a 3, a 4 9 a 2, a 3 a 2, a 3, a 4 a 1, a 4 a 2, a 3 10 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 2, a 4 a 1, a 3 11 a 2, a 3, a 4 a 2, a 3 a 1, a 2 a 3, a 4 12 a 1, a 2, a 4 a 1, a 2 a 1, a 2, a 3 a 1, a 4 W macierzy nierozróznialno±ci z poprzedniego przykªadu a 1 - wyst puje 23 razy a 2 - wyst puje 23 razy a 3 - wyst puje 18 razy a 4 - wyst puje 16 razy Je±li wybieramy a 1, to po usuni ciu pól zawieraj cych a 1 zostaªo 9 niepustych pól macierzy nierozró»nialno±ci. W±ród nich: a 2 - wyst puje 7 razy a 3 - wyst puje 7 razy a 4 - wyst puje 6 razy Je±li wybieramy tym razem a 2 to zostaªy 2 niepuste pola i w±ród nich a 4 jest zdecydowanym faworytem. Mo»emy dosta w ten sposób redukt: R 1 = {a 1, a 2, a 4 }. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 108 / 297

Jak dobra jest heurystyka Johnsona? Niech X = {(u, v) U 2 : dec(u) dec(v)}; Niech S ai = {(u, v) X : a i (u) a i (v)}; Niech C A b dzie minimalnym reduktem, lecz C = {a 1,..., a k } b dzie reduktem znalezionym przez heurystyk Johnsona; Zaªó»my,»e heurystyka Johnsona musi pªaci 1zª za ka»dym razem, gdy dodaªa a i do C. Rozªó»my ten koszt tym elementom, które zostaªy po raz pierwszy pokryte przez zbiór S ai Niech c x = koszt ponoszony przez x. Je±li x jest pokryty po raz pierwszy przez a i, to c x = 1 S ai (S a1... S ai 1 ) H.S. Nguyen (MIM UW) SYD 30 listopada 2017 109 / 297

Jak dobra jest heurystyka Johnsona? Heurystyka Johnsona ponosi ª czny koszt = C. Mamy C = x X c x c x a C x S a Gdyby±my pokazali,»e dla dowolnego altrybutu a A x S a c x H( S a ) gdzie H(n) = n i=1 1 i, wówczas mo»emy oszacowa dalej: C c x C H(max{ S a : a A }) a C x S a C H( X ) C ln( X + 1) H.S. Nguyen (MIM UW) SYD 30 listopada 2017 110 / 297

Lemat: Dla dowolnego altrybutu a A Dowód: x S a c x H( S a ) Niech u i = S a (S a1... S ai 1 ), mamy: u 0 = S a... u i 1 u i... u k = 0; gdzie k jest najmniejszym indeksem t.,»e S a = S a1... S ak Zatem x S a c x = k 1 (u i 1 u i ) S ai (S a1... S ai 1 ) i=0 k 1 (u i 1 u i ) u i 1 i=0 k (H(u i 1 ) H(u i )) = H( S a ) i=0 H.S. Nguyen (MIM UW) SYD 30 listopada 2017 111 / 297

Inne heurystyki do szukania implikantów pierwszych ILP (Integer Linear Program) Symulowane wy»arzanie (simulated annealing) Algorytmy genetyczne SAT solver??? H.S. Nguyen (MIM UW) SYD 30 listopada 2017 112 / 297

ILP Dana jest funkcja f : {0, 1} n {0, 1} zapisana w postaci CNF za pomoc zmiennych x 1,..., x n 1 Utwórz nowe zmienne {y 1,..., y 2n } odpowiadaj ce literaªom x 1, x 1,..., x n, x n ; 2 Dla ka»dej zmiennej x i, utwórzmy nierówno± y 2i 1 + y 2i 1 3 Zamie«ka»d klausul ω i = (l i1... l ini ) na nierówno± y i1 +... + y ini 1; 4 Utwórzmy ukªad nierówno±ci z poprzednich punktów: Ay b 5 Zagadnienie programowania liniowego liczb caªkowitych (ILP) jest deniowane jako problem szukania min n y i przy ograniczeniu: Ay b. i=1 H.S. Nguyen (MIM UW) SYD 30 listopada 2017 113 / 297

J zyk deskryptorów (ang. description language) Dla danego zbioru atrybutów A deniujemy j zyk deskryptorów jako trójk gdzie D jest zbiorem deskryptorów L(A) = (D, {,, }, F) D = {(a = v) : a A and v Val a }; {,, } jest zbiorem standardowych operatorów logicznych; F jest zbiorem formuª logicznych zbudowanych na deskryptorach z D. Dla ka»dego zbioru atrybutów B A oznaczamy: D B = {(a = v) : a B and v Val a }, czyli zbiór deskryptorów obci tych do B. F B zbiór formuª zbudowanych na D B. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 114 / 297

Semantyka w systemach informacyjnych Semantyka: Niech S = (U, A) b dzie tablic informacyjn. Ka»da formuªa φ F, jest (semantycznie) skojarzona ze zbiorem [[φ]] S zawieraj cym obiekty speªniaj ce φ. Formalnie mo»emy indukcyjnie deniowa semantyk jak nast puj co: [[(a = v)]] S = {x U : a(x) = v} (1) [[φ 1 φ 2 ]] S = [[φ 1 ]] S [[φ 2 ]] S (2) [[φ 1 φ 2 ]] S = [[φ 1 ]] S [[φ 2 ]] S (3) [[ φ]] S = U \ [[φ]] S (4) Ka»da formuªa φ mo»e by charakteryzowana przez: length(φ) = liczba deskryptorów w φ; support(φ) = [[φ]] S = liczba obiektów speªniaj cych formuª H.S. Nguyen (MIM UW) SYD 30 listopada 2017 115 / 297

Reguªy decyzyjne Denition Denicja reguª decyzyjnych Niech S = {U, A {dec}} b dzie tablic decyzyjn. Reguª decyzyjn dla S nazywamy formuªy postaci: φ δ gdzie φ F A i δ F dec. Formuª φ nazywamy poprzednikiem (lub zaªo»eniem) reguªy r, a δ nazywamy nast pnikiem (lub tez ) reguªy r. Oznaczamy poprzednik i nast pnik reguªy r przez prev(r) oraz cons(r). Denition Reguªy atomowa: S to reguªy postaci: r (a i1 = v 1 )... (a im = v m ) (dec = k) (5) H.S. Nguyen (MIM UW) SYD 30 listopada 2017 116 / 297

Reguªy decyzyjne (c.d.) Ka»da reguªa decyzyjna r postaci (5) mo»e by charakteryzowana nast puj cymi cechami: length(r) = liczba deskryptorów wyst puj cych w zaªo»eniu reguªy r [r] = no±nik reguªy r, czyli zbiór obiektów z U speªniaj cych zaªo»enie reguªy r support(r) = liczba obiektów z U speªniaj cych zaªo»enie reguªyr: support(r) = card([r]) confidence(r) = wiarygodno± reguªy r: confidence(r) = [r] DEC k [r] Mówimy,»e reguªa r jest niesprzeczna z A je±li confidence(r) = 1 H.S. Nguyen (MIM UW) SYD 30 listopada 2017 117 / 297

Minimalne reguªy Denition Minimalne niesprzeczne reguªy: Niech S = (U, A {dec}) b dzie dan tablic decyzyjn. Niesprzeczn reguª (a i1 = v 1 )... (a im = v m ) (dec = k) nazywamy minimaln niesprzeczn reguª decyzyjn je±li usuni cie któregokolwiek z deskryptorów spowoduje,»e reguªa przestaje by niesprzezcna z S. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 118 / 297

Ogólne metody Klasykatory reguªowe dzialaj w trzech fazach: 1 Faza treningu: Generuje pewien zbiór reguª RULES(A) z danej tablicy decyzyjnej A. 2 Faza selekcji reguª: Szuka w RULES(A) tych reguª, które s wspierane przez obiekt x. Oznaczamy zbiór tych reguª przez MatchRules(A, x). 3 Faza klasykacji: wyznacza klas decyzyjn dla x za pomoc reguª z MatchRules(A, x) wedªug nast puj cego schematu: 1 Je±li MatchRules(A, x) jest pusty: odpowied¹ dla x jest NIEWIEM, tzn. nie mamy podstaw, aby klasykowa obiekt x do którejkolwiek z klas; 2 Je±li MatchRules(A, x) zawiera tylko obiekty z k-tej klasy: wówczas dec(x) = k; 3 Je±li MatchRules(A, x) zawiera reguªy dla ró»nych klas decyzyjnych: wówczas decyzja dla x okre±limy za pomoc pewnego, ustalonego schematu gªosowania mi dzy reguªami z MatchRules(A, x). H.S. Nguyen (MIM UW) SYD 30 listopada 2017 119 / 297

Metoda Oparta o Wnioskowanie Boolowskie Ka»da reguªa powstaje poprzez skracanie opisu jakiego± obiektu. Redukty lokalne Te same heurystyki dla reduktów decyzyjnych. H.S. Nguyen (MIM UW) SYD 30 listopada 2017 120 / 297

Przykªad tablicy decyzyjnej Hurt. Jako± obsªugi Jako± towaru Obok autostrady? Centrum? decyzja ID a 1 a 2 a 3 a 4 dec 1 dobra dobra nie nie strata 2 dobra dobra nie tak strata 3 bdb dobra nie nie zysk 4 slaba super nie nie zysk 5 slaba niska tak nie zysk 6 slaba niska tak tak strata 7 bdb niska tak tak zysk 8 dobra super nie nie strata 9 dobra niska tak nie zysk 10 slaba super tak nie zysk 11 dobra super tak tak zysk 12 bdb super nie tak zysk 13 bdb dobra tak nie? 14 slaba super nie tak? H.S. Nguyen (MIM UW) SYD 30 listopada 2017 121 / 297

Macierz i funkcja lokalnych odró»nialno±ci M 1 2 6 8 3 a 1 a 1, a 4 a 1, a 2, a 3, a 4 a 1, a 2 4 a 1, a 2 a 1, a 2, a 4 a 2, a 3, a 4 a 1 5 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 4 a 1, a 2, a 3 7 a 1, a 2, a 3, a 4 a 1, a 2, a 3 a 1 a 1, a 2, a 3, a 4 9 a 2, a 3 a 2, a 3, a 4 a 1, a 4 a 2, a 3 10 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 2, a 4 a 1, a 3 11 a 2, a 3, a 4 a 2, a 3 a 1, a 2 a 3, a 4 12 a 1, a 2, a 4 a 1, a 2 a 1, a 2, a 3 a 1, a 4 f u3 = (α 1 )(α 1 α 4 )(α 1 α 2 α 3 α 4 )(α 1 α 2 ) = α 1 Reguªy: (a 1 = bdb) = dec = zysk H.S. Nguyen (MIM UW) SYD 30 listopada 2017 122 / 297

Macierz i funkcja lokalnych odró»nialno±ci M 1 2 6 8 3 a 1 a 1, a 4 a 1, a 2, a 3, a 4 a 1, a 2 4 a 1, a 2 a 1, a 2, a 4 a 2, a 3, a 4 a 1 5 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 4 a 1, a 2, a 3 7 a 1, a 2, a 3, a 4 a 1, a 2, a 3 a 1 a 1, a 2, a 3, a 4 9 a 2, a 3 a 2, a 3, a 4 a 1, a 4 a 2, a 3 10 a 1, a 2, a 3 a 1, a 2, a 3, a 4 a 2, a 4 a 1, a 3 11 a 2, a 3, a 4 a 2, a 3 a 1, a 2 a 3, a 4 12 a 1, a 2, a 4 a 1, a 2 a 1, a 2, a 3 a 1, a 4 f u8 = (α 1 α 2 )(α 1 )(α 1 α 2 α 3 )(α 1 α 2 α 3 α 4 )(α 2 α 3 ) (α 1 α 3 )(α 3 α 4 )(α 1 α 4 ) = α 1 (α 2 α 3 )(α 3 α 4 ) = α 1 α 3 α 1 α 2 α 4 Reguªy: (a 1 = dobra) (a 3 = nie) = dec = strata (a 1 = dobra) (a 2 = super) (a 4 = nie) = dec = strata H.S. Nguyen (MIM UW) SYD 30 listopada 2017 123 / 297