Granular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY PB
2 PB 1 Projekt z wyznaczania reduktów zbioru Liczba osób realizuj cych projekt: 1-2 osoby 1. Wczytanie danych w formatach arf, tab 2. Wybór atrybutów, które maj zosta uwzgl dnione podczas wyszukania reduktów 3. Wykonanie poszczegóªnych kroków algorytmu z wypisaniem wyników po±rednich 1.1 Nazewnictwo (x 1, x 2,...) - zbiór obiektów, reprezentuj cych dane x i = {x 1 i, x2 i,.., xp i }, gdzie xj i oznacza atrybut o indeksie j obiektu x i. U przestrze«wszystkich obiektów X - podzbiór zbioru wszystkich obiektów U x i - obiekt nale» cy do podzbioru wszystkich obiektów U A - zbiór wszystkich atrybutów, cech, wªa±ciwo±ci a i - atrybut nale» cy do zbioru atrybutów A V ai - zbiór wszystkich warto±ci atrybutu a i (nazywany dziedzin a i ) V (a i ) - zbiór wszystkich warto±ci atrybutu a i (nazywany dziedzin a i ) B - niepusty podzbiór A (B A) LOW (X B ) - dolna aproksymacja X wzgl dem B X B - dolna aproksymacja X wzgl dem B UP P (X B ) - górna aproksymacja X wzgl dem B X B - górna aproksymacja X wzgl dem B AS B - standardowa przestrze«aproksymacyjna AS #,$ - sparametryzowana przestrze«aproksymacyjna R ai (X) - przybli»ono± ze wzdgledu na {a i } Rough aj (a i ) - ±rednia przybli»ono± atrybutu a i wzgl dem atrybutu {a j } MR(a i ) - minimalna przybli»ono± atrybutu a i M M R - minimalna warto± MR wszystkich atrybutów IN D(B) - relacja nierozró»nialno±ci [x i ] IND(B) - klasa równowa»no±ci obiektu x i w relacji IND(B), nazywana tak»e zbiorem elementarnym w B (C 1, C 2,..., C K ) - klasy, skupienia w danym pogrupowaniu danych Card(X) - liczebno± zbioru X X - liczebno± zbioru X P (U) - zbiór pot gowy zbioru U 2 Algorytm - Expansion Algorithm Przykªad, dla podanego systemu informacyjnego: a b c d E
METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY 3 x 1 1 0 2 1 1 x 2 1 0 2 0 1 x 3 1 2 0 0 2 x 4 1 2 2 1 0 x 5 2 1 0 0 2 x 6 2 1 1 0 2 x 7 2 1 2 1 1 Tablica 2: System informacyjny x 1 x 2 x 1 x 2 x 3 x 4 x 5 x 6 x 7 d x 3 b,c,d b,c x 4 b b,d c,d x 5 a,b,c,d a,b,c a,b,d a,b,c,d x 6 a,b,c,d a,b,c,d a,b,c a,b,c,d c x 7 a,b a,b,d a,b,c,d a,b c,d c,d Tablica 3: System informacyjny - macierz rozró»nialno±ci W tabeli decyzyjnej, dwa atrybuty x oraz y nazywane s silnie równowa»nymi je»eli wyst puj zawsze razem w maceirzy rozró»nialnosci. Ka»dy element mo»na rozpatrywa w postaci alternatywy, to znaczy, je»eli element macierzy rozró»nialno±ci ma posta a, b, c wtedy mo»na go zapisa jako a b c. Funkcja rozró»nialno±ci ma posta koniunkcji wyra»e«w postaci alternatywy macierzy rozró»nialno±ci. EXPANSION LAW 1. odszuka atrybut X wyst puj cy najcz ±ciej (przynajmniej raz) 2. wykona operacje AND z X i z wszystkimi pozostaªymi OR z macerzy nierozró»- nialnosci, które nie zawieraj atrybutu X 3. zastosowa koniunkcj AND z elementami OR wszystkich elementów, w których je»eli element zawiera X, wyeliminowa X. 4. poª czy elementy otrzymane z punktu (2) i (3) Przykªad: niech b dzie zadana macierz rozró»nialnosci: {{a, b, e}, {a, b}, {a, c}, {d}}. Relacja rozró»nialno±ci zadana jest w postaci: {a b e} {a b} {a c} d W podanej relacji, element a wyst puje cz sto. Stosujemy operacj AND z a i d. Otrzymujemy {a} {d} = {a, d} - nazwijmy jako komponent I. Po zastosowaniu operacji AND dla b c, b i c otrzymujemy: (b e) (b) (c) = {b, c} {b, c, e} - jako komponent II. W postaci poª czonej komponnetu I oraz II mamy: {a, d}, {b, c}, {b, c, e}
4 PB Algorithm 1: Algorytm Ekspansji Data: System Informacyjny Result: Redukt systemu informacyjnego Zdeniowa funkcj rozró»nialno±ci f = f 1 f 2... f k Step 1 Zastosowa prawo absorbcji do wyeliemonowania wszystkich wyra»e«w postaci alternatywy, które stanowi nadzbiór pozostaªych wyra»e«w postaci alternatywy. Step 2: Zastapi zbiór silnie równowa»nych atrybutów zmienn zast pcz. Step 3: Wybra atrybut, wyst puj cy najcz ±ciej w zbiorach w postaci koniunkcji (przynajmniej dwa razy), i zastosowa prawo ekspansji. Step 4: Powórzy kroki od 1 do 3, do chwili gdy nie mo»na zastsowa prawa ekspansji dla ka»dego komponentu. Step 5: Zastapi wszystkie silnie równowa»ne klasy ich odpowiadaj cymi atrybutami. Step 6: Wyznaczy redukt dla ka»dego komponentu. Step 7: Wypisa zintegrowany redukt.
METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY 5 Algorithm 2: Algorytm Ekspansji - przykªad Data: System Informacyjny Result: Redukt systemu informacyjnego - przykªad Relacja rozró»nialno±ci: F = {a b c f} {b d} {a d e f} {a b c d} {b d e f} {c d} Zastosowanie prawa absorbcji: {b d} {a b c d} {b d} {a b c d} = {b d} Zastosowanie prawa absorbcji: {b d} {b d e f} {b d} {b d e f} = {b d} Po powy»szych przeksztaªceniach, relacja rozró»nialno±ci przyjmuje posta : F = {a b c f} {b d} {a d e f} {c d} Relacja silnej równowa»no±ci: Atrybuty {a, f} silnie równowa»ne. Oznaczanie M = {a f} relacja rozró»nialno±ci przyjmuje posta : F = {M b c} {b d} {M d e} {c d} Atrybut d wyst puje cz sto. Zastosowanie prawa ekspansji: F = [{d} {M b c}] [{M b c} {b} {M e} {c}] Zastosowanie prawa absorbcji dla drugiego komponentu: F = [d {M b c}] [{b} {M e} {c}] W ten sposób wszystkie komponenty znajduj si w prostej postaci. Zast pienie M przez a f daje w wyniku: F = [{d} {M b c}] [{b} {M e} {c}] Redukt pierwszego komponentu: R 1 = {a, d}, {d, f}, {b, d}, {b, c} Redukt drugiego komponentu: R 2 = {a, b, c}, {b, c, f}, {b, c, e} Redukt wynikowy przyjmuje posta : R = {a, d}, {d, f}, {b, d}, {b, c}, {a, b, c}, {b, c, f}, {b, c, e}