Wprowadzenie i pojęcia wstępne.
X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1 S = <X, A, V, ρ> X = {x 1,,x 8 } A = {a, b, c} V a = {a 1, a 2 } V b = {b 1, b 2 } V c = {c 1, c 2, c 3, c 4 } ρ = X x A V ρ(x, a) = v np. ρ(x 6, b) = b 2
Funkcja informacji przyporządkowuje każdemu obiektowi i atrybutowi odpowiednią wartość; przedstawiona może być za pomocą tabeli: X\A Wykonawca Gatunek Czas trwania X 1 Lady Pank Rock 4:01 X 2 U2 Rock 3:10 X 3 Verba Hip Hop 3:30 X 4 Bajm Pop 4:06 Informacją o obiekcie x jest funkcja ρ x : A V taka, że ρ x (a) = ρ(x, a) dla każdego a A, x X. Jest to zbiór wartości wszystkich atrybutów obiektu w danym systemie. Przykład: ρ x6 = (a, a 1 )(b, b 2 )(c, c 2 )
Informacją w systemie S będzie każda funkcja o argumentach w zbiorze atrybutów A oraz wartościach należących do V, taka, że (a) Va. Informacja jest pusta gdy nie odpowiada jej żaden obiekt w systemie: X = ø Wszystkich możliwych do uzyskania informacji w systemie będzie:
Deskryptor para atrybut-wartość. (ai, vij ), gdzie ai A; vij Vai; Vai zbiór wartości atrybutu a. Dziedzina atrybutu ai jest co najmniej dwuelementowa każdy atrybut może przyjmować co najmniej jedną z 2 możliwych wartości. Opis obiektu x w systemie S to zbiór deskryptorów wyznaczony przez informację o obiekcie. Język deskryptorowy (LS) to język systemowy, język opisu w kartotece wyszukiwawczej oraz język pytań i odpowiedzi w systemie. Jest on zdefiniowany jako para: LS = <A, G>, gdzie A alfabet, G dwustopniowa gramatyka
Alfabet określa zbiór dopuszczalnych symboli jakie występują w języku: 1. 0, 1 stałe (oznaczenie zbioru pustego i pełnego) 2. A zbiór nazw atrybutów 3. V zbiór nazw wartości atrybutów 4. +,, ~ symbole operacji logicznych lub, i, nie 5. (, ) nawiasy
Zdefiniowana jest dwustopniowo: Syntaktyka określa zasady tworzenia słów w danym języku. Słowa w języku deskryptorowym nazywamy termami (T zbiór termów; zbiór słów w języku deskryptorowym): 1. Stałe 0, 1 T (są termami). 2. Deskryptor (a, v) T, gdzie a A, V V a jest termem. 3. Jeżeli dwa termy t, t należą do języka to słowami języka są również: t + t T t t T t T Przykłady termów: (Gatunek, Rock) T, (Wykonawca, U2) T, (Gatunek, Pop) (Wykonawca, Bajm) T, (Gatunek, Rock) (Wykonawca, U2) + (Wykonawca, Lady Pank) T
Semantyka określa znaczenie słów. Znaczenie słów (termów) określa funkcja σ odwzorowująca zbiór termów T systemu S w zbiór obiektów X tego systemu: σ : T (X), gdzie (X) oznacza rodzinę podzbiorów zbioru X. Funkcja σ określona jest w następujący sposób: 1. σ (0) = ø σ(1) = X (pełny zbiór obiektów) 2. σ (a, v) = {x X, ρ x (a) = v} 3. σ ( t) = {X σ(t) } 4. σ (t + t ) = σ(t) σ(t ) 5. σ (t t ) = σ(t) σ(t )
Gdy pytanie kierowane do systemu jest termem, to znalezienie odpowiedzi na to pytanie polega na nadaniu znaczenia poszczególnym jego termom. Przykład: t = (c, c 3 ) σ(t) = {x 3 } σ(t 1 ) = {x 3 } σ(t 2 ) = {x 1, x 2, x 4, x 7 } σ(t) = σ(t 1 ) σ(t 2 ) = {x 3 } {x 1, x 2, x 4, x 7 } = {x 1, x 2, x 3, x 4, x 7 }
Term elementarny. Term t nazywamy elementarnym jeśli jest postaci: t e = (a 1, v i1 ) (a 2, v i2 ) (a n, v in ) gdzie: a i A, v ij V aj. Jeżeli przez oznaczymy deksprytor (a j, v ij ) to: Term składowy. Term t nazywamy składowym jeśli jest postaci: gdzie k n. Term normalny. Term t nazywamy normalnym jeśli jest on sumą termów elementarnych: t n = t 1 + t 2 + + t m, gdzie t i to termy elementarne
Proces prowadzący od termu składowego do termu elementarnego to normalizacja. W wyniku normalizacji oczywiście powstaje term normalny. Przykład Załóżmy, że szukamy odpowiedzi na pytanie wyrażone termem składowym t = (a,a 1 ) (b,b 1 ). Wartość atrybutu c jest wówczas nieistotna. Zatem należy znaleźć odpowiedź na pytanie: t = (a,a 1 ) (b,b 1 ) [(c,c 1 )+(c,c 2 )+(c,c 3 )+(c,c 4 )] = (a,a 1 )(b,b 1 )(c,c 1 ) + (a,a 1 )(b,b 1 )(c,c 2 ) + (a,a 1 )(b,b 1 )(c,c 3 ) + (a,a 1 )(b,b 1 )(c,c 4 )
1. Wszystkie termy elementarne są rozłączne. 2. Suma odpowiedzi na termy elementarne daje cały zbiór obiektów.
Zawieranie się termów Term t jest zawarty w t' wtedy i tylko wtedy, gdy zbiór obiektów odpowiadający wartości termu t jest zawarty w zbiorze obiektów odpowiadających wartości termu t: Równość termów Termy t i t są równe w systemie S wtedy i tylko wtedy, gdy wartości tych termów są równe:
t = (a, a 1 ) t = (a, a 1 )(b, b 1 ) σ(t) = {x 1, x 2, x 3, x 5, x 6, x 7 } σ(t ) = {x 1, x 2, x 7 } ODP: Term t zawiera się w t, gdyż: X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1
System jest kompletny wtedy i tylko wtedy, gdy każdej informacji odpowiada co najmniej jeden obiekt (tj. gdy każda informacja jest niepusta). Nasz przykładowy system nie jest kompletny bo istnieje informacja (a, a 1 )(b, b 1 )(c, c 4 ) = ø (której nie odpowiada żaden obiekt w systemie). System jest selektywny wtedy i tylko wtedy, gdy każdej informacji odpowiada co najwyżej jeden obiekt. Nasz przykładowy system nie jest selektywny bo istnieje informacja (a, a 1 )(b, b 1 )(c, c 1 ) = {x 1, x 7 } (której odpowiadają dwa obiekty x 1 oraz x 7).
Liczba informacji (L) w systemie wyznaczania jest ze wzoru: L = m 1 m 2 m n, gdzie m i = card V ai (liczebność konkretnego zbioru wartości) Przykład: m 1 = 2, m 2 = 2, m 3 = 4 stąd L = 2 2 4 = 16. Redundancja nadmiar informacji w stosunku do przyjętego minimum. Wady: zwiększa zajętość pamięci utrudnia aktualizację
Powiemy, że atrybut b jest zależy od atrybutu a wtedy i tylko wtedy, gdy klasa równoważności (nierozróźnialności) dla atrybutu a zawiera się w klasie równoważności dla atrybutu b. Klasa równoważności zbiór obiektów nierozróżnialnych ze względu na wartość danego atrybutu.
Atrybuty a i b są niezależne gdy nie zachodzi żadna z relacji: Atrybuty a i b są równoważne w systemie S gdy:
Klasy równoważności: Wynika z tego że: Atrybut a jest atrybutem zależnym od atrybutu c, zatem jest on zbędny bo: } X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1
Powiemy, że obiekty x, y X są nierozróżnialne w systemie S ze względu na atrybut a A wtedy i tylko wtedy, gdy ρ x (a) = ρ y (a). Nierozróżnialność obiektów x, y ze względu na atrybut a zapisujemy jako. Przykład: Obiekty x 1 i x 2 są nierozróżnialne w systemie ze względu na atrybut b. Obiekty x, y X nazywamy nierozróżnialnymi w systemie S ( ) wtedy i tylko wtedy, gdy ρ x = ρ y. Przykład: Obiekty x 1 i x 7 są nierozróżnialne w systemie.
Nie Proszę zapoznać się również z: http://zsi.tech.us.edu.pl/~nowak/swibio/w1.pdf
Na podstawie kartoteki wyszukiwawczej i opisu systemu sporządzonego w domu: 1. Zapisz po 3 termy elementarne oraz składowe. 2. Dokonaj normalizacji wybranego termu składowego. 3. Sprawdź czy (i uzasadnij dlaczego) system jest selektywny i kompletny. 4. Policz liczbę informacji w systemie. 5. Zbadaj zależności między atrybutami w systemie.