Wprowadzenie i pojęcia wstępne.

Podobne dokumenty
Metoda Składowych atomowych

Dekompozycja w systemach wyszukiwania informacji

Metoda list inwersyjnych. Wykład III

Część wspólna (przekrój) A B składa się z wszystkich elementów, które należą jednocześnie do zbioru A i do zbioru B:

Metoda List Łańcuchowych

Metoda list prostych Wykład II. Agnieszka Nowak - Brzezińska

Metoda list inwersyjnych

Metoda List Inwersyjnych

- Dla danego zbioru S zbiór wszystkich jego podzbiorów oznaczany symbolem 2 S.

Zasada indukcji matematycznej

METODA LIST PROSTYCH. Marcin Jaskuła

Metoda List Prostych mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2012

030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła

Systemy baz danych. Notatki z wykładu

LOGIKA I TEORIA ZBIORÓW

Systemy Wyszukiwania Informacji

O pewnych związkach teorii modeli z teorią reprezentacji

domykanie relacji, relacja równoważności, rozkłady zbiorów

Relacje. opracował Maciej Grzesiak. 17 października 2011

Języki formalne i automaty Ćwiczenia 1

Algebra Boole a i jej zastosowania

LOGIKA Klasyczny Rachunek Zdań

Prawdopodobieństwo. Prawdopodobieństwo. Jacek Kłopotowski. Katedra Matematyki i Ekonomii Matematycznej SGH. 16 października 2018

Maszyna Turinga. Algorytm. czy program???? Problem Hilberta: Przykłady algorytmów. Cechy algorytmu: Pojęcie algorytmu

FUNKCJE LICZBOWE. Na zbiorze X określona jest funkcja f : X Y gdy dowolnemu punktowi x X przyporządkowany jest punkt f(x) Y.

Semantyka rachunku predykatów

Systemy Wyszukiwania Informacji: Metoda list inwersyjnych

Logika Stosowana. Wykład 1 - Logika zdaniowa. Marcin Szczuka. Instytut Informatyki UW. Wykład monograficzny, semestr letni 2016/2017

Bazy danych Algebra relacji Wykład dla studentów matematyki

Matematyka dyskretna. Andrzej Łachwa, UJ, B/14

02DRAP - Aksjomatyczna definicja prawdopodobieństwa, zasada w-w

Uzupełnienia dotyczące zbiorów uporządkowanych (3 lutego 2011).

Internet Semantyczny i Logika II

Symbol, alfabet, łańcuch

Temperatura w atmosferze (czy innym ośrodku) jako funkcja dł. i szer. geogr. oraz wysokości.

Weronika Siwek, Metryki i topologie 1. (ρ(x, y) = 0 x = y) (ρ(x, y) = ρ(y, x))

Rozdział 7 Relacje równoważności

Matematyka dyskretna. Andrzej Łachwa, UJ, /10

Algebrą nazywamy strukturę A = (A, {F i : i I }), gdzie A jest zbiorem zwanym uniwersum algebry, zaś F i : A F i

Rysunek 1: Przykłady graficznej prezentacji klas.

Teoria miary i całki

RACHUNEK ZBIORÓW 5 RELACJE

1 Zbiory. 1.1 Kiedy {a} = {b, c}? (tzn. podać warunki na a, b i c) 1.2 Udowodnić, że A {A} A =.

vf(c) =, vf(ft 1... t n )=vf(t 1 )... vf(t n ).

3 Abstrakcyjne kompleksy symplicjalne.

Zadanie 1. Czy prawdziwa jest następująca implikacja? Jeśli L A jest językiem regularnym, to regularnym językiem jest też. A = (A, Q, q I, F, δ)

G. Plebanek, MIARA I CAŁKA Zadania do rozdziału 1 28

Andrzej Wiśniewski Logika II. Materiały do wykładu dla studentów kognitywistyki. Wykład 14. Wprowadzenie do logiki intuicjonistycznej

Wyk lad 6 Podprzestrzenie przestrzeni liniowych

Cel normalizacji. Tadeusz Pankowski

Jak należy się spodziewać, mamy. Zauważmy jednak, że nie zachodzi równość

Przykłady zdań w matematyce. Jeśli a 2 + b 2 = c 2, to trójkąt o bokach długości a, b, c jest prostokątny (a, b, c oznaczają dane liczby dodatnie),

BOGDAN ZARĘBSKI ZASTOSOWANIE ZASADY ABSTRAKCJI DO KONSTRUKCJI LICZB CAŁKOWITYCH

Elementy logiki matematycznej

Jest to zasadniczo powtórka ze szkoły średniej, być może z niektórymi rzeczami nowymi.

Np. Olsztyn leży nad Łyną - zdanie prawdziwe, wartość logiczna 1 4 jest większe od 5 - zdanie fałszywe, wartość logiczna 0

1. Reguły minimalne (optymalne) Podstawowe twierdzenia i definicje. Definicja 1 Funkcję postaci f. nazwiemy n-argumentową funkcją boolowską.

1.1 Definicja. 1.2 Przykład. 1.3 Definicja. Niech G oznacza dowolny, niepusty zbiór.

Hierarchia Chomsky ego

RBD Relacyjne Bazy Danych

020 Liczby rzeczywiste

Rodzinę spełniającą trzeci warunek tylko dla sumy skończonej nazywamy ciałem (algebrą) w zbiorze X.

5. Algebra działania, grupy, grupy permutacji, pierścienie, ciała, pierścień wielomianów.

Lista zadań - Relacje

WYŻSZA SZKOŁA INFORMATYKI STOSOWANEJ I ZARZĄDZANIA

System BCD z κ. Adam Slaski na podstawie wykładów, notatek i uwag Pawła Urzyczyna. Semestr letni 2009/10

1 Wstęp do modelu relacyjnego

Wprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty. Literatura

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem

Andrzej Wiśniewski Logika I Materiały do wykładu dla studentów kognitywistyki. Wykład 9. Koniunkcyjne postacie normalne i rezolucja w KRZ

F t+ := s>t. F s = F t.

Podstawowe własności grafów. Wykład 3. Własności grafów

Ziemia obraca się wokół Księżyca, bo posiadając odpowiednią wiedzę można stwierdzić, czy są prawdziwe, czy fałszywe. Zdaniami nie są wypowiedzi:

Adam Meissner.

. : a 1,..., a n F. . a n Wówczas (F n, F, +, ) jest przestrzenią liniową, gdzie + oraz są działaniami zdefiniowanymi wzorami:

RACHUNEK PRAWDOPODOBIEŃSTWA - POJĘCIA WSTĘPNE MATERIAŁY POMOCNICZE - TEORIA

Matematyka dyskretna. Andrzej Łachwa, UJ, /10

FUNKCJA I JEJ WŁASNOŚCI

Elementy logiki. Wojciech Buszkowski Wydział Matematyki i Informatyki UAM Zakład Teorii Obliczeń

Monoidy wolne. alfabetem. słowem długością słowa monoidem wolnym z alfabetem Twierdzenie 1.

1 Działania na zbiorach

Obszar statyczny dane dostępne w dowolnym momencie podczas pracy programu (wprowadzone słowem kluczowym static),

Składnia rachunku predykatów pierwszego rzędu

A i A j lub A j A i. Operator γ : 2 X 2 X jest ciągły gdy

0 + 0 = 0, = 1, = 1, = 0.

Wykład nr 1 Techniki Mikroprocesorowe. dr inż. Artur Cichowski

2 Rodziny zbiorów. 2.1 Algebry i σ - algebry zbiorów. M. Beśka, Wstęp do teorii miary, rozdz. 2 11

Maszyna Turinga języki

Wyk lad 9 Baza i wymiar przestrzeni liniowej

Ekonomia matematyczna - 1.2

Programowanie w Logice

Algebra. Jakub Maksymiuk. lato 2018/19

Rachunek prawdopodobieństwa dla informatyków

TEORIA wiązań Magdalena Pawłowska Gr. 10B2

Pojęcie zależności funkcyjnej

Metody Kompilacji Wykład 3

Bazy danych TERMINOLOGIA

Literatura. Bazy danych s.1-1

Reguły decyzyjne, algorytm AQ i CN2. Reguły asocjacyjne, algorytm Apriori.

Transkrypt:

Wprowadzenie i pojęcia wstępne.

X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1 S = <X, A, V, ρ> X = {x 1,,x 8 } A = {a, b, c} V a = {a 1, a 2 } V b = {b 1, b 2 } V c = {c 1, c 2, c 3, c 4 } ρ = X x A V ρ(x, a) = v np. ρ(x 6, b) = b 2

Funkcja informacji przyporządkowuje każdemu obiektowi i atrybutowi odpowiednią wartość; przedstawiona może być za pomocą tabeli: X\A Wykonawca Gatunek Czas trwania X 1 Lady Pank Rock 4:01 X 2 U2 Rock 3:10 X 3 Verba Hip Hop 3:30 X 4 Bajm Pop 4:06 Informacją o obiekcie x jest funkcja ρ x : A V taka, że ρ x (a) = ρ(x, a) dla każdego a A, x X. Jest to zbiór wartości wszystkich atrybutów obiektu w danym systemie. Przykład: ρ x6 = (a, a 1 )(b, b 2 )(c, c 2 )

Informacją w systemie S będzie każda funkcja o argumentach w zbiorze atrybutów A oraz wartościach należących do V, taka, że (a) Va. Informacja jest pusta gdy nie odpowiada jej żaden obiekt w systemie: X = ø Wszystkich możliwych do uzyskania informacji w systemie będzie:

Deskryptor para atrybut-wartość. (ai, vij ), gdzie ai A; vij Vai; Vai zbiór wartości atrybutu a. Dziedzina atrybutu ai jest co najmniej dwuelementowa każdy atrybut może przyjmować co najmniej jedną z 2 możliwych wartości. Opis obiektu x w systemie S to zbiór deskryptorów wyznaczony przez informację o obiekcie. Język deskryptorowy (LS) to język systemowy, język opisu w kartotece wyszukiwawczej oraz język pytań i odpowiedzi w systemie. Jest on zdefiniowany jako para: LS = <A, G>, gdzie A alfabet, G dwustopniowa gramatyka

Alfabet określa zbiór dopuszczalnych symboli jakie występują w języku: 1. 0, 1 stałe (oznaczenie zbioru pustego i pełnego) 2. A zbiór nazw atrybutów 3. V zbiór nazw wartości atrybutów 4. +,, ~ symbole operacji logicznych lub, i, nie 5. (, ) nawiasy

Zdefiniowana jest dwustopniowo: Syntaktyka określa zasady tworzenia słów w danym języku. Słowa w języku deskryptorowym nazywamy termami (T zbiór termów; zbiór słów w języku deskryptorowym): 1. Stałe 0, 1 T (są termami). 2. Deskryptor (a, v) T, gdzie a A, V V a jest termem. 3. Jeżeli dwa termy t, t należą do języka to słowami języka są również: t + t T t t T t T Przykłady termów: (Gatunek, Rock) T, (Wykonawca, U2) T, (Gatunek, Pop) (Wykonawca, Bajm) T, (Gatunek, Rock) (Wykonawca, U2) + (Wykonawca, Lady Pank) T

Semantyka określa znaczenie słów. Znaczenie słów (termów) określa funkcja σ odwzorowująca zbiór termów T systemu S w zbiór obiektów X tego systemu: σ : T (X), gdzie (X) oznacza rodzinę podzbiorów zbioru X. Funkcja σ określona jest w następujący sposób: 1. σ (0) = ø σ(1) = X (pełny zbiór obiektów) 2. σ (a, v) = {x X, ρ x (a) = v} 3. σ ( t) = {X σ(t) } 4. σ (t + t ) = σ(t) σ(t ) 5. σ (t t ) = σ(t) σ(t )

Gdy pytanie kierowane do systemu jest termem, to znalezienie odpowiedzi na to pytanie polega na nadaniu znaczenia poszczególnym jego termom. Przykład: t = (c, c 3 ) σ(t) = {x 3 } σ(t 1 ) = {x 3 } σ(t 2 ) = {x 1, x 2, x 4, x 7 } σ(t) = σ(t 1 ) σ(t 2 ) = {x 3 } {x 1, x 2, x 4, x 7 } = {x 1, x 2, x 3, x 4, x 7 }

Term elementarny. Term t nazywamy elementarnym jeśli jest postaci: t e = (a 1, v i1 ) (a 2, v i2 ) (a n, v in ) gdzie: a i A, v ij V aj. Jeżeli przez oznaczymy deksprytor (a j, v ij ) to: Term składowy. Term t nazywamy składowym jeśli jest postaci: gdzie k n. Term normalny. Term t nazywamy normalnym jeśli jest on sumą termów elementarnych: t n = t 1 + t 2 + + t m, gdzie t i to termy elementarne

Proces prowadzący od termu składowego do termu elementarnego to normalizacja. W wyniku normalizacji oczywiście powstaje term normalny. Przykład Załóżmy, że szukamy odpowiedzi na pytanie wyrażone termem składowym t = (a,a 1 ) (b,b 1 ). Wartość atrybutu c jest wówczas nieistotna. Zatem należy znaleźć odpowiedź na pytanie: t = (a,a 1 ) (b,b 1 ) [(c,c 1 )+(c,c 2 )+(c,c 3 )+(c,c 4 )] = (a,a 1 )(b,b 1 )(c,c 1 ) + (a,a 1 )(b,b 1 )(c,c 2 ) + (a,a 1 )(b,b 1 )(c,c 3 ) + (a,a 1 )(b,b 1 )(c,c 4 )

1. Wszystkie termy elementarne są rozłączne. 2. Suma odpowiedzi na termy elementarne daje cały zbiór obiektów.

Zawieranie się termów Term t jest zawarty w t' wtedy i tylko wtedy, gdy zbiór obiektów odpowiadający wartości termu t jest zawarty w zbiorze obiektów odpowiadających wartości termu t: Równość termów Termy t i t są równe w systemie S wtedy i tylko wtedy, gdy wartości tych termów są równe:

t = (a, a 1 ) t = (a, a 1 )(b, b 1 ) σ(t) = {x 1, x 2, x 3, x 5, x 6, x 7 } σ(t ) = {x 1, x 2, x 7 } ODP: Term t zawiera się w t, gdyż: X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1

System jest kompletny wtedy i tylko wtedy, gdy każdej informacji odpowiada co najmniej jeden obiekt (tj. gdy każda informacja jest niepusta). Nasz przykładowy system nie jest kompletny bo istnieje informacja (a, a 1 )(b, b 1 )(c, c 4 ) = ø (której nie odpowiada żaden obiekt w systemie). System jest selektywny wtedy i tylko wtedy, gdy każdej informacji odpowiada co najwyżej jeden obiekt. Nasz przykładowy system nie jest selektywny bo istnieje informacja (a, a 1 )(b, b 1 )(c, c 1 ) = {x 1, x 7 } (której odpowiadają dwa obiekty x 1 oraz x 7).

Liczba informacji (L) w systemie wyznaczania jest ze wzoru: L = m 1 m 2 m n, gdzie m i = card V ai (liczebność konkretnego zbioru wartości) Przykład: m 1 = 2, m 2 = 2, m 3 = 4 stąd L = 2 2 4 = 16. Redundancja nadmiar informacji w stosunku do przyjętego minimum. Wady: zwiększa zajętość pamięci utrudnia aktualizację

Powiemy, że atrybut b jest zależy od atrybutu a wtedy i tylko wtedy, gdy klasa równoważności (nierozróźnialności) dla atrybutu a zawiera się w klasie równoważności dla atrybutu b. Klasa równoważności zbiór obiektów nierozróżnialnych ze względu na wartość danego atrybutu.

Atrybuty a i b są niezależne gdy nie zachodzi żadna z relacji: Atrybuty a i b są równoważne w systemie S gdy:

Klasy równoważności: Wynika z tego że: Atrybut a jest atrybutem zależnym od atrybutu c, zatem jest on zbędny bo: } X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1

Powiemy, że obiekty x, y X są nierozróżnialne w systemie S ze względu na atrybut a A wtedy i tylko wtedy, gdy ρ x (a) = ρ y (a). Nierozróżnialność obiektów x, y ze względu na atrybut a zapisujemy jako. Przykład: Obiekty x 1 i x 2 są nierozróżnialne w systemie ze względu na atrybut b. Obiekty x, y X nazywamy nierozróżnialnymi w systemie S ( ) wtedy i tylko wtedy, gdy ρ x = ρ y. Przykład: Obiekty x 1 i x 7 są nierozróżnialne w systemie.

Nie Proszę zapoznać się również z: http://zsi.tech.us.edu.pl/~nowak/swibio/w1.pdf

Na podstawie kartoteki wyszukiwawczej i opisu systemu sporządzonego w domu: 1. Zapisz po 3 termy elementarne oraz składowe. 2. Dokonaj normalizacji wybranego termu składowego. 3. Sprawdź czy (i uzasadnij dlaczego) system jest selektywny i kompletny. 4. Policz liczbę informacji w systemie. 5. Zbadaj zależności między atrybutami w systemie.