Internet Semantyczny Logika opisowa
Ontologie Definicja Grubera: Ontologia to formalna specyfikacja konceptualizacji pewnego obszaru wiedzy czy opisu elementów rzeczywistości. W Internecie Semantycznym językiem służącym do zapisu ontologii jest OWL (Ontology Web Language) Teoretyczną bazę dla języka OWL stanowi logika opisowa (Description Logic)
Logika opisowa W logice opisowej (DL) ontologia (a raczej baza wiedzy) dzieli się na dwie części: terminologię (TBox) i opis świata (zbiór asercji - ABox).
Koncepty Elementarnymi opisami w logice opisowej są koncepty atomowe (atomic concepts) i relacje atomowe (atomic roles). Koncepty złożone budowane są za pomocą tzw. konstruktorów. Literami A i B będziemy oznaczali koncepty atomowe. Literami C i D będziemy oznaczali koncepty złożone. Literami R i S będziemy oznaczali relacje atomowe.
Język AL Języki opisowe różnią się dostępnymi konstruktorami. Minimalnym językiem mającym praktyczne zastosowanie jest język AL (Attributive Language). W języku AL koncepty złożone budowane są za pomocą następujących reguł syntaktycznych:
Język AL - przykład Załóżmy, że Person i Female są konceptami atomowymi. Ponadto niech haschild będzie relacją atomową. Wówczas w języku AL możemy zdefiniować koncepty złożone:
Język AL - semantyka W celu zdefiniowania formalnej semantyki języka AL rozważmy tzw. interpretację. Interpretacja I składa się z niepustego zbioru I oraz funkcji przypisującej: każdemu konceptowi atomowemu A zbiór A I I. każdej relacji atomowej R relację binarną R I I I.
Język AL - interpretacja Interpretacja jest zwykle rozszerzana na koncepty złożone w następujący sposób:
Język AL - interpretacja Mówimy, że dwa koncepty C i D są równoważne jeżeli dla każdej interpretacji I. C I =D I Równoważność konceptów C i D zapisujemy następująco: C D Przykład Łatwo pokazać, że koncepty są równoważne.
Rodzina języków AL Wzbogacając język AL o kolejne konstruktory możemy uzyskać inne języki. Suma konceptów C i D oznaczona jest przez i interpretowana następująco: Suma konceptów oznaczana jest literą U.
Rodzina języków AL Pełna kwantyfikacja egzystencjalna oznaczona jest przez i interpretowana następująco: Pełna kwantyfikacja egzystencjalna oznaczana jest literą E.
Rodzina języków AL Ograniczenia liczbowe oznaczone są przez i interpretowane następująco: Ograniczenia liczbowe oznaczane są literą N.
Rodzina języków AL Negacja dowolnego konceptu C znaczona jest przez i interpretowana następująco: Negacja dowolnego konceptu oznaczana jest literą C.
Rodzina języków AL Przykład Wykorzystując wprowadzone powyżej dodatkowe konstruktory możemy zdefiniować następujący koncept złożony: (osoby posiadające co najwyżej jedno dziecko lub więcej niż trójkę dzieci z których jedno jest kobietą)
Rodzina języków AL Dowolny język z rodziny AL określamy następująco: gdzie obecność danej litery związana jest z obecnością w języku odpowiedniego konstruktora. Okazuje się, że nie wszystkie uzyskane w ten sposób języki są między sobą różne.
Rodzina języków AL Można pokazać, że: Zatem suma i pełna egzystencjalna kwantyfikacja może być określona przy pomocy negacji. Przeciwnie za pomocą sumy i pełnej egzystencjalnej kwantyfikacji może określić negację. Przyjmujemy zatem, że suma i pełna egzystencjalna kwantyfikacja może być określona przy pomocy negacji i odwrotnie.
DL - FOL Semantyka konceptów pozwala interpretować logikę opisową (DL) jako fragment logiki pierwszego rzędu (FOL). Każdy koncept C może być rozumiany jako formuła FOL: z jedną zmienną wolną (free) x. Dla każdej interpretacji I zbiór elementów I spełniających C (x) jest równy C I.
DL - FOL Koncept atomowy A odpowiada formule FOL: Przecięciu, sumie i negacji w DL odpowiadają w FOL odpowiednio: koniunkcja, alternatywa i negacja. Kwantyfikacji egzystencjalnej i ogólnej w DL odpowiadają następujące formuły w FOL:
DL - FOL Ograniczeniom liczbowym odpowiadają formuły: (zapis w języku DL jest oczywiście bardziej zwarty).
Terminologia Aksjomaty terminologiczne opisują jak powiązane są między sobą koncepty (i relacje) i mają postać inkluzji lub równości gdzie C i D są konceptami (R i S relacjami). Semantyka aksjomatów jest określona następująco: Interpretacja I spełnia jeżeli odpowiednio
Terminologia Jeżeli interpretacja I spełnia aksjomat (aksjomaty) wówczas mówimy, że jest modelem aksjomatu (aksjomatów). Dwa aksjomaty są równoważne jeżeli posiadają te same modele. Równość (aksjomat) w przypadku której po lewej stronie znaku występuje koncept atomowy nazywamy definicją. Za pomocą definicji możemy wprowadzać nazwy (symboliczne) dla złożonych opisów.
Terminologia Przykład Przykładowe definicje:
Terminologia Skończony zbiór definicji nazywamy terminologią (TBox) jeżeli każda nazwa symboliczna jest zdefiniowana co najwyżej jeden raz. Innymi słowy dla każdego konceptu atomowego istnieje co najwyżej jedna definicja w której koncept ten występuje po lewej stronie.
Terminologia Przykład
Opis świata Opis świata (ABox) przyporządkowuje elementy uniwersum (indywidua) poszczególnym konceptom i pokazuje powiązania pomiędzy indywiduami za pomocą relacji. Niektóre z konceptów wykorzystanych w opisie świata mogą być zdefiniowane w terminologii.
Opis świata Indywidua oznaczamy małymi literami a, b, c. Używając koncepty C i relacje R możemy w opisie świata umieszczać następujące asercje: - asercja koncepcyjna - a należy do (interpretacji) C. - asercja relacyjna - b jest w relacji R z c.
Opis świata Przykład
Opis świata Interpretację terminologii możemy rozszerzyć na opis świata. Zakładamy, że interpretacja I sładająca się z niepustego zbioru I przypisuje elementy zbioru I indywiduom tzn: a przypisuje element a I I. Zakładamy, że indywiduom o różnych nazwach przypisywane są różne elementy (UAN - unique name assumption).
Opis świata Mówimy, że interpretacja I spełnia asercje koncepcyjną: jeżeli: Mówimy, że interpretacja I spełnia asercje relacyjną: jeżeli:
Pytanie 1 Jaki jest związek terminologii (Tbox) i opisów świata (ABox) z poznanymi językami RDF i OWL? OWL TBox opisy zasobów w RDF ABox
Pytanie 2 Jakie konstruktory są potrzebne do zbudowania języka OWL DL? czyli jakim językiem logicznym jest OWL DL? Język ten jest bardziej złożony niż języki przez nas poznane. OWL SHOIN(D)
Nasza ontologia Jakiego języka logiki wymaga nasza ontologia związana z książkami?
Nasza ontologia
Nasza ontologia
Nasza ontologia
Nasza ontologia Ekspresyjność naszej ontologii:
Wnioskowanie Systemy reprezentacji wiedzy oparte na logice opisowej umożliwiają wnioskowanie. Baza wiedzy składająca się z TBox i ABox posiada semantykę, dzięki której równoważna jest zbiorowi aksjomatów w logice pierwszego rzędu. W konsekwencji baza ta zawiera pewną wiedzę niejawną (implicite knowledge), która dzięki wnioskowaniu może się stać wiedzą jawną (explicite knowledge).
Wnioskowanie TBox ABox Grandmother(Mary)
Wnioskowanie Niech T będzie pewną terminologią (TBox). Spełnialność (satisfability) Koncept C jest spełnialny (ze względu na T) jeżeli istnieje model I terminologii T taki, że zbiór C I jest niepusty. Zawieranie (subsumption) Koncept C jest zawarty w koncepcie D jeżeli C I D I dla każdego modelu I terminologii T. Zapisujemy: lub
Wnioskowanie Przykład
Wnioskowanie Przykład
Wnioskowanie Przykład
Wnioskowanie Przykład
Wnioskowanie Równoważność (equivalence) Dwa koncepty C i D są równoważne jeżeli C I =D I dla każdego modelu I terminologii T. Zapisujemy: lub Rozłączność (disjointness) Dwa koncepty C i D są rozłączne jeżeli C I D I = dla każdego modelu I terminologii T.
Redukcja do zawierania Dla konceptów C i D mamy: Koncept C jest niespełnialny C jest zawarty w. Koncepty C i D są równoważne C jest zawarty w D i D jest zawarty w C. Koncepty C i D są rozłączne C D jest zawarty w. Większość istniejących systemów DL dostarcza operator oraz koncept niespełnialny. W konsekwencji systemy pozwalające sprawdzić zawieranie mogą przeprowadzić wszystkie powyższe wnioskowania.
Redukcja do spełnialności Jeżeli dodatkowo system dostarcza operatora negacji ( ) wówczas wymienione wnioskowania mogą być zredukowane do spełnialności. Dla konceptów C i D mamy: Koncept C jest zawarty w D C D jest niespełnialny. Koncepty C i D są równoważne C D oraz C D są niespełnialne. Koncepty C i D są rozłączne C D jest niespełnialny.
Semantyka zamknięta vs. otwarta Analogia między opartymi na DL: bazami danych i bazami wiedzy Schemat bazy danych Instancja bazy danych TBox ABox Istnieje jednak istotna różnica między semantykami instancji bazy danych i ABox!
Semantyka zamknięta vs. otwarta Brak informacji w instancji bazy danych interpretowany jest jako informacja negatywna. Brak informacji w Abox interpretowany jest jako brak wiedzy. Przykład DB Peter ma tylko jedno dziecko!
Semantyka zamknięta vs. otwarta Przykład (cd) ABox Peter ma dziecko o imieniu Harry! Instancja bazy danych reprezentuje jedną interpretacje schematu bazy. Abox reprezentuje wiele różnych interpretacji (wszystkie swoje modele).
Semantyka zamknięta vs. otwarta Przykład Według mitu Edyp został wyrzucony z domu w niemowlęctwie, ponieważ prorok ogłosił, że Edyp popełni ojcobójstwo i ożeni się z matką. Przygarnęli go pasterze. Po jakimś czasie Edyp powraca, zabija ojca i poślubia Jokastę, nie wiedząc o swoim pochodzeniu. Z tego związku rodzą się dwaj synowie: Polinik i Eteokles, oraz dwie córki: Antygona i Ismena. Kiedy wieszcz Tejrezjasz wyjawia obojgu prawdę, Jokasta popełnia samobójstwo, a Edyp wykłuwa sobie oczy i opuszcza miasto.
Semantyka zamknięta vs. otwarta Rozważmy następujący ABox: (Jokasta, Edyp, Polinik, Tejrezjasz)
Semantyka zamknięta vs. otwarta Załóżmy, że interesuje nas odpowiedź na następujące pytanie: Czy Jokasta ma dziecko, które jest patrycjuszem i samo posiada dziecko nie będące patrycjuszem? Formalnie:
Semantyka zamknięta vs. otwarta Rozwiązanie 1 (semantyka zamknięta) Dzieckiem Jokasy jest Edyp. Edyp jest patrycjuszem. Edyp posiada jedno dziecko (Polinik) Nie wiemy czy Polinik jest patrycjuszem. Edyp nie jest dzieckiem o które nam chodzi. Dzieckiem Jokasy jest Polinik. Nie wiemy czy Polinik jest patrycjuszem. Polinik nie jest dzieckiem o które nam chodzi. Odpowiedź na pytanie jest zatem negatywna.
Semantyka zamknięta vs. otwarta Rozwiązanie 2 (semantyka otwarta) Wszystkie modele naszego ABox mogą być podzielone na dwie grupy: A. Modele w których Polinik nie jest patrycjuszem. B. Modele w których Polinik jest patrycjuszem. W modelach z grupy A to Edyp jest dzieckiem o które chodzi w pytaniu. W modelach z grupy B to Polinik jest dzieckiem o które chodzi w pytaniu. Odpowiedź na pytanie jest zatem pozytywna.
Open World Assumption W Internecie Semantycznym obowiązuje następująca zasada: Nie możemy założyć, że coś nie istnieje (nie jest prawdą) dopóki nie jest wprost stwierdzone że to coś nie istnieje (nie jest prawdą)! Powyższa zasada ma istotne konsekwencje dla działania resonerów przetwarzających ontologie.