Metody strukturalnej analizy ontologii opartych na logice opisowej



Podobne dokumenty
Internet Semantyczny i Logika II

Internet Semantyczny. Logika opisowa

Ontologie, czyli o inteligentnych danych

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.

KARTOGRAFICZNA METODA REPREZENTACJI WIEDZY W SYSTEMIE KASEA

Reprezentacja wiedzy ontologie, logiki deskrypcyjne

Systemy ekspertowe. System ekspertowy wspomagający wybór zestawu komputerowego w oparciu o ontologie i system wnioskujący RacerPro

Systemy liczenia. 333= 3*100+3*10+3*1

PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU>

LOGIKA I TEORIA ZBIORÓW

PODSTAWY SZTUCZNEJ INTELIGENCJI

Wykład I. Wprowadzenie do baz danych

Programowanie deklaratywne

Web 3.0 Sieć Pełna Znaczeń (Semantic Web) Perspektywy dla branży motoryzacyjnej i finansowej. Przyjęcie branżowe EurotaxGlass s Polska 10 luty 2012

JAKIEGO RODZAJU NAUKĄ JEST

Systemy ekspertowe. Krzysztof Patan

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

0.1. Logika podstawowe pojęcia: zdania i funktory, reguły wnioskowania, zmienne zdaniowe, rachunek zdań.

Rachunek zdań. Zdanie w sensie logicznym jest to wyraŝenie jednoznacznie stwierdzające, na gruncie reguł danego języka, iŝ tak a

Instrukcja warunkowa i złoŝona.

M T E O T D O ZI Z E E A LG L O G R O Y R TM

SZTUCZNA INTELIGENCJA

Technologia informacyjna

Wykład 11a. Składnia języka Klasycznego Rachunku Predykatów. Języki pierwszego rzędu.

Ziemia obraca się wokół Księżyca, bo posiadając odpowiednią wiedzę można stwierdzić, czy są prawdziwe, czy fałszywe. Zdaniami nie są wypowiedzi:

Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.

Internet Semantyczny i Logika I

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Ontologie Wiedza semantyczna Semantic Web Inżynieria ontologii. Zarządzanie wiedzą. Wykład Sieci semantyczne. Joanna Kołodziejczyk.

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski

UCHWAŁA NR 46/2013. Senatu Akademii Marynarki Wojennej im. Bohaterów Westerplatte z dnia 19 września 2013 roku

PRZEWODNIK PO PRZEDMIOCIE

Transformacja wiedzy w budowie i eksploatacji maszyn

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Definicje. Algorytm to:

Laboratorium nr 8. Temat: Podstawy języka zapytań SQL (część 2)

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

Semantic Web Internet Semantyczny

Zagadnienia (1/3) Data-flow diagramy przepływów danych ERD diagramy związków encji Diagramy obiektowe w UML (ang. Unified Modeling Language)

Metody reprezentacji i przetwarzania wiedzy w warunkach niepewności w ontologiach opartych na logice opisowej

Potencjał społeczności lokalnej-podstawowe informacje

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

KURS ACCESS 2003 Wiadomości wstępne

Natalia Gorynia-Pfeffer STRESZCZENIE PRACY DOKTORSKIEJ

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE

Efekty kształcenia dla kierunku studiów INFORMATYKA, Absolwent studiów I stopnia kierunku Informatyka WIEDZA

Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Rysunek 1: Przykłady graficznej prezentacji klas.

KIERUNKOWE EFEKTY KSZTAŁCENIA

Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem przedsięwzięcia z wykorzystaniem metod sieciowych PERT i CPM

Tom 6 Opis oprogramowania

Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08

domykanie relacji, relacja równoważności, rozkłady zbiorów

Efekty kształcenia wymagane do podjęcia studiów 2 stopnia na kierunku Informatyka

Kierunek Zarządzanie II stopnia Szczegółowe efekty kształcenia i ich odniesienie do opisu efektów kształcenia dla obszaru nauk społecznych

Edukacja informatyczna w gimnazjum i w liceum w Nowej Podstawie Programowej

Najprostszy schemat blokowy

INSTYTUT AUTOMATYKI I INŻYNIERII INFORMATYCZNEJ POLITECHNIKI POZNAŃSKIEJ. Adam Meissner. Elementy logik deskrypcyjych

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 5 Ćwiczenia w narzędziu CASE diagram przypadków uŝycia. Materiały dla nauczyciela

3 grudnia Sieć Semantyczna

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

Definicje. Najprostszy schemat blokowy. Schemat dokładniejszy

DLA SEKTORA INFORMATYCZNEGO W POLSCE

Jak złowić klienta? Analiza sieci społecznych jako nowe narzędzie badań marketingowych

Uniwersytet Zielonogórski Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Sterowania i Systemów Informatycznych

DOBÓR PRÓBY. Czyli kogo badać?

Zapisywanie algorytmów w języku programowania

Strukturalizacja otoczenia agentów: ontologie, CYC, sieci semantyczne

O badaniach nad SZTUCZNĄ INTELIGENCJĄ

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

Wprowadzenie do Prologa

PN-ISO 704:2012/Ap1. POPRAWKA do POLSKIEJ NORMY. Działalność terminologiczna Zasady i metody ICS nr ref. PN-ISO 704:2012/Ap1:

166 Wstęp do statystyki matematycznej

Informatyka, studia I stopnia (profil ogólnoakademicki) - wersja

2

Opis programu OpiekunNET. Historia... Architektura sieciowa

Wykład z Technologii Informacyjnych. Piotr Mika

Opracował: Jan Front

Instrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs.

Jednostki informacji. Bajt moŝna podzielić na dwie połówki 4-bitowe nazywane tetradami (ang. nibbles).

Opis efektów kształcenia dla programu kształcenia (kierunkowe efekty kształcenia) WIEDZA. rozumie cywilizacyjne znaczenie matematyki i jej zastosowań

1. Wstęp do logiki. Matematyka jest nauką dedukcyjną. Nowe pojęcia definiujemy za pomocą pojęć pierwotnych lub pojęć uprzednio wprowadzonych.

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.

Instytut Technik Innowacyjnych Semantyczna integracja danych - metody, technologie, przykłady, wyzwania

Integracja heterogenicznych źródeł wiedzy z wykorzystaniem logiki opisowej

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Logika Stosowana. Wykład 1 - Logika zdaniowa. Marcin Szczuka. Instytut Informatyki UW. Wykład monograficzny, semestr letni 2016/2017

Analiza i projektowanie obiektowe 2017/2018. Wykład 3: Model wiedzy dziedzinowej

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest

Badania w naukach społecznych

Wykorzystanie standardów serii ISO oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Programowanie deklaratywne

Paradygmaty dowodzenia

Uniwersytet Śląski w Katowicach str. 1 Wydział Nauk Społecznych. Efekty kształcenia

KOMPUTEROWE WSPOMAGANIE ZARZĄDZANIA PROJEKTAMI W PRZEDSIĘBIORSTWIE

Podsumowanie wyników ankiety

Rachunek prawdopodobieństwa projekt Ilustracja metody Monte Carlo obliczania całek oznaczonych

Transkrypt:

Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra InŜynierii Oprogramowania Wojciech Waloszek Metody strukturalnej analizy ontologii opartych na logice opisowej Rozprawa doktorska Promotor: dr hab. inŝ. Krzysztof Goczyła, prof. nadzw. Politechniki Gdańskiej Gdańsk, 2007

Spis treści Oznaczenia i skróty stosowane w pracy...4 Rozdział 1. Wprowadzenie...5 1.1 Zarządzanie a wiedza...5 1.2 Wiedza a zarządzanie...6 1.3 Informatyczny system zarządzania wiedzą...7 1.4 Ontologie oparte na logice opisowej...8 1.5 Semantyczny Internet...8 1.6 Zakres, motywacje i cele pracy...11 1.7 Struktura dalszej części pracy...13 Rozdział 2. Podstawy teoretyczne wybranych metod reprezentacji wiedzy...14 2.1 Wprowadzenie...14 2.2 Interpretacja w logice formalnej...14 2.3 Logika opisowa...17 2.3.1 Wprowadzenie...17 2.3.2 Model świata i baza wiedzy w logice opisowej...18 2.3.3 Problemy wnioskowania w logice opisowej...22 2.3.4 ZałoŜenie świata otwartego...26 2.3.5 Dialekty i rozszerzenia logiki opisowej...29 2.3.6 Zaawansowane problemy wnioskowania w logice opisowej...35 2.4 RDF i OWL, czyli grafy w Semantycznym Internecie...37 Rozdział 3 Algorytmy wnioskowania z ontologii opartych na logice opisowej...43 3.1 Wprowadzenie...43 3.2 Metoda wnioskowania strukturalnego...43 3.3 Algorytmy tableau...47 Rozdział 4 Metoda kartograficzna...55 4.1 Wprowadzenie...55 4.2 Podstawy metody kartograficznej...56 4.3 Formalizm kartografii wiedzy...62 4.4 Algorytmy tworzenia mapy konceptów...75 4.4.1 Algorytm ATMK...77 4.4.2 Algorytm ATMK-OBDD...86 4.4.3 Algorytm TreeFusion...95 2

4.5 Osobniki na mapie konceptów...100 4.6 Podsumowanie...105 Rozdział 5 Praktyczne aspekty wykorzystania metody kartograficznej...106 5.1 Wprowadzenie...106 5.2 Projekt i system PIPS...106 5.3 System KASEA...108 5.3.1 Struktura bazy danych systemu KASEA...109 5.3.2 Ładowanie terminologii...113 5.3.3 Obsługa rozkazów typu Tell...115 5.3.4 Obsługa rozkazów typu Ask...116 5.4 Wnioskowanie niestandardowe w systemie KASEA...119 5.5 Podsumowanie...122 Rozdział 6 Rozszerzenia i inne zastosowania metody kartograficznej...123 6.1 Wprowadzenie...123 6.2 Rozszerzenia metody kartograficznej...123 6.2.1 Dziedziny konkretne...123 6.2.2 Aktualizacja baz wiedzy...127 6.2.3 Sygnatury rozszerzone i hierarchiczne...128 6.3 Wykorzystanie metody kartograficznej...134 6.4 Podsumowanie...136 Rozdział 7 Podsumowanie...137 Podziękowania...138 Literatura...139 3

Oznaczenia i skróty stosowane w pracy Z P(Z) moc zbioru Z zbiór potęgowy zbioru Z,, \ suma, iloczyn i róŝnica zbiorów iloczyn kartezjański zbiorów /, -, operacje logicznej sumy, iloczynu i negacji w,, ~ operacje sumy, przecięcia i negacji sygnatury (def. 4.2) [x y] Õ Ÿ przedział liczb całkowitych od x do y włącznie zbiór liczb naturalnych (bez zera) zbiór liczb całkowitych zbiór liczb rzeczywistych zbiór wartości boolowskich {0,1} T N C zbiór konceptów atomowych terminologii T (def. 4.4) T N R zbiór ról atomowych terminologii T (def. 4.4) T N E rozszerzony zbiór kwantyfikacji egzystencjalnych terminologii T (def. 4.5) T N K zbiór konceptów kartograficznych terminologii T (def. 4.6) K N I zbiór nazw osobników bazy wiedzy K (def. 4.13) CLC(T) dialekt kartograficzny dla terminologii T (def. 4.6) C(CLC(T)) zbiór konceptów moŝliwych do wyraŝenia za pomocą dialektu kartograficznego dla terminologii T (def. 4.6) ATMK Algorytm tworzenia mapy konceptów (punkt 4.4.1) OBDD uporządkowany binarny diagram decyzyjny (ang. Ordered Binary Decision Diagram; def. 4.15) RDF Resource Description Framework (punkt 2.4) OWL Web Ontology Language (punkt 2.4) DL logika opisowa (ang. description logics; punkt 2.3) 4

Rozdział 1. Wprowadzenie Niniejszą pracę doktorską zaliczyć moŝna do prac związanych z technicznym nurtem zarządzania wiedzą. Praca skupia się na wykorzystaniu ontologii opartych na logice opisowej (zwanej takŝe w rodzimej literaturze logiką deskrypcyjną) i proponuje nową metodę wewnętrznej reprezentacji wiedzy w nich zawartej wraz z zestawem operujących na niej algorytmów. Zaproponowana metoda i algorytmy mogą być wykorzystane przez informatyczny system zarządzania wiedzą, a w szczególności moduł wnioskujący i repozytorium, do przechowywania wiedzy i uzupełniania jej o nowe wnioski. Następujące wprowadzenie zarysowuje tło dla pracy poprzez wyjaśnianie kolejnych terminów wprowadzonych w ramach pierwszego akapitu. Poprowadzone rozwaŝania dadzą nam materiał do ukazania motywacji i celów autora. Wprowadzenie zakończone jest sformułowaniem tezy niniejszej pracy, a takŝe opisem struktury jej dalszej części. 1.1 Zarządzanie a wiedza Encyklopedyczne definicje zarządzania wiedzą kładą nacisk na jego nurt organizacyjny, postrzegając je jako część szeroko pojmowanego zarządzania organizacją. W ramach zarządzania wiedzą wyróŝnia się zadania obejmujące najczęściej: pozyskiwanie, przechowywanie, wykorzystywanie, a takŝe upowszechnianie wiedzy i dzielenie się nią. Takie ujęcie zagadnienia potraktowane jest teŝ jako wyjściowe w kompendium Handbook on Knowledge Management pod redakcją Clyde a Holsapple a [Hol03a]. W otwierającym rozdziale [BB03] tejŝe pracy podkreślona jest waga zarządzania wiedzą dla współczesnej organizacji. Jesteśmy w trakcie burzliwie przebiegającej rewolucji informacyjnej. Rewolucja ta wymusiła odejście od tradycyjnego modelu organizacji, w ramach którego wiedza była własnością jedynie warstwy zarządzającej i stanowiła jeden z atrybutów jej autorytetu [BB03]. Burzliwy rozwój technologii komunikacyjnych i informacyjnych w latach osiemdziesiątych i dziewięćdziesiątych XX wieku połączony z napływem nowej wiedzy pochodzącej z odkryć naukowych spowodował zmianę warunków funkcjonowania organizacji. Dotychczasowa struktura okazała się niewystarczająca, a organizacje stanęły przed wyborem restrukturyzacji albo upadku. Te, które przetrwały, rozpoczęły, według autorów [BB03], drogę ku organizacji informacyjnej. Cechą takiej organizacji będzie nacisk na uczenie się: pozyskiwanie wiedzy i jej efektywne wykorzystanie, dzięki czemu uzyska ona zdolność adaptacji do szybko zmieniającego się środowiska. Jedynie takie organizacje będą w stanie sprostać wymogom trudnej konkurencji. Przytoczona argumentacja podkreśla wagę wyzwań dotyczących technicznego nurtu zarządzania wiedzą. Nurt ten kładzie nacisk na wspomagane komputerowo technologie przetwarzania wiedzy tak, aby wspierać wykonywanie zadań wyróŝniane w ramach aspektu organizacyjnego. Szereg technik pokrywanych przez ten nurt obejmuje na przykład: wydobywanie wiedzy (ang. data mining) i analizę danych zawartych w bazach danych OLAP. Najnowsze technologie są oczywiście inspirowane dynamicznym rozwojem globalnej sieci i związane są z inicjatywą Semantycznego Internetu (ang. Semantic Web) [BHL01] opisaną w dalszej części niniejszego wprowadzenia. Kiedy w dalszej części pracy uŝywać będziemy terminu zarządzanie wiedzą będziemy mieli na myśli nurt techniczny. Trzeba jednak zgodzić się z autorami [Hol03b], którzy twierdzą, Ŝe wymienione nurty zarządzania wiedzą (organizacyjny i techniczny), chociaŝ często bywają sobie przeciwstawiane, nie mogą wzajemnie bez siebie istnieć i nieustannie się przenikają. 5

1.2 Wiedza a zarządzanie Kolejnym terminem wykorzystanym w pierwszym akapicie niniejszej pracy jest samo pojęcie wiedzy. ChociaŜ pojęcie to często rozumie się intuicyjnie, sformułowanie jego definicji jest zadaniem bardzo trudnym. Wikipedia [Wiki] pisze wprost: wiedza to termin uŝywany powszechnie i przez wszystkich, ale dotychczas nie posiada jeszcze ogólnie uznanej definicji. Rysunek 1.1 przedstawia często stosowany w informatyce podział na dane, informację i wiedzę [Hol03b][Gocz07]. Intencją tego podziału jest ukazanie, Ŝe wiedza jest czymś więcej i posiada pewne atrybuty niedostępne informacjom lub danym. Linie podziału pomiędzy wyróŝnionymi pojęciami moŝna poprowadzić róŝnie. Dane zazwyczaj uwaŝa się za odizolowane obserwacje, informacje to dane ustrukturalizowane, zaś wiedza to informacja zdatna do wykorzystania do wykonania pewnego zadania. Rys. 1.1. Wiedza jako informacja na wyŝszym poziomie (źródło: [Hol03b]). Krytycy opisanego podziału często wskazują na jego niekonkretność i nieścisłość. To, co uznamy za dane, a co za informacje, zaleŝy od przyjętej perspektywy badawczej i załoŝonego kontekstu. W rezultacie pojęcia te często (równieŝ w pozostałych rozdziałach niniejszej pracy) stosowane są zamiennie. Podział ten wskazuje jednak na istotną cechę wiedzy: jej uŝyteczność oraz kładzie nacisk na konieczność włoŝenia dodatkowego wysiłku w uczynienie danych i informacji uŝytecznymi dla zewnętrznego uŝytkownika. Inne spojrzenie na wiedzę ukazuje dane i informacje jako róŝne jej aspekty, wyróŝniając dodatkowo inne pojęcia wiązane potocznie z wiedzą: informację ustrukturalizowaną, wgląd, osąd i decyzję (rys. 1.2). Perspektywa ta przenosi wiedzę na inny poziom znaczeniowy niŝ informację i traktuje ją raczej jako całościowy proces transformacji danych w stronę form potencjalnie coraz bardziej uŝytecznych dla podejmowanych działań. Rys. 1.2. Wiedza jako progresja stanów (źródło: [Hol03b]). Z punktu widzenia niniejszej pracy oba spojrzenia na wiedzę są uŝyteczne. Nowoczesny system zarządzania wiedzą (a takŝe informatyczny system zarządzania wiedzą wspierający organizację) musi brać pod uwagę aspekty obydwu opisanych reprezentacji. Przede wszystkim nacisk kładziony musi być na uŝyteczność wyników produkowanych przez system. Aby informacje uczynić przydatnymi, konieczny jest dodatkowy wysiłek włoŝony w przetwarzanie informacji. Z kolei dochodzenie do wiedzy to proces wieloetapowy, obejmujący wiele czynności, na który naleŝy patrzeć całościowo. 6

1.3 Informatyczny system zarządzania wiedzą Informatyczny system zarządzania wiedzą powinien wspomagać róŝne aspekty jej wykorzystania: pozyskiwanie, przechowywanie, wykorzystywanie, a takŝe upowszechnianie wiedzy i dzielenie się nią. Zręby ogólnej architektury takiego systemu przedstawione są na rysunku 1.3. Rys. 1.3. Ogólna architektura systemu zarządzania wiedzą (opracowano na postawie: [Hol03a], [GGWZ04], [SS04]). W ramach takiego systemu dane są pozyskiwane z róŝnych (w tym zewnętrznych) źródeł danych. Za ujednolicenie tych danych na poziomie struktury (syntaktycznym) odpowiada podsystem pozyskiwania danych. Podsystem wspierający uŝycie wiedzy ma róŝnorodne zadania obejmujące m.in.: zarządzanie schematem przetwarzanej wiedzy, wyraŝonym np. w postaci pewnego systemu pojęciowego, wnioskowanie, czyli uzupełnianie zgromadzonych informacji o informacje z nich wynikające, ale nie podane wprost, zarządzanie przechowywaniem gromadzonej wiedzy w repozytorium oraz obsługę zapytań wystosowanych w stosunku do gromadzonej wiedzy. ZauwaŜmy, Ŝe przedstawiona ogólna architektura systemu jest zgodna z obydwoma zaprezentowanymi spojrzeniami na wiedzę. Zadaniem systemu jest stopniowe zwiększanie uŝyteczności pozyskiwanych danych i informacji. MoŜna powiedzieć, Ŝe źródła zawierają dane (pojedyncze obserwacje) strukturalizowane do postaci informacji przez podsystem pozyskiwania danych i czynione uŝyteczną wiedzą przez podsystem wspierający uŝycie wiedzy poprzez uzupełnianie ich w procesie wnioskowania i udostępnianie odpowiedzi na zapytania uŝytkownikom. Takie ukierunkowane na transformacje spojrzenie podkreśla znaczenie reprezentacji wiedzy stosowanej na róŝnych poziomach systemu. Od niej zaleŝy zdolność systemu do gromadzenia danych, wnioskowania oraz dostatecznie wydajnego udzielania odpowiedzi. Artykuł [GZ06] dzieli metody reprezentacji zgrubnie na ontologiczne i regułowe (tj. wyraŝone w postaci reguł). Obecnie na znaczeniu zyskują ontologiczne metody reprezentacji wiedzy. Ontologia jest pojęciem, którego źródeł naleŝy doszukiwać się w staroŝytnej Grecji, 7

a jego oryginalnym znaczeniem jest nauka (logos) o bycie (ontos). W filozofii z kolei ontologia stanowi jeden z trzech głównych (obok epistemologii traktującej o poznaniu i aksjologii o normach moralnych) działów tej nauki, dział opisujący świat, który nas otacza, czy teŝ teorię bytu (siedem bardziej precyzyjnych definicji ontologii z punktu widzenia filozofii moŝna znaleźć w [Hem89]). W bardziej potocznym, a zarazem bardziej zbliŝonym do informatycznego, ujęciu ontologia oznacza kategoryzację bytów wyróŝnionych w ramach pewnej dziedziny zainteresowań i wyznaczenie powiązań pomiędzy wyróŝnionymi kategoriami. Gruber [BMNP03] określa ontologię jako specyfikację konceptualizacji, czyli jawnie wyspecyfikowany podział pojęciowy danej dziedziny wiedzy. Definicja ta ulega doprecyzowaniu w ramach konkretnych ontologicznych reprezentacji wiedzy, do których [GZ06] zalicza: ramy Mińskiego, sieci semantyczne i ontologie oparte na logice opisowej. Właśnie te ostatnie, głównie ze względu na ich związek z inicjatywą Semantycznego Internetu (ang. Semantic Web), są, z punktu widzenia niniejszej pracy, najbardziej interesujące. 1.4 Ontologie oparte na logice opisowej Ontologie oparte na logice opisowej [BMNP03] stanowią jeden z zasadniczych elementów podstaw teoretycznych niniejszej pracy. Jako takie są znacznie szerzej opisane w rozdziale drugim. Dla zachowania spójności wywodu prezentowanego we wprowadzeniu konieczne jest przedstawienie kilku zasadniczych terminów z dziedziny logiki opisowej. Logiki opisowej uŝywamy do opisu dziedziny zainteresowań, zwanej uniwersum. Sam opis dziedziny zainteresowań moŝemy nazwać ontologią. Ontologia w logice opisowej dzieli się na dwie części: terminologię (zbiór aksjomatów) i opis świata (zbiór asercji). Terminologia (TBox) wyszczególnia pojęcia, które mogą być uŝyte do opisu uniwersum; określa teŝ związki pomiędzy pojęciami w formie aksjomatów. Aksjomaty te mają ściśle sformalizowaną formę i, w zaleŝności od dialektu logiki opisowej, mogą wyraŝać róŝne treści; na przykład: kaŝdy Polak jest Europejczykiem (Polak i Europejczyk to pojęcia). Opis świata (ABox) przyporządkowuje elementy uniwersum (zwane osobnikami bądź indywiduami) poszczególnym pojęciom (w postaci asercji unarnych, np. Wojciech jest Polakiem) i pokazuje powiązania pomiędzy osobnikami za pomocą relacji binarnych (Magda kocha Wojciecha). 1.5 Semantyczny Internet Nieocenionym źródłem informacji jest w obecnej dobie Internet. Zawiera on dziesiątki miliardów stron, a codziennie tworzone są miliony nowych. MoŜliwość wykorzystania dowolnej strony Internetu jako źródła danych dla systemu zarządzania wiedzą jest potencjalnie bezcenna. Nadzieję na stworzenie takiej moŝliwości daje inicjatywa Semantycznego Internetu, czy teŝ Sieci Semantycznej (ang. Semantic Web). Zmierza ona do uczynienia zasobów sieci Internet czytelnymi dla komputerów (ang. machine-readable). MoŜliwość wykorzystania komputerowej analizy treści dokumentów w sieci wyniesie korzystanie z jej zawartości na zupełnie nowy poziom. Tim Berners-Lee, twórca sieci WWW, dyrektor W3C i gorący orędownik inicjatywy Semantycznego Internetu, w wywiadzie [Upd05] wypowiada się następująco: Google doskonale pomaga ludziom odnajdywać róŝne rzeczy, tak! Ale ułatwienie odnajdywania róŝnych rzeczy to nie to samo, co korzystanie z Semantycznego Internetu. Semantyczny Internet polega na tworzeniu czegoś nowego na podstawie danych, które sami wprowadziliśmy, czy teŝ łączeniu tego z woluminami danych ( ) z innych źródeł, by dokonać nowych odkryć!. 8

Rys. 1.4. Warstwowa struktura Semantic Web (opracowano na podstawie: [SemWeb]). Główną ideą Semantycznego Internetu jest wzbogacenie dokumentów o dodatkowy opis ich znaczenia pozwalający komputerowi na wykorzystanie ich treści w swoim przetwarzaniu. Nie mamy więc uczyć komputerów rozumienia treści dokumentów, a sami, wkładając dodatkowy wysiłek, formułujemy i dodatkowo opisujemy je w sposób dla komputera zrozumiały. Warstwową strukturę zagadnień i standardów związanych z tworzącą się Semantycznym Internetem przedstawia rysunek 1.4. U podłoŝa leŝy warstwa standardów kodowania i identyfikowania informacji w Internecie. Unicode ujednolica dokumenty pod względem standardu kodowania, natomiast standard URI (ang. Universal Resource Identifer) pozwala na jednoznaczne określanie adresów sieciowych zasobów (i sposobu dostępu do nich) i jest tym, co, według [Her06], łączy Semantyczny Internet z Internetem. Zasoby pod względem syntaktycznym ujednolica standard XML, pozwalający na swobodne kształtowanie układu treści dokumentu w ramach metastruktury wzajemnie zagnieŝdŝonych znaczników wyposaŝonych w atrybuty. Standardowi XML towarzyszą schematy opisujące aplikacje XML, czyli klasy dokumentów stworzonych przez uŝytkowników na ich potrzeby, oraz inne standardy, takie jak przestrzenie nazw (dla unikania konfliktów pomiędzy uŝytkownikami Sieci) oraz XPointer czy XPath pozwalające na określanie części dokumentów XML jako pojedynczych zasobów. Wymienione warstwy ujednolicają sposoby dostępu i syntaktycznej analizy dokumentów sieciowych. Zasadnicze elementy opisujące znaczenie rozpoczynają się od trzeciej warstwy od dołu, czyli standardu RDF. RDF (opisywany szerzej w rozdziale 2) umoŝliwia formułowanie prostych stwierdzeń dotyczących zasobów sieciowych, w postaci tzw. trójek (ang. triples). Trójki te mają postać <podmiot, orzeczenie, dopełnienie>, przy czym za kaŝdy element trójki podstawiamy pewien zasób sieciowy. W ramach standardu RDF moŝna takŝe tworzyć własne zestawy pojęć (klas) i relacji (orzeczeń), tworząc tzw. schemat RDF. ZbliŜa to RDF do logiki opisowej, jako Ŝe pozwala na formułowanie asercji (binarnych wprost, unarnych gdy za podmiot podstawiamy indywidualny obiekt, za orzeczenie relację przynaleŝenia, a za dopełnienie klasę), a takŝe prostych aksjomatów (za podmiot i za dopełnienie podstawiamy klasy). Ujednolicenia RDF z logiką opisową (a konkretnie pewnym jej dialektem) dokonuje obecny w kolejnej warstwie język OWL (ang. Web Ontology Language) słuŝący do formułowania ontologii. Dzięki niemu moŝliwe jest formułowanie bardziej złoŝonych zaleŝności pomiędzy pojęciami w formie bardziej zaawansowanych aksjomatów. 9

Rys. 1.5. Uproszczona architektura aplikacji Semantycznego Internetu (opracowano na podstawie: [SemWeb]). Kolejna warstwa, warstwa logiki (Logic), pozwala na wyciąganie wniosków na podstawie zgromadzonych informacji. Znaczną część reguł logicznych moŝna zapisać wprost w RDF i w ontologiach OWL [Ber98]. Wnioskowanie na podstawie ontologii polega na uzupełnianiu jej o nowe asercje i aksjomaty wynikające z juŝ sformułowanych. OWL-DL daje uŝytkownikom Semantycznego Internetu szeroki zakres konstrukcji słuŝących do budowania aksjomatów odpowiadających ekspresyjnemu dialektowi logiki opisowej SHOIN(D). Semantyczny Internet przewiduje moŝliwość, Ŝe w konkretnych zastosowaniach zakres zaleŝności logicznych opisywanych przez OWL moŝe okazać się niewystarczający. Wówczas warstwę logiczną moŝna rozbudować o dodatkowe reguły obejmujące np. logikę probabilistyczną. W szczególności uŝytkownikowi moŝe zaleŝeć na dowodach wyprowadzonych wniosków, czemu słuŝy umieszczona nad warstwą logiczną warstwa dowodów (Proof). Dowody te mogą słuŝyć budowie infrastruktury zaufania, pokrywanej przez kolejną warstwę (Trust), jako Ŝe zagadnienie zaufania do pozyskanej i wywnioskowanej informacji jest kluczowe dla wielu zastosowań Sieci Semantycznej. Podsumowując i wiąŝąc opis inicjatywy Semantycznego Internetu z wcześniejszymi rozwaŝaniami, moŝemy powiedzieć, Ŝe kolejne jego warstwy dostarczają standardów ułatwiających pozyskiwanie, uŝywanie i publikowanie informacji. Warstwy niŝsze ujednolicają kodowanie i syntaktykę dokumentów, a warstwy RDF i OWL dają moŝliwość opisu znaczenia informacji poprzez umiejscowienie jej w pewnym systemie pojęciowym. Sam system pojęciowy ma swoją wewnętrzną strukturę wiąŝącą zasadami logicznymi wyróŝnione pojęcia, dzięki czemu moŝliwe jest wnioskowanie czyli wyprowadzanie nowych stwierdzeń na podstawie istniejących, Architekturę aplikacji Semantycznego Internetu przedstawia rysunek 1.5. Na rysunku 1.5 połoŝono nacisk na przepływ informacji. Zagadnienie pozyskiwania i upowszechniania wiedzy jest ułatwione dzięki opracowywaniu i ujednolicania odpowiednich systemów pojęciowych (które to zadania wspomaga inŝynieria ontologii). Wykorzystywanie wiedzy to domena agentów autonomicznych programów skupiających się na wykonaniu pewnego 10

zadania. Agenty w zadaniu odpowiedniego wykorzystania wiedzy wspomaga moduł wnioskujący, którego zadanie jest szczególne, gdyŝ polega ono na produkowaniu nowych informacji na podstawie juŝ pozyskanych, czyli uŝywając przytoczonych słów Tima Bernesa-Lee czynienie odkryć. Przetworzone wyniki są prezentowane uŝytkownikom i systemom korzystającym z usług agentów. 1.6 Zakres, motywacje i cele pracy Przedstawione dotychczas zagadnienia uzasadniają, w nadziei autora, waŝność podejmowanego zakresu prac. W niniejszej rozprawie autor skupia się na wnioskowaniu ze zgromadzonej wiedzy. Moduły wnioskujące pełnią waŝną rolę w systemach zarządzania wiedzą, pozwalając na wszechstronne wykorzystanie gromadzonej informacji. Szczególnego znaczenia nabiera ich wykorzystanie w środowisku Internetu, gdzie poszukiwana informacja jest często rozproszona, przedstawiana z róŝnych punktów widzenia i fragmentaryczna. W pracy skupiono się na wnioskowaniu z ontologii opartych na logice opisowej. Ograniczenie to podyktowane jest faktem, Ŝe ontologie te stanowią zasadniczy element inicjatywy Semantic Web i moŝna spodziewać się, Ŝe ich uŝycie będzie się upowszechniać. Kwestie wnioskowania z ontologii opartych na logice opisowej są przedmiotem intensywnych badań, a ich owocem stały się prototypowe narzędzia wnioskujące. Jednak istniejące metody i narzędzia oraz powstające z ich zastosowaniem systemy zarządzania wiedzą wciąŝ wykazują niedojrzałość w zastosowaniach praktycznych. W ramach badań stanowiących przygotowanie do niniejszej pracy przeanalizowano narzędzia: Jena [CDD03], FaCT [Hor98] oraz Racer [HM01]. Wymienione systemy reprezentują przekrój trendów w rozwoju przetwarzania ontologii opartych na logice opisowej: Jena jest narzędziem przetwarzania trójek RDF rozwijanym przez firmę Hewlett-Packard, natomiast FaCT oraz Racer do wnioskowania wykorzystują zoptymalizowane wersje algorytmów tablicowych (ang. tableau algorithm). Zasadniczym niedostatkiem tych systemów okazała się przede wszystkim zła skalowalność, rozumiana jako wydajność systemu w funkcji liczby przechowywanych osobników (patrz teŝ wyniki testów w rozdziale 5). W niniejszej pracy podjęto próbę przełamania ograniczeń istniejących modułów wnioskujących. Jako drogę do tego celu zaproponowano wykorzystanie nowej metody wewnętrznej reprezentacji wiedzy ułatwiającej wnioskowanie z baz wiedzy zawierających duŝą liczbę osobników. Aby wyjaśnić pojęcie wewnętrznej reprezentacji wiedzy, sięgniemy najpierw do pozycji [Sow00], w której John F. Sowa przytacza następujące pryncypia dotyczące reprezentacji wiedzy: 1. Reprezentacja wiedzy jest surogatem rzeczywistego świata. Fizyczne obiekty, które nie mogą być przeniesione do wnętrza komputera, są tam reprezentowane przez symbole. 2. Reprezentacja wiedzy to szereg uzgodnień ontologicznych. Ontologie reprezentują wyróŝnione kategorie obiektów, które istnieją lub mogą istnieć w rzeczywistej dziedzinie zainteresowań. 3. Reprezentacja wiedzy to fragmentaryczna teoria inteligentnego wnioskowania. Reprezentacja wiedzy dostarcza opisu interakcji pomiędzy obiektami w uniwersum. Opis ten konstytuuje teorię dziedziny zainteresowań, niezaleŝnie od tego czy jest on skompilowany w ramach binariów programu komputerowego, czy wyraŝony w postaci aksjomatów. 11

4. Reprezentacja wiedzy jest medium dla efektywnego przetwarzania komputerowego. Oprócz reprezentowania wiedzy inteligentny program musi zakodować wiedzę w formie umoŝliwiającej efektywne przetwarzanie. 5. Reprezentacja wiedzy jest medium dla wyraŝania myśli przez człowieka. Dobry język reprezentacji wiedzy stanowi pomost pomiędzy ekspertami dziedzinowymi, inŝynierami aplikacji i komputerami. OWL (a takŝe RDF), jako standard reprezentowania wiedzy, dobrze stosuje się do zasad 1 3 spośród prezentowanych powyŝej. Jednak postulaty 4 i 5 nie powinny być traktowane jako spełnione przez standard jako taki. Wewnętrzna reprezentacja wiedzy jest ukierunkowana na spełnienie reguły 4. Według opinii autora, do reprezentowania wiedzy wewnątrz systemu wnioskującego nie trzeba wykorzystywać podstawowych struktur OWL-a lub logiki opisowej, czyli trójek (tak jak w Jenie) czy teŝ aksjomatów i asercji (tak jak w Racerze i Fakcie). Wykorzystanie specjalnie dobranych struktur ułatwiających wnioskowanie i przechowywanie wniosków moŝe znacznie poprawić parametry wydajnościowe systemów wnioskujących. Ostateczna forma tych struktur powinna być zaleŝna od specyfiki przetwarzanej ontologii, jako Ŝe przestrzenie wniosków dla róŝnych ontologii mogą być zasadniczo róŝne. Dodatkowo, co udowadniamy w niniejszej pracy, odpowiedni dobór struktury moŝe poprawić takŝe parametry jakościowe systemów wnioskujących rozumiane jako zakres oferowanych moŝliwości wnioskowania i zadawania zapytań. Polepszenie to nastąpi ze względu na fakt, Ŝe wykonanie niektórych operacji na wiedzy wyraŝonej za pomocą wewnętrznej reprezentacji stanie się znacznie ułatwione. Proponowane przez autora rozwiązanie bazuje na opracowanym sposobie wewnętrznej reprezentacji wiedzy w ramach systemu wnioskującego, nazwanym reprezentacją kartograficzną. Reprezentacja ta pozwala na efektywne wykorzystanie baz danych do przechowywania i, przede wszystkim, przetwarzania gromadzonej wiedzy. W sposób istotny odróŝnia ją to od innych metod reprezentacji wiedzy, bazujących na przetwarzaniu struktur w pamięci operacyjnej komputera, a więc niedostatecznie skalowalnych. Reprezentacja ta bazuje na strukturalnej analizie ontologii. Analiza strukturalna, polegająca na badaniu charakterystycznych cech przetwarzanych ontologii, słuŝy do automatycznego wyznaczania wartości zmiennych parametrów reprezentacji wiedzy, umoŝliwiając efektywne przechowywanie wniosków i dostęp do nich. Dzięki temu dostępna przestrzeń wniosków jest ograniczana do tych praktycznie przydatnych. Przeprowadzona analiza pozwala na wyprowadzanie nowych wniosków i wykonywaną na bieŝąco konwersję wiedzy z reprezentacji wewnętrznej na zewnętrzną i odwrotnie. Proponowany zestaw technik i algorytmów nazwano łącznie metodą kartograficzną. Całość powyŝszych rozwaŝań doprowadza nas do sformułowania głównej tezy niniejszej rozprawy doktorskiej: Teza 1: Poprzez zastosowanie zaproponowanych w rozprawie metod strukturalnej analizy ontologii moŝliwe jest polepszenie parametrów jakościowych i ilościowych systemów zarządzania wiedzą dla szerokiej klasy ontologii spotykanych w praktyce. 12

Ta główna teza wspierana jest przez poniŝsze tezy pomocnicze: Teza 2: Przy uŝyciu strukturalnych metod analizy ontologii moŝliwe jest efektywne wyznaczenie formy wewnętrznej reprezentacji wiedzy ukierunkowanej na przyspieszenie procesu wnioskowania. Teza 3: Opracowany zestaw metod operujących na wyznaczonej reprezentacji wiedzy pozwala na uzyskanie lepszej skalowalności (rozumianej jako wydajność w funkcji liczby przechowywanych osobników) w stosunku do istniejących systemów. Teza 4: Opracowany zestaw metod operujących na wyznaczonej reprezentacji wiedzy moŝe być zaadaptowany do udzielania odpowiedzi na zapytania o większej ekspresywności niŝ zapytania obsługiwane przez większość istniejących systemów wnioskujących. Tezy te zostaną udowodnione w dalszym ciągu rozprawy. 1.7 Struktura dalszej części pracy Dalsza część pracy ustrukturalizowana jest następująco. W rozdziałach 2 i 3 przedstawiono podstawy teoretyczne, na których opiera się dalsza część pracy. W rozdziale drugim przybliŝono Czytelnikowi logikę opisową oraz język OWL. W rozdziale trzecim skoncentrowano się na istniejących rozwiązaniach stosowanych w systemach wnioskujących. Rozdziały 4 i 5 stanowią zasadniczą część pracy. Rozdział czwarty koncentruje się na teoretycznej stronie metody kartograficznej, zaś rozdział piąty na wykorzystaniu jej w praktyce, szczegółach implementacyjnych, przedstawia takŝe wyniki testów. W rozdziale 6 opisano istniejące zastosowania metody kartograficznej oraz rozszerzenia pozwalające na wykorzystanie jej w innych dziedzinach zarządzania wiedzą. Rozdział 7 stanowi podsumowanie rozprawy. 13

Rozdział 2. Podstawy teoretyczne wybranych metod reprezentacji wiedzy 2.1 Wprowadzenie Niniejszy rozdział opisuje wybrane zagadnienia z dziedziny logiki i reprezentacji wiedzy, stanowiące zasadniczą podstawę teoretyczną, na której opiera się niniejsza praca doktorska. Kluczowym pojęciem uŝywanym w ramach stosowanych przez autora narzędzi matematycznych jest interpretacja. Krótki podrozdział wprowadzający ma za zadanie naświetlić rolę tego pojęcia w klasycznej logice pierwszego rzędu. Zasadniczym celem tego podrozdziału jest umieszczenie dyskusji w szerszym kontekście i pokazanie, Ŝe część terminów definiowanych później ma znaczenie szersze, nie ograniczone jedynie do konkretnego formalizmu. Główną część niniejszego rozdziału stanowi wprowadzenie do logiki opisowej. Logika opisowa wykorzystywana jest przez autora jako narzędzie reprezentacji ontologii oraz źródło precyzyjnych definicji podstawowych problemów przetwarzania wiedzy. Ostatni podrozdział ma za zadanie zapoznać Czytelnika z nowoczesnymi językami reprezentowania wiedzy RDF i OWL wykorzystywanymi w ramach Semantycznego Internetu. Szczególny nacisk połoŝono na pokazanie związku pomiędzy tymi językami a logiką opisową. Związek ten pozwala na wykorzystanie metod wnioskowania i reprezentacji wiedzy opartych na logice opisowej w ramach toczących się obecnie szeroko zakrojonych prac nad systematyzowaniem wiedzy zawartej w Internecie i czynieniu jej czytelnej dla komputerów. 2.2 Interpretacja w logice formalnej Człowiek do reprezentowania swojej wiedzy posługuje się najczęściej językiem naturalnym. Zdanie wyraŝające pewną wiedzę, którą dysponuje konkretny człowiek moŝe wyglądać następująco: Kowalski jest doktorem. (2.1) Zdania wyraŝone w języku naturalnym mają jednak oczywistą tendencję do braku precyzji w stopniu wystarczającym do uczynienia ich obiektem przetwarzania komputerowego. Zastanawiając się nad rozpatrywanym zdaniem, moŝna wysunąć szereg wątpliwości: czy autor wypowiedzi ma na myśli, Ŝe kaŝdy człowiek o nazwisku Kowalski jest doktorem? Posługując się terminami logiki, czy Kowalski jest nazwą generalną (obejmującą zbiór obiektów) czy nazwą indywidualną (obejmującą pojedynczy obiekt)? Czy autor poprzez słowo doktor ma na myśli lekarza (jak często zakłada wiele osób starszych lub mieszkających w wiejskich rejonach Polski), czy raczej doktora nauk humanistycznych, medycznych lub technicznych? Aby uniknąć powstawania takich wątpliwości, zdanie naleŝy sformalizować zarówno pod względem składni (syntaktyki), jak i doprecyzowania znaczenia poszczególnych elementów zdania (semantyki). Naturalnym kandydatem do przeprowadzenia takiej formalizacji jest rachunek predykatów pierwszego rzędu czasem określany anglojęzycznym symbolem FOL (ang. first order logic). 14

Składnia rachunku predykatów pierwszego rzędu obejmuje nawiasy, symbole operacji logicznych (negacji, koniunkcji, alternatywy itp.), kwantyfikatory, zmienne oraz nazwy predykatów o dowolnej, ale dla kaŝdego predykatu ustalonej, krotności (predykaty o krotności 0 nazywamy stałymi) 1. W takim ujęciu naturalne jest, Ŝe nazwy generalne reprezentujemy poprzez predykaty unarne (o krotności 1), a nazwy indywidualne poprzez stałe. Zdanie (2.1) moŝemy zatem w sposób sformalizowany zapisać następująco: Doktor(Kowalski) (2.2) gdzie Doktor i Kowalski są nazwami predykatów o krotności odpowiednio 1 i 0. Taka formalizacja składni pozwala rozwiać część naszych wątpliwości dotyczących zdania (2.1). Jednak nadal nie dostarcza ona odpowiedzi na pytanie, kogo tak naprawdę uwaŝamy za doktora ani kogo mamy na myśli, odnosząc się do (juŝ wiemy, Ŝe konkretnego) Kowalskiego. W tym celu musimy precyzyjnie określić znaczenie wprowadzonych terminów, a dokonujemy tego poprzez określenie interpretacji, czyli powiązania predykatów z pewną dziedziną zainteresowań światem. ZałoŜenia dotyczące definicji interpretacji w chyba najprostszy sposób przedstawia podręcznik klasyków w dziedzinie wnioskowania i reprezentacji wiedzy Ronalda Brachmana i Hectora Levesque [BL04]: 1. Istnieje pewien świat składający się z obiektów. 2. Kiedy weźmiemy pod uwagę pewien predykat unarny, pewne obiekty będą spełniały ten predykat, a pewne nie. KaŜdemu predykatowi unarnemu przypisujemy zatem pewien podzbiór spełniających go obiektów składających się na świat. Predykatom o krotności n przypisujemy zbiory n-krotek złoŝonych z obiektów składających się na świat. Stałym przypisujemy pojedyncze obiekty. 3. śaden inny aspekt świata nie ma znaczenia. Posługując się tymi załoŝeniami moŝemy sformalizować interpretację I jako parę obejmującą dziedzinę, czyli zbiór elementów świata, I oraz powiązania interpretacyjne określane symbolem I przypisujące poszczególnym predykatom odpowiednie zbiory n-krotek złoŝonych z obiektów składających się na świat. Przykładową interpretację pokazano poniŝej: Przykład 2.1: Przykładowa interpretacja w FOL: I = {Jan_Kowalski, Jerzy_Wiśniewski, Jacek_Nowak} Kowalski I = Jan_Kowalski (2.3) Doktor I = {Jan_Kowalski, Jacek_Nowak} Symbole pisane czcionką maszynową mają za zadanie reprezentować rzeczywistych ludzi, elementy świata, a nie symbole predykatów. Jak widać z powyŝszego przykładu, interpretacja w sposób precyzyjny i formalny określa znaczenie poszczególnych terminów, inaczej mówiąc określa zakresy odpowiednich nazw (generalnych i indywidualnych). 1 Istnieją teŝ inne ujęcia: czasem przyjmuje się np., Ŝe krotność predykatu musi być większa od lub równa 1, zatem stałych nie uznaje się za predykaty, często wyróŝnia się teŝ symbole funkcji, co do których przyjmujemy tutaj, Ŝe wyraŝane są przez specyficzny rodzaj predykatów. 15

Łatwo zauwaŝyć, Ŝe interpretacja (2.3) została sformułowana w taki sposób, Ŝe zdanie (2.2) jest prawdziwe. Po określeniu interpretacji poszczególnych predykatów sprawdzenie poprawności zdania polega na iteracyjnym wykonaniu ściśle określonych operacji wzdłuŝ poszczególnych gałęzi drzewa syntaktycznego. W przypadku zdania (2.2) sprawdzenie jego prawdziwości sprowadza się do stwierdzenia, czy Kowalski I Doktor I. PoniewaŜ tak jest, zdanie (2.2) w interpretacji (2.3) uznajemy za prawdziwe, mówiąc jednocześnie, Ŝe interpretacja (2.3) jest modelem zdania (2.2). MoŜemy oczywiście pomyśleć o wielu interpretacjach będących modelami zdania (2.2). Dziedziną takich interpretacji mogą być mieszkańcy róŝnych polskich miast, z arbitralnie wskazanym Kowalskim będącym doktorem (czasem moŝe to nawet być tytuł wyłącznie honorowy). MoŜemy nawet pomyśleć o modelach zdania (2.2), których dziedziną nie będą prawdziwi ludzie, a np. bohaterowie historii literackich lub nawet przedmioty martwe. W tym sensie faktyczne znaczenie zdań (2.1) i (2.2) zaleŝy wyłącznie od interpretacji (zarówno w znaczeniu potocznym, jak i formalnym). System wnioskujący abstrahuje od faktycznej interpretacji (która moŝe, jak pokazaliśmy, być bardzo róŝna) przetwarzanych przez niego informacji. System taki dysponuje bazą wiedzy (na potrzeby tego rozdziału przyjmiemy, Ŝe baza taka zawiera zbiór zdań logicznych), co do której zakłada, Ŝe zawiera ona wyłącznie zdania prawdziwe. Na ich podstawie jest moŝliwe przeprowadzenie wnioskowania, czyli określenie kolejnego zbioru zdań, co do których wiadomo, Ŝe (przy załoŝeniu prawdziwości bazy wiedzy) są prawdziwe przy dowolnej interpretacji będącej modelem bazy wiedzy. Fakt ten nazywamy wynikaniem 2 pewnego zdania Z z bazy wiedzy (zbioru zdań) KB i zapisujemy następująco: KB Z (2.4) Jeśli załoŝymy, Ŝe nasza baza wiedzy obejmuje zdanie (2.2), to moŝliwe do wywnioskowania zdania Z mogą mieć na przykład postać: Doktor(Kowalski) czy teŝ Doktor(Kowalski) Doktor(Kowalski). Wymienione zdania są prawdziwe w kaŝdej Interpretacji będącej modelem bazy wiedzy KB. Oczywiście przydatność tego typu zdań dla uŝytkownika systemu wnioskującego jest wątpliwa. Praktyczną wartość wysnuwanych wniosków moŝemy radykalnie poprawić, gdy do bazy wiedzy dodamy zdania opisujące pewne ogólne prawa rządzące opisywanymi przez nas światami. Przykładem takiego zdania moŝe być: x ( Doktor(x) OsobaZWyŜszymWykształceniem(x) ) (2.5) Wówczas z bazy wiedzy zawierającej zdania (2.2) i (2.5) wynika (i to niezaleŝnie od tego, jaką interpretację nowego terminu przyjmiemy) zdanie OsobaZWyŜszymWykształceniem(Kowalski), co juŝ niekoniecznie musi być uznane za wniosek trywialny. Wraz ze zwiększaniem się naszej bazy wiedzy wyciągane wnioski stają się coraz bardziej złoŝone i mniej trywialne. Abstrahowanie przez system wnioskujący od faktycznej interpretacji wykorzystywanych przez niego terminów oznacza, Ŝe system nie zna semantyki informacji, na których operuje, a jego działanie sprowadza się do przetwarzania składniowego dostarczanych mu zdań. Pojawia się naturalne pytanie, czy taki system jest w stanie przeprowadzać wnioskowanie w sensie zbliŝonym do tego, który nadajemy temu słowu potocznie, odnosząc je do czynności wykonywanej przez człowieka. Problem ten jest przedmiotem oŝywionej dyskusji, równieŝ, a moŝe przede wszystkim, filozoficznej. Tutaj przytoczymy tylko krótką odpowiedź na tę wątpliwość, jakiej Brachman i Levesque udzielają w [BL04]: 2 Mówiąc bardziej precyzyjnie, definiujemy tutaj fakt wynikania semantycznego [Mar70]. 16

Wnioskowanie oparte na koncepcji wynikania pozwala na wysnuwanie jedynie bezpiecznych wniosków, których prawdziwość gwarantowana jest przez logikę. JednakŜe, jeśli rozpoczniemy od bogatej kolekcji zdań jako przesłanek, kolekcji zawierającej nie tylko stwierdzenia dotyczące indywidualnych obiektów, ale równieŝ wyraŝające powiązania pomiędzy wprowadzanymi terminami, zbiór wniosków stanie się znacznie bogatszy, zbliŝając się tym samym znacznie do zbioru zdań prawdziwych w interpretacji zamierzonej. Dzięki temu wnioskowanie automatyczne staje się zbliŝone do tego, jakiego oczekiwalibyśmy od osoby znającej faktyczne znaczenie terminów, na których operujemy. 2.3 Logika opisowa 2.3.1 Wprowadzenie W ramach poprzedniego podrozdziału do reprezentowana informacji zawartej w bazie wiedzy systemu wnioskującego wykorzystywaliśmy zdania wyraŝone za pomocą rachunku predykatów pierwszego rzędu. Takie podejście ma wiele zalet, obejmujących między innymi precyzję tego typu zdań, a takŝe fakt, Ŝe rachunek predykatów, jako podstawowe narzędzie logiki formalnej, a co za tym idzie podstawa współczesnej matematyki, jest szeroko znany i stosowany w wielu dziedzinach nauki. Jednak jest przynajmniej kilka waŝnych powodów, dla których warto szukać alternatywnych sposobów reprezentowania wiedzy. Jednym z nich jest mała czytelność zdań wyraŝonych w rachunku predykatów. Wraz ze wzrostem złoŝoności konstruowanych zdań odczytanie ich znaczenia staje się coraz trudniejsze. Zadanie analizy przez uŝytkownika zestawu kilkudziesięciu złoŝonych zdań moŝe okazać się bardzo uciąŝliwe. Innym powodem szukania alternatywnych metod jest dąŝenie do uzyskania bardziej zbliŝonych do optymalnych algorytmów automatycznego wnioskowania. Podjęto wiele prób opracowania reprezentacji wiedzy, która byłaby czytelniejsza dla człowieka i lepiej uwzględniała naturalną skłonność rozumu ludzkiego do podziału obiektów świata rzeczywistego na kategorie. Wiele z takich reprezentacji wspomaganych było przez, bądź nawet przyjmowało jako swoją podstawę, pewną formę graficznej reprezentacji zaleŝności pomiędzy wyróŝnianymi kategoriami. Wśród tych reprezentacji naleŝy wymienić ramy Mińskiego [Min85], a takŝe róŝne formy sieci semantycznych, rozwijające się intensywnie w latach 70. XX wieku. W [GZ06] zaklasyfikowano te prace jako wczesne ontologiczne metody reprezentacji wiedzy, czyli reprezentacje, których celem jest dokonanie specyfikacji konceptualizacji, czyli jawnie wyspecyfikowanego podziału pojęciowego danej dziedziny zainteresowań. Pierwsze postaci ram Mińskiego oraz sieci semantycznych charakteryzowały się nie do końca sformalizowanym znaczeniem opisywanych przez nie struktur, co stanowiło zasadniczą przeszkodę w budowie algorytmów wnioskujących. Właśnie próby sformalizowania tych reprezentacji za pomocą języka predykatów dały początek nowej dziedzinie badań logice opisowej [BMNP03] (ang. description logics). Logika opisowa jest narzędziem pod wieloma względami wyjątkowym. Dostarcza ona formalizmu reprezentacji wiedzy bardzo silnie zakorzenionego w tradycyjnej logice formalnej, a jednocześnie wychodzi naprzeciw naturalnej potrzebie kategoryzacji. Nurt badań związany z logiką opisową bardzo mocno podkreśla praktyczne aspekty przetwarzania wiedzy, kładąc nacisk na opracowanie algorytmów wnioskowania i badanie ich właściwości. Właśnie te cechy logiki opisowej sprawiają, Ŝe zyskuje ona na znaczeniu, stając się podstawą wielu standardów i narzędzi. 17

2.3.2 Model świata i baza wiedzy w logice opisowej Formalizm reprezentacji wiedzy w logice opisowej zakłada, Ŝe opisujemy pewną dziedzinę zainteresowań inaczej zwaną uniwersum. Uniwersum składa się z indywidualnych obiektów zwanych osobnikami. Osobniki mogą pozostawać ze sobą w relacjach binarnych. Dzięki moŝliwości nazywania poszczególnych elementów tego świata wprowadzamy do niego pewien porządek. Pojedyncze osobniki moŝemy określać nazwami osobników (nazwami indywidualnymi). MoŜemy takŝe tworzyć nazwy obejmujące swoim zakresem zbiory elementów naszego uniwersum. W ten sposób elementy uniwersum są przypisywane do pewnych pojęć, zwanych w logice opisowej konceptami 3. Podobnie grupę związków pomiędzy parami osobników moŝemy określić pewną nazwą. W ten sposób przypisujemy pary obiektów do pewnej relacji, zwanej w logice opisowej rolą (ang. role). Koncepty i role łącznie określać będziemy jako terminy. Przykładem konceptu prostego moŝe być dowolna nazwa pisana wedle konwencji wielką literą: Człowiek, Kobieta, MęŜczyzna, ObywatelPolski itp. Role proste równieŝ oznaczamy wyrazami bądź grupami wyrazów pisanych konwencjonalnie małą literą, np.: kocha, lubi, szanuje, maojca. Tak samo oznaczamy nazwy osobników, a piszemy je, dla odróŝnienia, kapitalikami: EWA, MAREKNOWAK, GRUCHOT. Podobnie jak w poprzednim podrozdziale, semantykę poszczególnym terminom nadaje interpretacja. Interpretacja I = ( I, I ) określa dziedzinę zainteresowań (zbiór I osobników, na których operujemy) oraz zakresy terminów, przypisując (za pomocą funkcji I ) konceptom zbiory osobników, rolom zbiory par osobników, a nazwom osobników elementy dziedziny. Przykład 2.2: Przykładowa interpretacja terminów w logice opisowej. Podobnie jak w przykładzie 1.1, symbole pisane czcionką maszynową reprezentują rzeczywistych ludzi. I = {Ewa_Kowalska, Jan_Kowalski, Danielle_Smith} Człowiek I = {Ewa_Kowalska, Jan_Kowalski, Danielle_Smith} Kobieta I = {Ewa_Kowalska} MęŜczyzna I = {Jan_Kowalski, Danielle_Smith} (2.6) ObywatelPolski I = {Ewa_Kowalska, Jan_Kowalski} kocha I = { (Ewa_Kowalska, Jan_Kowalski), (Jan_Kowalski, Ewa_Kowalska) } EWA I = Ewa_Kowalska JAN I = Jan_Kowalski DANIELLE I = Danielle_Smith W bazie wiedzy budowanej za pomocą logiki opisowej obok terminów prostych (zwanych teŝ atomowymi, ang. atomic) pojawiają się terminy złoŝone. Terminy złoŝone budowane są z prostych za pomocą specjalnych operatorów logiki opisowej. Przykładem konceptu złoŝonego jest przecięcie konceptów: MęŜczyzna * ObywatelPolski (2.7) 3 Na takie tłumaczenie angielskiego słowa concept zdecydowano się, aby podkreślić sformalizowany charakter terminu koncept, jednocześnie nawiązując do łac. conceptus = pojęcie. 18

Za pomocą takiej konstrukcji wprowadzamy koncept złoŝony, który obejmuje swym zakresem część wspólną zakresów konceptów MęŜczyzna i ObywatelPolski. Interpretacja terminów złoŝonych nie jest dowolna i zaleŝy ściśle od interpretacji terminów wykorzystanych do budowy danego terminu złoŝonego. W przypadku przecięcia jest ona definiowana następująco (C i D są być moŝe złoŝonymi konceptami): (C * D) I = C I D I (2.8) Łatwość budowy nowych terminów na podstawie terminów istniejących jest jedną charakterystycznych cech logiki opisowej. ZauwaŜmy, Ŝe chociaŝ w rachunku predykatów wprowadzenie nowego terminu ObywatelPolski-MęŜczyzna jest moŝliwe, to wymaga wykorzystania bardziej skomplikowanej notacji. Koncentracja na manipulowaniu terminami (czyli opisami) jest uzasadnieniem dla nazwy logiki opisowej (z tego samego powodu ta gałąź wiedzy nosiła teŝ kiedyś nazwę systemów terminologicznych ang. terminological systems [BMNP03][BL04]). To, jakie terminy złoŝone jesteśmy w stanie budować, zaleŝy od zestawu dostępnych operatorów logiki opisowej. Zestaw ten jest wyznaczony przez dialekt logiki opisowej, którego uŝywamy. RóŜne dialekty logiki opisowej róŝnią się od siebie zestawem oferowanych konstruktorów, a co za tym idzie, zakresem ekspresywności konstrukcji, które w danym dialekcie moŝna budować. Uzasadnieniem dla ograniczania ekspresywności jest trudność implementacji i duŝa złoŝoność obliczeniowa wnioskowania lub wręcz nierozstrzygalność niektórych problemów w obecności niektórych terminów złoŝonych. Przykład 2.3: PoniŜsza lista prezentuje koncepty złoŝone wykorzystywanych w jednym z popularniejszych dialektów logiki opisowej zwanym ALC. Zgodnie z przyjętą konwencją dowolne koncepty proste oznaczamy literami A, B, dowolne koncepty złoŝone literami C, D, dowolną rolę literą R. koncept prosty: A koncept uniwersalny:, I = I koncept pusty: ^, ^I = przecięcie konceptów: C * D, (C * D) I = C I D I suma konceptów: C + D, (C + D) I = C I D I dopełnienie konceptu: C, ( C) I = I \ C I kwantyfikacja ogólna: R.C, ( R.C) I = {a I : b (a, b) R I b C I } kwantyfikacja egzystencjalna: R.C, ( R.C) I = {a I : b (a, b) R I b C I } W logice opisowej baza wiedzy (którą nazywać będziemy teŝ ontologią, gdyŝ spełnia ona klasyczną definicję tego terminu) dzieli się na dwie części: terminologię i opis świata. Terminologia (TBox) wyszczególnia uŝywane terminy; określa teŝ związki pomiędzy konceptami i rolami. Opis świata (ABox) przyporządkowuje osobniki poszczególnym konceptom i przyporządkowuje pary osobników do odpowiednich ról. Terminologia składa się ze zdań zwanych aksjomatami. Aksjomaty dzielą się na aksjomaty równowaŝności (ang. equalities) i aksjomaty podrzędności (ang. inclusions). Aksjomaty równowaŝności stwierdzają, Ŝe dwa terminy mają równe zakresy. Aksjomaty podrzędności stwierdzają, Ŝe zakres pojęcia podrzędnego jest podzbiorem zakresu pojęcia nadrzędnego. W dialektach mniej ekspresywnych terminami tymi mogą być jedynie koncepty. 19

Definicja 2.1 (terminologia). Terminologia T jest zbiorem zdań postaci: C m D, zwanych aksjomatami podrzędności, C D, zwanych aksjomatami równowaŝności, gdzie C i D są konceptami (prostymi lub złoŝonymi) wyraŝonymi w ustalonym dialekcie logiki opisowej L. W dostatecznie ekspresywnych dialektach pojęcie aksjomatów podrzędności i równowaŝności rozszerzane jest na role (zdania takie mają postać odpowiednio R m S oraz R S, gdzie R i S są rolami prostymi lub złoŝonymi). Formułowanie aksjomatów moŝna przyrównać do formułowania pewnych praw panujących w ramach naszej dziedziny zainteresowań. Aksjomaty, poprzez opisywanie pewnych prawidłowości dotyczących definiowanych terminów, określają zaleŝności pomiędzy konceptami i rolami zawartymi w danej terminologii. W tym sensie przypominają one zdania w rodzaju zdania (2.5). Przykład 2.4: Przykładowa terminologia T zapisana w dialekcie ALC znajduje się poniŝej: Człowiek Kobieta + MęŜczyzna Kobieta * MęŜczyzna ^ ObywatelPolski m Człowiek kocha. m Człowiek (2.9a) (2.9b) (2.9c) (2.9d) Aksjomaty tej terminologii w sposób potoczny moŝna odczytać następująco: ludzie to (wyłącznie) kobiety i męŝczyźni (2.9a), nie ma osobników będących jednocześnie kobietami i męŝczyznami (2.9b), wszyscy obywatele Polski to ludzie (2.9c), kaŝdy, kto kocha (kogokolwiek lub cokolwiek), jest człowiekiem (2.9d). Aksjomaty są zdaniami, co oznacza, Ŝe mogą istnieć interpretacje, w ramach których dany aksjomat (zdanie) jest prawdziwy, oraz interpretacje, w ramach których dany aksjomat jest nieprawdziwy. O tych pierwszych interpretacjach mówimy, Ŝe spełniają dany aksjomat lub Ŝe są jego modelem. Interpretacja spełniająca wszystkie aksjomaty w danej terminologii T jest modelem tej terminologii. Definicja 2.2 (spełnianie terminologii): Interpretacja I spełnia: aksjomat o postaci C m D wtedy i tylko wtedy, gdy C I D I ; aksjomat o postaci C D wtedy i tylko wtedy, gdy C I = D I ; aksjomat o postaci R m S wtedy i tylko wtedy, gdy R I S I ; aksjomat o postaci R S wtedy i tylko wtedy, gdy R I = S I ; terminologię T wtedy i tylko wtedy, gdy spełnia kaŝdy aksjomat, który do niej naleŝy. Fakty te zapisujemy odpowiednio jako: I C m D, I C D, I R m S, I R S, I T. 20

Interpretacja I z przykładu 2.2 jest modelem terminologii T z przykładu 2.4. Opis świata składa się ze zdań zwanych asercjami. Asercje dzielą się na asercje unarne, które stwierdzają przynaleŝność danego osobnika do zakresu danego konceptu, oraz asercje binarne, które stwierdzają przynaleŝność danej pary osobników do zakresu danej roli. Definicja 2.3 (opis świata). Opis świata A jest zbiorem zdań postaci: C(a), zwanych asercjami unarnymi, R(a, b), zwanych asercjami binarnymi, gdzie C i R są odpowiednio konceptem i rolą (prostymi lub złoŝonymi) wyraŝonymi w ustalonym dialekcie logiki opisowej L, zaś a i b to nazwy osobników. Formułując asercje, określamy osobniki i pary osobników pewnymi nazwami i wykorzystując te nazwy, przypisujemy osobniki do poszczególnych konceptów oraz mówimy, które osobniki pozostają ze sobą w pewnych relacjach. Asercje są odpowiednikami zdań w rodzaju zdania (2.2). Przykład 2.5: Przykładowy opis świata A zapisany w dialekcie ALC znajduje się poniŝej: Kobieta(EWA) Kobieta(JAN) ObywatelPolski(EWA) Człowiek(DANIELLE) kocha(jan, EWA) (2.10a) (2.10b) (2.10c) (2.10d) (2.10e) Asercje tego opisu świata w sposób potoczny moŝna odczytać następująco: Ewa jest kobietą (2.10a), Jan nie jest kobietą (2.10b), Ewa jest obywatelem Polski (2.10c), Danielle to (pewien) człowiek (2.10d), Jan kocha Ewę (2.10e). Podobnie, jak w przypadku aksjomatów, mogą istnieć interpretacje, w których dana asercja jest prawdziwa bądź fałszywa. Interpretacje spełniające daną asercję są jej modelem, a interpretacje spełniające wszystkie asercje w danym opisie świata A są modelem tego opisu świata. Definicja 2.4 (spełnianie opisu świata): Interpretacja I spełnia: asercję o postaci C(a) wtedy i tylko wtedy, gdy a I C I ; asercję o postaci R(a, b) wtedy i tylko wtedy, gdy (a, b) I R I ; opis świata A wtedy i tylko wtedy, gdy spełnia kaŝdą asercję, która do niego naleŝy. Fakty te zapisujemy odpowiednio jako: I C(a), I R(a, b), I A. 21