Wykład Sieci semantyczne czerwiec 2010
Ontologie Struktura sieci semantycznej
Plan wykładu Ontologie
Definicja ontologii Jest to formalna reprezentacja wiedzy przez zbiór konceptów z zadanej dziedziny i relacji pomiędzy konceptami. Jest stosowana do wnioskowania w dziedzinie i może być użyta do opisywania dziedziny. "formal, explicit specification of a shared conceptualisation" Ontologia dostarcza wspólnego słownika, który może być użyty do modelowania danej dziedziny, tj. typy istniejących obiektów i konceptów z ich własnościami i relacjami.
Jak zaprezentować różnorodność świata Czy można stworzyć ogólny model, który można rozwijać przez opisywanie wiedzy o poszczególnych elementach modelu? Głównym celem jest stworzenie kategorii, do których należą różne obiekty. Taki ogólny zarys konceptów nazywa się Ontologiami nadrzędnymi ūpper ontology
Przykłady ontologii nadrzędnych http://www.cyc.com/cycdoc/upperont-diagram.html
Cechy ontologii nadrzędnych Ontologia nadrzędna jest ograniczona do pojęć ogólnych, meta, abstrakcyjnych i filozoficznych i dlatego jest na tyle ogólna, by opisać szeroką gamę dziedzin z różnych obszarów. Nie uwzględnia się w niej pojęć specyficznych dla dziedziny, choć pokazuje struktury i zbiory pojęć ogólnych nad dziedzinami, w których ontologia specyficzna można być budowana. Cechy odróżniające ontologię nadrzędną od specyficznych dla dziedziny: Przeznaczenie ogólne: w jej ramach można ująć wiedzę na temat kilku dziedzin bez pomijania jakichkolwiek jej aspektów. Różne aspekty wiedzy muszą być ujednolicone, gdyż wnioskowanie na danych zazwyczaj wymaga równoległego działania w różnych dziedzinach. np. systemy powinny równie dobrze funkcjonować we wszystkich jednostkach miar.
Co to jest ontologia Ontologia jest to jawny opis (słownik) pewnej dziedziny, który zawiera: pojęcia własnołci i atrybuty pojęć, relacje, aksjomaty instancje (niekoniecznie). Ontologia wprowadza: jednolitą terminologią, jednolitą interpretację (definicję) pojęć.
Plan wykładu Ontologie
Pozyskiwanie wiedzy z Internetu Wiedza w Internecie ma bardzo zróżnicowany charakter: różne formaty plików wielkość danych różna struktura A może uda się tą wiedzę okiełznać?... podać w precyzyjnym i możliwym do przetwarzania formacie?
Ramy (FRAMES) Twórca Marvin Minsky 1975. Według Minskiego, każdy element świata może być reprezentowany w postaci bytu zwanego ramą. Nazwał on ramą strukturę danych opisującą pewien obiekt, w którym umieszcza się wszystkie typowe i oczekiwane informacje, ale również przypuszczenie o tym obiekcie. Koncepcja Minskiego oparta jest na obserwacji człowieka w nowej sytuacji i otoczeniu mającego jednak o dziedzinie pewne wcześniejsze wyobrażenia. Człowiek wydobywa wówczas z pamięci określoną ramę i konfrontuje sytuację z wiedzą zawartą w ramie. Gdy natomiast natykamy się na nowy obiekt staramy się o nim zapamiętać jak najwięcej informacji, co jest równoważne z tworzeniem nowej ramy.
Wiedza "w ramach" Ramy dają możliwość reprezentacji wiedzy deklaratywnej i proceduralnej. Pozwalają ma wyraźne oddzielenie reguł w danej dziedzinie od reguł niezbędnych do poprawnego działania systemu ekspertowego. Potrafią grupować informacje dotyczące wybranego fragmentu wiedzy w postaci jednej ramy, co upraszcza weryfikację i modyfikację bazy wiedzy. Idea ram poszerzona o aspekty behawioralne stała się podstawą do obiektowych języków programowania.
Struktura ramy Rama jest strukturą opisującą obiekt i składa się z podstruktur: klatek (slots). Każdy slot reprezentuje: własność cechę opisywanego obiektu. Opisują zatem wiedzę wg schematu (<obiekt><atrybut><wartość>) Klatka dzieli się na fasety, które opisują ograniczenia dla wartości slotów.
Przykład
Przykład http://kio.eti.pg.gda.pl/kmg/publications/papers/studia_informatica.pdf
Przykład opis OWN: sloty własne Template: sloty szablonowe Metaklasa: jej sloty szablonowe stają się własnymi klas. Klasa: zawiera własne sloty szablonowe (klasy dziedziczą po sobie sloty K3 po K1) Obiekt nie zawiera slotów szablonowych a jego własne sloty pochodzą z szablonowych slotów klasy, którą reprezentuje.
Zalety i wady można określać domyślne wartości dla slotów można podawać ograniczenia można opisać procedury na slotach nadmierna ogólność brak formalnej definicji
Sieci semantyczne (semantic networks) Opracowane prze Quillana w 1968r. Założeniem było stworzenie modelu pamięci ludzkiej. Ten model okazał się przydatny do reprezentacji wiedzy. Posługując się pojęciami możemy stworzyć sieć stwierdzeń jako pewien graf, którego węzłami są stwierdzenia a gałęziami relacje. Węzłom i gałęziom można przypisać wagi określające stopień przekonania o słuszności stwierdzeń. Sieć semantyczna jest pewnego rodzaju logiką, gdzie relacje między obiektami są przedstawione w postaci rysunku. Wnioskowanie to poruszanie się po grafie.
Przykład http://kio.eti.pg.gda.pl/kmg/publications/papers/studia_informatica.pdf
Opis przykładu relacje: hierarchia abstrakcji (strzałka blokowa) hierarchia własności (strzałka zwykła) klasy, obiekty (pogrubione kółko) wartości (kółko)
Przykład (jakie zdarzenie opisuje?) http://www.cse.unsw.edu.au/ billw/cs9414/notes/kr/frames/frames.html
Logika deskrypcyjna - Description Logic Logika opisowa jest formalizmem będącym rozstrzygalnym podzbiorem rachunku predykatów pierwszego rzędu. Z tego też względu nadaje się do algorytmizacji i przetwarzania komputerowego. Reprezentacja wiedzy o świecie w formie ontologii opartych na logice opisowej (w skrócie: ontologii DL) bazuje na następujących założeniach: istnieje pewne uniwersum (zwane też dziedziną zainteresowań), które chcemy opisać w formie ontologii elementy tego uniwersum, zwane osobnikami, są wystąpieniami pojęć pojęcia są ze sobą powiązane binarnymi relacjami zwanymi rolami
Budowa DL TBox (terminological box): terminologia ontologii, w skład której wchodzą: 1. zbiór konceptów, 2. zbiór ról 3. zbiór aksjomatów definiujących ograniczenia nałożone na koncepty i role ABox (assertional box): opis świata.
Języki opisu ontologii oparte o DL Każdy język z licznej rodziny języków logiki opisowej zawiera pewne podstawowe elementy składowe: 1. koncepty atomowe, w tym koncept uniwersalny (Top), reprezentujący uniwersum, oraz koncept pusty (Bottom), reprezentujący koncept, który nie może mieć żadnych wystąpień; 2. role atomowe; 3. konstruktory służące do tworzenia złożonych konceptów i ról.
Intuicyjna semantyka Pojęcia reprezentują klasy, czyli zbiory obiektów. Role reprezentują relacje między parami obiektów. Pojęcia atomowe są nazwami elementarnych (niedefiniowanych) pojęć, a konstrukcje reprezentują obiekty złożone. Dzięki temu można użyć kilku własności (tzn. pojęć nadrzędnych lub ograniczeń atrybutów) równocześnie w definicji pojęcia.
Logika (język) ALC Konstruktor Znaczenie C negacja pojęcia C D część wspólna pojęć C D suma pojęć R.C Kwantyfikacja egzystencjalna: zbiór takich osobników, które są powiązane przynajmniej jeden raz rolą R z osobnikiem należącym do konceptu C R.C Kwantyfikacja ogólna: zbiór takich osobników, których wszystkie istniejące powiązania rolą R dotyczą osobników należących do konceptu C (obejmuje także takie osobniki które nie są powiązane rolą R z żadnymi osobnikami)
Przykład Ontologia zawiera pojęcia: Osoba, Mężczyzna, Kobieta i Rodzic oraz rolą madziecko. Tbox Mężczyzna Osoba Kobieta Osoba Kobieta Mężczyzna Rodzic Osoba madziecko.osoba Ojciec Mężczyzna Rodzic Matka Kobieta Rodzic ABox Kobieta (Anna) Kobieta (Joanna) Mężczyzna (Karol) madziecko (Anna, Joanna) madziecko (Anna, Karol)
Inne zdania Rozszerzamy ontologię o rolą masyna, wówczas prawdziwy jest aksjomat: masyna madziecko syn zawsze jest Mężczyzną masyna. Mężczyzna. tylko Rodzice mogą mieć synów masyna. Rodzic wprowadzamy asercję: masyna(karol, Jan) i pytamy: types(jan) (czyli podaj wszystkie pojęcia z terminologii z wystąpieniem Jan) odp: Mężczyzna, Osoba a następnie: types(karol) odp: Rodzic, Mężczyzna, Osoba
Struktura sieci semantycznej Plan wykładu Ontologie Struktura sieci semantycznej
Struktura sieci semantycznej Czym jest sieć semantyczna? Sieć Semantyczna jest to rozszerzenie istniejącej sieci WWW o mechanizmy semantyczne, tak aby informacje dostępne w tej sieci były dobrze zdefiniowane i umożliwiały lepszą współpracę komputerom i ludziom. Idea budowy Sieci Semantycznej została podjęta jako odpowiedź na gwałtowne rozrastanie się Internetu, a w szczególności tych zasobów informacyjnych, które nazywamy Word Wide Web (WWW). Wiedza w sieci jest nieuporządkowana, porozrzucana po różnych zakątkach i nie jest skatalogowana.
Struktura sieci semantycznej Warstwy sieci semantycznej
Struktura sieci semantycznej Warstwy w podejściu semantycznym - opis Element URI UNICODE XML RDF Znaczenie adresowanie zasobów sieci (pod jednym URI wiele zasobów) binarne kodowanie znaków dowolnego alfabetu definiowanie typów dokumentów; możliwość definiowania przestrzeni nazw (name spaces NS), co pozwala na unikanie konfliktów w sytuacji, gdy w różnych miejscach Sieci pod tymi samymi nazwami rozumie się różne pojęcia. Pozwala wyrażać treść dokumentów, strukturalizowaną w formy drzewiaste. (Resource Description Framework), wyraża proste ontologie w postaci trójek RDF <obiekt, właściwość, wartość>. <rdf:resource rdf:about="http://pg#jk"pg:nazwisko= Kowalski > <pg:stronadomowa rdf:resource="http://www.pg/page.html"/> </rdf:resource>
Struktura sieci semantycznej Element RDFS OWL RIF SPARQL Logic and Proof Trust Znaczenie RDF Schemata opisuje cechy i klasy źródeł opartych na RDF język ontologii oparty na trójkach RDF, ALC i kilku rozwinięciach (Rule Interchange Format), określa reguły jak uzyskiwać nowe informacje z ontologii, jak je łączyć i opisuje inne formy manipulacji obiektami. protokół i język zapytań dla sieci semantycznych ontologie rozszerzane są o reguły dedukcyjne i proceduralne, zapisane na przykład w języku RuleML lub podobnym stosowanie podpisu cyfrowego i związanej z nim odpowiedniej infrastruktury bezpieczeństwa
Struktura sieci semantycznej Agenty w Sieci Semnatycznej http://infolab.stanford.edu/pub/gio/2000/foodchain.htm
Plan wykładu Ontologie
Poprawność ontologii Ontologia jest poprawna, jeśli poprawnie realizuje stawiane jej wymagania. Model formalny świata zapisany w ontologii musi odpowiadać rzeczywistej dziedzinie, dla której dana ontologia została stworzona. Metody tworzenia potrzebnych ontologi: integrowanie ontologii (ontology integration) poprzez tworzenie nowej ontologii z wykorzystaniem ontologii już istniejących, łączenie ontologii (ontology merging) w jedną ontologię ujednolicającą wszystkie łączone ontologie, budowanie ontologii (ontology building) na nowo.
Integrowanie i łączenie ontologii
Integrowanie ontologii Proces integrowania ontologii polega na tworzeniu nowej ontologii z ontologii istniejących (ontologii integrowanych) w taki sposób, że: ontologie integrowane są dostosowywane do konkretnych potrzeb, a następnie ontologie te są wzbogacane Specjalizacja ontologii: terminy w ontologii są zbyt ogólne np. ProduktyZbożowe, a potrzebne jest pojecie Pieczywo. Wzbogacenie ontologii: terminy w ontologii są zbyt szczególne np. Pieczywo i dodaje się Produkty Zbożowe. Mogą być też definiowane dodatkowe role, atrybuty i pojęcia.
łączenie ontologii łączenie ontologii jest w rzeczywistości szczególnym przypadkiem integrowania ontologii. łączone ontologie nie są dostosowywane do konkretnych potrzeb, ontologia wynikowa nie definiuje żadnych nowych terminów. W rzeczywistości łączenie ontologii jest procesem znajdowania wspólnych terminów pomiędzy różnymi ontologiami i wywiedzenie z nich nowej ontologii wynikowej, która umożliwia współpracę systemów komputerowych opartych na ontologiach łączonych.
Tworzenie ontologii Po zdefiniowaniu celu budowania nowej ontologii i analizie istniejących ontologii należy zidentyfikować pojęcia, relacje pomiędzy pojęciami, określić atrybuty i role oraz ostatecznie zapisać ontologię w formalnym języku, np. OWL. Formalny opis modelowanego świata zazwyczaj powstaje z półformalnego opisu rzeczywistości. Na podstawie opisu półformalnego inżynierowie wiedzy formułują taksonomię konceptów. Taka taksonomia wzbogacana jest o dodatkowe zależności między pojęciami, inne niż relacja zawierania, oraz odpowiednie role i atrybuty, będące binarnymi relacjami między pojęciami oraz pomiędzy pojęciami a dziedzinami konkretnymi.