Od metadanych do map wiedzy



Podobne dokumenty
Technologie zarządzania wiedzą

Technologie zarządzania wiedzą. Szymon Zioło.

Topic Maps geneza. Modelowanie wiedzy. Pojęcia. Wystąpienia. Kompletny przykład. Powiązania. Firma. urodzony w. siedziba. stolica.

Spis treści Informacje podstawowe Predykaty Przykłady Źródła RDF. Marek Prząda. PWSZ w Tarnowie. Tarnów, 6 lutego 2009

RDF (Resource Description Framework)

Internet Semantyczny. Schematy RDF i wnioskowanie

Semantic Web. Grzegorz Olędzki. prezentacja w ramach seminarium Protokoły komunikacyjne. luty 2005

Modelowanie wiedzy. Topic Maps geneza

Internet Semantyczny. Wstęp do OWL 2

Dodatkowe możliwości RDF. Seminarium magisterskie Paweł Chrząszczewski

The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych - analiza przypadków

Technologie zarządzania wiedzą

rdf:type ex:homepage ex:createdwith /amaya rdf:type ex:htmleditor

Metadane w Jagiellońskiej Bibliotece Cyfrowej. Piotr Myszkowski

Rozszerzenie funkcjonalności systemów wiki w oparciu o wtyczki i Prolog

RDF Schema (schematy RDF)

Linked Open Data z wykorzystaniem wolnego oprogramowania w gospodarce przestrzennej

Semantic Web. dr inż. Aleksander Smywiński-Pohl. Elektroniczne Przetwarzanie Informacji Konsultacje: czw , pokój 3.211

Standardy meta danych w administracji publicznej

Technologie Sieci Semantycznych

Semantic Web Internet Semantyczny

3 grudnia Sieć Semantyczna

Internet Semantyczny. Linked Open Data

Resource Description Framework (RDF)

Przetwarzanie języka naturalnego (NLP)

Język RDF. Mikołaj Morzy Agnieszka Ławrynowicz. Instytut Informatyki Poznań, rok akademicki 2013/2014

Marcin Werla, PCSS

Przykładowy dokument XML

Wykorzystanie standardów serii ISO oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Tomasz Grześ. Systemy zarządzania treścią

POZYSKIWANIE, INTEGRACJA I UDOSTĘPNIANIE INFORMACJI PRZESTRZENNEJ W ERZE BIG DATA

Programowanie komponentowe

GML w praktyce geodezyjnej

Technologie zarządzania wiedzą

serwisy W*S ERDAS APOLLO 2009

Standaryzacja metadanych w muzealnictwie

Rozproszone systemy internetowe

Laboratoria 1 i 2. Akademia Górniczo-Hutnicza. Podstawy in»ynierii wiedzy

Reprezentacja wiedzy ontologie, logiki deskrypcyjne

Systemy ekspertowe. System ekspertowy wspomagający wybór zestawu komputerowego w oparciu o ontologie i system wnioskujący RacerPro

Marcin Werla, PCSS

SYSTEM DO GENEROWANIA ONTOLOGII NA PODSTAWIE DIAGRAMÓW UML SYSTEM TO ONTOLOGY GENERATION FROM UML DIAGRAMS

WOJSKOWA AKADEMIA TECHNICZNA

Metadane. Przykry obowiązek czy przydatny zasób?

Marcin Skulimowski - RDF

Mona na Lido Próba wstępnego zmapowania modelu danych MNW

MINISTERSTWO FINANSÓW PLAN INTEGRACJI SYSTEMU ZAŁĄCZNIK NR 6 SEAP SPECYFIKACJA KANAŁ DLA PODMIOTÓW ZEWNĘTRZNYCH PL PROJEKT ECIP/SEAP

Na podstawie artykułu:

Model semistrukturalny

JĘZYKI I NARZĘDZIA DO TWORZENIA I WYSZUKIWANIA ONTOLOGII W KONTEKŚCIE SEMANTYCZNEGO WEBA

Definiowanie typów dokumentów Część 2. Przestrzenie nazw, XML Schema

Internet Semantyczny. Idea

Semantyczne Wiki na przykładzie Semantic MediaWiki

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

Semantyczne Wiki! na przykładzie! Semantic MediaWiki!

Internet Semantyczny i Logika I

Biorąc udział w projekcie, możesz wybrać jedną z 8 bezpłatnych ścieżek egzaminacyjnych:

Internet Semantyczny i Logika II

AKADEMICKA BAZA INFORMACJI JAKO PRZYKŁAD WYKORZYSTANIA TECHNOLOGII SIECI SEMANTYCZNEJ

Strukturalizacja otoczenia agentów: ontologie, CYC, sieci semantyczne

Automatyzacja bibliotek

Sprawozdanie z laboratorium 2: Modeling knowledge with Resource Description Framework (RDF)

Web Services. Wojciech Mazur. 17 marca Politechnika Wrocławska Wydział Informatyki i Zarządzania

Infrastr ukt ura, procedur y i standardy digit aliz acji.

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

Zasady Nazewnictwa. Dokumentów XML Strona 1 z 9

Krzysztof Kutt Sprawozdanie 2: Modeling knowledge with Resource Description Framework (RDF)

Zastosowanie ontologii do organizacji informacji pozyskiwanych z Internetu

Ministerstwo Finansów

ROLA INTEROPERACYJNOŚCI W BUDOWIE CYFROWYCH USŁUG PUBLICZNYCH ORAZ W UDOSTĘPNIANIU ZASOBÓW OTWARTYCH DANYCH

Kraków, 14 marca 2013 r.

OfficeObjects Ontology Manager

WZORCE LOGIKI APLIKACJI Reużywalne składniki wymagań

Internet Semantyczny. Logika opisowa

Format danych adnotacji do tytułów wykonawczych przekazywanych do organów egzekucyjnych przez epuap w związku ze zbiegiem egzekucji

JAK OPTYMALNIE DOBRAĆ ODPOWIEDNIE TECHNOLOGIE INFORMATYCZNE?

Paweł Kurzawa, Delfina Kongo

Przepływy danych. Oracle Designer: Modelowanie przepływów danych. Diagramy przepływów danych (1) Diagramy przepływów danych (2)

The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych analiza przypadków

1 Projektowanie systemu informatycznego

Przewodnik Szybki start

4. Jak połączyć profil autora w bazie Scopus z identyfikatorem ORCID. 5. Jak połączyć ResearcherID (Web of Science) z identyfikatorem ORCID

Web 3.0 Sieć Pełna Znaczeń (Semantic Web) Perspektywy dla branży motoryzacyjnej i finansowej. Przyjęcie branżowe EurotaxGlass s Polska 10 luty 2012

DOKUMENTY. v Strona 1 z 10

Logika rozmyta typu 2

PDM wbudowany w Solid Edge

Rola języka XML narzędziem

Wstęp do Technologii Semantycznych. Idea, język RDF

system kontroli obchodów

Analizy na podstawie danych sprawozdawczych - Moduł analiz z obsługą broszur

METADANE A ONTOLOGIE czyli sztuka integracji i wyszukiwania danych

Analizy na podstawie danych sprawozdawczych - Moduł Analiz dla Banków Spółdzielczych

Definiowanie typów dokumentów Część 2. Przestrzenie nazw, XML Schema. Elementy czy atrybuty? Wartości domyślne i ustalone. Elementy czy atrybuty?

Internet Semantyczny. Podstawy SPARQL

Zasady Wykorzystywania Plików Cookies

World Wide Web? rkijanka

NOWY PARADYGMAT PUBLIKACJI I WYSZUKIWANIA DANYCH PRZESTRZENNYCH W SIECI WWW

EXSO-CORE - specyfikacja

Bazy danych. Zachodniopomorski Uniwersytet Technologiczny w Szczecinie. Wykład 3: Model związków encji.

WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1

Transkrypt:

Od metadanych do map wiedzy BachoTeX 2004 Mariusz Olko Mariusz.Olko@empolis.pl 1 maja 2004 1 <Tytuł> <Autor> 20 lutego 2004

Metadane co to jest? Informacja na temat informacji! Opisuje własności informacji Często trzymana osobno od informacji/dokumentu W wypadku książki Tytuł, autor Wydawca, miejsce i data wydania Kolofon, w jaki sposób złożone, czcionka, drukarnia W bibliotece metadane książek są przechowywane w katalogach rzeczowym i alfabetycznym Metadane o obywatelu są zapisane w jego dowodzie osobistym Granica między danymi i metadanymi jest płynna i zależy bardziej od kontekstu użycia tych informacji niż od ich postaci 2 6 kwietnia 2004

Przykłady metadanych Windows Microsoft Office umożliwia ustawianie metadanych w tworzonych dokumentach Metadane mogą być wstawiane jako wartości pól do dokumentu Można po nich wyszukiwać wykorzystując wbudowaną w Windows "usługę indeksowania" Są wyświetlane przy dokumencie w Explorerze Adobe Acrobat pozwala przechowywać dowolne metadane w plikach PDF Metadane są zapisywane zgodnie ze standardem RDF Metadane mogą być przechowywane w obrazkach TIFF, JPEG, EXIF i są potem używane w programach katalogujących 3 6 kwietnia 2004

Metadane w internecie Metadane można zapisywać w dokumentach HTML w tagach meta np. <meta name="author" content="adam Mickiewicz"> Metadane są wykorzystywane do katalogowania i wyszukiwania w internecie Podstawę wyszukiwania ciągle stanowi treść dokumentów Dodatkowe informacje są uzyskiwane z analizy Linków pomiędzy stronami Struktury adresów internetowych Takie metadane są niewystarczające Można opisywać tylko swoje własne strony Wartością metadanej jest zawsze tylko napis Prowadzi do niejednoznaczności opisu 4 6 kwietnia 2004

RDF - "Internetowy" język zapisu metadanych Resource Description Framework Każdy może opisywać wszystko (nie tylko własne zasoby) Rozszerzalny o dowolne własności (kolor włosów, numer kołnierzyka, numer ISBN) Serializowany/zapisywany w postaci XMLa Obecnie rekomendacja W3C http://www.w3.org/rdf 5 6 kwietnia 2004

Zasoby Zasobem (ang. resource) czyli obiektem opisywanym metadanymi może być strona internetowa, ale też konkretna osoba, firma itp. Zasoby mogą być identyfikowane w opisie RDFowym przez URI (Universal Resource Identifier) Niektóre zasoby nie potrafimy zidentyfikować inaczej, jak tylko poprzez podanie ich własności, wtedy zasób nazywamy anonimowym Każdy URL jest URI http://www.gust.org.pl http://www.molko.com.pl/pan-tadeusz.html#ksiega1 Możemy też nadać URI osobom pesel:123456788900 gg:2539120 http://empolis.pl/employee#olko21 6 6 kwietnia 2004

Budowa URI zasobów Universal Resource Identifier http://gust.org.pl/memebers#molko Przestrzeń nazw http://gust.org.pl/memebers# Nazwa lokalna molko Identyfikator przestrzeni nazw mmbr Teraz ten sam URL można zapisać w skróconej postaci mmbr:molko 7 6 kwietnia 2004

Metadane zapisujemy w postaci zdań Autorem strony www.molko.com.pl jest Mariusz Olko Podmiot (Subject) http://www.molko.com.pl Orzeczenie, własność (Property) dc:creator Dopełnienie (Object) Mariusz Olko 8 6 kwietnia 2004

Własności też są zasobami Własności też są zasobami tzn. są identyfikowane przez URI Własności też mogą mieć swoje własności 9 6 kwietnia 2004

Literały i zasoby jako wartości Wartościami własności mogą być literały bądź zasoby Literały mogą mieć typy zgodnie z XMLSchema 10 6 kwietnia 2004

Serializacja do XMLa <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:description about="http://www.molko.com.pl"> <dc:creator about="http://gust.org.pl/members#molko"> <foaf:name>mariusz Olko</foaf:name> <foaf:mbox>mariusz@molko.com.pl</foaf:mbox> </dc:creator> </rdf:description> </rdf:rdf> 11 6 kwietnia 2004

Do interpretacji potrzebujemy języka/słownictwa RDF nie niesie ze sobą żadnej semantyki Semantyka wiąże się z uzgodnionymi schematami Schemat RDF: przestrzeń nazw zestaw zasobów (również własności) interpretacje zasobów należących do schematu 12 6 kwietnia 2004

Dublin Core Metadata Initative The Dublin Core Metadata Initiative (DCMI) is an organization dedicated to promoting the widespread adoption of interoperable metadata standards and developing specialized metadata vocabularies for describing resources that enable more intelligent information discovery systems. Publikuje schematy do opisu publikacji Rekomenduje sposoby opisu publikacji w różnych technologiach 13 6 kwietnia 2004

Dublin Core - podstawowe słownictwo Namespace URI http://purl.org/dc/elements/1.1/ Elements Title Creator Subject Description Publisher Contributor Date Type Format Source Language Rights 14 6 kwietnia 2004

Jak z tego wszystkiego skorzystać? <RDF xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:term="http://purl.org/dc/terms/"> <Description about="pan-tadeusz.html"> <dc:title>pan Tadeusz</dc:title> <dc:creator>adam Mickiewicz</dc:creator> <dc:publisher>mariusz Olko</dc:publisher> <term:isformatof about="pan-tadeusz.xml"/> <term:tableofcontent> <Sequence> <li resource="pan-tadeusz-1.html"/>... </Sequence> </term:tableofcontent> </Description> </RDF> 15 6 kwietnia 2004

Friend-Of-A-Friend (FOAF) W jaki sposób jednoznacznie zidentyfikować osobę w internecie? Użyć jej adres email jako identyfikator! Słownictwo Agent Person name nick Mbox knows depiction publications homepage organization group project http://xmlns.com/foaf/0.1/ 16 6 kwietnia 2004

Friend Of A Friend Osoby publikują pliki FOAF zawierające informacje O osobach które znają O projektach którymi się zajmują Nt. miejsca swojego pobytu lub zamieszkania Kalendarz np. konferencji w których biorą udział Aplikacje agregują dane FOAF pochodzące z wielu źródeł Zebrane informacje mogą posłużyć do odpowiedzi na pytania w rodzaju: Kogo ze znajomych, bądź znajomych znajomych mogę spotkać w mieście w którym odbywa się konferencja na którą jadę? 17 6 kwietnia 2004

Łączenie grafów RDFowych name "M. Olko" name Jan Kowalski knows mbox MOl@empolis.pl mbox somebody@empolis.pl contact:nearestairport mbox somebody@empolis.pl airport:iatacode WAW 18 6 kwietnia 2004

Łączenie grafów RDFowych Wartość własności mbox indentyfikuje jednoznacznie osobę! name "M. Olko" name Jan Kowalski knows mbox MOl@empolis.pl mbox somebody@empolis.pl contact:nearestairport mbox somebody@empolis.pl airport:iatacode WAW 19 6 kwietnia 2004

Łączenie grafów RDFowych Wartość własności mbox indentyfikuje jednoznacznie osobę! name "M. Olko" knows mbox MOl@empolis.pl name Jan Kowalski mbox somebody@empolis.pl contact:nearestairport airport:iatacode WAW 20 6 kwietnia 2004

Potrzeba języka opisu słownictwa (Schema for schema) RDF Schema - rekomendacja W3C Przy pomocy RDFS można definiować własne schematy takie jak np. Dublin Core czy FOAF RDFS zawiera słownictwo potrzebne do budowy schematów RDFS jest sam zdefiniowany w języku RDFS RDFS pozwala na definiowanie Klas Własności 21 6 kwietnia 2004

Narzędzia do modelowania schematów RDF definiuje podstawowy zestaw pojęć, który może być użyty do modelowania informacji i budowy ontologii Własności dotyczące zasobów label (krótka etykieta nadana zasobowi) description (dłuższy opis zasobu) type (określenie typu zasobu) Własności dotyczące klas subclassof (podział klasy na podklasy) Własności dotyczące własności subpropertyof domain (klasa obiektów, które mogą być podmiotem zdań z danym predykatem) range (klasa obiektów, które mogą być dopełnieniem zdań z danym predykatem) 22 6 kwietnia 2004

Przykład zdań ze schematem 23 6 kwietnia 2004

Reguły inferencyjne Nadanie interpretacji językowi oraz predykatom służącym do budowania modeli pozwala na skonstruowanie reguł zwanych regułami inferencji. Reguły te pozwalają na wywnioskowanie dodatkowych faktów ze zdań powiedzianych explicite 24 6 kwietnia 2004

Reguły związane z hierarchią klas 25 6 kwietnia 2004

Reguły dotyczące zakresu własności 26 6 kwietnia 2004

Reifikacja Nie można w prosty sposób wypowiadać zdań na temat innych zdań! Aby można było się wypowiedzieć na temat jakiegoś zdania, musi ono zostać zreifikowane tzn. zamienione na zestaw zdań (metazdań) Prawdopodobieństwo faktu, że 9 stycznia będzie temperatura 20 stopni celsjusza jest bliskie zeru 27 6 kwietnia 2004

Mamy możliwość budowania schematów i co dalej? Co moglibyśmy jeszcze chcieć? Możliwość definiowania dowolnych własności jako przechodnich Przechodniość subclassof i subpropertyof jest wbudowana w silniki rozumiejące RDFS Możliwość definiowania jednej własności jako odwrotnej do drugiej Jeśli "Maleństwo" jest dzieckiem "Kangurzycy" to "Kangurzyca" jest rodzicem "Maleństwa" Możliwość deklarowania własności jako jednoznacznie identyfikującej instancję (functional property) Aplikacja FOAF musi mieć wbudowaną wiedzę o tym, że jeśli dwa obiekty mają taką samą własność mbox to można je utożsamić ze sobą Możliwość deklarowania dwóch obiektów jako tożsamych Pomimo różnych URI obydwa obiekty są tożsame 28 6 kwietnia 2004

Web Ontology Language - OWL Obecnie Proposed Recommendation w W3C Bardziej sformalizowany język budowania ontologii Dostosowany do możliwości implementacji silników inferencyjnych Ogranicza wolność opisu RDFowego dając w zamian dobrze zdefiniowaną interpretację zdań Składnia oparta o dokumenty RDF, "internetowy" charakter Semantyka korzysta z dorobku AI w zakresie reprezentacji wiedzy 29 6 kwietnia 2004

Słownictwo OWL Definicja klasy owl:oneof przez wyliczenie przynależnych instancji owl:restriction i owl:onproperty przez podanie ograniczenia na własności instancji owl:allvaluesfrom wszystkie wartości własności są w podanej klasie owl:somevaluesfrom przynajmniej jedna w własności jest w podanej klasie owl:mincardinality i owl:maxcardinality Przez wykonanie operacji teoriomnogościowej na innych klasach owl:intersectionof owl:unionof owl:complementof 30 6 kwietnia 2004

OWL słownictwo owl:sameas stwierdza tożsamość dwóch obiektów owl:equivalentproperty ta sama dziedzina i ten sam zakres mogą mieć całkowicie inne znaczenie Owl:TransitiveProperty przechodniość własności Owl:FunctionalProperty Własność P, która może mieć tylko jedną unikalną wartość dla każdej instancji obiektu Inaczej jeżeli dwa obiekty mają jako tę samą wartość P to oznacza, że obiekty są tożsame owl:differentfrom Dwa URI odnoszą się do dwóch różnych bytów 31 6 kwietnia 2004

OWL - trzy poziomy języka OWL full Pozwala mieszać słownictwo RDFSchema oraz OWL Pozwala na dowolność w opisywaniu obiektów, klas i własności OWL DL Stawia ograniczenia na używanie słownictwa RDFSchema Wymaga rozdzielenia klas, własności, instancji Pozwala na zastosowanie istniejących już silnych narzędzi do wnioskowania opartych na Description Logic OWL Lite Stawia te same ograniczenia co OWL DL na użycie słownictwa RDFSchema oraz na rozdzielenie klas, własności i instancji Wybiera prosty podzbiór słownictwa umożliwiający łatwy start użytkownikom oraz zapewniający prostotę implementacji narzędzi 32 6 kwietnia 2004

Semantic Web "The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where software agents roaming from page to page can readily carry out sophisticated tasks for users." Scientific American, May 2001 Internetowa infrastruktura publikacji danych neutralna (niezależna od aplikacji) umożliwiająca przetwarzanie informacji przez programy w celu automatyzacji agregacji wielokrotnego użycia 33 6 kwietnia 2004

Semantic Web - aplikacje Poprawienie jakości wyszukiwania informacji Umożliwienie wyszukiwania usług sieciowych Automatyzacja czynności codziennych Rezerwacja wizyty u lekarza, w urzędzie Przygotowanie podróży Uwaga To jest ciągle wizja Technologie się pojawiają ale... Zdania nie oznaczają faktów URI nie identyfikują bytów rzeczywistych Potrzebna jest kodyfikacja wiedzy codziennej Pojawiają się problemy związane z etyką oraz bezpieczeństwem 34 6 kwietnia 2004