Semantic Web Internet Semantyczny
Semantyczny Internet - Wizja (1/2) Pomysłodawca sieci WWW - Tim Berners-Lee, fizyk pracujący w CERN Jego wizja sieci o wiele bardziej ambitna niż istniejąca obecnie (syntaktyczna) sied WWW: plan uzyskania zbioru aplikacji, dla danych w sieci, powiązanych w taki sposób aby uzyskad spójną, logiczną sied danych rozszerzenie obecnej sieci, w którym informacje mają dobrze zdefiniowane znaczenie, co ułatwid ma współpracę pomiędzy komputerami i ludźmi Ta wizja sieci WWW stała się znana pod nazwą Semantic Web
Semantyczny Internet (2/2) Scientific American, 2001:
Sied WWW dzisiaj (1/3) Większośd treści w sieci WWW ma formę nie sprawiającą problemów w odbiorze ludziom. Przykład (HTML): <HTML> <HEAD> <TITLE>BIURO PODROZY</TITLE> </HEAD> <BODY bgcolor="ccffff"> <CENTER> <H1>Biuro podrozy</h1> </CENTER> <BR></BR> <TABLE BORDER="1" align="center"> <TR bgcolor="#ffff00"> <TD>Francja</TD> <TD>Nicea</TD> <TD>Hilton</TD> <TD>***</TD> <TD>2500</TD> <TD>0001</TD> </TR> <TR> Jednak maszyny (agenty software owe) mogą mied problem z odróżnieniem np. nazwy miejscowości od nazwy hotelu lub ceny od numeru oferty Nawet ta treśd, która jest generowana z baz danych jest prezentowana bez zachowania oryginalnej informacji o jej strukturze
Sied WWW dzisiaj (2/3) Sieć syntaktyczna Trudne lub niemożliwe (?) jest np.: Zasób href href Zasób href znalezienie odpowiedzi, na skomplikowane pytania wymagające wiedzy dziedzinowej, href Zasób Zasób href Zasób Zasób href Zasób znajdowanie i używanie usług sieciowych, zlecanie skomplikowanych zadao agentom
Sied WWW dzisiaj (3/3) Lepsza reprezentacja - XML <biuro_podrozy> <oferta numer="0001"> <miejsce_pobytu> <kraj> Francja </kraj> <miejscowosc> Nicea </miejscowosc> <nazwa_hotelu klasa="***"> Hilton </nazwa_hotelu> </miejsce_pobytu> <termin> </termin> <cena>2500</cena> </oferta>
Jednak XML to za mało aby zrealizowad Semantyczny Internet XML sam w sobie nie zapewnia: specyficznego dla danej dziedziny ontologicznego słownika, ontologicznych podstawowych elementów składniowych i wymaga wstępnych uzgodnieo co do powyższych dwóch punktów co ogranicza jego użycie do małych i stabilnych systemów a nie do zasobów WWW, które mają byd współdzielone na szeroką skalę Człowiek widzi: <biuro_podrozy> <oferta numer="0001"> <miejsce_pobytu> <kraj> Francja </kraj> <miejscowosc> Nicea </miejscowosc> <nazwa_hotelu klasa="***"> Hilton </nazwa_hotelu> </miejsce_pobytu> <termin> </termin> <cena>2500</cena> </oferta> Komputer widzi : <biuro_podrozy> <oferta numer="0001"> <miejsce_pobytu> <kraj> Fra cja </kraj> <miejscowosc> Nicea </miejscowosc> <nazwa_hotelu klasa="***"> Hi to </nazwa_hotelu> </miejsce_pobytu> <termin> </termin> <cena>2500</cena> </oferta>
Jak zrealizowad Semantyczny Internet? Wizja 1 Rozszerzenie aktualnej WWW ( ideologiczna ) rozszerzenie aktualnej sieci WWW przez adnotacje obecnych zasobów semantycznymi znacznikami (opisującymi znaczenie), przez ich klasyfikację i indeksację wykonane ręcznie lub pół-automatycznie (naiwne założenie?) zastosowania do personalizacji, wyszukiwania i przeglądania w sieci WWW
Jak zrealizowad Semantyczny Internet? Wizja 2 Sieć danych ( Web of data ) ekspozycja do sieci WWW zbiorów danych z baz danych, integracja tych zbiorów semantyka schematów baz danych powinna zostad wyeksponowana w sieci WWW razem z danymi umożliwienie maszynowej interpretacji, integracji i nieprzewidzianych przypadków użycia Semantyczny Internet jako wielka, globalna baza danych potencjał komercyjny
Linking Open Data Cel: ekspozycja do WWW otwartych zbiorów danych i ich integracja Ustalenie pozwiązao pomiędzy danymi pochodzącymi z różnych zbiorów Przykładowy zbiór danych: DBpedia
DBpedia Ekstracja ustrukturalizowanej informacji z Wikipedii (tzw. infoboxów ) Dostarczenie interfejsu umożliwiającego wydawanie zapytao Ustalenie połączeo z innymi zbiorami danych w ramach inicjatywy LOD
LOD cloud, Maj 2007
LOD cloud, Maj 2008
LOD cloud, Maj 2009
Warstwy semantycznego Internetu W3C standard (OWL)-2004 W3C standard (RDF)-2002 W3C standard (XML) Tim Berners-Lee
Języki Semantycznego Internetu XML: składnia pozwalająca tworzyd dokumenty semistrukturalne, brak założeo co do ich znaczenia XML Schema: nakłada ograniczenia poprawnościowe na strukturę dokumentu XML, dodaje rozszerzalną hierarchię typów RDF: model danych do reprezentacji prostych relacji między obiektami (zasobami) RDF Schema: umożliwia opis klas i własności zasobów RDF oraz ich hierarchii OWL: bardziej rozbudowane możliwości opisywania klas i własności Wszystkie języki mogą byd serializowane do XML
Bardziej aktualna wersja SPARQL: język zapytao do RDF (także do RDFS i OWL) RIF (lub SWRL): reguły