Wprowadzenie do technologii semantycznych

Podobne dokumenty
Semantic Web Internet Semantyczny

3 grudnia Sieć Semantyczna

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

Semantic Web. Grzegorz Olędzki. prezentacja w ramach seminarium Protokoły komunikacyjne. luty 2005

Ontologie, czyli o inteligentnych danych

Internet Semantyczny. Linked Open Data

Web 3.0 Sieć Pełna Znaczeń (Semantic Web) Perspektywy dla branży motoryzacyjnej i finansowej. Przyjęcie branżowe EurotaxGlass s Polska 10 luty 2012

Instytut Technik Innowacyjnych Semantyczna integracja danych - metody, technologie, przykłady, wyzwania

2

Rozszerzenie funkcjonalności systemów wiki w oparciu o wtyczki i Prolog

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM, regulski@metal.agh.edu.pl

Monitoring procesów z wykorzystaniem systemu ADONIS

Zastosowanie technologii Semantic Web w regionalnej sieci telemedycznej

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

Spis treści Informacje podstawowe Predykaty Przykłady Źródła RDF. Marek Prząda. PWSZ w Tarnowie. Tarnów, 6 lutego 2009

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

MODEL SYSTEMU WIELOAGENTOWEGO KORZYSTAJĄCEGO Z DANYCH SIECI SEMANTYCZNEJ W PROJEKCIE OPEN NATURA 2000

RDF Schema (schematy RDF)

PROLOG WSTĘP DO INFORMATYKI. Akademia Górniczo-Hutnicza. Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej.

Automatyzacja procesu tworzenia i zarządzania Wirtualnymi Organizacjami w oparciu o wiedzę w zastosowaniu do architektur zorientowanych na usługi

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

Projektowanie Systemów Informatycznych. Katedra Systemów Informatycznych

Internet Semantyczny. Schematy RDF i wnioskowanie

Wykorzystanie standardów serii ISO oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Przygotowała Elżbieta Pastucha na podstawie CityGML OGC Standard for Photogrammetry by Thomas H. Kolbe, Claus Nagel, Alexandra Stadler

Język RDF. Mikołaj Morzy Agnieszka Ławrynowicz. Instytut Informatyki Poznań, rok akademicki 2013/2014

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE

Jak udostępnić dane PZGiK w sieci? Artur Kapuściński

Rozkład materiału do zajęć z informatyki. realizowanych według podręcznika

Środowisko publikacyjne oparte na XML-u. Szymon Zioło 1 maja 2004

Przetwarzanie języka naturalnego (NLP)

INNOWACYJNE METODY UDOSTĘPNIANIA PUBLICZNYCH DANYCH PRZESTRZENNYCH

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Dlaczego musimy nauczać o katalogach bibliotecznych, w świecie idei Web 2.0?

Wirtualny Konsultant Usług Publicznych Interoperacyjność

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

Wykład I. Wprowadzenie do baz danych

EGZAMIN MATURALNY W ROKU SZKOLNYM 2014/2015

Architektura nowoczesnych aplikacji internetowych

WYKŁAD 1 METAJĘZYK SGML CZĘŚĆ 1

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Dr Adam Naumowicz

POZYSKIWANIE, INTEGRACJA I UDOSTĘPNIANIE INFORMACJI PRZESTRZENNEJ W ERZE BIG DATA

EGZAMIN MATURALNY W ROKU SZKOLNYM 2014/2015

Wprowadzenie do XML. Joanna Jędrzejowicz. Instytut Informatyki

Technologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca:

SK01-KA

Model semistrukturalny

Tomasz Grześ. Systemy zarządzania treścią, cz. II

System komputerowy. Sprzęt. System komputerowy. Oprogramowanie

NUKAT i Federacja Bibliotek Cyfrowych pierwsze wyniki działań w kierunku integracji metadanych

EXSO-CORE - specyfikacja

GS1 Globalny Język Biznesu. GS1 Smart Search. GTIN w sieci czy to ma sens? Artur Kośmider Instytut Logistyki i Magazynowania

Reprezentacja wiedzy ontologie, logiki deskrypcyjne

PRZEWODNIK PO PRZEDMIOCIE

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

Internet Semantyczny. Idea

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Sieci Komputerowe. Wykład 1: Historia, model ISO, Ethernet, WiFi

System SINUS otwarte narzędzie do budowy bibliograficznych baz danych

Specyfikacja dla strony internetowej Fundacji Śląskie Hospicjum dla Dzieci

Witryny i aplikacje internetowe

PRZEWODNIK PO PRZEDMIOCIE

KARTA KURSU. Przetwarzanie dokumentów XML i zaawansowane techniki WWW

PRZEWODNIK PO PRZEDMIOCIE

Programowanie komputerów

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

STANDARDY SIECI SEMANTYCZNEJ W ZARZĄDZANIU WIEDZĄ ORGANIZACJI

Funkcjonalność oprogramowania Bazy Wiedzy i Repozytorium Politechniki Warszawskiej

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

Rok akademicki: 2030/2031 Kod: ZIE s Punkty ECTS: 5. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne

Kraków, 14 marca 2013 r.

TOPWEB SPSall Budowanie portalu intranetowego

Otwarte protokoły wymiany informacji w systemach ITS

Alicja Marszałek Różne rodzaje baz danych

Podstawy (X)HTML i CSS

rdf:type ex:homepage ex:createdwith /amaya rdf:type ex:htmleditor

BAZY DANYCH wprowadzenie. Opracował: dr inż. Piotr Suchomski

World Wide Web? rkijanka

Spis treści. Od autorów / 9

SCENARIUSZ LEKCJI. Czas realizacji. Podstawa programowa

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2

Webowy generator wykresów wykorzystujący program gnuplot

Języki programowania zasady ich tworzenia

Semantyczne Wiki na przykładzie Semantic MediaWiki

Język angielski. Poziom rozszerzony Próbna Matura z OPERONEM i Gazetą Wyborczą CZĘŚĆ I KRYTERIA OCENIANIA ODPOWIEDZI POZIOM ROZSZERZONY CZĘŚĆ I

Informatyka kl. 1. Semestr I

Komputer nie myśli. On tylko wykonuje nasze polecenia. Nauczmy się więc wydawać mu rozkazy

Baza danych i ORM mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Katowice, 2011

Programowanie WEB PODSTAWY HTML

Nie przegrzewaj mózgu wrzuć dane do bazy!

tel

Dziedziczenie. Dziedziczenie i kaskadowość. Dodał Administrator środa, 10 marzec :00. Tematy: Dziedziczenie Kaskadowość

Semantyczne Wiki! na przykładzie! Semantic MediaWiki!

Tomasz Grześ. Systemy zarządzania treścią

Semantic Web. dr inż. Aleksander Smywiński-Pohl. Elektroniczne Przetwarzanie Informacji Konsultacje: czw , pokój 3.211

The Binder Consulting

Hurtownie danych - przegląd technologii

Bazy danych 2. Wykład 1

LAB 7. XML EXtensible Markup Language - Rozszerzalny Język Znaczników XSD XML Schema Definition Definicja Schematu XML

Transkrypt:

Wprowadzenie do technologii semantycznych Sieć Semantyczna Mikołaj Morzy Agnieszka Ławrynowicz Instytut Informatyki Poznań, rok akademicki 2013/2014 (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 1

Krótkie preludium Johannes Gutenberg wynalazł przemysłową metodę druku w 1439 Dążył do stworzenia mechanizmu przyspieszenia wydruku Biblii Wynik: książki, czasopisma, artykuły naukowe,itp. Tim Berners- Lee, fizyk pracujacy w CERN w Genewie, stworzył ideę sieci WWW w 1989, obecnie szef W3C Dążył do uzyskania szybkiego, elektronicznego dostępu online do dokumentów laboratoriów fizyki wysokich energii Wynik: fundamentalna zmiana w sposobie komunikacji międzyludzkiej (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 2

Sieć Semantyczna Wizja Oryginalna wizja sieci wg Sir Tim a BL o wiele bardziej ambitna niż istniejąca obecnie sieć WWW: I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web the content, links, and transactions between people and computers. A Semantic Web, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The intelligent agents people have touted for ages will finally materialize. (Berners-Lee, 1999) (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 3

Scientific American, 2001 (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 4

Przykładowy scenariusz Polska wersja: LIPIEC 2001 ŚWIAT NAUKI (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 5

Klasyczna sieć WWW = sieć syntaktyczna Zasób href href Zasób href href Zasób Zasób Zasób href href Zasób Zasób (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 6

Klasyczna sieć WWW = sieć syntaktyczna c.d. komputery dokonują prezentacji (łatwe) ludzie dokonują integracji i interpretacji danych (trudne) (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 7

Klasyczna sieć WWW: trudne lub niemożliwe znalezienie odpowiedzi, na skomplikowane pytania wymagające wiedzy dziedzinowej znajdź informację o zwierzętach, które wykorzystują echolokację, ale nie są to ani nietoperze ani delfiny zlokalizowanie informacji w repozytoriach danych podróże, ceny produktów znajdowanie i używanie usług sieciowych zwizualizuj interakcję pomiędzy dwoma białkami zlecanie skomplikowanych zadań agentom zarezerwuj mi wczasy na następny weekend, gdzieś w miarę blisko w ciepłym miejscu, gdzie mówią po angielsku lub po francusku (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 8

Przykład: wycieczka z Edynburga do Poznania Najpierw rezerwacja przelotu (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 9

duże linie lotnicze (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 10

lub linie lotnicze kraju docelowego (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 11

lub tanie linie (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 12

Przykład: wycieczka z Edynburga do Poznania Następnie szukamy noclegu (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 13

.taniego (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 14

.lub luksusowego (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 15

.może skorzystać z wyspecjalizowanej witryny (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 16

.lub innej (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 17

Przykład: wycieczka z Edynburga do Poznania Być może chcielibyśmy się dowiedzieć czegoś więcej na temat Poznania, poszukać zdjęć (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 18

.na flickr (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 19

.przez Google (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 20

.może zajrzeć na społecznościową stronę (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 21

Wycieczka z Edynburga do Poznania podsumowanie Zapoznanie się z dużą liczbą stron o różnym stylu, celu, być może też języku Integracja informacji w myślach żeby osiągnąć założony cel Czasami długi i żmudny proces! (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 22

Wycieczka z Edynburga do Poznania podsumowanie c.d. Każda ze stron tylko wierzchołkiem góry lodowej prawdziwe dane ukryte w bazach danych, plikach XML files, arkuszach kalkulacyjnych, dostęp jedynie do tego o czym zadecydowali twórcy strony Wyspecjalizowane strony (Expedia, TripAdvisor) idą o krok dalej: gromadzą i agregują dane z różnych źródeł (zazwyczaj za zgodą właścicieli) jednak kontrolują ich prezentację (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 23

Sieć danych czasami potrzeba dostępu do oryginalnych danych i dowolnego ich łączenia! wykorzystywać dane w Sieci podobnie jak dokumenty: łączyć dane (niezależnie od ich prezentacji) prezentować, eksplorować wykorzystywać programy agentowe, które mogą częściowo interpretować dane rozszerzyć aktualną Sieć do Sieci Danych (ang. Web of Data) i umożliwić aplikacjom bezpośrednie wykorzystanie danych (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 24

Klasyczna Sieć WWW - HTML <HTML> <HEAD> <TITLE>BIURO PODROZY</TITLE> </HEAD> <BODY bgcolor="ccffff"> <CENTER> <H1>Biuro podrozy</h1> </CENTER> <BR></BR> <TABLE BORDER="1" align="center"> <TR bgcolor="#ffff00"> <TD>Francja</TD> <TD>Nicea</TD> <TD>Hilton</TD> <TD>***</TD> <TD>2500</TD> <TD>0001</TD> </TR> HTML - forma nie sprawiającą problemów w odbiorze ludziom maszyny (agenty) - problem z odróżnieniem np. nazwy miejscowości od nazwy hotelu treść generowana z baz danych często prezentowana bez zachowania oryginalnej informacji o jej strukturze (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 25

Klasyczna Sieć WWW - XML XML krok w stronę maszynowej interpretacji <biuro_podrozy> <oferta numer="0001"> <miejsce_pobytu> <kraj> Francja </kraj> <miejscowosc> Nicea </miejscowosc> <nazwa_hotelu klasa="***"> Hilton </nazwa_hotelu> </miejsce_pobytu> <termin> </termin> <cena>2500</cena> </oferta> (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 26

XML problem z interpretacją treści Człowiek widzi: <biuro_podrozy> <oferta numer="0001"> <miejsce_pobytu> <kraj> Francja </kraj> <miejscowosc> Nicea </miejscowosc> <nazwa_hotelu klasa="***"> Hilton </nazwa_hotelu> </miejsce_pobytu> <termin> </termin> <cena>2500</cena> </oferta> Komputer widzi : Bez słownika pojęć: <biuro_podrozy> <b i u r o_ p od r oz y > <oferta numer="0 0 0 1 "> <miejsce_pobytu> <of e r t a n u m e r ="0 0 0 1 "> <kraj> F r a n c j a </kraj> <m i e j s c e _ p ob y t u > <miejscowosc> N i c e a </ miejscowosc> <k r a j > F r a n c j a </k r a j > <nazwa_hotelu klasa="* * * "> H i l t on </nazwa_hotelu> <m i e j s c ow os c > </miejsce_pobytu> N i c e a </m i e j s c ow os c > <termin> <n a z w a _ h ot e l u k l a s a ="* * * "> H i l t on </ </termin> n a z w a _ h ot e l u > <cena>2 5 0 0 </cena> </m i e j s c e _ p ob y t u > </oferta> <t e r m i n > </t e r m i n > <c e n a >2 5 0 0 </c e n a > (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 27

Potrzeba reprezentacji semantyki XML sam w sobie nie zapewnia: specyficznego dla danej dziedziny słownika podstawowych elementów składniowych Wykorzystanie ontologii do określenia znaczenia ontologie dostarczają słownik pojęć nowe pojęcia mogą być konstruowane poprzez łączenie istniejących ( Pojęciowe Lego ) znaczenie (semantyka) pojęć jest formalnie określona możliwe określenie relacji między pojęciami z różnych ontologii (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 28

Co to jest semantyka? Semantyka (grecki: semanmkos, z sema = znak ) odnosi się do aspektów znaczenia, które są wyrażone w języku, kodzie, lub innej formie reprezentacji Innymi słowy, odnosi się do znaczenia przypisanego symbolom i zbiorom symboli w danym języku (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 29

Sieć Semantyczna podsumowanie dane w sieci, powiązane w taki sposób aby uzyskać spójną, logiczną sieć danych rozszerzenie obecnej sieci, w którym informacje mają dobrze zdefiniowane znaczenie (semantykę), co ułatwić ma współpracę pomiędzy komputerami i ludźmi zbiór technologii do realizacji Sieci Danych (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 30

Jak zrealizować Sieć Semantyczną? Wizja 1 ideologiczna rozszerzenie aktualnej sieci WWW przez adnotacje obecnych zasobów znacznikami opisującymi znaczenie (semantykę), przez klasyfikację i indeksację zasobów wykonane ręcznie lub pół- automatycznie (kto będzie to wykonywać?) zastosowania: personalizacji, wyszukiwanie i przeglądanie w sieci WWW (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 31

Jak zrealizować Sieć Semantyczną? Wizja 2 Sieć danych ( Web of data ) bliższa oryginalnej wizji Tim a Berners a Lee ekspozycja do sieci WWW zbiorów danych z baz danych, integracja tych zbiorów semantyka schematów baz danych powinna zostać wyeksponowana w sieci WWW razem z danymi umożliwienie maszynowej interpretacji, integracji i nieprzewidzianych przypadków użycia Sieć Semantyczna = wielka, globalna baza danych potencjał komercyjny (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 32

Warstwy Sieci Semantycznej W3C standard (OWL)- 2004 W3C standard (RDF)- 2002 W3C standard (XML) Tim Berners- Lee (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 33

Sieć Semantyczna - języki XML: składnia pozwalająca tworzyć dokumenty semistrukturalne, brak założeń co do ich znaczenia XML Schema: nakłada ograniczenia poprawnościowe na strukturę dokumentu XML, dodaje rozszerzalną hierarchię typów RDF: model danych do reprezentacji prostych relacji między obiektami (zasobami) RDF Schema: umożliwia opis klas i własności zasobów RDF oraz ich hierarchii OWL: bardziej rozbudowane możliwości opisywania klas i własności, modelowanie ontologii Wszystkie języki mogą być serializowane do XML (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 34

Bardziej aktualna wersja SPARQL: język zapytań do RDF, SQL dla Sieci Semantycznej, standard W3C 2008 RIF (lub SWRL): reguły (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 35

Web 3.0 People keep asking what Web 3.0 is. I think maybe when you've got an overlay of scalable vector graphics - everything rippling and folding and looking misty on Web 2.0 and access to a Semanxc Web integrated across a huge space of data, you'll have access to an unbelievable data resource... Tim Berners- Lee, 2006 (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 36

Syntactic Web (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 37

The Semantic Web (c) Mikołaj Morzy, Agnieszka Ławrynowicz, Instytut Informatyki Politechniki Poznańskiej TSiSS 38