Web 3.0 SIEĆ PEŁNA ZNACZEŃ Web Full of Meaning Łódź, 16 styczeń 2013
Agenda Część 1: Web 3.0 - wprowadzenie Dr. Mirek Sopek Część 2: Semantic Web - przykłady użycia Dr. Marcin Skulimowski 2
Wprowadzenie PODSTAWY SEMANTIC WEB
Część I Agenda Ewolucja sieci Web Problemy dzisiejszej sieci Web Semantic Web rozwiązaniem problemów (Podstawy, Technologie, Filozofia, Historia) Spotkanie z Semantic Web Rola Semantic Web w biznesie i w IT 4
Ewolucja sieci Web Sieć Web istnieje (tylko) 8722 dni (24 lata)!!! WEB 1.0 Sieć dokumentów WEB 2.0 Sieć uspołeczniona, Read/Write Web WEB 3.0 Semantic Web = Sieć Danych? WEB 4.0 Sieć Inteligentna? 5
Web 1.0 Sieć dokumentów 1989-2000 Web hyperlinkowanych dokumentów 6
Web 2.0 Sieć uspołeczniona / Read-Write Web 2000-2010 Web Sieci Społecznościowych i Mądrości Tłumu 7
Web 3.0 Semantic Web Sieć Pełna Znaczeń 2010-2020(?) Sieć danych/sieć danych połączonych (Linked Data) Organization Resource hasproducts Link haspeople Link humanresources Link hasservices Link Resource HR Resource Services Resource Products haspeople Link hasproduct Link Resource People Link haspeople colleague Link Resource People Resource Product colleague Link hasproduct Link Resource Product 8
Problemy dzisiejszej sieci Web 9
Główne problemy Web 1.0 & 2.0 The WEB is BIG* Between the birth of the world and 2003, there were five exabytesof information created. We [now] create five exabytesevery two days. See why it s so painful to operate in information markets? Eric Schmidt, CEO, Google, 2010 1 Exabyte = 10 6 Terabytes = 1 gigabyte of gigabytes 31 EB 44 EB 59 EB 77 EB 94 EB 110 EB *Not a bad thing in itself Problem w tym, że nie bardzo wiemy jak, przy tej skali sieci, pożytecznie jej używać? 2011 2012 2013 2014 2015 2016 Exabytesper Month Source: Cisco VNI Global Forecast, 2011-2016 10
Główne problemy Web 1.0 & 2.0 Sieć WEB jest TOO BIG to KNOW... Sieć osiąga tak wielką skalę tylko dlatego, że nie ma żadnych granic w jakich wiedza w niej gromadzona musiałaby się zamknąć. Brak granic oznacza jednak brak określonej formy. Z braku określonej i trwałej formy, wynika iż sieciowej wiedzy brakuje tego co jest esencją każdej ludzkiej wiedzy: fundamentów. On the Net, every fact has an equal and opposite reaction David Weinberger Too Big to Know Basic Books 2011 11
Sieci społecznościowe tworzą izolowane silosy 12
Sieć Web widzimy przez Googlowe GOGLE Nastąpiła dominacja i monopolizacja rynku wyszukiwarek Search engine barier 13
ROZWIĄZANIE: Semantic Web Web 3.0 14
Podstawy Semantic Web Semantic w Semantic Web dotyczy ZNACZENIA danych, i nie ma nic wspólnego z zapisem danych (syntax) ani jego formatem. Semantic Web = Web Full of Meaning = Sieć Pełna Znaczeń Semantic Web buduje reprezentację RZECZY (ZASOBÓW, OBIEKTÓW i KONCEPCJI) oraz ich WŁASNOŚCI w sieci Web, a nie tylko reprezentację dokumentów Semantic Web używa globalnego schematu NAZYWANIA i identyfikowania RZECZY, nie ogranicza się do adresowania dokumentów Semantic Web linkuje RZECZY za pomocą TYPED LINKS, a nie za pomocą ślepych hyperlinków Semantic Web pozwala na ODKRYWANIE nowych FAKTÓW dotyczących RZECZY, a nie tylko oglądanie stron 15
Co to znaczy reprezentować RZECZY w SW? Na przykład: W Semantic Web reprezentujemy RZECZY/ZASOBY za pomocą "atomów" danych jakimi są elementarne TRÓJKI (TRIPLES). Podmiot Orzeczenie Dopełnienie Obiekt Własność Wartość :RenaultClioSport :VIN_Number hasengine VF1CRCJ0H42590904 :2.0_litre_straight_4 Za pomocą elementarnych trójek tworzymy strukturalne relacje, budujemy słowniki, taksonomie, klasy i zbiory pojęć, aby ostatecznie przeprowadzać "rozumowanie" na dużych zbiorach trójek. Trójki zapisujemy w formacie RDF "RDF jest dla RZECZY tym, czym HTML dla DOKUMENTÓW" Resource Description Framework 16
Co oznacza Identyfikacja Rzeczy/Zasobów w Semantic Web? W celu jednoznacznej identyfikacji RZECZY (objektów) w sieci Web i ich własności, Semantic Web używa identyfikatorów URI (Universal Resource Identifiers) czyli generalizacji standardowych adresów URL (Universal Resource Locator) http://www.renault.co.uk/cars/model/new-clio/product.aspx http://purl.org/vso/ns#vin A number Renault Clio VIN Number VF1CRCJ0H42590904 17
Natura Semantycznych Linków Semantic Web linkuje rzeczy, a nie tylko dokumenty Semantyczne linki są kategoryzowane: RDF pozwala na jawną deklarację typu danego linku. COMPANY gr:offers gr:offers Offer/ Product 2 Offer/ Product 1 gr:availableatorfrom gr:haspos gr:haspos gr:availableatorfrom Store 1 Store 2 18
Jak wyglądają dane semantyczne? Fragment ontologii zapisanej w RDF/XML: <owl:class rdf:about="http://purl.org/uco/ns#parkingtype"> <rdfs:label xml:lang="en">parking Type</rdfs:label> <rdfs:subclassof rdf:resource="http://purl.org/goodrelations/v1#qualitativevalue"/> <rdfs:isdefinedby rdf:resource="http://purl.org/uco/ns#"/> <rdfs:comment xml:lang="en">a type of parking for a vehicle, e.g. in a garage, on the street (open-sky), or in a carport. You can use DBpedia URIs for additional types.</rdfs:comment> </owl:class> <owl:class rdf:about="http://purl.org/uco/ns#modificationormaintenance"> <rdfs:label xml:lang="en">modification or Maintenance</rdfs:label> <rdfs:subclassof rdf:resource="http://schema.org/event"/> <rdfs:isdefinedby rdf:resource="http://purl.org/uco/ns#"/> <rdfs:comment xml:lang="en">a modification or maintenance is an event in which a part of the vehicle is being replaced or removed, or a new part is being added. Typical examples are the replacement of the engine or the installation of a trailor-hitch.</rdfs:comment> </owl:class> 19
Jak wyglądają dane semantyczne? Fragment opisu cech samochodu zapisany za pomocą Turtle:... # Non-standard features using uco:propertyvalue # 12V front power outlet foo:car_155049 uco:feature [ a uco:propertyvalue ; uco:propertyname "12V front power outlet"@en ; uco:propertyvalue "yes"@en ]. # Rear leg room: 26.8 in. foo:car_155049 uco:feature [ a uco:propertyvalue ; uco:propertyname "Rear leg room"@en ; uco:propertyvalue "26.8" ; uco:unitcode "INH"^^xsd:string ; uco:unittext "inches"@en ]. 20
Semantic Web umożliwia odkrywanie nowych faktów Semantic Web posiada narzędzia do budowy "inteligentnych" słowników. Słowniki te przybierające postać "ontologii" (wyrażonych w RDFS i OWL) pozwalają na wykonywanie logicznych wnioskowań i odkrywanie DOMNIEMANYCH (IMPLICIT) faktów. Np. Kiedy internauta szuka samochodu o określonych cechach silnika można mu "podesłać" ofertę innego samochodu należącego do takiej klasy samochodów które używają danego typu samochodu. 21
Semantic Semantic Web Web = = GGG GGG (Gigantyczny (Gigantyczny Globalny Globalny Graf) Graf) People haspeople haspeople colleague HR humanresources Organization People Ooops sorry, but it s BIG haspeople Services hasservices hasproducts colleague Product hasproduct Products hasproduct Product GGG Giant Global Graph pojęcie stworzone przez Tim Berners Lee w 2007 22
Technologie Semantyczne jedno spojrzenie RDF Resource Description Framework RDFa RDF in attributes RDFS Resource Description Framework Schema Language OWL Ontology Web Language SPARQL Semantic Protocol & RDF Query Language (SPARQL Protocol ) RDF opisuje RZECZY (ZASOBY) RDFa umożliwia publikowanie RDF w stronach HTML RDFS opisuje ZBIORY of RZECZY OWL Tworzy inteligentne SŁOWNIKI (wraz z relacjami logicznymi pomiędzy pojęciami) SPARQL pozwala na przeszukiwanie grafów semantycznych 23
... i jedno na podstawy filozoficzne Semantic Web AAA Anyone can say Anything about Any Topic. OWA Open World Assumption Musimy zawsze zakładać, że w dowolnym momencie nowa informacja może stać się dostępna, tak więc nie możemy zakładać że posiadamy CAŁĄ informację w momencie konsumpcji tej informacji. Oznacza to również że brak pełnej wiedzy o czymś nie implikuje fałszywości wiedzy! Nonunique naming Ponieważ publikując w sieci Web nie musimy koordynować naszych wysiłków, dowolna rzecz może być znana pod wieloma nazwami (pomimo tego, że mamy gwarancję iż w schemacie URI nazwy są unikalne) Hendler Hypothesis: A Little Semantics Goes A Long Way Z odrobiną Semantyki Zajdziesz Daleko 24
Hendler Hypothesis w działaniu... Cztery reguły inicjatywy Link Data: 1. Zawsze używaj ADRESÓW URL jako nazw dla rzeczy. 2. Używaj ADRESÓW KTÓRE DZIAŁAJĄ Aby inni mogli zawsze się do nich odwołać. 3. Kiedy ktoś się do nich odwołuje, DOSTARCZ UŻYTECZNEJ INFORMACJI za pomocą uznanych STANDARDÓW (takich jak RDF). 4. Publikuj LINKI DO INNYCH URL aby ludzie mogli odkrywać inne rzeczy. The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine can explore the web of data. With linked data, when you have some of it, you can find other, related, data. (Tim-Berners Lee) 25
Architektury systemów semantycznych Typowe składniki systemów semantycznych 1. Parsery RDF i narzędzia do serializacji grafów 2. Triple-Stores 3. Aplikacje Sematyczne (integracje danych, anotacje, zarządzanie treścią, inteligentne wieloaspektowe wyszukiwanie) 4. Data Federation Tools Narzędzia obsługi Danych Powiązanych 5. Rezonery narzędzia do automatycznego wnioskowania Rysunek z Tim Berners-Lee Putting the Web back in Semantic Web 26
Historia sieci (semantycznej) historia jednego człowieka? Web 1.0 (Web of Documents) Sir Tim Berners-Lee Information Management: A Proposal Marzec 1989, Pierwszy serwer sieci Web http://info.cern.ch Grudzień 1990, CERN Web 3.0 (Web of Data) Sir Tim Berners-Lee again! Inspirujący artykuł: Semantic Web Scientific American Maj 2001 z James Handler emi Ora Lassila(Nokia) TBL s TED talk Luty 2009 27
Semantic Web na osi czasu RDF 1999 FOAF - 2000 RDFa - 2004 DBPedia 2007 GoodRelations (2008, Adopcja przez Google: Listopad 2, 2010) Schema.org Czerwiec 2011 Google s Knowledge Graph Maj 2012 Integracja GoodRelations i schema.org Listopad 2012 (Boston ISWC) FaceBook Graph Search Styczeń 2013 28
Rendez-vous z Semantic Web Semantic SEO Rich Snippets Google s Knowledge Graph Google Fusion Tables SIRI Volkswagen OpenCalais GoodRelations w e-commerce (PrestaShop, Oxid) Renault Link Data car configurator XBRL & Semantic Financial DataSpaces 29
Transformacyjna rola Sieci Semantycznych Koniec ery Push w marketingu Ekonomia Pull - nie Push The Power of Pull (Deloitte) Pull The power of Semantic Web to Transform your Business Performance economy The overhaul of our information infrastructure that the semantic web heralds ultimately will lead to a performance economy, where the winners will be those companies that understand how to leverage the transition from a world where information is pushed to one where customers pull it on demand. Jennifer Zaino 30
Transformacyjna rola Sieci Semantycznych (przyszłe tematy Forum?) Zupełnie nowe podejście do Integracji Danych Nowe metody publikacji i udostępniania danych Nowe podejście do SEO Systematyczne opisy procesów biznesowych 31
Szczególne kompetencje MakoLab w SW: Ekspert w implementacji GoodRelations: prawie 4500 sklepów na świecie używa naszego modułu do PrestaShop Zaawansowane wykonane pod klucz sklepy w UK i Austrii używają naszych implementacji Tworzenie ontologii (UCO Used Cars Ontology) http://purl.org/uco - najwyższej jakości ontologia dla motoryzacji Semantyczne konfiguratory produktów (http://semcms.makolab.fr/semantic-configurator) Semantyczne systemy CMS (http://blog.iksproject.eu/makolabs-stanbol-integration-with-renault-internationalcms-system/) Semantyczne opisy procesów biznesowych (opisy dla własnych systemów Fractus/ColDis) Coroczna konferencja MSD MakoLab Semantic Day - Paryż 32
Zapraszamy do udziału w Forum Rejestracja: http://semantic.makolab.pl/ 33
Dziękuję za uwagę Mirek Sopek MakoLab SA Demokratyczna 46 93430 Lodz Poland Phone +48 600 814 537 Web www.makolab.com email sopek@makolab.com