Plan wykładu. O mnie

Podobne dokumenty
Sprawy organizacyjne. XML i nowoczesne technologie zarządzania treścią. Zawartość zajęć. Plan wykładu. empolis. O mnie

Znakowanie tekstu w epoce komputerów

Sprawy organizacyjne. Zawartość zajęć. Plan wykładu. O mnie. empolis. XML i nowoczesne technologie zarządzania treścią

Sprawy organizacyjne. XML i nowoczesne technologie zarządzania treścią. Plan wykładu. Zawartość zajęć. empolis. O mnie

Sprawy organizacyjne. Zawartość zajęć. Plan wykładu. O mnie. Moje projekty. XML i nowoczesne technologie zarządzania treścią

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

Historia rozwoju technik znakowania tekstu

Historia rozwoju technik znakowania tekstu

XML Extensible Markup Language

METAJĘZYKI

Jak wygląda XML? Definiowanie typów dokumentów Część 1. DTD. Struktura logiczna dokumentu XML. Podstawy składni XML. Definiowanie języków

Jak wygląda XML? Definiowanie typów dokumentów. Struktura logiczna dokumentu XML. Podstawy składni XML. Definiowanie języków. Poprawność dokumentów

Jak wygląda XML? Definiowanie typów dokumentów Część 1. DTD, XML Schema. Struktura logiczna dokumentu XML. Składnia XML. Encje predefiniowane.

XML i nowoczesne metody zarządzania treścią

Jak wygląda XML? Definiowanie typów dokumentów Część 1. DTD, XML Schema. Struktura logiczna dokumentu XML. Składnia XML. Encje predefiniowane.

Rola języka XML narzędziem

Rok akademicki: 2013/2014 Kod: ZZIP IN-s Punkty ECTS: 2. Kierunek: Zarządzanie i Inżynieria Produkcji Specjalność: Informatyka w zarządzaniu

Model semistrukturalny

Plan dzisiejszego wykładu. Narzędzia informatyczne w językoznawstwie. XML - Definicja. Zalety XML

XML i nowoczesne metody zarządzania treścią

Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

XPath XML Path Language. XPath. XSLT część 1. XPath data model. Wyrażenia XPath. Location paths. Osie (axes)

WYKŁAD 1 METAJĘZYK SGML CZĘŚĆ 1

ROZPORZĄDZENIE RADY MINISTRÓW. z dnia 11 października 2005 r. (Dz. U. z dnia 28 października 2005 r.)

HTML nie opisuje układu strony!!!

ROZPORZĄDZENIE RADY MINISTRÓW. z dnia 11 października 2005 r. w sprawie minimalnych wymagań dla systemów teleinformatycznych

Programowanie internetowe

Implementacja standardu GML w oprogramowaniu firmy INTERGRAPH

Wprowadzenie do technologii XML

Podstawy języka XML. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Blok I6 Nowoczesne postaci dokumentów - tworzenie i wymiana dokumentów komputerowych

Środowisko XML (Extensible Markup Language).

Źródła. cript/1.5/reference/ Ruby on Rails: AJAX: ssays/archives/

LAB 7. XML EXtensible Markup Language - Rozszerzalny Język Znaczników XSD XML Schema Definition Definicja Schematu XML

KARTA KURSU. Przetwarzanie dokumentów XML i zaawansowane techniki WWW

Sposób doręczania dokumentów elektronicznych. do Urzędu Gminy Zawady

mgr inż. Jacek Staniec Język XML

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Tomasz Grześ. Systemy zarządzania treścią

Narzędzia informatyczne w językoznawstwie

Programowanie komponentowe

Wprowadzenie do XML. Joanna Jędrzejowicz. Instytut Informatyki

Bazy danych i strony WWW

Sprawy organizacyjne. Zawartość zajęć. Plan wykładu. O mnie. Moje projekty (wybór) XML i nowoczesne technologie zarządzania treścią

XML extensible Markup Language. Paweł Chodkiewicz

Rozdział 1. Informacje podstawowe

UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

O stronach www, html itp..

Wprowadzenie do arkuszy stylistycznych XSL i transformacji XSLT

Języki formatowania dokumentów strukturalnych. XSL przekształcenia XML-a. XSL a XSLT. XSL części składowe. Zasada działania przekształcenia XSLT

The Binder Consulting

Komunikacja i wymiana danych

Systemy zarządzania treścią

Ogólna struktura dokumentu XSL-FO. Model formatowania. Ogólna struktura dokumentu XSL-FO C.d. Przykład Hello World Użycie szablonu strony

ECDL/ICDL Web Editing Moduł S6 Sylabus - wersja 2.0

JAK OPTYMALNIE DOBRAĆ ODPOWIEDNIE TECHNOLOGIE INFORMATYCZNE?

Opis standardu. Dokumenty w postaci czystego (niesformatowanego) zbioru znaków zapisanych w standardzie Unicode UTF-8 jako pliki typu.

Programowanie w Internecie

Kierunek i poziom studiów: Chemia, pierwszy. Sylabus modułu: Technologia informacyjna (0310-CH-S1-003) 1. Informacje ogólne

Elektroniczna wymiana danych (EDI) jest to: - wymiana informacji pomiędzy komputerami, z użyciem powszechnie akceptowanych standardów

Języki programowania wysokiego poziomu WWW

Sposoby tworzenia projektu zawierającego aplet w środowisku NetBeans. Metody zabezpieczenia komputera użytkownika przed działaniem apletu.

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Część II. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Przedmiot: Grafika komputerowa i projektowanie stron WWW

Jak skutecznie zarządzać informacją?

Wykorzystanie standardów serii ISO oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Semantic Web Internet Semantyczny

29. Poprawność składniowa i strukturalna dokumentu XML

STRONY INTERNETOWE mgr inż. Adrian Zapała

Otwarte protokoły wymiany informacji w systemach ITS

Definiowanie typów dokumentów Część 1. DTD, XML Schema

Kurs HTML 4.01 TI 312[01]

3 grudnia Sieć Semantyczna

Relacyjne bazy danych a XML

Modelowanie i analiza systemów informatycznych

Web Services. Wojciech Mazur. 17 marca Politechnika Wrocławska Wydział Informatyki i Zarządzania

BPM vs. Content Management. Jarosław Żeliński analityk biznesowy, projektant systemów

Copyright wersji angielskiej: The European Computer Driving Licence Foundation Ltd. Copyright wersji polskiej: Polskie Towarzystwo Informatyczne

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

2 Podstawy tworzenia stron internetowych

USB firmware changing guide. Zmiana oprogramowania za przy użyciu połączenia USB. Changelog / Lista Zmian

URL:

GML w praktyce geodezyjnej

Podstawy elektronicznej wymiany danych. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Technologie informacyjne (6) Zdzisław Szyjewski

WITRYNY I APLIKACJE INTERNETOWE

Sylabus Moduł 2: Przetwarzanie tekstów

Środowisko publikacyjne oparte na XML-u. Szymon Zioło 1 maja 2004

Co już można, a co będzie można zrobić w e-podręczniku technologicznie?

PRZEWODNIK PO PRZEDMIOCIE

Aplikacje internetowe - opis przedmiotu

Pla$orma edukacyjna czy to wystarczy? Przygotował: Artur Dyro, Prezes Learnetic S.A.

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

Lab.1. Praca z tekstem: stosowanie arkuszy stylów w dokumentach OO oraz HTML/CSS

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Historia kodowania i format plików XML. Jolanta Bachan

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/2017

c TP: anything: 13 listopada 2004 roku 1

Transkrypt:

Plan wykładu XML i nowoczesne technologie zarządzania treścią Wykład monograficzny, semestr letni 2001/2002 Szymon Zioło Dyrektor Działu Usług empolis Polska Historia rozwoju technik znakowania tekstu. Podstawowe koncepcje SGML-a i XML-a. Standardy związane z SGML-em i XML-em. Modelowanie informacji. Systemy i technologie zarządzania treścią. Publikowanie treści. Przekształcenia XSL. XML w elektronicznej wymianie danych i integracji aplikacji. Wykorzystanie XML-a we własnych ch. XML a bazy danych. Kategoryzacja, klasyfikacja i wyszukiwanie informacji. Technologie modelowania i kodowania wiedzy. 1 2 Ćwiczenia O mnie Omówienie technicznych aspektów zagadnień przedstawianych na wykładzie. Studia przypadków. Prezentacje oprogramowania. Ćwiczenia z modelowania informacji, przekształceń XSL, itp. W empolis Polska od 1999 roku: prace analityczno-projektowe, wdrożenia systemów zarządzania i przetwarzania informacji strukturalnej opartych na technologii SGML/XML, popularyzacja technologii XML, kursy, szkolenia, od lipca 2001 Dyrektor Działu Usług. Inicjator powstania grupy newsowej pl.comp.xml. Redaktor prowadzący wydania 6 2001 czasopisma Software 2.0 poświęconego XML-owi. 3 4 empolis Referencje empolis Polska empolis: Niemcy Węgry Norwegia Polska Wielka Brytania USA, Bertelsmann Mohn Media Group. Doświadczenie w: technologiach wspierających zarządzanie informacją strukturalną (m. in. SGML / XML), organizacji środowiska informacyjnego zorientowanej na treść i jej strukturę. 5 6 1

Referencje grupa empolis (wybór) Rozwiązania empolis Rozwiązania w zakresie zarządzania treścią i zarządzania wiedzą w całym cyklu jej życia: Media Automotive/ Suppliers przygotowywania treści, generowania wartości dodanej, Public Administration dostarczania treści. Utilities/ Engineering Produkty empolis: Pharma/Chemie zarządzanie treścią: sigmalink, Retail/Mail Order inteligentne wyszukiwanie: orenge, zarządzanie wiedzą: x2x, k42, Aerospace publikowanie: catalox, mediatopix. Telecom/IT 7 8 Markup znakowanie Markup Languages (emele): SGML Standard Generalized Markup Language, HTML Hypertext Markup Language, Historia rozwoju technik znakowania tekstu XML Extensible Markup Language. Markup: the process of marking manuscript copy for typesetting with directions for use of type fonts and sizes, spacing, indentation, etc. (The Chicago Manual Of Style). 9 Prehistoria: znakowanie tekstu 10 Znakowanie tekstu w epoce komputerów Treść wytłuszczyć wcięcie Hamlet Być albo nie być. Oto jest pytanie + Hamlet odstęp Być albo nie być. Oto jest pytanie. Formatowanie, adjustacja {nowy_wiersz} {bold} {wyłącz_bold} {wcięcie} Dokument = Hamlet {bold}hamlet{wyłącz_bold}{nowy_wiersz}{wcięcie} Być albobyć nie być. pytanie. albooto niejest być. Oto jest pytanie. 11 12 2

Przykłady języków znakowania Korzenie Frame (MIF) QuarkXPress RTF Ventura TeX/LaTeX PostScript HTML <Font <FTag `B >> <String `Hamlet > <B>Hamlet<B> {\b\f5\cf1 Hamlet} <B>Hamlet<D> \textbf{hamlet} /Times-BoldR 900 ff (Hamlet)W <B>Hamlet</B> Lata 60-te: 1967 William Tunnicliffe, prezes Graphic Communications Association, podczas spotkania w Canadian Government Printing Office przedstawia ideę oddzielenia zawartości informacyjnej dokumentów od ich formatu, Stanley Rice proponuje użycie uniwersalnych znaczników do znakowania struktury tekstu, projekt GenCode definiuje sposób oznaczania tekstu ukierunkowany na jego strukturę. 13 14 Korzenie: INTIME Edytor kontekstowy INTIME INteractive Textual Information Management Experiment: projekt badawczy Charlesa Goldfarba (IBM Cambridge Scientific Center, koniec lat 60-tych), prototyp zintegrowanego systemu przetwarzania tekstu: edycja tekstu, repozytorium dokumentów, wyszukiwanie; wykorzystane technologie: "maszyny wirtualne" na mainframie IBM 360, "concurrent access to a disk file", "context editors". LOCATE /researchers/ researchers. A system which integrates CHANGE /researchers/analysts/ analysts. A system which integrates CHANGE /edit/edit/ * In online systems, text editing is are known as "context" editors. They NEXT provide a retrieval capability: e.g., QUIT 15 16 Wnioski z projektu INTIME Rozwój języków uogólnionego znakowania tekstu The usefulness of a retrieval program can be affected by its ability to identify the structure and purpose of the parts of text (e.g., footnotes, abstracts, citations). [...] A heuristic routine for identifying new paragraphs in normal text was developed for INTIME, but a more sophisticated facility is needed. A typesetting command language could convey such information, but present languages deal with the appearance of the text, not with the purpose which motivated it. C. Goldfarb, "SGML: The Reason Why and the First Published Hint", Journal of the American Society for Information Science. Volume 48, Number 7 (July 1997) 1969, IBM: GML Generalized Markup Language (Goldfarb, Mosher, Laurie). 1986: SGML Standard Generalized Markup Language, ISO 8879:1986. 1991: powstaje World Wide Web. 1994: HTML 2.0 zdefiniowany jako zastosowanie SGML-a. 1998: XML Extensible Markup Language, World Wide Web Consortium. 17 18 3

Wokół SGML-a World Wide Web Consortium (W3C) Pierwsze szerzej znane zastosowania SGML-a: Electronic Manuscript Project, Association of American Publishers, 1987, CALS Computer-Aided Acquisition and Logic Support, US Department of Defense, MIL-M-28001, February 1988. Standardy pokrewne: DSSSL Document Style Semantics and Specification Language, HyTime: meta-notacja dla linków, opis struktur multimedialnych, rozciągniętych w czasie. Kuźnia standardów internetowych, np.: HTML Hyper Text Markup Language, HTTP Hyper Text Transfer Protocol, CSS Cascading StyleSheets,... XML Extensible Markup Language: najważniejsza rekomendacja ostatnich lat, twórcy: Tim Bray (Netscape), Jean Paoli (Microsoft), C.M. Sperberg-McQueen (University of Illinois). Obecne dominują prace nad standardami związanymi z XML-em. 19 20 Ewolucja Internetu Programy i ich formaty Prawie każda wprowadza swój wewnętrzny format. Nowe wersje tej samej aplikacji wprowadzają zmiany do używanego formatu: czas wsteczna kompatybilność, brak możliwości zapisu do formatu poprzednich wersji. Aplikacje dostarczają konwerterów: tylko do najpopularniejszych formatów, możliwość utraty danych podczas konwersji. start dzisiaj 21 22 Standardy Potrzeba struktury Nie istnieją uznane standardy. Istnieją substandardy w różnych dziedzinach: dokumenty biurowe: Microsoft Word, teksty naukowe: Postscript, TeX, Internet: HTML, GIF, JPG, elektroniczna wymiana danych: EDIFACT. Standard musi być: własnością publiczną, otwarty i jawny, niezależny od konkretnego producenta oprogramowania. Masa informacji cyfrowej powoduje potrzebę struktury: jeden format dokumentu nie wystarczy dla 5 miliardów ludzi, ale nie możemy operować milionami niekompatybilnych formatów. 23 24 4

Idea SGML/XML (1) Sposób prezentacji Oddzielenie znaczenia tekstu od sposobu prezentacji. <OSOBA MÓWIĄCA>Hamlet</OSOBA MÓWIĄCA> <WYPOWIEDŹ>Być albo nie być. Oto jest pytanie.</wypowiedź> OSOBA MÓWIĄCA nowy akapit do lewej wytłuszczenie WYPOWIEDŹ nowy akapit wcięcie na 2 cm do lewej Hamlet Być albo nie być. Oto jest pytanie. 25 26 Inny sposób prezentacji Idea SGML/XML (2) OSOBA MÓWIĄCA na marginesie tekst pionowo niebieski hiperlink do opisu postaci na początku dramatu WYPOWIEDŹ nowy akapit kursywa ew. użyj syntezatora mowy z ustawieniami dla OSOBY MÓWIĄCEJ Stworzenie najodpowiedniejszego modelu dla naszych własnych dokumentów. Hamlet Być albo nie być. Oto jest pytanie. <OSOBA MÓWIĄCA>Hamlet</OSOBA MÓWIĄCA> <WYPOWIEDŹ> <NUDA> Być albo nie być. Oto jest pytanie. </NUDA> </WYPOWIEDŹ> 27 28 Najodpowiedniejszy model Język metajęzyk Przykłady: encyklopedia: <nazwisko>, <imie>, <ur>, <zm>, <wymowa>, <etymologia>, <liczba-mieszk> prawo: <promulgator>, <rocznik>, <poz>, <art> <sąd>, <sygn-wyroku>, <teza> dokument techniczny: <part-number>, <function-name> patenty: <wynalazca>, <nr-zgłoszenia> ubezpieczenia: <data-polisy>, <wart-polisy> Stan obecny: Wieża Babel (brak wspólnego języka), czy w ogóle możliwy jeden wspólny język? Wspólny metajęzyk: znana gramatyka, jednolita metodologia, takie same narzędzia. Dowolnie wiele języków specyficznych dla zastosowań. 29 30 5

Genealogia XML-a Co to jest XML?... CDF XML SGML GML RDF SVG HTML VRML... XML to nie język programowania. XML to sposób zapamiętywania danych wraz z ich strukturą w dokumencie tekstowym: otwarty, elastyczny, bezpłatny, niezależny od platformy sprzętowej. XML to rama składniowa do tworzenia języków specyficznych dla zastosowań. Użycie XML-a nie zwalnia od myślenia (analizy, projektowania,...) 31 32 Jak wygląda XML? HTML XML <?xml version= 1.0?> <zeznanie-sprawcy nr= 1313/2001 > <autor>st. asp. Jan Łapówka</autor> <miejsce>dołowice Górne</miejsce> <treść>wypadek dnia <data>13.10.2001r</data> o godzinie <godzina>13:13</godzina> (<dzien-tygodnia>piątek </dzien-tygodnia>) miał miejsce nie z mojej winy. <poszkodowany>alojzy M.</poszkodowany> nie miał żadnego pomysłu w którą stronę uciekać, więc go przejechałem.</treść> </zeznanie-sprawcy> Deklaracja XML Element główny Atrybut Element Znacznik początkowy Znacznik końcowy Zawartość tekstowa Znaczenie elementów i ich atrybutów z góry określone. Interpretację elementów określa standard, a w praktyce przeglądarki internetowe. To, co jest poprawne również określają przeglądarki internetowe. Znaczenie elementów i ich atrybutów określa użytkownik lub. <p> może w jednym dokumencie oznaczać paragraf, w drugim pomoc, a w trzecim pismo odręczne. Poprawność XML-a jest ściśle określona przez specyfikację. 33 34 SGML XML Klasy zastosowań XML-a Filozofia: jeden duży system edytorialny. Konieczność definiowania struktury. Skomplikowana składnia, wiele opcji. Trudność tworzenia parserów. Bardzo drogie narzędzia. Filozofia: wiele małych komunikujących się ze sobą modułów. Opcjonalne definiowanie struktury. Uproszczona składnia. Łatwość tworzenia parserów. Darmowe narzędzia. Zarządzanie dokumentami, treścią, wiedzą: Pierwotne zastosowanie SGML-a. Dokumenty tworzone przez a i przeznaczone dla a. Długi czas życia dokumentów. Typowy model mieszany zawartości. Elektroniczna wymiana danych, integracja aplikacji: Nowa klasa zastosowań XML-a. Dokumenty tworzone oraz przetwarzane automatycznie Dokumenty tworzone tylko na czas komunikacji. Konieczność dokładnego kontrolowania struktury i zawartości. 35 36 6

Dwie twarze XML-a Gdzie szukać dalej Dokument tekstowy: <zeznanie-sprawcy> Wypadek dnia <data> 13.01.2001 r.</data> o godzinie <godzina>13.13 </godzina> (<dzien-tygodnia> piątek</dzien-tygodnia>) miał miejsce nie z mojej winy. <poszkodowany>alojzy M.</poszkodowany> nie miał żadnego pomysłu w którą stronę uciekać, więc go przejechałem. </zeznanie-sprawcy> Baza danych: <zamowienie> <pozycja> <nazwa>papier</nazwa> <jednostka>ryza </jednostka> <ilosc>3</ilosc> </pozycja> <zamawiajacy id= 123456 > <imie>szymon</imie> <nazwisko>zioło </nazwisko> <firma>empolis Polska </firma> </zamawiajacy> </zamowienie> Charles F. Goldfarb's SGML Source Home Page: www. sgmlsource.com Rekomendacja XML: www.w3.org/tr/rec-xml W3C The World Wide Web Consortium: www.w3.org XML.com: www.xml.com 37 38 Gdzie szukać dalej Gdzie szukać dalej The XML Industry Portal, hosted by OASIS: www.xml.org The XML Cover Pages: www.oasis-open.org/cover/xml.html XML/SGML w Polsce: www.xml.pl pl.comp.xml Harold, E. R., XML Księga eksperta, Wydawnictwo Helion, 2000 (wersja oryginalna: XML Bible, IDG Books Worldwide, Inc., 2000) Marchal, B., XML w przykładach, Wydawnictwo Mikom, 2000 (wersja oryginalna: XML by Example, QUE Corporation) Young, M. J., XML krok po kroku, Wydawnictwo RM, 2000 (wersja oryginalna: XML step by step, Microsoft Press) 39 40 7