Technologie zarządzania treścią

Wielkość: px
Rozpocząć pokaz od strony:

Download "Technologie zarządzania treścią"

Transkrypt

1 Technologie zarządzania treścią dr inż. Robert Perliński Politechnika Częstochowska Instytut Informatyki Teoretycznej i Stosowanej

2 Technologie zarządzania treścią 2/43 Technologie zarządzania treścią XML język, parsery (DOM i SAX - biblioteka libxml2), technologie powiązane z XMLem: nazewnictwo (Namespaces), opis struktury dokumentu (DTD, XML Schema), prezentacja i przetwarzanie (XSLT, XSL-FO), odsyłacze (XLink, XPath, XPointer), wyszukiwanie (XPath, XQuery, XPointer), JSON format, parser.

3 Technologie zarządzania treścią 3/43 Trochę historii Koniec lat 60-tych to powstanie języka GML (ang. General Markup Language) - pierwszy język znaczników rok ogłoszenie standardu SGML (ang. Standard General Markup Language). SGML ma bardzo skomplikowaną strukturę definiowania dokumentu Specyfikacja standardu SGML to 500 stron maszynopisu! Koniec lat 80-tych i początek lat 90-tych - powstaje język HTML (ang. HyperText Markup Language). HTML + HTTP + URL = WWW Wzrost liczby stron, użytkowników i liczby przetwarzanych informacji. HTML nie wystarcza do coraz bardziej złożonych informacji dostępnych w sieci rok - początek prac nad językiem XML 1998 rok - pierwsza oficjalna wersja XML (1.0), specyfikacja to 35 stron 2008 rok - piąta edycja XML 1.0

4 Technologie zarządzania treścią 4/43 Dlaczego powstał XML Ściśle określony zbiór znaczników języka HTML - brak możliwości definiowania własnych znaczników. XML, jako metajęzyk pozwala definiować własne znaczniki, pozwala tworzyć własne języki. Definicja własnych znaczników pozwala nadać informacji pewną strukturę. HTML odpowiada za sposób prezentacji informacji, struktura informacji jest mniej ważna; ciężko tutaj o automatyczne przetwarzanie informacji. W HTML informacje o sposobie prezentacji są w dokumencie - zaciemniają treść samej informacji. <h4 align=center>politechnika Częstochowska</h4> <p>nasza uczelnia składa się z 6 wydziałów: <ul> <li>wydział Budownictwa</li> <li>wydział Inżynierii Mechanicznej i Informatyki</li> <li>wydział...</li> <li>wydział Zarządzania</li> </ul> </p>

5 Technologie zarządzania treścią 5/43 Dlaczego powstał XML Ściśle określony zbiór znaczników języka HTML - brak możliwości definiowania własnych znaczników. XML, jako metajęzyk pozwala definiować własne znaczniki, pozwala tworzyć własne języki. Definicja własnych znaczników pozwala nadać informacji pewną strukturę. HTML odpowiada za sposób prezentacji informacji, struktura informacji jest mniej ważna; ciężko tutaj o automatyczne przetwarzanie informacji. W HTML informacje o sposobie prezentacji są w dokumencie - zaciemniają treść samej informacji. <uczelnia> <nazwa>politechnika Częstochowska</nazwa> <opis>nasza uczelnia składa się z 6 wydziałów:</opis> <wydzial>wydział Budownictwa</wydzial> <wydzial>wydział Inżynierii Mechanicznej i Informatyki</wydzial> <wydzial>wydział...</wydzial> <wydzial>wydział Zarządzania</wydzial> </uczelnia>

6 Technologie zarządzania treścią 6/43 Dlaczego powstał XML HTML - brak rozróżniania wielkich i małych liter, nie ma konieczności umieszczania wartości atrybutów w apostrofach lub cudzysłowach, nie ma konieczności występowania znaczników końcowych. W HTML nie ma konieczności sprawdzenia poprawności danych - przeglądarki wyświetlają strony nawet z błędami. Potrzeba skutecznego sposobu wymiany danych w sieci EDI (ang. Electronic Data Interchange) - stąd (XML, JSON). HTML jest zbyt prosty w zastosowaniach kiedy chodzi o przetwarzanie informacji. <h4 align=center>politechnika Częstochowska</h4> <p>nasza uczelnia składa się z 6 wydziałów: <ul> <LI>Wydział Budownictwa <li>wydział Inżynierii Mechanicznej i Informatyki <li>wydział... <li>wydział Zarządzania </UL>

7 Technologie zarządzania treścią 7/43 SGML, XML i HTML SGML i XML to metajęzyki (XML to znacznie uproszczony SGML). XML jest lżejszą wersją języka SGML. HTML, XHTML, MathML,... to konkretne aplikacje SGMLa czy XMLa.

8 Technologie zarządzania treścią 8/43 XML XML - rozszerzalny język znaczników (ang. extensible Markup Language) Uniwersalny język przeznaczony do reprezentowania różnych danych w strukturalizowany sposób. Język niezależny od platformy, co umożliwia łatwą wymianę dokumentów pomiędzy heterogenicznymi systemami i znacząco przyczyniło się do popularności tego języka w dobie internetu. Standard specyfikowany i rekomendowany przez organizację W3C. Powstał dla sieci internet, z myślą o niej, ale jego zastosowanie wykracza poza tę sieć.

9 Technologie zarządzania treścią 9/43 XML Jest językiem tekstowym - dokumenty XML są plikami tekstowymi. Jest rozszerzalny - można dodawać własne znaczniki. Jest międzynarodowy - używa standardu Unicode, domyślnie kodowanie UTF-8. Jest sposobem tekstowego przechowywania informacji - jest bliższy bazom danych niż językom programowania Jest całą rodziną języków i technologii (MathML, SVG, RSS,...). Jest otwartym standardem - sprzyja to rozwojowi bazujących na nim technologii. W stosunku do języka SGML, XML jest łatwy w użyciu. Dzięki DTD czy XML Schema można określać strukturę dokumentu. Jest hierarchiczny, każdy dokument XML to pojedyncza hierarchia elementów.

10 Technologie zarządzania treścią 10/43 Czym nie jest XML XML nie jest językiem programowania. Nie istnieje kompilator XML. Dokumenty XML mogą być wykorzystywane przez kompilator (np. plik konfiguracyjny) lub program, ale poszczególne działania zawsze podejmuje program - nie dokument XML. XML nie jest protokołem transportu sieciowego, ale dane przesyłane przez sieć np. przy użyciu HTTP, FTP lub innego protokołu mogą zostać zapisane w formacie XML. XML nie jest bazą danych. Dane w formacie XML możemy przechowywać w bazie danych.

11 Technologie zarządzania treścią 11/43 DTD DTD (ang. Document Type Definition) dokument definiujący formalną strukturę dokumentów XML. DTD może znajdować się w pliku dokumentu, którego strukturę definiują, lub w osobnym pliku tekstowym. Zapis DTD w osobnym pliku pozwala na użycie tego samego DTD do wielu dokumentów XML. DTD wymienia wszystkie dozwolone oznaczenia i określa gdzie i w jaki sposób dane oznaczenie może być umieszczone w dokumencie XML. Dokumenty XML można porównywać z DTD i na tej podstawie określać czy dany dokument XML jest prawidłowy.

12 Technologie zarządzania treścią 12/43 Dokument XML Dokument XML: zawiera wyłącznie dane tekstowe - nigdy dane binarne, może być zapisany w postaci pliku, ale może to być też rekord w bazie danych, zawartość zmiennej,... może być otwarty i modyfikowany za pomocą każdej aplikacji tekstowej, Umieszczenie w dokumencie XML znaków będących elementami składni XML jest możliwe za pomocą tzw. sekwencji unikowych. XML dostarcza 5 predefiniowanych sekwencji: < < > > & & &apos; apostrof " cudzysłów

13 Technologie zarządzania treścią 13/43 Dokument XML Dokument XML przechowuje informacje w elementach, które składają się z nazwy (typu elementu) oraz treści, atrybutach, które zawierają dodatkowe informacje zamieszczane w elementach. Pojedynczy element XML zawiera: znacznik początkowy (bez znaku /), treść elementu znacznik końcowy (zawiera /) Nazwa elementu objęta jest znakami < i >. <przedmiot>podstawy programowania</przedmiot> <uczelnia> Politechnika Częstochowska </uczelnia>

14 Technologie zarządzania treścią 14/43 Dokument XML - elementy puste Treść elementu może być pominięta - element pusty. Znacznik początkowy musi mieć również znacznik końcowy. Element nie posiadający treści można zapisać za pomocą znacznika elementu pustego (nazwa zakończona znakiem /). <rysunek nazwa="dokumenty/diagram.png"></rysunek> <rysunek nazwa="dokumenty/aktor.png"/> <nowa_strona/>

15 Technologie zarządzania treścią 15/43 Dokument XML - atrybuty Atrybuty składają się z: nazwy, znaku równości =, wartość atrybutu (wewnątrz znaków apostrofu lub cudzysłowu "). <p style="big_font">dawno, dawno temu...</p> <rysunek sciezka= Dokumenty/rys.png /> <odnosnik href="http://www.pcz.pl" nazwa= PCz-WWW /> Atrybuty mogą być tylko w znaczniku początkowym. Nazwy atrybutów w jednym elemencie nie mogą się powtarzać. Kolejność atrybutów jest dowolna.

16 Technologie zarządzania treścią 16/43 Dokument XML - hierarchia elementów Pojedynczy element XML może zawierać: tylko tekst - zawartość tekstowa, tylko inne elementy - zawartość elementowa, tekst i inne elementy - zawartość mieszana. Element zawierający inne elementy (podelementy) jest dla nich elementem nadrzędnym. Dokument XML opisuje pewną hierarchię elementów. Element główny, nadrzędny do wszystkich elementów w dokumencie nazywa się korzeniem. W całym dokumencie XML może być tylko jeden element nadrzędny.

17 echnologie zarządzania treścią 17/43 Dokument XML - struktura drzewa Dokumenty XML posiadają strukturę drzewa. Znaczniki XML mogą znajdować się wewnątrz innych znaczników. Każdy element (z wyjątkiem korzenia) ma dokładnie jeden element obejmujący (rodzica). Każdy element może mieć wiele elementów będących jego częściami. <student> <imie>jaś</imie> <nazwisko>kowalski</nazwisko> <uczelnia> Politechnika Częstochowska <kierunek>informatyka</kierunek> </uczelnia> </student>

18 Technologie zarządzania treścią 18/43 Dokument XML - struktura drzewa Elementy w dokumencie XML nie mogą zachodzić na siebie. Jeśli znacznik początkowy danego elementu znajduje się wewnątrz innego elementu, wtedy odpowiadający mu znacznik zamykający również musi znajdować się wewnątrz tego elementu. <p><b>treść akapitu...</p></b> <!-- błąd, elementy zachodzą na siebie --> Znacznik o tej samej nazwie może powtórzyć się wielokrotnie wewnątrz jednego znacznika (np. kierunek) - odwzorowanie tablic w XML. <uczelnia> Politechnika Częstochowska <kierunek>informatyka</kierunek> <kierunek>mechatronika</kierunek> </uczelnia>

19 Technologie zarządzania treścią 19/43 Atrybut czy element? <student rocznik="1990" kierunek="informatyka" uwagi="brak"> Jaś Kowalski </student> <student> Jaś Kowalski <rocznik>1990</rocznik> <kierunek>informatyka</kierunek> <uwagi>brak</uwagi> </student> Dwa różne zapisy i taki sam zasób informacji - którą wersję wybrać? Nie ma jasno określonych reguł ale...

20 Technologie zarządzania treścią 20/43 Atrybut czy element? <student rocznik="1990" kierunek="informatyka" uwagi="podczas wykładu student wykazuje się bardzo dużą aktywnością, nie jest to jednak aktywność związana z tematyką przedmiotu. Skutkiem tego na zajęciach laboratoryjnych nie wie co i jak ma robić. Przekłada się to bezpośrednio na słabe oceny studenta oraz trudności z zaliczeniem przedmiotu"> Jaś Kowalski </student> Atrybuty, w których zapisywana jest duża ilość treści zmniejszają czytelność dokumentu. Atrybutów nie można stosować w sytuacji gdy dany element występuje więcej niż raz - np. kierunek. Atrybuty dobrze sprawdzają się w przypadku małych danych występujących jednokrotnie dla danego znacznika (np. rocznik).

21 Technologie zarządzania treścią 21/43 Atrybut czy element? <student rocznik="1990"> <kierunek>informatyka</kierunek> <kierunek>inżynieria biomedyczna</kierunek> <uwagi> Podczas wykładu student wykazuje się bardzo dużą aktywnością, nie jest to jednak aktywność związana z tematyką przedmiotu. Skutkiem tego na zajęciach laboratoryjnych nie wie co i jak ma robić. Przekłada się to bezpośrednio na słabe oceny studenta oraz trudności z zaliczeniem przedmiotu </uwagi> Jaś Kowalski </student>

22 Technologie zarządzania treścią 22/43 Unicode w dokumentach XML Dokument XML może składać się z dowolnych znaków Unicode, z wyłączeniem znaków sterujących (null, bell, backspace, \r, \n, itp.) Każdy znak Unicode może być wstawiony do dokumentu XML za pomocą kodu numerycznego szesnastkowego lub dziesiętnego. Np. chiński znak, którego kod wynosi 4E2D (szesnastkowo) i (dziesiętnie) może być wstawiony do dokumentu XML za pomocą 中 lub 中 Przykład zapisu I <3 Jörg w dokumencie XML: &I <3 Jörg& Wykorzystanie kodów numerycznych jest szczególnie przydatne w sytuacji, gdy znaku, którego chcemy użyć nie ma na klawiaturze.

23 Nazwy XML XML określa reguły dotyczące nazw zarówno elementów jak i atrybutów: nazwy mogą zawierać dowolne znaki alfanumeryczne: standardowe litery alfabetu A-Z, a-z, cyfry 0-9, także polskie znaki diakrytyczne i inne znaki narodowe, ideogramy: <ĄąĘę ΨΩ= αβγδ > One word </ĄąĘę> znaki interpunkcyjne (wyłącznie wymienione poniżej): podkreślenie łącznik - kropę. dwukropek : (zarezerwowane dla przestrzeni nazw) rozróżniane są małe i duże litery w nazwach (element osoba, Osoba i OSOBA to inne elementy), nazwy mogą się zaczynać tylko od liter, ideogramów lub znaku podkreślenia, ograniczenia długości nazw - zdrowy rozsądek :) Technologie zarządzania treścią 23/43

24 echnologie zarządzania treścią 24/43 Trochę ciekawych przykładów Dokumenty dobrze, poprawnie uformowane (ang. well-formed): <faktura></faktura> <!-- elementy puste --> <faktura/> <informacja treść="program się prawie kompilował..."/> <_info-łk11_9 treść= On powiedział: "Proście a będzie wam dane..." /> <Książka>Ania z "Zielonego Wzgórza </Książka> <A ΨΩ>Greek alphabet is: A, B, Γ,...Ω</A ΨΩ> Niepoprawna składnia XML: <osoba imie="jan" imie="karol" nazwisko="nowak"></osoba> <Uczelnia>Politechnika Częstochowska</uczelnia> <osoba id=3408>janusz Nowak</osoba> <odczyt></odczyt przelicznik= 1.84 > <!-- KOM -- Co tutaj jest nie tak? --> <8859-2name>Polska strona kodowa...</8859-2name>

25 echnologie zarządzania treścią 25/43 Deklaracja XML Każdy poprawny dokument XML musi zawierać dokładnie jedną deklarację XML informującą o: wersji języka - atrybut version, zastosowanym kodowaniu - atrybut encoding, samodzielności dokumentu - atrybut standalone. Deklaracja XML rozpoczyna się od <?xml a kończy?>. Pomiędzy tymi elementami umieszczone są atrybuty i ich wartości. Przykładowa deklaracja XML: <?xml version="1.0" encoding="iso " standalone="yes"?> Deklaracja XML musi się być umieszczona w pierwszej linii dokumentu XML.

26 Technologie zarządzania treścią 26/43 Deklaracja XML - atrybuty version - atrybut obowiązkowy - zalecane jest korzystanie z wersji 1.0 wszędzie tam gdzie jest to możliwe. Wersja 1.1 wprowadza zmiany związane z modyfikacjami standardu Unicode, ale nie zachowuje zgodności wstecznej z wersją XML 1.0. encoding - atrybut opcjonalny - wartość atrybutu to nazwa kodowania zastosowanego w dokumencie XML. Zalecane jest stosowanie kodowania Unicode w formacie UTF-8 (wartość domyślna) lub UTF-16. Kodowanie wskazane w deklaracji XML musi być jednorodne i obowiązuje w całym dokumencie XML. standalone - atrybut opcjonalny - określa samodzielność dokumentu. Wartość no oznacza, że dokument nie jest samodzielny i konieczne jest przetworzenie dodatkowych plików zawierających definicje typu dokumentu lub encje. Domyślnie dokument jest traktowany jako samodzielny (standalone= yes ).

27 Technologie zarządzania treścią 27/43 Inne składniki języka XML 1.0 Język XML 1.0 pozwala na stosowanie w dokumentach XML dodatkowych konstrukcji. Są nimi: deklaracje podstawowe oraz deklaracje wykorzystywane w DTD; są umieszczone wewnątrz znaczników <! oraz >. instrukcje przetwarzania przeznaczone dla programów przetwarzających dokument XML; są umieszczone pomiędzy znacznikami <? oraz?>. encje, wykorzystywane do skojarzenia nazwy encji i łańcucha znakowego; definiowane w dokumentach XML za pomocą słowa ENTITY będącego składnikiem deklaracji <!ENTITY... >

28 Deklaracje podstawowe komentarze rozpoczynają się <!-- a kończą się -->, mogą występować w dowolnym miejscu dokumentu XML, mogą być jedno lub wielolinijkowe, nie są częścią danych dokumentu XML - najczęściej są pomijane przez parsery, Treść komentarza nie może zawierać dwuznaku --. sekcje CDATA - wykorzystywane do zapisu łańcuchów zawierających znaki specjalne rozpoczyna się łańcuchem <![CDATA[ a kończy ]]>, niedozwolone jest zagnieżdżanie sekcji CDATA, Przykład sekcji CDATA: <![CDATA[ Warunek logiczny: f+8>5 && g<12 z języka C++ ]]> Warunek logiczny: f+8>5 && g<12 z języka C++ Parser XML traktuje tekst w CDATA jako ciąg znaków. Technologie zarządzania treścią 28/43

29 Technologie zarządzania treścią 29/43 Deklaracje wykorzystywane w DTD Deklaracja Opis <!DOCTYPE... > Zawiera lub wskazuje specyfikację dokumentu <!ENTITY... > Definiuje encję <!NOTATION... > Definiuje notacje, za pomocą których można określić typy danych zewnętrznych <!ELEMENT... > Deklaruje element <!ATTLIST... > Deklaruje listę atrybutów elementu <!IGNORE... > Wskazuje fragment dokumentu wyłączony z przetwarzania <!INCLUDE... > Wskazuje fragment dokumentu włączony do przetwarzania

30 Technologie zarządzania treścią 30/43 Instrukcje przetwarzania Instrukcje przetwarzania (PI - ang. Processing Instructions) to informacje przeznaczone dla programów przetwarzających dokument XML. PI, umieszczone pomiędzy znakami <? oraz?>, są podzielone na dwie części: cel (ang. PITarget) oraz instrukcję do wykonania. Cel określa aplikację, dla której przeznaczona jest instrukcja do wykonania. Jeśli cel zostanie rozpoznany przez program przetwarzający dokument XML wykonywana jest instrukcja. Jeśli cel nie zostanie rozpoznany instrukcja jest pomijana.

31 echnologie zarządzania treścią 31/43 Standardowe i niestandardowe PI Specyfikacja XML 1.0 dzieli PI na standardowe i niestandardowe. Standardowe PI: służą do wskazania aplikacji zdefiniowanej lub wymaganej w specyfikacjach należących do rodziny technologii XML, np. instrukcja transformacji XSLT: <?xml-stylesheet type="text/xsl" href="demo.xml"?> standardowe PI mają jako cel nazwę xml lub inną nazwę zaczynającą się od xml Niestandardowe PI mogą zawierać skrypty, które aplikacja przetwarzająca dokument XML będzie potrafiła rozpoznać i wykonać, np: <?php print("skrypt PHP - niestandardowa instrukcja przetwarzania dokumentu XML!")?> <?javascript function JStoPI?> alert("skrypt JavaScript to też PI!");

32 Technologie zarządzania treścią 32/43 Encje Encja jest elementem notacji DTD i jest deklarowana przez słowo kluczowe ENTITY użyte w deklaracji encji. Oznacza skojarzenie nazwy encji i łańcucha znaków. Encje wykorzystuje się do: substytucji tekstu, integrowania zawartości umieszczonej w różnych plikach, wyodrębnienia danych, które mają nie być przetwarzane przez procesory XML. Wykorzystanie encji w dokumencie XML polega na umieszczeniu referencji encji składającej się z nazwy encji poprzedzonej znakiem & i zakończonej średnikiem. Często stosowanym przykładem encji jest encja wewnętrzna tekstowa.

33 echnologie zarządzania treścią 33/43 Encja wewnętrzna tekstowa Encja wewnętrzna tekstowa (ang. Internal Text Entity) nazywana jest również encją ogólną jednostką wewnętrzną. Deklaracja takiej encji znajduje się bezpośrednio w przetwarzanym dokumencie XML i musi zawierać wyłącznie tekst, np. <!ENTITY pcz "Politechnika Częstochowska"> oznacza, że nazwie pcz przyporządkowano tekst Politechnika Częstochowska. Ponieważ encje są elementem DTD umieszczamy je wewnątrz deklaracji <!DOCTYPE... > Aby wykorzystać tą encję należy w dokumencie XML użyć referencji do encji w postaci &pcz;

34 echnologie zarządzania treścią 34/43 Przykład wykorzystania encji <?xml version="1.0"?> <!DOCTYPE uczelnie [ <!ENTITY pcz "Politechnika Częstochowska"> <!ENTITY wimii "Wydział Inżynierii Mechanicznej i Informatyki"> ]> <student> <imie>jan</imie> <nazwisko>kowalski</nazwisko> <uczelnia>&pcz;</uczelnia> <wydzial>&wimii;</wydzial> </student> Postać wynikowa dokumentu XML: <?xml version="1.0"?> <student> <imie>jan</imie> <nazwisko>kowalski</nazwisko> <uczelnia>politechnika Częstochowska</uczelnia> <wydzial>wydział Inżynierii Mechanicznej i Informatyki</wydzial> </student>

35 Technologie zarządzania treścią 35/43 Weryfikacja poprawności dokumentu XML Specyfikacja języka XML wymaga pełnej poprawności składniowej - aplikacja przetwarzająca dokument XML powinna zakończyć działanie w momencie napotkania pierwszego błędu składniowego. Dokument XML poprawny składniowo (ang. well-formed) może zostać opcjonalnie sprawdzony pod względem poprawności strukturalnej. Dokument XML jest poprawny strukturalnie jeśli: jest poprawny składniowo, posiada definicję typu dokumentu (np. DTD), zawartość dokumentu XML jest zgodna z definicją typu dokumentu.

36 Technologie zarządzania treścią 36/43 Przestrzenie nazw Dokument XML może zawierać elementy i atrybuty z innych języków np. HTML, MathML,... Oprócz definiowania własnych znaczników można użyć już istniejące, zdefiniowane przez inne osoby. Wykorzystanie nazw z innych języków umożliwiają przestrzenie nazw (ang. namespaces). Przestrzenie nazw pozwalają na uniknięcie potencjalnego konfliktu nazw w dokumentach XML. Niezależność nazw uzyskuje się poprzez dodanie do nazw atrybutów i znaczników prefiksu identyfikującego zbiór nazw, czyli przestrzeń nazw. prefiks:nazwa_z_danej_przestreni_nazw

37 Technologie zarządzania treścią 37/43 Przestrzenie nazw Używanie przestrzeni nazw musi być poprzedzone jej deklaracją dokonaną poprzez zastosowanie atrybutu xmlns. Jest to przyporządkowanie prefiksu do konkretnego języka. Podczas deklaracji przestrzeni nazw za pomocą atrybutu xmlns określana jest jej nazwa oraz źródło (poprzez identyfikator URI). <HTML5:h3 xmlns:html5="http://www.w3.org/tr/html5"> Nagłówek trzeciego stopnia w HTML 5. </HTML5:h3> <pcz:student xmlns:pcz="http://www.pcz.pl">... </pcz:student> Co w deklaracji przestrzeni nazw oznacza źródło: HTML5 jest prefiksem nazw języka HTML 5.

38 Technologie zarządzania treścią 38/43 Przestrzenie nazw W dokumencie XML może być zdefiniowanych wiele przestrzeni nazw. Przestrzeń nazw musi zostać określona w elemencie, w którym jest używa, lub w dowolnym elemencie nadrzędnym względem tego elementu. Najczęściej przestrzenie nazw są deklarowane w elemencie głównym dokumentu - korzeń. <HTML5:header xmlns:html5="http://www.w3.org/tr/html5"> <HTML5:h1>Sekcja 1<HTML5:h1/> <HTML5:div> <HTML5:p>Akapit w sekcji 1</HTML5:p> <HTML5:img src= abc.jpg /> </HTML5:div> <HTML5:h1>Podsekcja 1.1<HTML5:h1/> </HTML5:header>

39 Technologie zarządzania treścią 39/43 Przestrzenie nazw Prefiks xml jest zastrzeżony i nie należy go wykorzystywać do tworzenia własnych przestrzeni nazw. Adres URI pełni funkcję symboliczną i może być dowolnym adresem URI - nie musi wskazywać na coś konkretnego. W celu zwiększenia czytelności dokumentów XML możliwe jest zastosowanie domyślnej przestrzeni nazw (bez prefiksu). <header xmlns="http://www.w3.org/tr/html5"> <h1>sekcja 1<HTML5:h1/> <div> <p>akapit w sekcji 1</p> <img src= abc.jpg /> </div> <h1>podsekcja 1.1<h1/> </header>

40 Technologie zarządzania treścią 40/43 Przestrzenie nazw - przykład <?xml version="1.0"?> <!DOCTYPE uczelnia [<!ENTITY inf "Informatyka">]> <uczelnia> <wimii:wydzial xmlns:wimii="www.wimii.pcz.pl" xmlns:stud="www.pcz.pl/student"> <nazwa>wydział Inżynierii Mechanicznej i Informatyki</nazwa> <stud:student> <stud:imie>jan</stud:imie> <stud:nazwisko>kowalski</stud:nazwisko> <wimii:kierunek>&inf;</wimii:kierunek> </stud:student> <adres> <ulica>dąbrowskiego</ulica> </adres> </wimii:wydzial> </uczelnia>

41 Technologie zarządzania treścią 41/43 Przestrzenie nazw - przykład <?xml version="1.0"?> <!DOCTYPE uczelnia [<!ENTITY inf "Informatyka">]> <uczelnia> <wimii:wydzial xmlns:wimii="www.wimii.pcz.pl" xmlns:stud="www.pcz.pl/student"> <nazwa>wydział Inżynierii Mechanicznej i Informatyki</nazwa> <stud:student> <stud:imie>jan</stud:imie> <stud:nazwisko>kowalski</stud:nazwisko> <wimii:kierunek>&inf;</wimii:kierunek> </stud:student> <adres> <ulica>dąbrowskiego</ulica> </adres> </wimii:wydzial> <wydzial> <nazwa>wydział Elektryczny</nazwa> <stud:student>... </stud:student> <!-- BŁĄD --> </wydzial> </uczelnia>

42 Technologie zarządzania treścią 42/43 Przestrzenie nazw - domyślna przestrzeń nazw <?xml version="1.0"?> <!DOCTYPE uczelnia [<!ENTITY inf "Informatyka">]> <uczelnia> <wimii:wydzial xmlns:wimii="www.wimii.pcz.pl"> <nazwa>wydział Inżynierii Mechanicznej i Informatyki</nazwa> <student xmlns="www.pcz.pl/student" > <imie>jan</imie> <nazwisko>kowalski</nazwisko> <wimii:kierunek>&inf;</wimii:kierunek> </student> <adres> <ulica>dąbrowskiego</ulica> </adres> </wimii:wydzial> </uczelnia> Która przestrzeń nazw jest tutaj domyślną?

43 Technologie zarządzania treścią 43/43 Przestrzenie standardowe Identyfikatory URI dla przestrzeni nazw wybranych języków Język Identyfikator URI Zwyczajowy prefiks HTML 4.0 html: HTML 5 html: XHTML 1.1 html: XML Schema xsd: MathML mml: SMIL 3.0 SVG svg:

XML. XML (ang. Extensible Markup Language) - Rozszerzalny język znaczników. Aktualna wersja 1.0 (1.1 czeka na akceptację) Należy do rodziny SGML.

XML. XML (ang. Extensible Markup Language) - Rozszerzalny język znaczników. Aktualna wersja 1.0 (1.1 czeka na akceptację) Należy do rodziny SGML. XML XML 1 XML XML (ang. Extensible Markup Language) - Rozszerzalny język znaczników Aktualna wersja 1.0 (1.1 czeka na akceptację) Należy do rodziny SGML. XML to uniwersalny język formalny przeznaczony

Bardziej szczegółowo

Interfejs użytkownika I

Interfejs użytkownika I Interfejs użytkownika I Wykład prowadzi: Marek Wojciechowski Interfejs użytkownika I 1 Plan wykładu Formatowanie HTML za pomocą arkuszy stylów CSS Język XML ogólna struktura dokumentów opis struktury za

Bardziej szczegółowo

Przegląd specyfikacji związanych z wykorzystaniem usług sieciowych (Web Services)

Przegląd specyfikacji związanych z wykorzystaniem usług sieciowych (Web Services) Przegląd specyfikacji związanych z wykorzystaniem usług sieciowych (Web Services) Spis treści 1. XPDL... 3 2. XML... 7 3. XSL Transformations [XSLT]... 10 4. XML Path Language [XPath]... 19 5. XML Linking

Bardziej szczegółowo

informatyka + Wymagania wstępne Podstawowa znajomość SQL Podstawowa znajomość SQL Server

informatyka + Wymagania wstępne Podstawowa znajomość SQL Podstawowa znajomość SQL Server Agenda Podstawy XML Historia XML w pigułce Struktura dokumentu XML XML a bazy danych Alternatywa dla relacyjnych baz danych? XML w SQL Server 2008 Klauzula FOR XML polecenia SELECT Typ danych XML Metody

Bardziej szczegółowo

XML w sosie własnym. Standard XML wraz z DTD, przestrzenie nazw, projektowanie struktury dokumentów. Patryk Czarnik. Instytut Informatyki UW

XML w sosie własnym. Standard XML wraz z DTD, przestrzenie nazw, projektowanie struktury dokumentów. Patryk Czarnik. Instytut Informatyki UW XML w sosie własnym Standard XML wraz z DTD, przestrzenie nazw, projektowanie struktury dokumentów. Patryk Czarnik Instytut Informatyki UW XML i nowoczesne technologie zarzadzania treścia 2007/08 Podstawy

Bardziej szczegółowo

Plan prezentacji: Bezpieczeństwo systemów komputerowych.

Plan prezentacji: Bezpieczeństwo systemów komputerowych. Bezpieczeństwo systemów komputerowych. Temat seminarium: Bezpieczny XML Autorzy: Piotr Sasak, Wojciech Śronek Plan prezentacji: - nowa technologia: XML - DTD opis struktury dokumentu XML - XML Schema zaawansowany

Bardziej szczegółowo

Kuźnia Talentów: Bazy danych Wykorzystanie XML w relacyjnych bazach danych

Kuźnia Talentów: Bazy danych Wykorzystanie XML w relacyjnych bazach danych Kuźnia Talentów: Bazy danych Wykorzystanie XML w relacyjnych bazach danych Andrzej Ptasznik OKLADKA_Wykorzystanie XML w relacyjnych bazach danych.indd 1-2 10-06-18 12:14 Wykorzystanie XML w relacyjnych

Bardziej szczegółowo

POLSKO-JAPOŃSKA WYŻSZA SZKOŁA TECHNIK KOMPUTEROWYCH PRACA MAGISTERSKA. Nr... Michał Degentysz Nr albumu 4870 Promotor

POLSKO-JAPOŃSKA WYŻSZA SZKOŁA TECHNIK KOMPUTEROWYCH PRACA MAGISTERSKA. Nr... Michał Degentysz Nr albumu 4870 Promotor POLSKO-JAPOŃSKA WYŻSZA SZKOŁA TECHNIK KOMPUTEROWYCH PRACA MAGISTERSKA Nr... Automatyzacja generowania plików pakietu MS Office Student/studentka Michał Degentysz Nr albumu 4870 Promotor Prof. dr inż. Kazimierz

Bardziej szczegółowo

WYDZIAŁ ELEKTRONIKI TELEKOMUNIKACJI I INFORMATYKI

WYDZIAŁ ELEKTRONIKI TELEKOMUNIKACJI I INFORMATYKI Politechnika Gdańska WYDZIAŁ ELEKTRONIKI TELEKOMUNIKACJI I INFORMATYKI Praca dyplomowa. Zastosowanie protokołu XCAP do integracji nowoczesnych serwisów WWW z serwerami XDMS (na podstawie platformy Mobicents

Bardziej szczegółowo

XML stan obecny i trendy rozwojowe

XML stan obecny i trendy rozwojowe IX Konferencja PLOUG Koœcielisko PaŸdziernik 2003 XML stan obecny i trendy rozwojowe Tomasz Traczyk Politechnika Warszawska Od kilku lat XML jest jedn¹ z najbardziej popularnych technologii informatycznych,

Bardziej szczegółowo

Rozprawa doktorska mgr Dariusza Mikułowskiego, pt. Koncepcja i realizacja rozproszonych ontologii w systemie entish

Rozprawa doktorska mgr Dariusza Mikułowskiego, pt. Koncepcja i realizacja rozproszonych ontologii w systemie entish Instytut Podstaw Informatyki Polskiej Akademii Nauk Rozprawa doktorska mgr Dariusza Mikułowskiego, pt. Koncepcja i realizacja rozproszonych ontologii w systemie entish Promotorem rozprawy jest dr hab.

Bardziej szczegółowo

Internet w przedsiębiorstwie

Internet w przedsiębiorstwie 1 Informatyka w Zarządzaniu WYKŁAD IV Internet w przedsiębiorstwie MAIL: WWW: KONSULTACJE: andrzej.dudek@ae.jgora.pl http://wgrit.ae.jgora.pl/~andrzej piątki 9.00-11.00 sala 80 budynek A Internet, www,

Bardziej szczegółowo

Podstawy programowania. dr inż. Krzysztof Białek

Podstawy programowania. dr inż. Krzysztof Białek Podstawy programowania dr inż. Krzysztof Białek 1 Cele i zakres przedmiotu Zapoznanie z istotą i metodyką programowania Opanowanie podstawowych technik programowania strukturalnego Nabycie umiejętności

Bardziej szczegółowo

Wstęp do programowania w C#

Wstęp do programowania w C# Anna Kempa Tomasz Staś Wstęp do programowania w C# Łatwy podręcznik dla początkujących Aktualna wersja podręcznika na stronie http://c-sharp.ue.katowice.pl Katowice, kwiecień 2014 Wersja 1.1 Anna Kempa,

Bardziej szczegółowo

Kup książkę Poleć książkę Oceń książkę. Księgarnia internetowa Lubię to!» Nasza społeczność

Kup książkę Poleć książkę Oceń książkę. Księgarnia internetowa Lubię to!» Nasza społeczność Tytuł oryginału: Learning Web Design: A Beginner s Guide to HTML, CSS, JavaScript, and Web Graphics Tłumaczenie: Aleksander Lamża (wstęp, rozdz. 1 11), Wojciech Moch (rozdz. 12 22, dodatki), z wykorzystaniem

Bardziej szczegółowo

Projektowanie stron www

Projektowanie stron www Projektowanie stron www Cel przedmiotu Celem przedmiotu jest poznanie podstaw projektowania stron WWW w zakresie stosowania języków ich przygotowania: HTML, CSS i JavaScript. Realizacja zajęć Zajęcia są

Bardziej szczegółowo

LDAP. Cezary Sobaniec

LDAP. Cezary Sobaniec LDAP Cezary Sobaniec 1 X.500 Globalna usługa katalogowa Przechowuje dane zorganizowane jako atrybuty obiektów Obiekty identyfikowane przez nazwy wyróżnione (ang. distinguished name DN) Pobieranie informacji

Bardziej szczegółowo

Pozyskiwanie z Internetu tekstów do badań lingwistycznych

Pozyskiwanie z Internetu tekstów do badań lingwistycznych Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Aleksander Buczyński Nr albumu: 155542 Pozyskiwanie z Internetu tekstów do badań lingwistycznych Praca magisterska na kierunku INFORMATYKA

Bardziej szczegółowo

Technologie tworzenia internetowych aplikacji działających po stronie serwera

Technologie tworzenia internetowych aplikacji działających po stronie serwera Technologie tworzenia internetowych aplikacji działających po stronie serwera Piotr Kołaczkowski e-mail: P.Kolaczkowski@elka.pw.edu.pl Wydział Elektroniki i Technik Informacyjnych Politechniki Warszawskiej,

Bardziej szczegółowo

Podstawowe techniki stosowane do budowy serwisów www

Podstawowe techniki stosowane do budowy serwisów www Podstawowe techniki stosowane do budowy serwisów www 1. Architektura www, HTTP, Cookies, HTML Historia rozwoju: Późne lata 60 projekt sieci ARPANet powstał jako inicjatywa Departamentu Obrony USA. 1969

Bardziej szczegółowo

Aplikacje Internetowe

Aplikacje Internetowe Piotr Bubacz Aplikacje Internetowe ITA-103 Wersja 1 Warszawa, październik 2008 Piotr Bubacz 2008 Piotr Bubacz. Autor udziela prawa do bezpłatnego kopiowania i dystrybuowania wśród pracowników uczelni oraz

Bardziej szczegółowo

Ćwiczenie 4... 12 Akapit... 12 Ćwiczenie 5... 13 Tekst pogrubiony... 13 Tekst pochylony... 13 Tekst podkreślony... 13 Ćwiczenie 6...

Ćwiczenie 4... 12 Akapit... 12 Ćwiczenie 5... 13 Tekst pogrubiony... 13 Tekst pochylony... 13 Tekst podkreślony... 13 Ćwiczenie 6... Zawartość Wyjaśnienie...3 Edytory...3 Windows...3 Pajączek...3 CoreEditor...3 Ager Web Edytor...3 EdHTML...3 Edytor Znaczników HTML - ezhtml...4 HateML Pro...4 JTHTML...4 ked...4 PSPad...4 Web Edit...5

Bardziej szczegółowo

Programowanie w C. Stworzone na Wikibooks, bibliotece wolnych podręczników.

Programowanie w C. Stworzone na Wikibooks, bibliotece wolnych podręczników. Programowanie w C Stworzone na Wikibooks, bibliotece wolnych podręczników. Wydanie I z dnia 17 lutego 2008 Copyright c 2004-2008 użytkownicy Wikibooks. Permission is granted to copy, distribute and/or

Bardziej szczegółowo

Język C# A.1. Aplikacje konsolowe w języku C# A.1.1. Wprowadzenie

Język C# A.1. Aplikacje konsolowe w języku C# A.1.1. Wprowadzenie A Język C# A.1. Aplikacje konsolowe w języku C# A.1.1. Wprowadzenie Język C# (wymawiamy: C sharp ) jest językiem przeznaczonym do tworzenia aplikacji, które działają w środowisku.net Framework. Jest to

Bardziej szczegółowo

METAJĘZYKI 1 2008-03-06

METAJĘZYKI 1 2008-03-06 METAJEZYKI.ie.tu.koszalin.pl dr inż. Robert Berezowski e-mail: robert.berezowski@ie.tu.koszalin.pl ul. Śniadeckich 2 Pokój 223A Konsultacje: wtorek 11.00 13.00 piątek 16.00 17.00 Politechnika Koszalińska

Bardziej szczegółowo

Zapisywanie algorytmów w języku programowania wysokiego poziomu

Zapisywanie algorytmów w języku programowania wysokiego poziomu Temat 7 program Zapisywanie algorytmów w języku programowania wysokiego poziomu 1. Język programowania 1.1. Klasyfikacja języków programowania 2. Struktura programu w języku Pascal 3. Etapy programowania

Bardziej szczegółowo

Poznajemy język ACTIONSCRIPT 3.0

Poznajemy język ACTIONSCRIPT 3.0 Poznajemy język ACTIONSCRIPT 3.0 Informacje prawne Informacje prawne Informacje prawne można znaleźć na stronie http://help.adobe.com/pl_pl/legalnotices/index.html. iii Spis treści Rozdział 1: Wprowadzenie

Bardziej szczegółowo

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki. Projekt inżynierski

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki. Projekt inżynierski Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Projekt inżynierski Tomasz Pawlicki Jacek Rajda Kierunek studiów: Elektronika

Bardziej szczegółowo

O autorach...9. Wprowadzenie... 11

O autorach...9. Wprowadzenie... 11 O autorach...9 Wprowadzenie... 11 Rozdział 1. Czym jest Ajax?... 17 Narodziny Ajax... 18 Ewolucja sieci WWW... 18 JavaScript... 19 Ramki... 19 Technika ukrytej ramki... 19 Dynamiczny HTML i model DOM...

Bardziej szczegółowo

EduCASE Narzędzie CASE wspomagające edukację

EduCASE Narzędzie CASE wspomagające edukację Wydział Informatyki Katedra Systemów Informacyjnych Inżynieria Oprogramowania i Baz Danych Łukasz Ziemiańczyk Nr albumu 3265 EduCASE Narzędzie CASE wspomagające edukację Praca magisterska dr Mariusz Trzaska

Bardziej szczegółowo