Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

Podobne dokumenty
WYKŁAD 1 METAJĘZYK SGML CZĘŚĆ 1

Rola języka XML narzędziem

Podstawy języka XML. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Plan dzisiejszego wykładu. Narzędzia informatyczne w językoznawstwie. XML - Definicja. Zalety XML

WYKŁAD 3 XML DOM XML DOCUMENT OBJECT MODEL CZĘŚĆ 1

Kurs języka Python Wykład 8. Przetwarzanie tekstu Wyrażenia regularne Biblioteka urllib Parsowanie html'a XML

Perl a XML. Narzędzia informatyczne w językoznawstwie. Generowanie danych XML - Przykład. Generowanie danych XML. Perl - Przetwarzanie XML

LABORATORIUM 5 WSTĘP DO SIECI TELEINFORMATYCZNYCH WPROWADZENIE DO XML I XSLT

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

Zaawansowane aplikacje WWW - laboratorium

29. Poprawność składniowa i strukturalna dokumentu XML

XML DTD XML Schema CSS

XML i nowoczesne technologie zarządzania treścią

GML w praktyce geodezyjnej

5.14 JSP - Przykład z obiektami sesji Podsumowanie Słownik Zadanie... 86

XHTML - Extensible Hypertext Markup Language, czyli Rozszerzalny Hipertekstowy Język Oznaczania.

2 Podstawy tworzenia stron internetowych

XML extensible Markup Language. Paweł Chodkiewicz

Dlaczego GML? Gdańsk r. Karol Stachura

1 XML w bazach danych

XML extensible Markup Language 3

Szczegółowy opis języka HTML5 znajdziemy w specyfikacji, która jest dostępna pod adresem

XML w.net. Dominik Baś nr alb Wrocław, 29 maja 2007

Zaawansowany kurs języka Python

Jak wygląda XML? Definiowanie typów dokumentów Część 1. DTD, XML Schema. Struktura logiczna dokumentu XML. Składnia XML. Encje predefiniowane.

Zasady Nazewnictwa. Dokumentów XML Strona 1 z 9

Podstawowe konstrukcje Podstawowymi konstrukcjami są wzorce element oraz attribute:

Procesowanie dokumentów XML

Model semistrukturalny

MINISTERSTWO SPRAW WEWNĘTRZNYCH I ADMINISTRACJI DEPARTAMENT INFORMATYZACJI

Obiektowy model dokumentu. Katedra Mikroelektroniki i Technik Informatycznych

Język XML Schema. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

XML INFORMACJE NA TEMAT STRUKTURY ( )

Środowisko XML (Extensible Markup Language).

Jak wygląda XML? Definiowanie typów dokumentów Część 1. DTD, XML Schema. Struktura logiczna dokumentu XML. Składnia XML. Encje predefiniowane.

Podstawy (X)HTML i CSS

Wprowadzenie do arkuszy stylistycznych XSL i transformacji XSLT

XPath XML Path Language. XPath. XSLT część 1. XPath data model. Wyrażenia XPath. Location paths. Osie (axes)

Wykorzystywanie parsera DOM w programach Java i PL/SQL

Wprowadzenie do technologii XML

mgr inż. Jacek Staniec Język XML

Dokumentacja Użytkownika Systemu

KARTA KURSU. Przetwarzanie dokumentów XML i zaawansowane techniki WWW

Programowanie internetowe

Usługi WWW. dr Zbigniew Lipiński Instytut Matematyki i Informatyki ul. Oleska Opole zlipinski@math.uni.opole.pl

<html> </html> <body> </body> <p> [</p>] <br> <html> <head> </head> <body> </body> </html> Materiały dydaktyczne 1/5

Kurs rozszerzony języka Python

JĘZYK PYTHON - NARZĘDZIE DLA KAŻDEGO NAUKOWCA. Marcin Lewandowski [ mlew@ippt.gov.pl ]

Format HTML. Wybrane działy Informatyki Stosowanej. Definicja i przeznaczenie Struktura dokumentu Znaczniki Formularze i komponenty

dlibra 3.0 Marcin Heliński

O HTML. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Semistrukturalne bazy danych Wykład dla studentów matematyki

Komunikacja i wymiana danych

Zaawansowana Pracownia Komputerowa - Ćwiczenia. Krzysztof Miernik

Technologie zarządzania treścią

XML i nowoczesne technologie zarządzania treścią 2007/08

Aplikacje internetowe laboratorium XML, DTD, XML Schema, XSL

Narzędzia informatyczne w językoznawstwie

Rok akademicki: 2013/2014 Kod: ZZIP IN-s Punkty ECTS: 2. Kierunek: Zarządzanie i Inżynieria Produkcji Specjalność: Informatyka w zarządzaniu

Zasady budowy i przekazywania komunikatów XML w systemie kdpw_otc

WITRYNY I APLIKACJE INTERNETOWE

Przykładowy dokument XML

Zasady budowy i przekazywania komunikatów XML w systemie kdpw_otc

Facelets ViewHandler

Kurs WWW Język XML, część I

ABC języka HTML i XHTML / Maria Sokół. wyd. 2. Gliwice, cop Spis treści

- wewnątrz elementów prostych występuje tylko jeden typ danych, wewnątrz złoŝonych nie moŝemy dokładnie określić liczby wystąpień elementu

Zasady budowy i przekazywania komunikatów wykorzystywanych w Systemie IT KDPW_CCP

Aplikacje internetowe laboratorium XML, DTD, XSL

Wykład Ćwiczenia Laboratorium Projekt Seminarium

Przedmiot: Grafika komputerowa i projektowanie stron WWW

Biblioteki dzielone, XML i readline

Programowanie Komponentowe WebAPI

Generated by Foxit PDF Creator Foxit Software For evaluation only. System Szablonów

Wprowadzenie do XML. Joanna Jędrzejowicz. Instytut Informatyki

Standard HL7 (cel, protokoły, zastosowanie) Piotr Dybski Jan Flik

Javadoc. Piotr Dąbrowiecki Sławomir Pawlewicz Alan Pilawa Joanna Sobczyk Alina Strachocka

Kurs programowania. Wykład 7. Wojciech Macyna. 25 kwietnia 2017

Rozdział 1. Informacje podstawowe

za pomocą: definiujemy:

LAB 7. XML EXtensible Markup Language - Rozszerzalny Język Znaczników XSD XML Schema Definition Definicja Schematu XML

Jak wygląda XML? Definiowanie typów dokumentów. Struktura logiczna dokumentu XML. Podstawy składni XML. Definiowanie języków. Poprawność dokumentów

XML extensible Markup Language. część 4

akademia androida Składowanie danych część VI

Programowanie w Javie nazwa przedmiotu SYLABUS A. Informacje ogólne

Ministerstwo Finansów

Tutorial. HTML Rozdział: Ramki

Jak wygląda XML? Definiowanie typów dokumentów Część 1. DTD. Struktura logiczna dokumentu XML. Podstawy składni XML. Definiowanie języków

Text mining w programie RapidMiner Michał Bereta

Otwarte protokoły wymiany informacji w systemach ITS

Zasady budowy i przekazywania komunikatów XML dla rynku OTC w systemie KDPW_CCP

4. Pliki Informacje ogólne o dostępie do plików w PHP Sprawdzanie istnienia pliku file_exists()

PROGRAMOWANIE. WNPiD UAM, Programowanie, inż. Piotr Jabłoński

Języki programowania wysokiego poziomu WWW

XML i nowoczesne metody zarządzania treścią

O stronach www, html itp..

rk HTML 4 a 5 różnice

Metryki. Narzędzia do pomiaru złożoności modułowej i międzymodułowej oprogramowania. autor: Zofia Kruczkiewicz

Transkrypt:

Extensible Markup Language (XML) Wrocław, 15.03.2019 - Java - technologie zaawansowane

Wprowadzenie XML jest językiem znaczników (ang. markup language) używanym do definiowania zbioru zasad rozmieszczenia elementów na dokumencie w taki sposób, aby był łatwy do odczytu zarówno dla człowieka jak I maszyny. Język XML zaprojektowano jako uproszczoną wersję języka SGML z myślą o zastosowaniach w Internecie. Jak często się zdarza, prostsze okazało się lepsze i język XML spotkał się z entuzjastycznym przyjęciem oraz szybko zdobył duże grono zwolenników, co nie udało się językowi SGML. 2

Przykładowy plik XML Jak łatwo zauważyć, format XML pozwala wyrazić hierarchiczną strukturę danych i powtórzenia elementów bez niepotrzebnych kombinacji. Format pliku XML jest przejrzysty i zbliżony do plików HTML. Języki XML i HTML stanowią bowiem pochodne języka SGML (Standard Generalized Markup Language). 3

Podobieństwo dwóch języków Mimo że języki XML i HTML posiadają wspólne korzenie, to istnieje między nimi wiele różnic. W przeciwieństwie do języka HTML język XML uwzględnia wielkość znaków. Dlatego też na przykład znaczniki <H1> i <h1> będą w nim rozróżniane. W języku HTML możemy opuścić znaczniki końca akapitu </p> lub końca elementu Listy </li>, jeśli z kontekstu wynika, w którym miejscu powinny one wystąpić. W języku XML nie wolno opuszczać znaczników końca. W języku XML elementy posiadające pojedynczy znacznik, któremu nie odpowiada żaden znacznik końca, muszą kończyć się znakiem ukośnika, na przykład <img src= "coffeecup.png"/>. Dzięki temu parser języka XML uzyskuje informację, że nie powinien szukać znacznika końca. 4

Struktura dokumentu XML Dokument XML powinien rozpoczynać się nagłówkiem w postaci <?xml version="1.0"?> lub <?xml version="1.0" encoding="utf-8"?> Chociaż użycie nagłówka jest opcjonalne, to jednak ze wszech miar zalecane. 5

Struktura dokumentu XML Każdy z elementów może zawierać element podrzędny i (lub) tekst. W przykładzie z poprzedniego slajdu element font posiada dwa elementy podrzędne, name i size. Element name zawiera tekst "Helvetica". 6

Struktura dokumentu XML Elementy mogą też posiadać atrybuty, na przykład: <size unit="pt">36</size> Pomiędzy projektantami języka XML nie ma zgody co do tego, kiedy należy stosować elementy, a kiedy ich atrybuty. Wydaje się na przykład, że czcionkę łatwiej opisać za pomocą atrybutów <font name="helvetica" size="36"/> niż za pomocą elementów <font> <name>helvetica</name> <size>36</size> </font> Jednak atrybuty okazują się mniej uniwersalne od elementów. Załóżmy na przykład, że opis rozmiaru czcionki chcemy wyposażyć w jednostkę. Korzystając z atrybutów, umieścimy ją w wartości atrybutu. <font name="helvetica" size="36 7

Parsowanie dokumentów XML Aby przetworzyć dokument XML, musimy najpierw go parsować. Parser jest programem, który wczytuje zawartość pliku, stwierdza poprawność jej formatu i rozkłada ją na elementy składowe, które udostępnia programiście. Istnieją dwa rodzaje parserów XML: parsery drzewiaste, jak na przykład DOM (Document Object Model), które umieszczają elementy dokumentu XML w strukturze drzewa, parsery strumieniowe, jak na przykład SAX (Simple API for XML), które generują zdarzenia podczas czytania dokumentu XML. W większości technologi parsowanie jest już zaimplementowane co pozwala na szybkie i wygodne parsowanie plików XML. 8

Kontrola poprawności dokumentów XML Załóżmy na przykład, że wczytaliśmy poniższy element. <font> <name>helvetica</name> <size>36</size> </font> Przed parsowaniem dokumentu Musimy sprawdzić, czy nazwą jego znacznika jest "name" a później, czy posiada on pojedynczy węzeł podrzędny typu Text. Ten ostatni warunek musimy sprawdzić dla wszystkich węzłów podrzędnych, ponieważ autor dokumentu mógł zmienić porządek tych węzłów lub dodać nowe. Napisanie odpowiedniego kodu jest pracochłonne i łatwo w nim o pomyłkę. 9

Kontrola poprawności dokumentów XML Jednak jedną z podstawowych zalet stosowania parsera dokumentów XML jest to, że może on automatycznie sprawdzić poprawność struktury dokumentu. Dzięki temu późniejsza jej analiza jest znacznie łatwiejsza. Jeśli na przykład element font przeszedł pomyślnie weryfikację, to możemy od razu pobrać dwa jego elementy podrzędne drugiego stopnia, rzutować je na typ Text i pobrać łańcuchy znaków bez żadnej dodatkowej kontroli. 10

Kontrola poprawności dokumentów XML Aby określić strukturę dokumentu, dostarczamy plik definicji typu dokumentu (DTD) lub definicję w języku XML Schema. Plik DTD lub definicja XML Schema zawiera reguły opisujące format dokumentu przez określenie dopuszczalnych elementów podrzędnych i atrybutów każdego z elementów. Przykładowa reguła może wyglądać następująco: <!ELEMENT font (name,size)> 11

Kontrola poprawności dokumentów XML Reguła ta wymaga, aby element font posiadał zawsze dwa elementy podrzędne name i size. W języku XML Schema te same ograniczenia moglibyśmy wyrazić w poniższy sposób: <xsd:element name="font"> <xsd:sequence> <xsd:element name="name" type="xsd:string"/> <xsd:element name="size" type="xsd:int"/> </xsd:sequence> </xsd:element> 12

Kontrola poprawności dokumentów XML 13 Następująca reguła określa, że element menu zawiera 0 lub więcej elementów item. <!ELEMENT menu (item)*>

Literatura Cay S. Horstmann, Gary Cornell - Java. Techniki zaawansowane. Wydanie VIII, Wydawnictwo: Helion How to read XML File in Java Tutorial: https://www.journaldev.com/898/read-xml-file-java-dom-parser 14