Narzędzia informatyczne w językoznawstwie

Podobne dokumenty
Plan dzisiejszego wykładu. Narzędzia informatyczne w językoznawstwie. XML - Definicja. Zalety XML

Źródła. cript/1.5/reference/ Ruby on Rails: AJAX: ssays/archives/

Zaawansowana Pracownia Komputerowa - Ćwiczenia. Krzysztof Miernik

Wykład 1: HTML (XHTML) Michał Drabik

XHTML - Extensible Hypertext Markup Language, czyli Rozszerzalny Hipertekstowy Język Oznaczania.

Podstawy (X)HTML i CSS

Programowanie internetowe

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

O stronach www, html itp..

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

Przedmiot: Grafika komputerowa i projektowanie stron WWW

XHTML Budowa strony WWW

Technologie Informacyjne

HTML DOM, XHTML cel, charakterystyka

2 Podstawy tworzenia stron internetowych

Elementarz HTML i CSS

HTML nie opisuje układu strony!!!

Rozdział 1. Informacje podstawowe

Wprowadzenie do HTML, CSS, JavaScript, PHP. Kurs

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Kierunek: Automatyka i Robotyka Studia stacjonarne I stopnia: rok I, semestr II

29. Poprawność składniowa i strukturalna dokumentu XML

WITRYNY I APLIKACJE INTERNETOWE

Odnośniki jeszcze do niedawna odróżniały strony WWW od wszystkich innych dokumentów elektronicznych. Możliwość deklarowania odnośników do innych

Akademia Techniczno-Humanistyczna w Bielsku-Białej

Tworzenie Stron Internetowych. odcinek 1

Rola języka XML narzędziem

XML. XML (ang. Extensible Markup Language) - Rozszerzalny język znaczników. Aktualna wersja 1.0 (1.1 czeka na akceptację) Należy do rodziny SGML.

używane skróty: HTTP - protokół do transferu tekstu, hipertekstu, zbiorów binarnych URL - jednolity lokalizator zasobów

Języki programowania wysokiego poziomu WWW

Systemy internetowe HTML

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

Format HTML. Wybrane działy Informatyki Stosowanej. Definicja i przeznaczenie Struktura dokumentu Znaczniki Formularze i komponenty

WYKŁAD 1 METAJĘZYK SGML CZĘŚĆ 1

Struktura języka HTML ZNACZNIKI. Oto bardzo prosta strona WWW wyświetlona w przeglądarce: A tak wygląda kod źródłowy takiej strony:

Tworzenie Stron Internetowych. odcinek 1

HTML jak zrobić prostą stronę www

Dokument hipertekstowy

Strony WWW - podstawy języka HTML

STRONY INTERNETOWE mgr inż. Adrian Zapała

XML extensible Markup Language. Paweł Chodkiewicz

Wykład 1 TINT. Wprowadzenie do XHTML. Zofia Kruczkiewicz

Facelets ViewHandler

PROGRAMOWANIE. WNPiD UAM, Programowanie, inż. Piotr Jabłoński

HTML (HyperText Markup Language) hipertekstowy język znaczników

Aplikacje internetowe. Interfejs użytkownika

Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

Kurs HTML 4.01 TI 312[01]

LABORATORIUM 5 WSTĘP DO SIECI TELEINFORMATYCZNYCH WPROWADZENIE DO XML I XSLT

Wprowadzenie do technologii XML

Wykład 1 Wprowadzenie do HTML

Wprowadzenie do arkuszy stylistycznych XSL i transformacji XSLT

LAB 7. XML EXtensible Markup Language - Rozszerzalny Język Znaczników XSD XML Schema Definition Definicja Schematu XML

Wybrane technologie wykorzystywane do tworzenia stron internetowych

Lab.1. Praca z tekstem: stosowanie arkuszy stylów w dokumentach OO oraz HTML/CSS

rk HTML 4 a 5 różnice

Tworzenie Stron Internetowych. odcinek 6

Środowisko XML (Extensible Markup Language).

Podstawy JavaScript ćwiczenia

Zawartość specyfikacji:

UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Bazy danych i strony WWW

HTML informacje podstawowe

Programy dedykowane do edycji stron internetowych dzielą się na dwa rodzaje:

Aplikacje WWW - laboratorium

XML DTD XML Schema CSS

Cel ogólny lekcji: Wprowadzenie do tworzenia stron WWW w języku HTML. Wprowadzenie pojęć: strona WWW, język HTML, dokument HTML.

Tworzenie Stron Internetowych. odcinek 5

HTML i XHTML. Leksykon kieszonkowy

Historia kodowania i format plików XML. Jolanta Bachan

HTML kurs podstawowy. nagłówek, linia pozioma, obraz, img, ramka, div, tabela, tabel, lista

Ćwiczenia laboratoryjne nr 8 Podstawy języka XML.

Przykładowy dokument XML

Specyfikacja techniczna dot. mailingów HTML

Można też ściągnąć np. z:

Można też ściągnąć np. z:

- Dla dokumentów HTML wyróŝniamy 2 rodzaje DTD: Transitional (przejściowa) Frameset (ramkowa) Język XHTML i CSS. 28 lutego 2010 Strona 1

Hyper Text Markup Language

Podstawy języka XML. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Referat z przedmiotu Technologie Internetowe SPIS TREŚCI

CSS Kaskadowe Arkusze Stylów

Język (X)HTML. Podstawowe znaczniki i parametry. dr Konrad Dominas / UAM

podstawowego kodu strony Nowa strona WWW Dodał Administrator wtorek, 13 lipiec :21

Kurs WWW Język XML, część I

HTML (HyperText Markup Language)

AUDYT DOSTĘPNOŚCI STRONY INTERNETOWEJ

DOKUMENTY CYFROWE. Waldemar Korłub. Aplikacje i Usługi Internetowe KASK ETI Politechnika Gdańska

Dodatek Technologie internetowe 1. UTF-8 wg 2. Adresy URL

<html> </html> <body> </body> <p> [</p>] <br> <html> <head> </head> <body> </body> </html> Materiały dydaktyczne 1/5

Języki programowania wysokiego poziomu. HTML cz.1.

Tworzenie Stron Internetowych. odcinek 6

Aplikacje internetowe. Wprowadzenie

Tworzenie stron internetowych w oparciu o język HTML

Budowa dokumentu HTML 5

INSTALACJA I KONFIGURACJA SERWERA PHP.

Kaskadowe arkusze stylów (CSS)

HTML. HTML(ang. HyperTextMarkupLanguage, pol. hipertekstowy język znaczników) język wykorzystywany do tworzenia stron internetowych

Techniki WWW. (HTML, CSS, JavaScript) Dr inż. Marcin Zieliński WYKŁAD 3. Środa 15:30-17:00 sala: A-1-04

Elementy podstawowe. Dodatek: Elementy języków HTML i XHTML. Dodał Administrator piątek, 23 lipiec :15. Element. Przykład. Opis. <?xml?

1. HTML dla zielonych

XML dla humanistów, i to cyfrowych... (pogadanka...)

Transkrypt:

Narzędzia informatyczne w językoznawstwie HTML i XHTML Marcin Junczys-Dowmunt junczys@amu.edu.pl Zakład Logiki Stosowanej http://www.logic.amu.edu.pl 17. października 2007 Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 1/17

Po co językoznawcom (X)HTML? Prawie cała widzialna część internetu opiera się na HTML i jego odmianach Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

Po co językoznawcom (X)HTML? Prawie cała widzialna część internetu opiera się na HTML i jego odmianach Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

Po co językoznawcom (X)HTML? Prawie cała widzialna część internetu opiera się na HTML i jego odmianach Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML Jeśli chcemy w jakikolwiek sposób przetwarzać informacje z internetu, nie obejdzie się bez podstawowych znajomości HTML (dlatego HTML dla językoznawców) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

Po co językoznawcom (X)HTML? Prawie cała widzialna część internetu opiera się na HTML i jego odmianach Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML Jeśli chcemy w jakikolwiek sposób przetwarzać informacje z internetu, nie obejdzie się bez podstawowych znajomości HTML (dlatego HTML dla językoznawców) Jeśli mamy zamiar umieszczać własne treści w internecie, to lepiej korzystać z XHTML niż HTML. Będziemy wtedy tworzyć strony bardziej przystosowane do przetwarzania automatycznego i świecić dobrym przykładem (dlatego XHTML) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

Ale co to właściwie HTML? Wikipedia (EN) HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

Ale co to właściwie HTML? Wikipedia (EN) HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych Służy do opisu struktury informacji tekstowych w dokumencie oznacza wybrane części tekstu jako nagłówki, akapity, listy itp. wzbogaca tekst o formularze, obrazki i inne obiekty kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

Ale co to właściwie HTML? Wikipedia (EN) HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych Służy do opisu struktury informacji tekstowych w dokumencie oznacza wybrane części tekstu jako nagłówki, akapity, listy itp. wzbogaca tekst o formularze, obrazki i inne obiekty kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze) HTML jest zapisywany jako zwykły tekst za pomocą znaczników otoczonych ostrymi nawiasami Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

Ale co to właściwie HTML? Wikipedia (EN) HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych Służy do opisu struktury informacji tekstowych w dokumencie oznacza wybrane części tekstu jako nagłówki, akapity, listy itp. wzbogaca tekst o formularze, obrazki i inne obiekty kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze) HTML jest zapisywany jako zwykły tekst za pomocą znaczników otoczonych ostrymi nawiasami Nazwa HTML jest nieraz stosowana jako hiperonim dla wszystkich innych pokrewnych formalizmów, w tym XHTML Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

Historia HTML 1989 Tim Berners-Lee (CERN) rozwija pierwszy internetowy system hipertekstowy 1990 Powstaje W3C (World Wide Web Consortium) 1993 Specyfikacja SGML 1995 Pierwsza oficjalna wersja: HTML 2 01 1997 HTML 3.2 próba uwzględnienia konsekwencji wojny przeglądarek 12 1997 HTML 4.0 pierwsze czystki 1999 HTML 4.01 jak na razie ostatnia wersja HTML 2000 XHTML 1.0 czyli uzgodznienie HTML 4.01 z XML 2001 XHTML 1.1 ostatnia oficjalna wersja Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/17

Struktura dokumentu HTML (1) Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to: Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

Struktura dokumentu HTML (1) Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to: elementy (główne znaczniki) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

Struktura dokumentu HTML (1) Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to: elementy (główne znaczniki) atrybuty (metadane dot. znaczników) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

Struktura dokumentu HTML (1) Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to: elementy (główne znaczniki) atrybuty (metadane dot. znaczników) dane tekstowe (tekst na stronie) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

Struktura dokumentu HTML (1) Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to: elementy (główne znaczniki) atrybuty (metadane dot. znaczników) dane tekstowe (tekst na stronie) encje (znaki szczególne, np. jawne spacje) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

Struktura dokumentu HTML (2) Elementy zwykle składają się z trzech częsci: znacznik początkowy (w postaci <znacznik>) zawartości elementu (tekst lub inne elementy) znacznik końcowy (w postaci </znacznik>) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/17

Struktura dokumentu HTML (2) Elementy zwykle składają się z trzech częsci: znacznik początkowy (w postaci <znacznik>) zawartości elementu (tekst lub inne elementy) znacznik końcowy (w postaci </znacznik>) Niektóre elementy można opisać dokładniej za pomocą atrybutów atrybuty umieszczamy w znaczniku początkowym (np. <znacznik atrybut1="wartość1" atrybut2="wartość2"... atrybutn="wartośćn">) znaczniki końcowe raczej nie mogą zwierać atrybutów Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/17

Struktura dokumentu HTML (3) Ogólna struktura dokumentu HTML: element główny każdego dokumentu HTML to html element główny zawiera dwa kolejne elementy: head (nagłówek dokumentu) body (treść dokumentu) na początku dokumentu powinna się znaleźć informacja o typie dokumentu <!DOCTYPE html PUBLIC... > <html> <head>... </head> <body>... </body> </html> Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 7/17

Mały przykład dokumentu HTML <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/tr/html401/loose.dtd"> <html> <head> <meta http-equiv="content-type" content="text/html; charset=utf-8"> <title>tytuł dokumentu</title> </head> <body background="white" text="black"> <h1>to jest dokument <font color="red">html</font></h1> <p>a tutaj mamy jakiś przykładowy akapit, który służy jedynie celom poznawczym. <br> <a href="http://www.ij.amu.edu.pl">link do strony instytutu</a> <p> To drugi akapit, który zawiera kilka tzw. <i>encji</i>: <br> \& \ \Ö ß </body> </html> Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/17

XHMTL XHMTL to extensible HyperText Markup Language 1 Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML 2 To akurat zależy niestety w znacznym stopniu od przeglądarki Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

XHMTL XHMTL to extensible HyperText Markup Language Jest rozwinięciem standardu HTML 4.01 Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML) 1 Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML 2 To akurat zależy niestety w znacznym stopniu od przeglądarki Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

XHMTL XHMTL to extensible HyperText Markup Language Jest rozwinięciem standardu HTML 4.01 Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML) XHTML jest lepszy pod względem automatycznego przetwarzania 1 (bardziej rygorystyczna składnia) 1 Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML 2 To akurat zależy niestety w znacznym stopniu od przeglądarki Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

XHMTL XHMTL to extensible HyperText Markup Language Jest rozwinięciem standardu HTML 4.01 Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML) XHTML jest lepszy pod względem automatycznego przetwarzania 1 (bardziej rygorystyczna składnia) Pozwala na korzystanie z różnych rozszerzeń XML, np. MathML, SVG itp. 2 1 Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML 2 To akurat zależy niestety w znacznym stopniu od przeglądarki Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

HTML, XHTML i XML Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 10/17

Aspekt przetwarzania XHTML Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

Aspekt przetwarzania XHTML Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

Aspekt przetwarzania XHTML Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu Pozorna niedogodność jest tak naprawdę zaletą: wymusza większą staraność przy tworzeniu stron internetowych Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

Aspekt przetwarzania XHTML Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu Pozorna niedogodność jest tak naprawdę zaletą: wymusza większą staraność przy tworzeniu stron internetowych Możliwość walidacji stron Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

XHTML w porównaniu do HTML (1) Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li>... </li>) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

XHTML w porównaniu do HTML (1) Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li>... </li>) Puste elementy są także zamykane (np. zamiast <br> stosujemy <br />) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

XHTML w porównaniu do HTML (1) Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li>... </li>) Puste elementy są także zamykane (np. zamiast <br> stosujemy <br />) Poprawne zagnieżdzanie (np. zamiast <p>tekst <em>wyróżniony</p></em> - <p>tekst <em>wyróżniony</em></p>) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

XHTML w porównaniu do HTML (1) Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li>... </li>) Puste elementy są także zamykane (np. zamiast <br> stosujemy <br />) Poprawne zagnieżdzanie (np. zamiast <p>tekst <em>wyróżniony</p></em> - <p>tekst <em>wyróżniony</em></p>) Nazwy elementów i atrybutów pisane małymi literami Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

XHTML w porównaniu do HTML (1) Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li>... </li>) Puste elementy są także zamykane (np. zamiast <br> stosujemy <br />) Poprawne zagnieżdzanie (np. zamiast <p>tekst <em>wyróżniony</p></em> - <p>tekst <em>wyróżniony</em></p>) Nazwy elementów i atrybutów pisane małymi literami Wartości artrybutów w cudzysłowie (np. <td rowspan="3">) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

XHTML w porównaniu do HTML (1) Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li>... </li>) Puste elementy są także zamykane (np. zamiast <br> stosujemy <br />) Poprawne zagnieżdzanie (np. zamiast <p>tekst <em>wyróżniony</p></em> - <p>tekst <em>wyróżniony</em></p>) Nazwy elementów i atrybutów pisane małymi literami Wartości artrybutów w cudzysłowie (np. <td rowspan="3">) Niedozwolona minimalizacja elementów (np. zamiast <textarea readonly> - <textarea readonly="readonly">) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

XHTML w porównaniu do HTML (2) Główny element hmtl musi zawierać atrybut xmlns (np. <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl">) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/17

XHTML w porównaniu do HTML (2) Główny element hmtl musi zawierać atrybut xmlns (np. <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl">) Dokument rozpoczyna się od (opcjonalnej) deklaracji XML, np. <?xml version="1.0" encoding="iso-8859-2"?> Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/17

XHTML w porównaniu do HTML (2) Główny element hmtl musi zawierać atrybut xmlns (np. <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl">) Dokument rozpoczyna się od (opcjonalnej) deklaracji XML, np. <?xml version="1.0" encoding="iso-8859-2"?> Należy zastsować odpowiednią definicję typu dokumentu (np. dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd">) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/17

Przykład dokumentu XHTML 1.0 <?xml version="1.0" encoding="iso-8859-2"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl"> <head> <title>przykład dokumentu zgodnego z XHTML 1.0 Strict</title> <link rel="stylesheet" type="text/css" href="style.css" /> </head> <body> <p>to jest przykład.</p> </body> </html> Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/17

Walidacja dokumentów (X)HTML Każdy dokument XHTML musi spełniać dwa rodzaje poprawności: Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

Walidacja dokumentów (X)HTML Każdy dokument XHTML musi spełniać dwa rodzaje poprawności: Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

Walidacja dokumentów (X)HTML Każdy dokument XHTML musi spełniać dwa rodzaje poprawności: Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

Walidacja dokumentów (X)HTML Każdy dokument XHTML musi spełniać dwa rodzaje poprawności: Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD) Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu. Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

Walidacja dokumentów (X)HTML Każdy dokument XHTML musi spełniać dwa rodzaje poprawności: Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD) Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu. Poprawność strukturalna jest sprawdzana przez tzw. walidatory. Walidator porównuje dokument z podaną definicją typu dokumentu. Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

Semantic (X)HTML - Idealizacja Semantic (X)HTML to nie tyle standard co pewien styl tworzenia stron Dążymy do seperacji treści od formatu Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/17

Semantic (X)HTML - Idealizacja Semantic (X)HTML to nie tyle standard co pewien styl tworzenia stron Dążymy do seperacji treści od formatu Rezygnujemy z elementów lub atrybutów służących tylko do formatowania, np. <font>, <marque> itp. Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/17

Semantic (X)HTML - Idealizacja Semantic (X)HTML to nie tyle standard co pewien styl tworzenia stron Dążymy do seperacji treści od formatu Rezygnujemy z elementów lub atrybutów służących tylko do formatowania, np. <font>, <marque> itp. Przykład: Różnica między <i> a <em> Nadajemy dokumentom strukturę logiczną Formatowanie odbywa się na innym poziomie, np. CSS (Cascading Style Sheets) Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/17

Przydatne linki Specyfikacja HTML 4.01 http://www.w3.org/tr/html4/ Specyfikacja XHTML 1.0 http://www.w3.org/tr/xhtml1/ Specyfikacja XHTML 1.1 http://www.w3.org/tr/xhtml11/ Walidator W3C http://validator.w3.org Kurs HTML http://webmaster.helion.pl/kurshtml/ Skrót HTML http://www.w3schools.com/html/html quick.asp Kurs XHTML http://kurs.browsehappy.pl Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 17/17