XML dla humanistów, i to cyfrowych... (pogadanka...)



Podobne dokumenty
Rola języka XML narzędziem

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

Plan dzisiejszego wykładu. Narzędzia informatyczne w językoznawstwie. XML - Definicja. Zalety XML

WYKŁAD 1 METAJĘZYK SGML CZĘŚĆ 1

LABORATORIUM 5 WSTĘP DO SIECI TELEINFORMATYCZNYCH WPROWADZENIE DO XML I XSLT

Wprowadzenie do XML. Joanna Jędrzejowicz. Instytut Informatyki

Narzędzia informatyczne w językoznawstwie

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Środowisko XML (Extensible Markup Language).

Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

Wprowadzenie do arkuszy stylistycznych XSL i transformacji XSLT

29. Poprawność składniowa i strukturalna dokumentu XML

2 Podstawy tworzenia stron internetowych

Prezentacja dokumentów XML

XML extensible Markup Language. Paweł Chodkiewicz

KARTA KURSU. Przetwarzanie dokumentów XML i zaawansowane techniki WWW

Dlaczego GML? Gdańsk r. Karol Stachura

Jak profesjonalnie pisać teksty w edytorach tekstu? Na jakie drobiazgi należałoby zwrócić szczególną uwagę?

za pomocą: definiujemy:

Wprowadzenie do technologii XML

XHTML - Extensible Hypertext Markup Language, czyli Rozszerzalny Hipertekstowy Język Oznaczania.

Przykładowy dokument XML

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

użytkownika 1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania

Część II. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Model semistrukturalny

Czcionki. Rodzina czcionki [font-family]

XML DTD XML Schema CSS

Podstawy (X)HTML i CSS

Zastanawiałeś się może, dlaczego Twój współpracownik,

Dokument hipertekstowy

Kaskadowe arkusze stylów (CSS)

Rok akademicki: 2013/2014 Kod: ZZIP IN-s Punkty ECTS: 2. Kierunek: Zarządzanie i Inżynieria Produkcji Specjalność: Informatyka w zarządzaniu

GML w praktyce geodezyjnej

XML i nowoczesne technologie zarządzania treścią

Elementarz HTML i CSS

Dzięki arkuszom zewnętrznym uzyskujemy centralne sterowanie wyglądem serwisu. Zewnętrzny arkusz stylów to plik tekstowy z rozszerzeniem css.

Danuta ROZPŁOCH-NOWAKOWSKA Strona Moduł 4. Przykład 1. Przykład 2. HTML 4.01 Transitional).

O stronach www, html itp..

mgr inż. Jacek Staniec Język XML

Zaawansowana Pracownia Komputerowa - Ćwiczenia. Krzysztof Miernik

Szczegółowy opis języka HTML5 znajdziemy w specyfikacji, która jest dostępna pod adresem

Ćwiczenia laboratoryjne nr 8 Podstawy języka XML.

Przedmiot: Grafika komputerowa i projektowanie stron WWW

HTML nie opisuje układu strony!!!

<html> </html> <body> </body> <p> [</p>] <br> <html> <head> </head> <body> </body> </html> Materiały dydaktyczne 1/5

1.5. Formatowanie dokumentu

Masz pomysł na lepszy wygląd?

Andrzej Frydrych SWSPiZ 1/8

MATERIAŁY SZKOLENIOWE WORD PODSTAWOWY

Lab.1. Praca z tekstem: stosowanie arkuszy stylów w dokumentach OO oraz HTML/CSS

Wymagania na poszczególne oceny w klasach 3 gimnazjum

ABC języka HTML i XHTML / Maria Sokół. wyd. 2. Gliwice, cop Spis treści

Prezentacja dokumentów XML

Formatowanie komórek

SIECI KOMPUTEROWE I TECHNOLOGIE INTERNETOWE

LEGISLATOR. Data dokumentu:24 maja 2013 Wersja: 1.3 Autor: Paweł Jankowski, Piotr Jegorow

Programowanie internetowe

XPath XML Path Language. XPath. XSLT część 1. XPath data model. Wyrażenia XPath. Location paths. Osie (axes)

Prezentacja dokumentów XML

Zacznijmy więc pracę z repozytorium. Pierwsza konieczna rzecz do rozpoczęcia pracy z repozytorium, to zalogowanie się w serwisie:

inż. Konrad Postawa Akademia Aktywnego Seniora Wolontariusza

DTD - encje ogólne i parametryczne, przestrzenie nazw

Tajemniczy List. Wstęp HTML & CSS

Steganografia w HTML. Łukasz Polak

LAB 7. XML EXtensible Markup Language - Rozszerzalny Język Znaczników XSD XML Schema Definition Definicja Schematu XML

PROGRAMOWANIE. WNPiD UAM, Programowanie, inż. Piotr Jabłoński

Technologie zarządzania treścią

Zautomatyzowane tworzenie korpusów błędów dla języka polskiego

Tworzenie Stron Internetowych. odcinek 6

ĆWICZENIE 1 SKŁAD TEKSTU DO DRUKU

Komputer nie myśli. On tylko wykonuje nasze polecenia. Nauczmy się więc wydawać mu rozkazy

Kaskadowość stylów określa pierwszeństwo w oddziaływaniu na te same elementy strony różnych stylów.

5.2. Pierwsze kroki z bazami danych

Prezentacja dokumentów XML

I. Formatowanie tekstu i wygląd strony

Informatyka Systemów Autonomicznych

Edytor tekstu jest to program przeznaczony do pisania modyfikowania i drukowania tekstów.

OpenOffice.org Writer

Edytor tekstu Microsoft Office 2007 przewodnik dla gimnazjalisty Autor: Dariusz Kwieciński nauczyciel ZPO w Sieciechowie

Prezentacja i transformacja

CSS. Kaskadowe Arkusze Stylów

p { color: yellow; font-weight:bold; }

CZYTANIE CICHE ZE ZROZUMIENIEM

BAZY DANYCH. Dr hab. Sławomir Zadrożny, prof. PR

Laboratorium 1 (ZIP): Style

Semantyczne Wiki na przykładzie Semantic MediaWiki

Szablon do pracy dyplomowej

Semantyczne Wiki! na przykładzie! Semantic MediaWiki!

Tomasz Grześ. Systemy zarządzania treścią, cz. II

XML. XML (ang. Extensible Markup Language) - Rozszerzalny język znaczników. Aktualna wersja 1.0 (1.1 czeka na akceptację) Należy do rodziny SGML.

KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk

1 XML w bazach danych

Wymagania na poszczególne oceny w klasach I gimnazjum

rk HTML 4 a 5 różnice

PROCES TWORZENIA DOKUMENTU

Skorzystaj z Worda i stwórz profesjonalnie wyglądające dokumenty.

ECDL/ICDL Web Editing Moduł S6 Sylabus - wersja 2.0

W ogólności znaczniki mogą również posiadać atrybuty które pozwalają wpływać i manipulować własnościami znaczników lub przenosić dodatkowe informacje:

Transkrypt:

XML dla humanistów, i to cyfrowych... (pogadanka...) Piotr Bański Institut für Deutsche Sprache (IDS) Mannheim bansp@o2.pl Licencja: Creative Commons BY-SA 3.0 Warszawa, DELab UW, październik 2014

Czego potrzebujemy do pracy Tekstu, głowy, tradycji badawczej, aparatu pojęciowego... Co najmniej: słowników elektronicznych, archiwów tekstów, korpusów tekstów (zbiorów o bardziej konkretnym przeznaczeniu), (ontologii/terminologii do bardziej zaawansowanych zastosowań), łatwości odnalezienia informacji/tekstów w Sieci [metadane!], sposobu na odpytanie słownika/archiwum (a więc języka zapytań), sposobu na podwiązanie dodatkowych danych o tekście do samego tekstu (a więc anotacji [uwaga: termin nie do końca zinstytucjonalizowany...]), sposobu na mówienie o tym samym (standardy, schematy) łatwości publikowania w Sieci (i nie tylko), oswojenia się z komputerem i komputerowym wspomaganiem badań. Piotr Bański, 20 października 2014 2 of 27

Ćwiczenie: otwórz http://nkjp.pl/ sprawdź... coś :-) Czy to pokazuje zalety XML-a? Nie, jedynie zalety zasobu językowego, który został stworzony przy zastosowaniu XML-a. Niezły, prawda? Piotr Bański, 20 października 2014 3 of 27

Problemy typowe dla językoznawcy brak danych (czy aby na pewno?) brak dostępu do danych (licencje, przyzwyczajenia, nieuzasadniony academic/non-commercial use, itp.) brak chęci podzielenia się danymi (b. krótkowzroczne, mało etyczne) dane mają złą formę trudno się do nich dobrać: zamknięty format (Word! no ludzie...), nietrwały format (Word 5.0, WordStar, itd. kto to dziś otworzy...), sztywny, niewygodny format (np. kolumnowe CSV, TSV; COCOA), wymagający czasem (nie)szczególnych narzędzi, format nieczytelny gołym okiem (binarny, np. relacyjne bazy danych). Piotr Bański, 20 października 2014 4 of 27

Odpowiedź na dziś: XML nie, XML to nie jest panaceum, to jedynie narzędzie: nieco wadliwe (problemy m.in. z nakładaniem się obszarów danych) ale proste i 'giętkie' ( SGML potwornie i zwykle niepotrzebnie skomplikowany, HTML zbyt szczegółowy, nastawiony na prezentację) także... modne a to istotne przy poszukiwaniu narzędzi, a także grup użytkowników (fora, listy dyskusyjne). (bardzo?) stara szkoła nie znosi XML, woli relacyjne bazy danych, ale relacyjne bazy danych nie są dobrze dostosowane do opisu zasobów językowych (sztywne rekordy por. zagnieżdżone sensy), istnieją coraz to lepsze i szybsze XML-owe bazy danych (np. exist, BaseX, etc.), które pozwalają 'odpytywać' XML językiem zbliżonym do SQL. Piotr Bański, 20 października 2014 5 of 27

*ML w skrócie SGML i XML to metajęzyki, służące do budowy bardziej wyspecjalizowanych (meta) języków znaczników. Np. HTML to aplikacja SGML na potrzeby WWW. SGML idea: lata 60-te standard: lata 80-te aplikacje *ML x 10 m.in. TEI P3 podzbiór HTML wiele wariantów, 'browser wars'; standaryzacja i wersja 4.x XML standard: 1998 *ML x 100 m.in. TEI P5 aplikacje XHTML HTML (4.0) jako XML XML 2.0? MicroXML? Zobaczymy, ale na razie jest stabilnie... HTML5 rozwinięcie HTML-a, ale nie SGML-a; połączenie języka opisu strony z językiem aplikacji. Istnieje też XHTML5. Piotr Bański, 20 października 2014 6 of 27

Zalety XML...: uwypuklenie struktury danych, oddzielenie opisu danych od ich prezentacji, łatwość obróbki i związana z tym dostępność narzędzi. dla językoznawcy: to co powyżej, oraz możliwość ukrycia części danych lingwistycznych (np. opisania własności słów) w sposób niewpływający na przepływ tekstu, możliwość standaryzacji formatu opisu, a więc: łatwość dzielenia się danymi, łatwość powtarzania pomiarów (przy spełnieniu dodatkowych warunków). Piotr Bański, 20 października 2014 7 of 27

[czas na demonstrację użyteczności XML-a, ale najpierw parę słów o nazwie] XML (extensible Markup Language) to rozszerzalny język znaczników. Czy używają Państwo na co dzień znaczników, znakowania przy pracy z tekstem? Ależ tak bez przerwy! odstępy między słowami, znaki interpunkcyjne, interlinie, zmiany kształtu liter (pogrubienie, kursywa) to wszystko są rodzaje znakowania... to wszystko jest niedoskonałe (radzimy sobie czasem bez powyższych, ponieważ jesteśmy zdolnymi zwierzętami ale jak biedna maszyna ma sobie z tym wszystkim poradzić?) konwencje: tylko ogólne (ale: akapit oddzielony linią czy wcięciem? wcięcie składa się ze spacji, znaku \t, czy wewnętrznego formatowania procesora tekstu?) Piotr Bański, 20 października 2014 8 of 27

[czas na demonstrację użyteczności XML-a, ale najpierw parę słów o nazwie] XML (extensible Markup Language) to rozszerzalny język znaczników. Czy używają Państwo na co dzień znaczników, znakowania przy pracy z tekstem? Ależ tak bez przerwy! odstępy między słowami, znaki interpunkcyjne, interlinie, zmiany kształtu liter (pogrubienie, kursywa) to wszystko są rodzaje znakowania... to wszystko jest niedoskonałe (radzimy sobie czasem bez powyższych, ponieważ jesteśmy zdolnymi zwierzętami ale jak biedna maszyna ma sobie z tym wszystkim poradzić?) konwencje: tylko ogólne (ale: akapit oddzielony linią czy wcięciem? wcięcie składa się ze spacji, znaku \t, czy wewnętrznego formatowania procesora tekstu?) Piotr Bański, 20 października 2014 9 of 27

[czas na demonstrację użyteczności XML-a, ale najpierw parę słów o nazwie] XML (extensible Markup Language) to rozszerzalny język znaczników. Czy używają Państwo na co dzień znaczników, znakowania przy pracy z tekstem? Ależ tak bez przerwy! odstępy między słowami, znaki interpunkcyjne, interlinie, zmiany kształtu liter (pogrubienie, kursywa) to wszystko są rodzaje znakowania... to wszystko jest niedoskonałe (radzimy sobie czasem bez powyższych, ponieważ jesteśmy zdolnymi zwierzętami ale jak biedna maszyna ma sobie z tym wszystkim poradzić?) konwencje: tylko ogólne (ale: akapit oddzielony linią czy wcięciem? wcięcie składa się ze spacji, znaku \t, czy wewnętrznego formatowania procesora tekstu?) Piotr Bański, 20 października 2014 10 of 27

[czas na demonstrację użyteczności XML-a, ale najpierw parę słów o nazwie] XML (extensible Markup Language) to rozszerzalny język znaczników. Czy używają Państwo na co dzień znaczników, znakowania przy pracy z tekstem? Ależ tak bez przerwy! odstępy między słowami, znaki interpunkcyjne, interlinie, zmiany kształtu liter (pogrubienie, kursywa) to wszystko są rodzaje znakowania... to wszystko jest niedoskonałe (radzimy sobie czasem bez powyższych, ponieważ jesteśmy zdolnymi zwierzętami ale jak biedna maszyna ma sobie z tym wszystkim poradzić?) konwencje: tylko ogólne (ale: akapit oddzielony linią czy wcięciem? wcięcie składa się ze spacji, znaku \t, czy wewnętrznego formatowania procesora tekstu?) Piotr Bański, 20 października 2014 11 of 27

(dalej...) Czy nowe terminy oznaczane są kursywą, czy wytłuszczeniem? A wtrącenia z innych języków? Czy nagłówki używają konkretnego stylu, czy robione są ręcznie (bold, small caps, etc.)? Czy daty albo nazwy własne są jakoś wyróżnione? Czy wiemy, która kropka kończy zdanie, a która należy do skrótu? (np. Warszawa) A jeśli chcemy zmienić oznakowanie nagłówków? Albo rodzaj odstępów pomiędzy akapitami? w Wordzie też to mogę zrobić! no tak, takie rozdzielenie opisu i prezentacji to nie jest wyłączna zaleta XML-a, ale dodajmy to do wszystkiego innego, o czym tu mówiłem. Piotr Bański, 20 października 2014 12 of 27

(dalej...) Czy nowe terminy oznaczane są kursywą, czy wytłuszczeniem? A wtrącenia z innych języków? Czy nagłówki używają konkretnego stylu, czy robione są ręcznie (bold, small caps, etc.)? Czy daty albo nazwy własne są jakoś wyróżnione? Czy wiemy, która kropka kończy zdanie, a która należy do skrótu? (np. Warszawa) A jeśli chcemy zmienić oznakowanie nagłówków? Albo rodzaj odstępów pomiędzy akapitami? w Wordzie też to mogę zrobić! no tak, takie rozdzielenie opisu i prezentacji to nie jest wyłączna zaleta XML-a, ale dodajmy to do wszystkiego innego, o czym tu mówiłem. Piotr Bański, 20 października 2014 13 of 27

Językoznawstwo... A co jeśli chcemy wykonać jakieś pomiary językoznawcze? Gdzie są granice zdań? (to problem ogólny, ale czy wystarczy umieścić każde zdanie w osobnej linii? a co jeśli potem zajmiemy się słowami?) Jak możemy oznakować własności słów? [atrybuty!] Jak oznaczą Państwo własności gramatyczne słów w korpusie w Wordzie? A jeśli zechcą Państwo dołożyć lematy (= formy słownikowe wyrazów)? A informację o strukturach składniowych? Jak zaznaczyć, że niektóre spacje są nieistotne? (po prostu, po ciemku) A brak spacji? (robiliście) I jak się całość będzie czytało? Piotr Bański, 20 października 2014 14 of 27

Rozszerzalny język znaczników: repertuar znaczników jest praktycznie nieograniczony. Możemy je dodatkowo opisywać atrybutami. No to się teraz przestraszmy... Piotr Bański, 20 października 2014 15 of 27

XML podstawy składni Struktura: drzewo, jeden korzeń (root) element element element element Element: znacznik otwierający + zawartość + znacznik zamykający <word>dziecko</word> Atrybuty: wewnątrz znaczników otwierających: <word pos= rzeczownik rodz= nijaki >dziecko</word> Piotr Bański, 20 października 2014 16 of 27

XML krótki tekst Tekst: artykuł z Wikipedii o Powszechnej Deklaracji Praw Człowieka. Wymyślmy jakieś znaczniki: czego potrzebujemy? <dokument> <rozdzial> (umówmy się: bez diakrytyków) <naglowek> (jak rozróżnić nagłówek rozdziału od nagłówka podrozdziału?) <akapit> <z>(danie) albo może <zdanie>? (tego w HTML-u nie ma...) <w>yraz albo może <wyraz>? <data>? <nazwisko>?? A teraz: <?xml-stylesheet type="text/css" href="udhr-wikipedia.css"?> Piotr Bański, 20 października 2014 17 of 27

XML krótki tekst Tekst: artykuł z Wikipedii o Powszechnej Deklaracji Praw Człowieka. Wymyślmy jakieś znaczniki: czego potrzebujemy? <dokument> <rozdzial> (umówmy się: bez diakrytyków) <naglowek> (jak rozróżnić nagłówek rozdziału od nagłówka podrozdziału?) <akapit> <z>(danie) albo może <zdanie>? (tego w HTML-u nie ma...) <w>yraz albo może <wyraz>? <data>? <nazwisko>?? A teraz: <?xml-stylesheet type="text/css" href="udhr-wikipedia.css"?> Piotr Bański, 20 października 2014 18 of 27

XML krótki tekst Tekst: artykuł z Wikipedii o Powszechnej Deklaracji Praw Człowieka. Wymyślmy jakieś znaczniki: czego potrzebujemy? <dokument> <rozdzial> (umówmy się: bez diakrytyków) <naglowek> (jak rozróżnić nagłówek rozdziału od nagłówka podrozdziału?) <akapit> <z>(danie) albo może <zdanie>? (tego w HTML-u nie ma...) <w>yraz albo może <wyraz>? <data>? <nazwisko>?? A teraz: <?xml-stylesheet type="text/css" href="udhr-wikipedia.css"?> Piotr Bański, 20 października 2014 19 of 27

CSS: Kaskadowy arkusz stylów element { cecha-1: wartość-1; cecha-2: wartość-2 } (Możemy wyszukać CSS2, pojawi się specyfikacja W3C: http://www.w3.org/tr/css2/) dokument { display: block; } naglowek {display: block; color: blue; } akapit > zdanie (= wybierz <zdanie> wewnątrz elementu <akapit>) naglowek[typ='glowny'] (= wybierz <naglowek typ= glowny >) font-weight: bold; font-size: 1em font-style: italic border:solid black 1px; display: inline Piotr Bański, 20 października 2014 20 of 27

Rozszerzalność, schematy Repertuar znaczników jest nieograniczony, i bardzo dobrze, bo dzięki temu możemy opisać, co tylko nam się zachce, ale jak sprawić, abyśmy mogli swobodnie zamienić się tekstami i wciąż mieć pewność, że rozumiemy, co poprzednia osoba wykonała, co zaznaczyła? Pochodny problem: jak sprawić, żeby mój arkusz CSS działał ze znakowaniem kolegi? Schematy i walidacja (rozróżnienie well-formedness od validity): proste DTD. (Są też bardziej zaawansowane języki schematów: XML Schema i RelaxNG.) Well-formedness poprawność podstawowa : jeden korzeń, domknięte elementy, wartości atrybutów w cudzysłowie, poprawne zagnieżdżenie. Validity poprawność w odniesieniu do konkretnego schematu. xmllint --noout yourfile.xml vs. xmllint --noout --valid yourfile.xml Piotr Bański, 20 października 2014 21 of 27

Standardy Mamy dwa różne znakowania i dwa różne DTD co dalej? Standardy (jak wszędzie; w tym kontekście znana jest organizacja ISO, i prowadzi ona także standaryzację opisu zasobów językowych ale nie będziemy się dziś w to zagłębiać) Standard dla humanistów: TEI (Text Encoding Initiative) Czasem pełna standaryzacja nie jest potrzebna czasem wystarcza regularny format, a więc dopracowana struktura danych. Z regularnej struktury da się wiele uzyskać. Piotr Bański, 20 października 2014 22 of 27

Roma narzędzie do tworzenia schematów http://www.tei-c.org/roma/ Wyderywujmy jakiś ogólny schemat... (nie trzeba znać się na pisaniu DTD lub innych językach schematów, aby ich używać...) oxygen automatycznie rozpoznaje schemat TEI. Robi to dzięki przestrzeni nazw TEI: <TEI xmlns="http://www.tei-c.org/ns/1.0"> Przestrzenie nazw pozwalają na dalszą rozszerzalność zasobu znaczników. Ale to dłuższa historia i nie będziemy jej dziś zapewne poznawać :-) Piotr Bański, 20 października 2014 23 of 27

Wady XML: Żeby nie było zbyt różowo... aż nazbyt hierarchiczny (jeden korzeń drzewa, nakładanie się opisywanych obszarów) pewne błędy w dodatkowych standardach (np. problemy z Namespaces, XML Schema), niektóre standardy niemal nieużywane (XLink, XPointer) wielkość plików ojej, mamy coraz większe dyski i RAM ale i tak jest to istotny problem (wiem z doświadczenia) szybkość przetwarzania względem innych formatów danych ale to się zmienia: optymalizacja natywnych baz danych streaming XSLT poza tym format przechowywania danych nie musi być formatem serwowania danych (XML łatwo skompilować do zadanej postaci). Piotr Bański, 20 października 2014 24 of 27

Tworzenie zasobów językowych Standaryzacja daje nam m.in.: możliwość użycia danych w wielu narzędziach oraz łączenia danych (np. łączenia kawałków słownika w jeden) ułatwia przechowywanie danych, nie pozwala im się zestarzeć (przypomnijmy WordStar...) Ale standaryzacja nie dotyczy jedynie formatu samych danych. Ważne: metadane opisowe (typ tekstu, dane twórcy, czas powstania, język/dialekt, itp.) treść metadanych opisowych i analitycznych: czy kategoria proz.hist to to samo co UDC 820+900? czy kategorie A, adj, przym. albo f, fem, żeń mają może coś wspólnego? Piotr Bański, 20 października 2014 25 of 27

Metadane, nagłówki, ontologie Metadane opisowe zawarte są zwykle w nagłówkach dokumentów. Nagłówek TEI (TEI header) jest narzędziem stosowanym nawet w systemach, które nie używają TEI do znakowania tekstów. Do uzgadniania zawartości kategorii analitycznych stosuje się tzw. ontologie językoznawcze (wyszukajmy GOLD ontology ) bądź repozytoria kategorii (wyszukajmy ISO DCR lub ISOCat ). Jak ontologie takie jak GOLD mają się do XML-a? Do czystego XML-a niemal nijak. Ale do XML-a używanego przez językoznawców jak najbardziej. Ponieważ zależy nam m.in. na tym, aby inni mogli porównać swoje wyniki z naszymi. Piotr Bański, 20 października 2014 26 of 27

Dodatkowe materiały Learn the TEI : http://www.tei-c.org/support/learn/ (szczególną uwagę warto zwrócić na Gentle Introduction... ) Intensive introduction to the TEI: http://dev.stg.brown.edu/staff/julia_flanders/tei/brown2006/ Kurs technologii XML Tomaža Erjaveca: http://nl.ijs.si/et/teach/esslli05/ Moje slajdy ze szkoły letniej TEI@Oxford-2010: http://tei.oucs.ox.ac.uk/oxford/2010-07- oxford/materials/workshops/languageresources/languageresources.pdf TEI Wiki: http://wiki.tei-c.org/ Piotr Bański, 20 października 2014 27 of 27