XML i nowoczesne metody zarządzania treścią

Podobne dokumenty
XML i nowoczesne metody zarządzania treścią

XML and Content Management

ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI [1]) z dnia r.

Przetwarzanie dokumentów XML i zaawansowane techniki WWW Przetwarzanie dokumentów XML za pomocą procesora XSLT (Zajęcia r.

Służy do wybierania/wyszukiwania fragmentów dokumentu XML. Przypomina trochę ścieżki w systemie operacyjnym. Niech będzie dany dokument XML:

XML i nowoczesne technologie zarządzania treścią

Wprowadzenie do arkuszy stylistycznych XSL i transformacji XSLT

XML Path Language (XPath)

EAP XML Legislator Opis zmian w wersji Service Pack 44 ABC PRO Sp. z o.o.

XML extensible Markup Language. część 3

ETJ XML Edytor Tekstów Jednolitych XML

XPath XML Path Language. XPath. XSLT część 1. XPath data model. Wyrażenia XPath. Osie (axes) Location paths

Przetwarzanie dokumentów XML i zaawansowane techniki WWW Wykład 04

XML i nowoczesne technologie zarządzania treścią

Budowa aplikacji wielowarstwowych. Zastosowanie Kaskadowych arkuszy stylów (CSS)

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

OMEGA-PSIR na Uniwersytecie Gdańskim

Załącznik nr 2 do zapytania ofertowego nr IN-I

DP/2310/6/14 ZAŁĄCZNIK NR 2 OPIS PRZEDMIOTU ZAMÓWIENIA

UKŁAD INFORMACJI I POWI

Extensible Markup Language III

Układ informacji i powiązań między danymi w deklaracji w formacie XML

XML extensible Markup Language. część 6

OPIS PRZEDMIOTU ZAMÓWIENIA

Planowanie przestrzenne

UCHWAŁA NR L/932/13 RADY MIASTA MYSŁOWICE. z dnia 19 grudnia 2013 r.

Legislator Premium. Jak to działa czyli krótki opis funkcjonalności

TECHNIKI INFORMACJI I KOMUNIKACJI. Semestr zimowy 2016/2017 I SSA I stopnia

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Regina Klukowska mgr

System kontroli wersji - wprowadzenie. Rzeszów,2 XII 2010

Słowem wstępu. Część rodziny języków XSL. Standard: W3C XSLT razem XPath 1.0 XSLT Trwają prace nad XSLT 3.0

Rządowy Proces Legislacyjny

UKŁAD INFORMACJI I POWI

Przewodnik użytkownika (instrukcja) AutoMagicTest

RÓWNOWAŻNOŚĆ ZAOFEROWANCH PAKIETÓW PROGRAMÓW BIUROWYCH

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Krystyna Łapin dr

XML i nowoczesne metody zarządzania treścią

Przetwarzanie dokumentów XML za pomocą XSLT ( r.)

System informacji prawnej w wersji internetowej

Język XSLT. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz. UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

Poziomy wymagań Konieczny K Podstawowy- P Rozszerzający- R Dopełniający- D Uczeń:

dlibra 3.0 Marcin Heliński

Szkolenie autoryzowane. MS Zaawansowany użytkownik programu SharePoint 2016

Javadoc. Piotr Dąbrowiecki Sławomir Pawlewicz Alan Pilawa Joanna Sobczyk Alina Strachocka

- wewnątrz elementów prostych występuje tylko jeden typ danych, wewnątrz złoŝonych nie moŝemy dokładnie określić liczby wystąpień elementu

Integracja Obieg Dokumentów - GiS Spis treści

Materiały do laboratorium MS ACCESS BASIC

Instrukcja obsługi systemu informacji o wolnych łóżkach w szpitalach Dostęp z poziomu Użytkownika

Wprowadzenie do projektu QualitySpy

XML extensible Markup Language. część 4

Deduplikacja danych. Zarządzanie jakością danych podstawowych

Trwały nośnik w Alior Bank

Dokumentacja techniczna RockPay

Instrukcja obsługi dla studenta

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

Dziennik Urzędowy Unii Europejskiej L 274/9

Warszawa, dnia 18 stycznia 2012 r.

Ogłoszenie. 1. Nazwa przedmiotu zamówienia System informacji prawnej dla Wojewódzkiego Urzędu Pracy w Lublinie.

OPIS JAKOŚCIOWY (wymagania minimalne) ZESTAWIENIE PARAMETRÓW GRANICZNYCH

Najczęściej stosowanym systemem obiegu dokumentów elektronicznych jest poczta elektroniczna. Dokumenty przesyłamy sobie jako załączniki do listów.

W oknie konfiguratora Importu/Exportu należy wprowadzić odpowiednie ustawienia poprzez zaznaczenie pól kursorem myszki przy poszczególnych opcjach.

MINISTERSTWO SPRAW WEWNĘTRZNYCH I ADMINISTRACJI DEPARTAMENT INFORMATYZACJI

Instrukcja obsługi dla studenta

Instrukcja obsługi dla studenta

APD Archiwum Prac Dyplomowych - ( apd.utp.edu.pl )

System generacji raportów

Instrukcja obsługi dla studenta

Przekazywanie prac dyplomowych z uczelni wyższej do ORPD

Koncepcja systemu informatycznego realizującego w środowisku Oracle Spatial proces generalizacji modelu BDOT10 do postaci BDOT50

I. Informacje ogólne. Jednym z takich systemów jest Mambo.

Semantyczne Wiki na przykładzie Semantic MediaWiki

WYJAŚNIENIE TREŚCI SIWZ

Przykładowy dokument XML

Legislator Premium. oraz obwieszczeń z tekstem jednolitym. Tworzenie aktów zmieniających

Integracja Symfonia ERP ze sklepem internetowym

Semantyczne Wiki! na przykładzie! Semantic MediaWiki!

Regulamin funkcjonowania systemu antyplagiatowego w Uniwersytecie Przyrodniczo-Humanistycznym w Siedlcach

TemplaVoilà alternatywne podejście do szablonów. TemplaVoilà. alternatywne podejście do szablonów

ECDL ZARZĄDZANIE PROJEKTAMI

Instrukcja obsługi dla studenta

Integracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych i Otwartym Systemem Antyplagiatowym

Wybrane zmiany wprowadzone w pakiecie Oprogramowanie: SyriuszStd

Przewodnik użytkownika (instrukcja) AutoMagicTest

PHP może zostać rozszerzony o mechanizmy dostępu do różnych baz danych:

XSLT. Patryk Czarnik. Instytut Informatyki UW. XML i nowoczesne technologie zarzadzania treścia 2007/08

Charakterystyka ogólna

XML extensible Markup Language. część 8

ABC LEGISLACJI. W SAMORZĄDZIE TERYTORIALNYM czyli co samorządowiec o stanowieniu prawa wiedzieć powinien? SZKOLENIE DATA I MIEJSCE

Przykład zawartości pliku informacyjnego info.txt poniżej: Dodatek J. Wytyczne w zakresie przygotowania MPZP w postaci numerycznej

Tom 6 Opis oprogramowania

Archiwum Prac Dyplomowych.

PLAN WYNIKOWY PROGRAMOWANIE APLIKACJI INTERNETOWYCH. KL IV TI 6 godziny tygodniowo (6x15 tygodni =90 godzin ),

WERSJA 4.3. Opis zmian. Spis treści

EXSO-CORE - specyfikacja

Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

Propozycja standaryzacji usługi lokalizacji adresu

Odkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013.

Rzeszów, dnia 18 czerwca 2015 r. Poz UCHWAŁA NR IX RADY MIEJSKIEJ W BOGUCHWALE. z dnia 28 maja 2015 r.

Spis wzorców. Działania użytkownika Strona 147 Obsługa większości Działań użytkownika za pomocą kodu JavaScript przy użyciu metod obsługi zdarzeń.

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Transkrypt:

XML i nowoczesne metody zarządzania treścią Wykład 14: Studium przypadku: System SET Władysław Baksza, Maciej Ogrodniczuk MIMUW, 14 stycznia 2010 Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 1

Trochę historii Przed rokiem 2005: system zarządzający metadanymi ustaw i projektów ustaw, dokumenty przechowywane w systemie plików w postaci plików MS Worda, ręczne wersjonowanie dokumentów, ręczne ujednolicanie tekstów. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 2

Podział procesu Wyodrębnienie części procesowej i redakcyjnej: 1 moduł serwera obsługujący procesy legislacyjne: rejestracja nowych tekstów, kontrola nad stanem prac, obsługa wariantów projektów nowelizujących, uruchamianie akcji edycji/podglądu/ujednolicania,... 2 środowisko edycyjne (XMetaL): zapis kompletu informacji w tekstach: adresy publikacji, daty: uchwalenia, wejścia w życie, obowiązywania zestawów przepisów, powiązania nowelizacyjne (przywołania), znaczniki definicji, dostosowania edytora XML-owego (CSS/makra/skróty klawiaturowe), integracja z repozytorium z użyciem protokołu WebDAV. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 3

Jak wygląda ustawa? Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 4

Jak wygląda nowelizacja? Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 5

Interfejs edytora XMetaL Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 6

Schemat dokumentów Założenia ogólne: brak konstrukcji formatujących, reprezentacja struktury: hierarchia jednostek: księga, dział, rozdział, artykuł,... zawartość tekstowa poszczególnych części aktu, tytuły części tytułowanych, przypisy końcowe, elementy dodatkowe: uwagi do tekstu, oznaczenia definicji, dodatkowe oznaczenia orzeczeń TK, elementy zewnętrzne w postaci wysp edycyjnych, znaczniki nowelizacyjne. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 7

Jak wygląda ustawa? <ustawa data-uchwalenia="20 grudnia 1990"> <tytul>o jednostkach innowacyjno-wdrożeniowych</tytul> <adres-publikacji> <adres-dzu rok="1991" numer="2" pozycja="7"/> </adres-publikacji> <artykul nr="1">urząd Postępu Naukowo-Technicznego i Wdrożeń na dotychczasowych zasadach: <punkt nr="1">dokonuje skreśleń w rejestrze jednostek innowacyjno-wdrożeniowych w okresie trzech lat od dnia wejścia w życie niniejszej ustawy,</punkt> <punkt nr="2">wpisuje jednostki do rejestru.</punkt> </artykul> <artykul nr="2">ustawa wchodzi w życie po upływie 14 dni od dnia ogłoszenia.</artykul> </ustawa> Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 8

Wynik wdrożenia Obecnie: dokumenty tworzone w XML-u (zgodnie z tzw. schematem sejmowym ), prezentacja tekstów w wielu formatach (PDF, HTML, DOCX) obsługiwana za pomocą XSLT, wersjonowanie przy każdym zapisie; teksty przechowywane w bazie danych (Oracle, CLOB), mechanizm automatycznego ujednolicania (przywołania, znaczniki nowelizacyjne, ścieżki nowelizacyjne), konwerter Word2XML prawie automatyczny, architektura: Solaris (Windows)/Oracle/JBoss/XMetaL. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 9

CSS ustawa:before { content: "USTAWA\Az dnia " attr(data-uchwalenia) " r."; font-weight: bold; display: block; text-align: center; } Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 10

XSLT <xsl:template match="artykul"> <xsl:choose> <xsl:when test="count(ancestor::*[name() = dodaj or name() = zastap ]) > 0"> <div class="artykul-cytowany"> <xsl:if test="position() = 1"> </xsl:if> Art. <xsl:value-of select = "@nr"/> <xsl:apply-templates/> </div> </xsl:when> <xsl:otherwise> <div class="artykul"> <div class="naglowek-artykulu">art. <xsl:value-of select = "@nr"/></div> <xsl:apply-templates/> </div> </xsl:otherwise> </xsl:choose> </xsl:template> Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 11

Ujednolicanie Projekty nowelizacji można nakładać na teksty obowiązujące: linki nowelizacyjne pomiędzy parami tekstów zapisane w treści nowelizacji: OO: przywołania = linki między ustawą nowelizującą a nowelizowaną, CC: znaczniki nowelizacyjne reprezentujące pojedyncze zmiany wraz z datami ich obowiązywania; cele linków zapisane w postaci wyrażeń XPath, możliwość nałożenia wielu projektów nowelizacji na pojedynyczy tekst obowiązujący, wykrywanie potencjalnych konfliktów nowelizacyjnych. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 12

Przywołania Przywołania przechowują informację o linku między fragmentem tekstu nowelizacji a ustawą bazową. Są wstawiane w miejscu odwołania do tytułu ustawy nowelizowanej i zastępują go; informacja o ustawie pobierana jest przy każdym otwarciu tekstu bezpośrednio z bazy danych. Przykład: <przywolanie ustawa-id="8ab282971830bb8a01183221c82c0010" typ="nowelizacyjne"> <ustawa-info data-uchwalenia="6 grudnia 1996"> <tytul>o zastawie rejestrowym i rejestrze zastawów</tytul> <adres-publikacji> <adres-dzu rok="1996" numer="149" pozycja="703"/> </adres-publikacji> </ustawa-info> <przypis nr="2"/> </przywolanie> Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 13

Znaczniki nowelizacyjne Dwa wymiary znaczników: 1 rodzaj operacji: <dodaj>, <zmien>, <usun>, 2 cel operacji: element struktury, fragment tekstu. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 14

Przykłady struktur znaczników nowelizacyjnych Tekst: W art. 7 w ust. 1 dodaje się pkt 6a w brzmieniu: 6a) analizę wykorzystania wynikających z kontroli wniosków dotyczących stanowienia lub stosowania prawa.. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 15

Przykłady struktur znaczników nowelizacyjnych Tekst: W art. 7 w ust. 1 dodaje się pkt 6a w brzmieniu: 6a) analizę wykorzystania wynikających z kontroli wniosków dotyczących stanowienia lub stosowania prawa.. Reprezentacja XML-owa: W art. 7 w ust. 1 dodaje się pkt 6a w brzmieniu: <dodaj> <po-elemencie id="//artykul[@nr= 7 ] /ustep[@nr= 1 ]/punkt[@nr= 6 ]"/> <element> <punkt nr="6a">analizę wykorzystania wynikających z kontroli wniosków dotyczących stanowienia lub stosowania prawa.</punkt> </element> </dodaj> Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 15

Przykłady struktur znaczników nowelizacyjnych Tekst: W art. 2 ust. 3 wyrazy armie zastępuje się wyrazami siły zbrojne. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 16

Przykłady struktur znaczników nowelizacyjnych Tekst: W art. 2 ust. 3 wyrazy armie zastępuje się wyrazami siły zbrojne. Reprezentacja XML-owa: W art. 2 ust. 3 wyrazy <zastap> <w-elemencie id="//artykul[@nr= 2 ] /ustep[@nr= 3 ]"/> <tekst>armie</tekst> <akcja>zastępuje się wyrazami</akcja> <tekstem>siły zbrojne</tekstem> </zastap>. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 16

Model znacznika <zastap> <xsd:element name="zastap"> <xsd:complextype> <xsd:choice> <xsd:sequence> <xsd:choice maxoccurs="unbounded"> <xsd:element ref="element"/> <xsd:element ref="elementy"/> </xsd:choice> <xsd:element ref="elementem" minoccurs="0"/> </xsd:sequence> <xsd:sequence> <xsd:element ref="w-elemencie" minoccurs="0" maxoccurs="unbounded"/> <xsd:element ref="tekst"/> <xsd:element ref="akcja" minoccurs="0"/> <xsd:element ref="tekstem"/> </xsd:sequence> </xsd:choice> <xsd:attributegroup ref="atr-nowelizacyjne"/> </xsd:complextype> </xsd:element> Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 17

Znaczenie wariantów modelu zawartości 5 modeli zawartości do reprezentacji: 1 zmiany brzmienia pojedynczego elementu struktury: <element id="ścieżka "> element pusty, ze ścieżką do elementu, którego zawartość ma zostać wymieniona, <elementem> nowe brzmienie elementu struktury (zapisane w treści znacznika), 2 zmiany brzmienia ciągłego zestawu elementów struktury: <elementy od="ścieżka1 " do="ścieżka2 "> ze ścieżkami wskazującymi początek i koniec ciągłego zestawu elementów o zmienianym brzmieniu, <elementem> nowe brzmieniem zestawu, 3 zmiany brzmienia tekstu: <w-elemencie id="ścieżka "> ze ścieżką do elementu, w którym ma zostać zmieniony tekst, <tekst> tekst, który ma zostać zastąpiony nowym, <akcja> tekst łączący (np. zastępuje się wyrazy ), <tekstem> nowe brzmienie zastępowanych wyrazów, Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 18

Znaczenie wariantów modelu zawartości 4 obudowania tekstu elementem struktury: <element id="ścieżka "> ze ścieżką do elementu, którego tekst ma zostać obudowany elementem struktury, <elementem poziom="element "> ze wskazaniem nazwy elementu reprezentującego poziomu struktury, którego należy użyć do obudowania tekstu (np. ustep), 5 obniżenia tekstu do poziomu tekstu podstawowego: <element id="ścieżka "> ze ścieżką do elementu, którego zawartość ma zostać obniżona. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 19

Wynik ujednolicania Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 20

Konwerter Word2XML Większość tekstów jest wciąż tworzonych w formatach MS Worda. Muszą zostać skonwertowane do formatu XML-owego: pliki Worda zapisywane w formacie DOCX, proces konwersji zaimplementowany w Javie, oprócz struktury weryfikowane dodatkowe własności tekstu (np. interpunkcja), błędy konwersji prezentowane w postaci komentarzy Worda, dokument wynikowy tworzony na bieżąco, wyrażenia regularne dostępne jako parametr mogą być modyfikowane przez klienta. Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 21

Interfejs konwertera Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 22

Przyszłość Czyli czego nie ma, a co można: prezentacja każdego tekstu w wersji na dany dzień, wyszukiwanie pełnotekstowe (i ew. bardziej zaawansowane), obsługa prac komisji,??? Wykład 14: Studium przypadku: System SET XML i nowoczesne metody zarządzania treścią 23