Organizacja informacji o obiektach cyfrowych z wykorzystaniem standardu metadanych METS. Pliki metadanych zewnętrznych

Podobne dokumenty
Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych

METADANE A PROCES CIĄGŁEJ DIGITALIZACJI OBIEKTÓW BIBLIOTECZNYCH

Publikacje w formacie DjVu. Integracja i wykorzystywanie metadanych w publikacjach DjVu

DInGO: Digitise and Go! Pakiet oprogramowania do kompleksowej obsługi projektów digitalizacyjnych. Tomasz Parkoła

Opis standardów przekazywania obiektów zdigitalizowanych oraz informacji towarzyszących.

Metody przekazywania obiektów cyfrowych do RCBN

Digitalizacja zbiorów Książnicy Cieszyńskiej. Etap drugi

Dzisiejsze organizacje odświeżają typowo swoje zaplecze technologiczne co 3 5 lat. Jednak dokumenty powinny być często przechowywane znacznie dłużej.

Dzisiejsze organizacje odświeżają typowo swoje zaplecze technologiczne co 3 5 lat. Jednak dokumenty powinny być często przechowywane znacznie dłużej.

Jeleniogórska Biblioteka Cyfrowa od kuchni

MINISTERSTWO SPRAW WEWNĘTRZNYCH I ADMINISTRACJI DEPARTAMENT INFORMATYZACJI

Udostępnianie i przechowywanie obiektów cyfrowych w kontekście biblioteki akademickiej

Dlaczego GML? Gdańsk r. Karol Stachura

ZP-P-I Strona 1 z 7

Metadane w Jagiellońskiej Bibliotece Cyfrowej. Piotr Myszkowski

Kartografia multimedialna krótki opis projektu. Paweł J. Kowalski

Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej. Zawartość cyfrowa

Dzisiejsze organizacje odświeżają typowo swoje zaplecze technologiczne co 3 5 lat. Jednak dokumenty powinny być często przechowywane znacznie dłużej.

Biblioteki cyfrowe i ich kolekcje

Filozofia. Jagiellońskiej Biblioteki Cyfrowej. Krystyna Sanetra

Hurtownie danych - przegląd technologii

Dokumenty SEDU składają się z dwóch części: Opisu sprawy Formularza elektronicznego

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

GML w praktyce geodezyjnej

Agnieszka Koszowska, FRSI Remigiusz Lis, ŚBC-BŚ

DIGITALIZACJA. Maciej Rynarzewski Oddział Zbiorów Specjalnych

Zasady Nazewnictwa. Dokumentów XML Strona 1 z 9

MINISTERSTWO SPRAW WEWNĘTRZNYCH I ADMINISTRACJI DEPARTAMENT INFORMATYZACJI

The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych analiza przypadków

Międzynarodowe standardy metadanych opisu muzealiów. Seminarium - Digitalizacja Obiektów Muzealnych - Warszawa

Rola języka XML narzędziem

Opis bibliograficzny katalogowanie właściwości formatu MARC21(NUKAT) dla Wojewódzkiej Biblioteki Publicznej im. Hieronima Łopacińskiego w Lublinie

Język programowania PASCAL

Funkcje i instrukcje języka JavaScript

P.2.1 WSTĘPNA METODA OPISU I

5. Mechanizm szablonów.

Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej

Nic nie zastąpi ciężkiej pracy*

Specyfikacja techniczna procesu wprowadzania zdigitalizowanych obiektów cyfrowych do bazy danych Biblioteki Cyfrowej UMCS - przykłady.

Metadanew archiwach cyfrowych

Przewodnik Użytkownika systemu POL-index. Opis formatu POL-index

KOPAL SYSTEM DŁUGOTERMINOWEJ ARCHIWIZACJI CYFROWEGO DZIEDZICTWA NAUKI I KULTURY. VI Warsztaty Biblioteki Cyfrowe Poznań 2009 r.

Metadane dokumentów w bibliotekach cyfrowych. Marcin Werla, PCSS

ARCHICAD 21 podstawy wykorzystania standardu IFC

1. Pierwszy program. Kompilator ignoruje komentarze; zadaniem komentarza jest bowiem wyjaśnienie programu człowiekowi.

- wewnątrz elementów prostych występuje tylko jeden typ danych, wewnątrz złoŝonych nie moŝemy dokładnie określić liczby wystąpień elementu

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA

Dopuszczalność skanu oferty w postępowaniu o zamówienie publiczne

Federacja Bibliotek Cyfrowych w sieci PIONIER

The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych - analiza przypadków

CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA

The Binder Consulting

Warszawa, dnia 29 maja 2019 r. Poz Rozporządzenie Prezydenta Rzeczypospolitej Polskiej. z dnia 27 maja 2019 r.

XHTML - Extensible Hypertext Markup Language, czyli Rozszerzalny Hipertekstowy Język Oznaczania.

z dnia r. w sprawie bazy danych obiektów topograficznych oraz mapy zasadniczej

System plików przykłady. implementacji

Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego pod redakcją Grzegorza Płoszajskiego

LAB 7. XML EXtensible Markup Language - Rozszerzalny Język Znaczników XSD XML Schema Definition Definicja Schematu XML

Wprowadzenie do XML schema

Czytelnik w bibliotece cyfrowej

Wyroby budowlane wprowadzone do obrotu w świetle obowiązujących przepisów.

Repozytorium Uniwersytetu Jagiellońskiego

ABC języka HTML i XHTML / Maria Sokół. wyd. 2. Gliwice, cop Spis treści

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

Tworzenie metadanych, proces digitalizacji i publikowanie dokumentów w projekcie Merkuriusz. Katarzyna Araszkiewicz

Raportów o Stanie Kultury

Integracja systemu dlibra i Manuscriptorium. Marcin Werla, PCSS

Biblioteka Cyfrowa czy Biblioteka 2.0 czyli co przechowuje biblioteka

Ewidencjonowanie materiałów państwowego zasobu geodezyjnego i kartograficznego

Przykłady pytań do zaliczenia programu wykonywanego w ramach zajęć laboratoryjnych 6-8 z Programowania komponentowego w Javie. Zofia Kruczkiewicz

Wyrażenie include(sciezka_do_pliku) pozwala na załadowanie (wnętrza) pliku do skryptu php. Plik ten może zawierać wszystko, co może się znaleźć w

dlibra platforma do budowy repozytoriów cyfrowych

Generowanie raportów

SUM Edukacja Techniczno Informatyczna Języki i Systemy Programowania. Wykład 2. dr Artur Bartoszewski - WYKŁAD: Języki i Systemy Programowania,

Katalog książek cz. 2

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

Digitalizacja wybranych pozycji księgozbioru w Bibliotece Centralnego Instytutu Ochrony Pracy Państwowego Instytutu Badawczego

XML Schema. Bartłomiej Świercz. Łódź, 19 listopada 2005 roku. Katedra Mikroelektroniki i Technik Informatycznych. Bartłomiej Świercz XML Schema

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

Wykład pt Plik DXF. Jarosław Bydłosz

Zasady budowy i przekazywania komunikatów wykorzystywanych w Systemie IT KDPW_CCP

Systemy plików i zarządzanie pamięcią pomocniczą. Struktura pliku. Koncepcja pliku. Atrybuty pliku

Dodatkowe możliwości RDF. Seminarium magisterskie Paweł Chrząszczewski

Kurs programowania. Wykład 7. Wojciech Macyna. 25 kwietnia 2017

Technologie obiektowe

(Dz. U. z dnia 17 listopada 2006 r.)

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej

System plików przykłady implementacji

Zmiana treści Specyfikacji Istotnych Warunków Zamówienia (SIWZ)

MINISTERSTWO SPRAW WEWNĘTRZNYCH I ADMINISTRACJI DEPARTAMENT INFORMATYZACJI

Systemy identyfikacji obiektów cyfrowych w środowisku sieciowym

Diagram klas UML jest statycznym diagramem, przedstawiającym strukturę aplikacji bądź systemu w paradygmacie programowania obiektowego.

CHARAKTERYSTYKA ZASOBÓW INFORMACYJNYCH

Opracowanie wydawnictw ciągłych w NUKAT a czasopisma w bibliotekach cyfrowych

Sposób prezentacji czasopisma w bibliotece cyfrowej

OPIS PRZEDMIOTU. Dygitalizacja i biblioteki cyfrowe MSIW IN23D-SP. Wydział Administracji i Nauk Społecznych Instytut/Katedra

Programowanie Urządzeń Mobilnych. Laboratorium nr 7, 8

Format danych adnotacji do tytułów wykonawczych przekazywanych do organów egzekucyjnych przez epuap w związku ze zbiegiem egzekucji

Dokument poprawnie sformułowany jest zgodny z ogólnymi zasadami składniowymi:

CREDO koncepcja. dr inż. Grzegorz Płoszajski doc. dr inż. Tomasz Traczyk. Instytut Automatyki i Informatyki Stosowanej Politechnika Warszawska

Transkrypt:

Organizacja informacji o obiektach cyfrowych z wykorzystaniem standardu metadanych METS. Pliki metadanych zewnętrznych Grzegorz Bednarek, GB Soft sp.j. 21/28 listopada 2017

Cechy charakterystyczne schematu METS Schemat metadanych METS : Jest standardem otwartym, Nie jest zastrzeżony, Został opracowany, jest rozwijany oraz dostarczony przez społeczność środowiska bibliotekarzy, Relatywnie prosty, Rozszerzalny, Posiada budowę modułową, Jest schematem wyrażonym za pomocą języka XML.

Podstawowe właściwości plików METS METS został zaprojektowany w celu tworzenia dokumentów XML, które określają : Hierarchiczną strukturę obiektów cyfrowych biblioteki, muzeum lub archiwum, Nazwy i lokalizacje plików, które dotyczą tych obiektów oraz powiązanych z nimi metadanych, Zawartość i sposób wykonania obiektów cyfrowych, Sposób przekazywania do archiwów long-term obiektów cyfrowych pod postacią pakietów transferowych.

Obszary zastosowań plików METS Dzięki plikom metadanych zewnętrznych METS, możliwym jest : wspólne opakowanie kolejnych plików obiektów cyfrowych i powiązanych z nimi metadanych, przekazywanie zasobów cyfrowych pomiędzy repozytoriami o zróżnicowanej wzajemnie organizacji, potwierdzenia przeprowadzenia procesu digitalizacji w taki sposób, który gwarantuje, że obiekt cyfrowy może pełnić rolę kopii - bądź wprost - oryginału obiektu bibliotecznego.

Postać produktu digitalizacji obiektów bibliotecznych i muzealnych Oryginał obiektu %digitalizacja Plik%metadanych zewnętrznych%mets plik skanu plik ALTO wspólne opakowanie kolejnych plików obiektu cyfrowego

Możliwe scenariusze realizacji projektu digitalizacyjnego Oryginał) papierowy Digitalizacja) oryginału Zwrot)oryginału Produkt:) Digital) Surrogate Udostępnianie) kopii)cyfrowej Oryginał) papierowy Digitalizacja) oryginału Upływ)czasu)=) Zwrot)oryginału Zniszczenie) oryginału Produkt:) Digitised) Record Udostępnianie) kopii)cyfrowej,) która)pełni)rolę) oryginału Przykład pochodzi z The National Archives (U.K.) przeprowadzenie procesu digitalizacji w taki sposób, który gwarantuje, że powstały obiekt cyfrowy może pełnić rolę kopii - bądź wprost - oryginału obiektu bibliotecznego

Dane i informacje umożliwiające wykonywanie kolejnych plików METS podczas realizacji projektu digitalizacyjnego Metadane deskryptywne dotyczące zarówno oryginału obiektu jak i jego kopii cyfrowej, inne informacje opisowe dotyczące oryginału obiektu, Informacje dotyczące projektu digitalizacji takie jak nazwy instytucji i/lub dane osób odpowiedzialnych za koordynację działań, wykonanie plików cyfrowych, Zestawienie operacji dotyczących okresu życia obiektu cyfrowego, które zostaną umieszczone w plikach METS (opis obiektów danych, operacji którym je poddano od momentu ich powstania oraz biorących w nich udział agentów).

Obiekt cyfrowy Obiekt)cyfrowy )Grupowy)obiekt) danych)h)(1) )Grupowy)obiekt) danych)h)(2) )Grupowy)obiekt) danych)h)(n) (1) (2) (n) 001.tif 002.tif 024.tif 001.jpg 002.jpg 024.jpg 001.xml 002.xml 024.xml 001.tif 001.jpg 001.xml 002.tif 002.jpg 002.xml 024.tif 024.jpg 024.xml

Elementy wysokiego poziomu plików METS <mets:metshdr> <mets:structlink> <mets:structmap>) )))))))))))))<mets:div> <mets:dmdsec>) Extension)schema Centralny element schematu Jedyny obowiązkowy element schematu Zagnieżdżony (<div>) <mets:filesec>)) ))))))))<mets:filegrp>) ))))))))))))))<mets:file> Różne odmiany, wskazywane atrybutem TYPE=" " )<mets:amdsec>) ))))))<mets:sourcemd>) ))))))<mets:techmd>) ))))))<mets:digiprovmd>) ))))))<mets:rightsmd>) Extension)schema

Kategorie metadanych Metadane strukturalne, Metadane deskryptywne (opisowe), Metadane administracyjno-techniczne : Metadane administracyjne, Metadane techniczne, Metadane konserwatorskie, Metadane praw i uprawnień udostępniania obiektu cyfrowego, Metadane rozpoznanego tekstu obiektu cyfrowego.

Zalecane standardy metadanych (schematy metadanych).

Schematy rozszerzeń (extension schemas) w plikach METS Dla standardu METS, zatwierdzonymi schematami rozszerzeń są : Metadane deskryptywne MARCxml, MODS, DCMES (Dublin Core), Metadane techniczne MIX, textmd, Metadane konserwatorskie PREMIS Data Dictionary. Innymi, a często wykorzystywanymi w plikach METS schematami metadanych są : METSRights, PAIS, ProcessMD, audiomd i videomd.

Budowa pliku METS Plik METS Deklaracje lokalizacji definicji użytych schematów xml (Name Space) Nagłówek informacyjny (Header, <mets:metshdr>) Metadane deskryptywne (Descriptive Metadata Section, <mets:dmdsec>) Metadane administracyjno-techniczne (Administrative Metadata Section, <mets:amdsec> : <mets:sourcemd>, <mets:techmd>, <mets:digiprovmd>, <mets:rightsmd>) Zestawienie plików współtworzących obiekt cyfrowy (File Section, <mets:filesec>) Struktura(y) plików fizyczna, logiczna, obiektu transferowego (Structural Map, <mets:structmap>) Rzadko wykorzystywane sekcje schematu (<mets:structlink> oraz <mets:behaviorsec>) Metadane rozpoznanego tekstu

Wartości elementów pliku xml, kontenery danych Wartość prosta, element schematu <accesscondition lang="pol">domena publiczna</accesscondition> <element atrybut="wartość atrybutu">wartość elementu</element> Wartość złożona, kontener danych Przykład: Kramorz, Stefan. Red. <name type="personal"> <namepart type="family">kramorz</namepart> <namepart type="given">stefan</namepart> <role> <roleterm type="code" lang="pol">red.</roleterm> <roleterm type="code" authority="marcrelator">red</roleterm> <roleterm type="text" authority="marcrelator">redaktor</roleterm> </role> <displayform>stefan Kramorz. Red.</displayForm> </name>

Elementy wysokiego poziomu schematu METS Element główny <mets:mets> tworzy kontener dla przechowywanych metadanych <mets:mets xmlns:mets=" <mets:metshdr> </mets:metshdr> <mets:dmdsec> </mets:dmdsec> <mets:amdsec> <mets:sourcemd> </mets:sourcemd> <mets:techmd> </mets:techmd> <mets:digiprovmd> </mets:digiprovmd> <mets:rightsmd> </mets:rightsmd> </mets:amdsec> <mets:filesec> </mets:filesec> <mets:structmap> </mets:structmap> <mets:structlink> </mets:structlink> </mets:mets>

Określenie warunków i sposobu wykonywania plików METS Postać elementów współtworzących plik METS, określana jest przed rozpoczęciem digitalizacji. Podaje się m.in. : Typy struktur, za pomocą których przedstawione będą obiekty w plikach METS, Formuły w oparciu o które wykonane będą nazwy identyfikatorów obiektów danych i kolejnych sekcji w plikach METS, Informacje o użytych słownikach kontrolowanych, Optymalizacja sekcji metadanych technicznych, Sposób wykonania operacji rozpoznania tekstu podstawowy, z uwzględnieniem układu graficznego, z uwzględnieniem układu graficzno logicznego treści obiektu, Relacje pomiędzy metadanych opisowymi obiektów a nazwami folderów jego obiektów danych.

Sposób wykonania operacji rozpoznania tekstu na stronie obiektu Rozpoznanie uwzględniające graficzny układ stron Rozpoznanie uwzględniające układ graficzno-logiczny stron

Identyfikacja i odwoływanie do elementów schematu METS Aby możliwym było odwołanie do pewnego elementu schematu, element taki musi posiadać unikalny w obrębie całego pliku METS identyfikator zdefiniowany jako ID=" ". <mets:file ID="FID.054189_MF"> <mets:dmdsec ID="DMD.DC"> <mets:dmdsec ID="DMD.MODS.Ch01"> <mets:digiprovmd ID="PMD.0064538_MF"> Odwołanie do sekcji metadanych wyrażonych za pomocą schematów rozszerzeń realizuje się za pomocą atrybutów DMDID=" " lub ADMID=" ". DMDID="DMD.MODS DMD.DC" ADMID="CMD.001257_MF TMD.0054189_MF AMD.0054189_MF" Odwołanie do pliku realizuje się za pomocą wskaźnika file pointer FILEID=" ". <mets:fptr FILEID="FID.0054189_MF"/>

Typowe struktury dokumentu cyfrowego Plakat, widokówka, zdjęcie, plakat teatralny, afisz : physical \ stillimage Książka : physical \ book \ page physical \ book (\ chapter) \ page (\ paragraph) Inkunabuł współoprawny : physical \ volume (\ book) \ page physical \ volume \ book (\ chapter) (\ page) Czasopismo : physical \ issue \ page logical (\ yearbook) \ issue \ article (\ paragraph)

Przykładowe struktury dokumentu cyfrowego <! Fotografia, afisz --> <mets:structmap ID="METS01" TYPE="physical"> <mets:div ID="photography" TYPE="stillImage"> <mets:fptr FILEID="FID.007231_MF"/> <mets:fptr FILEID="FID.007231_RC"/> </mets:div> </mets:structmap> <!-- Czasopismo --> <mets:structmap ID="METS02 TYPE="logical"> <mets:div ID="Periodical" TYPE="issue"> <mets:div ID="TBlock1" TYPE="article"> <mets:div ID="Pg_01" TYPE="paragraph"> <!-- Książka --> <mets:structmap ID="METS01" TYPE="physical"> <mets:div ID="BookPages" TYPE="book"> <mets:div ID="Page_01" TYPE="page"> <mets:fptr FILEID="FID.007231_MF"/> <mets:fptr FILEID="FID.007231_RC"/> <mets:fptr FILEID="FID.007231_RT"/> </mets:div>... </mets:div> </mets:structmap> <mets:ftpr><mets:area FILEID="FID.007231_MF" SHAPE="RECT" COORDS="219,2050,323,2105"/></mets:ftpr> <mets:ftpr><mets:area FILEID="FID.007231_RT" BETYPE="IDREF" BEGIN="BLOK_003"/></mets:ftpr> </mets:div>... </mets:div>... </mets:div> </mets:structmap>

Zachowanie informacji o użytych słownikach kontrolowanych Jakość metadanych authority nazwa/identyfikator użytego słownika kontrolowanego. authorityuri adres użytego słownika kontrolowanego. valueuri identyfikator rekordu z wybraną wartością z tego słownika. Dotyczą metadanych deskryptywnych wyrażonych za pomocą schematu MODS. Są podstawą oceny jakości metadanych zawartych w tej części pliku METS. <languageterm type="text" authority="iso639-2b">polish</languageterm> <languageterm type="code" authority="iso639-2b">pol</languageterm> <frequency lang="eng" authority="marcfrequency">weekly</frequency> <frequency lang="pol" authority="local">tygodnik</frequency> <physicallocation type="current" authority="marcorg">plwabn</physicallocation> <physicallocation type="current" authority="lcsh" valueuri="https://lccn.loc.gov/n80014571" lang="pol"> Biblioteka Narodowa w Warszawie</physicalLocation>

Sposoby dołączania metadanych deskryptywnych Opakowanie dołączonego schematu (wrapping) <mets:dmdsec ID="DMD.MODS"> <mets:mdwrap MDTYPE = "MODS" MIMETYPE = "text/xml"> <mets:xmldata> <mods:mods version="3.6"> </mods:mods> </mets:xmldata> </mets:mdwrap> </mets:dmdsec> Odnosząc się do pliku schematu metadanych poza METS (reference) <mets:dmdsec ID="DMD.MODS"> <mets:mdref MDTYPE = "MODS" /> </mets:dmdsec> LOCTYPE = "URL" xlink:href = "file://books/mdata/mods-000663.xml"

Sposoby dołączania metadanych administracyjnych Opakowanie dołączonego schematu (wrapping) <mets:amdsec> <mets:techmd ID="TMD.053DFB_MF"> <mets:mdwrap MDTYPE = "NISOIMG" MIMETYPE = "text/xml"> <mets:xmldata> <mix:mix> </mix:mix> </mets:xmldata> </mets:mdwrap> </mets:techmd> </mets:amdsec> Odnosząc się do pliku schematu metadanych poza METS (reference) <mets:amdsec> <mets:techmd ID="TMD.053DFB_MF"> < mets:mdref MDTYPE = "NISOIMG" LOCTYPE = "URL" xlink:href = "file://books/mdata/techmd-000663.xml" /> </mets:techmd> </mets:amdsec> Metadane techniczne opisujące plik graficzny (np. *.tif, *.jpg, *.pdf, *.djvu).

Sposoby dołączania metadanych administracyjnych Opakowanie dołączonego schematu (wrapping) <mets:amdsec> <mets:techmd ID="AMD.053DFD_RT"> <mets:mdwrap MIMETYPE="text/xml" MDTYPE="PREMIS:OBJECT"> <mets:xmldata> <premis:premis version="3.0"> </premis:premis> </mets:xmldata> </mets:mdwrap> </mets:techmd> </mets:amdsec> Odnosząc się do pliku schematu metadanych poza METS (reference) <mets:amdsec> <mets:techmd ID="AMD.053DFD_RT"> <mets:mdref MDTYPE="PREMIS:OBJECT" LOCTYPE="URL" xlink:href = "file://books/mdata/altomd-000663.xml" /> </mets:techmd> </mets:amdsec> Metadane opisujące obiekt plikowy.