The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych analiza przypadków



Podobne dokumenty
The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych - analiza przypadków

Metadane w Jagiellońskiej Bibliotece Cyfrowej. Piotr Myszkowski

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

Sposób prezentacji czasopisma w bibliotece cyfrowej

Biblioteki cyfrowe i ich kolekcje

Digitalizacja zbiorów muzycznych analiza od strony użytkownika na podstawie Federacji Bibliotek Cyfrowych (FBC)

Metadane dokumentów w bibliotekach cyfrowych. Marcin Werla, PCSS

Opracowanie wydawnictw ciągłych w NUKAT a czasopisma w bibliotekach cyfrowych

ZP-P-I Strona 1 z 7

OPIS PRZEDMIOTU. Dygitalizacja i biblioteki cyfrowe MSIW IN23D-SP. Wydział Administracji i Nauk Społecznych Instytut/Katedra

Marcin Werla, PCSS

Standaryzacja metadanych w muzealnictwie

Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych

Jeleniogórska Biblioteka Cyfrowa od kuchni

Standardy meta danych w administracji publicznej

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

projekt Zachodniopomorskiego Systemu Informacji i N@ukowej

Jolanta B. Kucharska Maria Miller Małgorzata Wornbard. Biblioteka Główna Politechniki Warszawskiej

Katalog centralny NUKAT 10 lat współkatalogowania

Federacja Bibliotek Cyfrowych w sieci PIONIER

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

Filozofia. Jagiellońskiej Biblioteki Cyfrowej. Krystyna Sanetra

Infrastruktura bibliotek cyfrowych

Linkowanie zwrotne pomiędzy NUKAT i bibliotekami cyfrowymi jako sposób na zwiększenie dostępności i uzupełnienia zasobów cyfrowych czasopism

Gdzieś w bibliotece jeleniogórskiej, 14 grudnia Wirtualna biblioteka e-pogranicze

Marcin Werla, PCSS

Ewa Piotrowska. Projekty biblioteczne realizowane w Bibliotece Głównej Uniwersytetu Pedagogicznego w Krakowie

POROZUMIENIE o współtworzeniu MAZOWIECKIEJ BIBLIOTEKI CYFROWEJ

Opis bibliograficzny katalogowanie właściwości formatu MARC21(NUKAT) dla Wojewódzkiej Biblioteki Publicznej im. Hieronima Łopacińskiego w Lublinie

Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

POROZUMIENIE o współtworzeniu MAZOWIECKIEJ BIBLIOTEKI CYFROWEJ. Preambuła

Specyfikacja techniczna procesu wprowadzania zdigitalizowanych obiektów cyfrowych do bazy danych Biblioteki Cyfrowej UMCS - przykłady.

Kartografia multimedialna krótki opis projektu. Paweł J. Kowalski

Agnieszka Koszowska, FRSI Remigiusz Lis, ŚBC-BŚ

Deutsches Musikarchiv, Gärtnerstr / D Berlin

Program opracowały: Barbara Derewiecka, Halina Szpak Pedagogiczna Biblioteka Wojewódzka w Bielsku-Białej

ZBIERANIE MATERIAŁÓW DO PRACY. Bazy danych

Wpływ rozwoju automatyzacji w bibliotekach na formę i jakość ich działalności informacyjnej

Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe

Realizacja założeń polityki otwartości na Politechnice Krakowskiej.

DOKUMENTY PRAWNE I NORMY W PRACY NAUCZYCIELA BIBLIOTEKARZA

Komentarz technik informacji naukowej 348[03]-01 Czerwiec 2009

Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej. Zawartość cyfrowa

Czy (centralne) katalogi biblioteczne są jeszcze potrzebne? OPAC w infotopii. Dr hab. Marek Nahotko, ISI UJ

Mgr Aniela Piotrowicz Poznań - UM

Wszystko na temat wzoru dokumentu elektronicznego

I Spotkanie pt. Katalogowanie dokumentów ikonograficznych w katalogu NUKAT, Warszawa Katalog NUKAT bieżące informacje

Zintegrowany System Wiedzy oraz Wielofunkcyjne Repozytorium Danych Źródłowych podstawy technologiczne. Marcin Werla, PCSS

GML w praktyce geodezyjnej

Przypisy i bibliografia załącznikowa Cz.1b. Elementy opisu i zalecana kolejność ich występowania w przypisach do drukowanych i elektronicznych

OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU

Biblioteki cyfrowe w środowisku sieciowym

Baza danych BazTech historia, twórcy, zasoby

POLSKIE BIBLIOTEKI CYFROWE 2009

Opis standardów przekazywania obiektów zdigitalizowanych oraz informacji towarzyszących.

CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA

Infrastruktura bibliotek cyfrowych w sieci PIONIER

Baza PEDAGOG narzędziem edukacji informacyjnej w bibliotece

Sieciowe usługi informacyjne dla nauk technicznych BazTech, BazTOL

RAPORT KOORDYNATORA DS. OTWARTEGO DOSTĘPU ZA 2017 R.

Lokalne systemy klasyfikacji zbiorów funkcjonujące w Bibliotece Głównej i bibliotekach specjalistycznych Uniwersytetu Opolskiego

Bibliografia Lubelszczyzny

Raportów o Stanie Kultury

KATALOG KOMPUTEROWY WYSZUKIWANIE

Repozytorium Uniwersytetu Jagiellońskiego

POZYCJONOWANIE ZASOBÓW BIBLIOTEK CYFROWYCH

Zbiory bibliotek cyfrowych dla ucznia i nauczyciela

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA

Trudności i wątpliwości bibliotekarzy uczestniczących. Z doświadczeń nowej biblioteki

Dlaczego musimy nauczać o katalogach bibliotecznych, w świecie idei Web 2.0?

Efektywność wyszukiwania informacji w publicznie dostępnych katalogach bibliotek wykorzystujących polskie programy biblioteczne

Warszawa, dnia 29 maja 2019 r. Poz Rozporządzenie Prezydenta Rzeczypospolitej Polskiej. z dnia 27 maja 2019 r.

Tworzenie układów działowych zbiorów udostępnianych w czytelniach na przykładzie Biblioteki Głównej Uniwersytetu Opolskiego

Oferta edukacyjna Książnicy Karkonoskiej 2017/2018 Szkoły ponadgimnazjalne. Szkoły PONADGIMNAZJALNE

Biblioteka Informator.

Wprowadzenie do tematyki bibliotek cyfrowych

Scenariusz zajęć warsztatowych dla nauczycieli bibliotekarzy

PLAN DZIAŁANIA KT 242. ds. Informacji i Dokumentacji

Jakość i otwartość: # otwarte e-podręczniki akademickie AGH

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Status prawny obiektów cyfrowych w polskich bibliotekach cyfrowych analiza techniczna stanu w roku 2011

Jolanta Szulc Biblioteka Wyższego Śląskiego Seminarium Duchownego w Katowicach

Omówienie normy PN-ISO Informacja i dokumentacja. Przypisy bibliograficzne. Dokumenty elektroniczne i ich części

Sebastian Krzepkowski, Piotr Szefliński Komputerowy katalog kartkowy. Forum Bibliotek Medycznych 1/2, 69-73

Biblioteka Cyfrowa Uniwersytetu Wrocławskiego Narzędzie do wspierania procesów dydaktycznych uczelni oraz promocji miasta i regionu.

Strona tytułowa jest standardowa i dostępna na:

Rozwój bibliotek cyfrowych w Polsce. Cezary Mazurek Tomasz Parkoła Marcin Werla

WYKORZYSTANIE FUNDUSZY UNIJNYCH PRZEZ BIBLIOTEKĘ GŁÓWNĄ AKADEMII MORSKIEJ W SZCZECINIE

Opracowanie książki w formacie MARC 21/ SOWA2

Oddział Opracowania Druków Zwartych

Masowe zabezpieczanie i udostępnianie egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej. Leszek Szafrański Biblioteka Jagiellońska

Merkuriusz Artykuły naukowe w systemie elektronicznych wypożyczeń międzybibliotecznych

01. Rodzaj publikacji artykuł, recenzja, sprawozdanie, wywiad 01.1 Język publikacji Nazwa języka, np. polski 02. Autor/autorzy publikacji

PROGRAM RETROKONWERSJI ZDALNEJ

Europeana Cloud: Wykorzystanie technologii chmurowych do współdzielenia on-line baz danych dziedzictwa kulturowego

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami Technik informacji naukowej 348 [03] Zadanie egzaminacyjne

Zarządzanie zdigitalizowaną biblioteką i systemy kontroli dostępu na przykładzie Wielkopolskiej Biblioteki Cyfrowej

Tworzenie metadanych, proces digitalizacji i publikowanie dokumentów w projekcie Merkuriusz. Katarzyna Araszkiewicz

Transkrypt:

POLSKIE BIBLIOTEKI CYFROWE 2009 str. 71-78 The Dublin Core Metadata Element Set, Ver. 1.1 a potrzeby i oczekiwania bibliotekarzy cyfrowych analiza przypadków JOANNA POTĘGA *, AGNIESZKA WRÓBEL ** * Biblioteka Narodowa j.potęga@bn.org.pl ** Biblioteka Uniwersytecka w Warszawie wrobel.a@uw.edu.pl Streszczenie Celem artykułu jest zaprezentowanie przeprowadzonej przez autorki analizy schematów metadanych stosowanych w polskich bibliotekach cyfrowych (przeszukiwalnych z poziomu Federacji Bibliotek Cyfrowych). Funkcjonujące w polskich bibliotekach cyfrowych schematy opisu publikacji, choć oparte na wspólnym piętnastoelementowym standardzie Dublin Core, często mają indywidualne rozwiązania. Autorki omawiają główne różnice w wypracowanych przez biblioteki cyfrowe schematach oraz w interpretacji poszczególnych elementów Dublin Core, a także wynikające z tego problemy w dotarciu do poszukiwanych przez użytkowników informacji. Uzupełniając obraz metadanych w polskich bibliotekach cyfrowych, w artykule przedstawiono również wyniki ankiety, w której uczestniczyły biblioteki zrzeszone w Federacji Bibliotek Cyfrowych. W ankiecie zapytano o sposoby tworzenia metadanych, zasady regulujące sporządzanie opisów obiektów oraz wykorzystywanie instukcji czy zaleceń. Słowa kluczowe metadane, Dublin Core, biblioteki cyfrowe, dlibra, Federacja Bibliotek Cyfrowych, FBC Wstęp Na pytanie czym są metadane? otrzymamy wiele odpowiedzi. Najbardziej zwięzła, jaką można przytoczyć, brzmi po prostu: dane o danych [4]. Inna, bardziej wyczerpująca, to: dane opisujące kontekst, zawartość i strukturę dokumentów oraz zarządzanie nimi w czasie [2]. W zależności od rodzaju informacji z jakimi mamy do czynienia, wyróżniamy kilka kategorii metadanych: opisowe opisujące obiekt źródłowy, jak i powiązania tego obiektu z innymi obiektami, służą do wyszukiwania zasobów; administracyjno-techniczne ułatwiające zarządzanie obiektami cyfrowymi; strukturalne opisujące strukturę treści odwzorowania cyfrowego, pomagają w przechowywaniu obiektów i ich prezentacji [3]. Innymi pytaniami, jakie możemy sobie zadać, zwłaszcza w kontekście metadanych opisowych, są czy i dlaczego metadane są potrzebne?. Specyfika środowiska sieciowego oraz oczekiwania odbiorców treści zamieszczanych w internecie stawiają liczne wyzwania przed twórcami bibliotek czy repozytoriów cyfrowych. Samo wytworzenie plików, często w postaci plików graficznych, jest dopiero początkiem w procesie pełnego, a co ważniejsze, funkcjonalnego udostępnienia zasobów. Niezbędnym elementem tego procesu jest sporządzenie odpowiedniego opisu obiektu, który

72 The Dublin Core metadata element set, ver. 1.1 a potrzeby i oczekiwania... umożliwi, z jednej strony, dotarcie do poszukiwanych informacji, z drugiej pozwoli na efektywne zarządzanie i obsługę dużego zasobu informacyjnego. Aby metadane były użyteczne, muszą zostać zdefiniowane i uporządkowane w konkretnym układzie, czyli ustandaryzowane. Przykładów takich ustandaryzowanych struktur opisu, które często zostały też znormalizowane i są powszechnie stosowane w tradycyjnej praktyce bibliotek, archiwów i muzeów, jest wiele. W przypadku bibliotek wymienić można, chociażby zestaw polskich norm PN- N-01152 opisu bibliograficznego dla poszczególnych dokumentów, czy format MARC21 służący do zapisu i wymiany danych w bazach katalogowych i bibliograficznych. W przypadku środowiska sieciowego, istnieje szereg rozwiązań umożliwiających opisanie różnego typu obiektów funkcjonujących w Internecie, np.: standard Dublin Core (DC), Encoded Archival Description (EAD), ale na polskim gruncie brak jest unormowań regulujących, czy określających sposoby tworzenia metadanych 1. Innym warunkiem do tego, aby metadane dobrze pełniły swoje funkcje jest ich odpowiednia i jednorodna interpretacja oraz stosowanie. Dzięki temu, dane uporządkowane w ustandaryzowanej strukturze są jednoznaczne i możliwe do wykorzystania w środowisku sieciowym, chociażby do wymiany czy agregacji przez różne oprogramowania lub systemy. Rozwijające się intensywnie w ostatnich latach polskie biblioteki cyfrowe udostępniają obecnie użytkownikom blisko 300 tysięcy obiektów (stan na koniec 2009 roku). Choć, porównując z ilością analogowych zbiorów przechowywanych przez instytucje kultury, stanowią one jedynie niewielki ułamek tych zasobów, to jednak należy zdać sobie sprawę z ogromu informacji już towarzyszącej obiektom cyfrowym. Metadane w polskich bibliotekach cyfrowych, ich jakość, spójność, a zwłaszcza interoperacyjność, nabrały szczególnego znaczenia w momencie pojawienia się Federacji Bibliotek Cyfrowych oraz projektu Europeana. Obydwie inicjatywy główny nurt swojej działalności opierają na agregacji danych z wielu rozproszonych zasobów cyfrowych. Jak w takim sieciowym modelu udostępniania metainformacji wyglądają dane tworzone przez polskie biblioteki cyfrowe? W jakim stopniu rozproszenie inicjatyw i brak na polskim gruncie wspólnych wytycznych dotyczących tworzenia metadanych wpłynęły na ich jakość? Co my, twórcy bibliotek cyfrowych, przez te kilka lat działalności przygotowaliśmy dla naszych użytkowników? Chęć odpowiedzi na te pytania stała się główną przyczyną przyjrzenia się uważniej schematom opisów funkcjonującym w polskich bibliotekach cyfrowych oraz zamieszczanym tam danym. W okresie od września do końca października 2009 roku dokonano analizy metadanych w 40 polskich bibliotekach cyfrowych, które dostępne były w tym czasie poprzez Federację Bibliotek Cyfrowych. W analizie pominięto Polską Bibliotekę Internetową (ze wzglądu na niską jakość danych) oraz planowaną dopiero (choć już uwzględnioną w FBC) Morską Bibliotekę Cyfrową. Niewątpliwie istotnym czynnikiem wpływającym na wybór schematu metadanych jest oprogramowanie wykorzystane do utworzenia biblioteki cyfrowej. Najczęściej używanym systemem (w 37 bibliotekach cyfrowych) była dlibra, a twórcy bibliotek zdecydowali o stosowaniu zaimplementowanego tam schematu Dublin Core. Z własnego oprogramowania korzystały dwie biblioteki: Biblioteka Cyfrowa Politechniki Krakowskiej do opisu obiektów stworzyła własny schemat oraz 1 W 2006 r. ukazała sie norma PN-ISO 15836:2006 Informacja i dokumentacja Zestaw elementów metadanych Dublin Core, w której podano zbiór elementów opisu. Nie zdefiniowano w niej szczegółowych kryteriów, według których zbiór elementów mógłby być używany w poszczególnych projektach i aplikacjach.

J. Potęga, A. Wróbel 73 ICM DIR Zasoby Polskie dane prezentowano w dwóch postaciach: skróconego opisu katalogowego oraz ograniczonego do kilku elementów Dublin Core. Z kolei Akademicka Biblioteka Cyfrowa Kraków do obsługi dokumentów cyfrowych zastosowała system biblioteczny VTLS/Virtua, a do ich opisu format MARC21. Ostatecznie, w analizie skupiono się na bibliotekach używających tego samego systemu dlibra, mając dzięki temu możliwość porównania, jakie było podejście twórców poszczególnych bibliotek cyfrowych do standardu Dublin Core, jego interpretacja i wykorzystanie. Predefiniowany w systemie dlibra zestaw atrybutów zgodny jest ze standardem Dublin Core Metadata Element Set (DCMES) [1] w wersji 1.1 (simple DC). Podstawowe 15 elementów (atrybutów) DCMS: Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights, zostało przetłumaczonych następująco: Tytuł, Autor, Temat i słowa kluczowe, Opis, Wydawca, Współtwórca, Data wydania, Typ zasobu, Format, Identyfikator zasobu, Źródło, Język, Powiązania, Zakres, Prawa 2. Zestaw ten może być dowolnie zmodyfikowany przez administratora systemu w zakresie: zmiany kolejności elementów (atrybutów), nadawania elementom dowolnych (unikalnych) nazw, tworzenia podatrybutów w domyślnych (oferowanych przez oprogramowanie) elementach (ale mających taką samą rolę jak element nadrzędny), tworzenia nowych elementów ze zdefiniowaniem dla nich innej roli niż te przewidziane dla 15 DC (uzyskując tym samym schemat lokalny charakterystyczny dla tej BC). Analiza tworzonych w polskich bibliotekach cyfrowych opisów obiektów wykazała szereg problemów związanych zarówno ze rozumieniem schematu i jego budową, jak i wypełnianiem wartościami poszczególnych elementów w schemacie. Problemy te można ująć w dwie grupy: dotyczącą organizacji metadanych w schemacie, czyli: nazewnictwo elementów Dublin Core, ich interpretacja oraz organizacja danych w elementach, związaną z budową schematu opisu: stosowanie doprecyzowań dla poszczególnych elementów (dodawanie podatrybutów ) oraz zamieszczanie w schemacie nowych elementów, niezdefiniowanych w Dublin Core. 1. Organizacja metadanych 1.1. Nazewnictwo elementów Dublin Core Pierwszą wyraźną różnicą w schematach opisu jest znaczna dowolność w nazewnictwie elementów Dublin Core. Przykładowo, element Creator występuje pod nazwą Autor (35 wystąpień) oraz Twórca (2); dla elementu Type oprócz domyślnego tłumaczenia Typ zasobu (32) zastosowano określenia: Typ dokumentu (2), Typ źródła (1), Rodzaj dokumentu (1), Typ publikacji (1). Tylko trzy atrybuty: Contributor, Language oraz Coverage występują konsekwentnie pod taką samą nazwą we wszystkich bibliotekach cyfrowych, odpowiednio: Współtwórca, Język oraz Zakres. 2 Por. PN-ISO 15836:2006 Informacja i dokumentacja Zestaw elementów metadanych Dublin Core oraz Nahotko, M. [przekład] (2002) Dublin Core Metadata Element Set, Version 1.1: Reference Description [online] http://ebib.oss.wroc.pl/standard/dc.html

74 The Dublin Core metadata element set, ver. 1.1 a potrzeby i oczekiwania... Różnice w nazewnictwie wynikają w znacznej mierze z dowolności tłumaczeń terminów DC. Ponadto nadawanie unikalnych nazw często związane jest z chęcią wskazania przez twórców BC na szczególny rodzaj danych zamieszczanych w atrybucie, np. dla Subject użyto terminów: Temat i słowa kluczowe (31), Słowa kluczowe (2), Hasło przedmiotowe (2), Hasło przedmiotowe KABA (1), Dziedzina (1). 1.2. Interpretacja elementów Dublin Core Kolejną problematyczną sytuacją jest interpretacja znaczenia danego elementu przez poszczególne BC. Często spotyka się wprowadzanie do tego samego atrybutu wartości o całkowicie odmiennym charakterze i to często przy zachowaniu tego samego nazewnictwa. Przykładem może być element Relation Powiązania, w którym w poszczególnych bibliotekach cyfrowych można znaleźć nastepujące wartości: DVD OSD00027, (e-biblioteka Historyczna; 1), Mf. 10406, Joachima Lelewela Bibliograficznych ksiąg dwoje T.1, Tyt. poprz. Annalen der Chemie und Pharmacie, Nasza Przeszłość t.106: 2006, s. 283-293, adligat: sygn.13278-13283; bezpłatny dodatek, Muzeum Narodowe w Raperswilu, Wersja oryginalna. 1.3. Organizacja danych w elemencie Okazuje się, że techniczna możliwość dodawania do elementów doprecyzowań może wpływać również na odmienne podejście w bibliotekach cyfrowych do organizacji danych w samym elemencie. Mamy tu na myśli takie przypadki, kiedy dana wartość informacyjna dzielona jest na mniejsze jednostki, umieszczane w elemencie głównym i jego podatrybutach, a w innej bibliotece cyfrowej wartość tego samego typu funkcjonuje tylko w elemencie głównym (brak doprecyzowań). Przykładem posłuży element Rights Management. Pojawiają się w nim informacje o: właścicielu praw majątkowych, nazwie licencji, rodzaju licencji, a także podawany jest link do treści licencji. I tak: w jednym przypadku informacje podawane są z rozbiciem na podatrybuty: Licencja i Tekst (bądź Treść ), w drugim przypadku bez rozbicia na podatrybuty. 2. Struktura schematu opisu 2.1. Doprecyzowania (podatrybuty) Jak już wcześniej wspomniano, aplikacja dlibra umożliwia administratorowi biblioteki na dodawanie każdemu elementowi dowolnej liczby doprecyzowań podatrybutów, tworząc tym samym hierarchiczny schemat opisu. Wśród 37 analizowanych bibliotekach podatrybuty wprowadzało 24 z nich. Doprecyzowano 10 elementów DC:

J. Potęga, A. Wróbel 75 Publisher w 21 bibliotekach; stosowane podatrybuty: Miejsce wydania (19), Miejsce wydania oraz Drukarz (1), Drukarz (1), Title w 8 bibliotekach; stosowane podatrybuty: Wariant tytułu (2), Inny tytuł (2), Podtytuł (2), Tytuł oryginału (1), Gatunek sceniczny + Miejsce powstania + Data powstania (1), Rights w 7 bibliotekach; stosowane podatrybuty: Licencja + Tekst (bądź Treść ) (2), Prawa (w tym przypadku nazwę elementu głównego tłumaczono Prawa do dysponowania publikacją (1), Digitalizacja + Lokalizacja oryginału (1), Lokalizacja (1), Lokalizacja oryginału (1), Kontakt + Digitalizacja + Sygnatura + Zespół archiwalny + Sygn. (1), Identifier w 6 bibliotekach; stosowane podatrybuty: ISBN + ISSN (2), Identyfikator oryginału (2), Sygnatura oryginału + Identyfikator obiektu cyfrowego (1), Identyfikator oryginału + Identyfikator obiektu cyfrowego (1), Subject w 5 bibliotekach; stosowane podatrybuty: Hasło przedmiotowe (3), Hasło przedmiotowe + Słowa kluczowe (1), Słowa kluczowe użytkowników (1), Description w 3 bibliotekach; stosowane podatrybuty: Wymiary (1), Abstrakt (1), Komentarz (1), Relation w 3 bibliotekach; stosowane podatrybuty: Katalog GAIK (1), OPAC WWW kat. online (1), Seria (1), Date w 2 bibliotekach; stosowane podatrybuty: Data druku (1), Miejsce wydania (1), Contributor w 1 bibliotece; stosowany podatrybut Instytucja sprawcza (1),Source w 1 bibliotece; stosowane podatrybuty: Uwagi + Współoprawny z + Powiązania + Proweniencja + Linki (1). Warto tu nadmienić, że stosowany do wymiany danych protokół OAI-PMH umożliwia przesyłanie informacji z rozbiciem na element główny i jego doprecyzowanie, ale ze względu na brak jednolitości i spójności w hierarchicznym tworzeniu opisów przez biblioteki cyfrowe, nie jest to wykorzystywane. W związku z tym, na platformie FBC oraz w Europeanie podatrybuty pełnią dokładnie taką samą rolę jak element główny, a zamieszczane w nich wartości trafiają do słownika wartości elementu głównego. Często zdarza się, że wartość oderwana od nazwy swojego podatrybutu, a prezentowana w elemencie podstawowym/nadrzędnym traci sens i generuje szum informacyjny. 2.2. Dodatkowe elementy poza Dublin Core (elementy lokalne) W literaturze często powtarza się pogląd, że schemat Dublin Core jest schematem prostym [3, 5]. Jednocześnie istnieje świadomość, że podstawowy zestaw elementów ma charakter ogólny i może być niewystarczający do zaspokojenia potrzeb użytkowników twórców bibliotek cyfrowych [5]. Uwidoczniło się to wśród analizowanego materiału. Wiele bibliotek, chcąc zamieścić różne, często specyficzne informacje, do podstawowych 15 elementów DC dodało własne atrybuty, rozszerzając tym samym swój schemat o elementy lokalne. Przykładowo, niektóre instytucje godzą się pokryć koszty digitalizacji obiektu, w zamian organizatorzy biblioteki cyfrowej zamieszczają informację o tym w opisie publikacji w wyniku stosowania takiego rozwiązania pojawił się dodatkowy element Sponsor digitalizacji. Dane zawarte w dodatkowych atrybutach obecnie znajdują się poza protokołem OAI-PMH i funkcjonują wyłącznie w obrębie biblioteki cyfrowej. W analizowanych bibliotekach wyodrębniono następujące elementy lokalne:

76 The Dublin Core metadata element set, ver. 1.1 a potrzeby i oczekiwania... Tagi (26) i Słowa kluczowe użytkowników (1); Uwagi (5), Adnotacje (1), Informacje techniczne (1), Uwagi archiwistów (1); Lokalizacja oryginału (7); Digitalizacja (6), Reprodukcja cyfrowa (1); Miejsce wydania (6); Sygnatura BCPW (1), Sygnatura archiwalna (1), Identyfikator oryginału (1); OPAC (1), WebOPAC BN (1), Pełny opis katalogowy (1); Wariant tytułu (1), Tytuł w języku angielskim (1); Identyfikator obiektu cyfrowego (2); Numer zespołu archiwalnego (2); Sponsor digitalizacji (2); www (2); Opis fizyczny (1); Seria (1); Wydanie (1); Publikacja (1); Tryb dostępu (1); Nazwa zespołu archiwalnego (1). Specyficznym elementem w tym zestawie jest atrybut Tagi (w jednej bibliotece cyfrowej występujący pod nazwą Słowa kluczowe użytkowników), który, nie będąc zdefiniowany w Dublin Core, jest umieszczony w domyślnym schemacie oprogramowania dlibra 4.0. Analiza schematów opisu opartych na Dublin Core w polskich bibliotekach cyfrowych pokazała znaczną dowolność przy wpisywaniu danych, co z jednej strony pozwala na większą elastyczność i intuicyjność informacji, ale w konsekwencji prowadzi do szumu informacyjnego. Znacznym utrudnieniem w spójności danych jest brak słowników kontrolowanych dla poszczególnych atrybutów (zwłaszcza tych podstawowych: autor, hasła/słowa kluczowe, typ zasobu). Często elementy (przy zachowaniu tego samego ich nazewnictwa) interpretowane są bardzo różnie, co prowadzi do zamieszczania w nich nierównoważnych informacji. Na przykład, w elemencie Powiązania znajdziemy informacje o serii, związkach z innymi tytułami, ale też: sygnatury wersji MF, płyt DVD, linki do opisu w katalogu bibliotecznym, link do innej publikacji. Konsekwencją różnic interpretacyjnych jest zamieszczanie danych tego samego typu w różnych elementach w poszczególnych bibliotekach cyfrowych, np. informacje o sygnaturze oryginału można znaleźć w atrybutach DC: Identyfikator zasobu, Źródło, Powiązania lub poza DC: Identyfikator oryginału, Sygnatura BCPW, Sygnatura oryginalna. Widząc tak znaczną różnorodność w schematach opisu w polskich bibliotekach cyfrowych naturalnymi stały się pytania, w jaki sposób są tworzone metadane, jakimi wskazówkami, zasadami czy wytycznymi kierują się redaktorzy cyfrowi. W związku z tym, w październiku 2009 r. skierowano do 41 bibliotek cyfrowych przeszukiwalnych z poziomu FBC ankietę, której zadaniem było uzyskanie informacji o tym, co może mieć wpływ na jakość metadanych w BC. Uzyskano 29 odpowiedzi, w tym z 27 bibliotek wykorzystujących standard Dublin Core (z oprogramowaniem dlibra). Podstawowymi pytaniami w ankiecie były: czy redaktor samodzielnie tworzy opis dla obiektu, czy też wykorzystywany jest opis katalogowy dokumentu analogowego i dane są importowane z bazy katalogowej (oprogramowanie dlibra umożliwia import metadanych w różnych formatach),

J. Potęga, A. Wróbel 77 w przypadku importu jaki jest format danych wyjściowych oraz czy następuje ingerencja w zaimportowane dane, jakie jest funkcjonowanie instrukcji (zaleceń) do tworzenia metadanych (instrukcji ogólnych oraz szczegółowych, przeznaczonych dla poszczególnych typów obiektów), w przypadku bibliotek konsorcyjnych (partnerskich) czy jest obligatoryjność obowiązywania zaleceń. Tylko w 4 bibliotekach cyfrowych metadane były tworzone wyłącznie na podstawie zaimportowanego opisu bibliograficznego (1 bez ingerencji w opis; 3 z ingerencją), w 11 redaktorzy korzystali z mechanizmu importu danych (z późniejszą ingerencją w dane), ale i też samodzielnie opracowywali opisy (w przypadku braku opisu obiektu analogowego w katalogu komputerowym), a w 14 bibliotekach opisy przygotowywano wyłącznie samodzielne (13 DC; 1 własny schemat). W przypadku importu, podstawowym formatem dla danych wyjściowych jest MARC21. Przy imporcie danych z systemów katalogowych, w zdecydowanej większości opisy uzupełniane są przez informacje dookreślające zasób cyfrowy, czyli: format pliku cyfrowego, typ zasobu (ale tu rozumiany jako typ dokumentu oryginalnego), informacje o własności (także prawnej), tryb dostępu, miejsce przechowywania dokumentu, jednostkę wykonującą digitalizację. Bardzo często poprawiane są dane w elemencie Subject na 13 bibliotek importujących metadane, aż 10 dokonuje zmian. Zalecenia dotyczące tworzenia metadanych opracowało 27 bibliotek cyfrowych, z czego w 15 były to wyłącznie zalecenia ogólne do sporządzania opisu, w 8 wytyczne dotyczyły poszczególnych typów obiektu, a 4 biblioteki miały przygotowane obydwa poziomy zaleceń. W bibliotekach cyfrowych tworzonych przez wielu partnerów (na ankietę odpowiedziało 16 takich bibliotek) w 15 zalecenia były wspólne dla wszystkich partnerów, w jednej każdy z partnerów tworzył własne wytyczne. Wnioski Różnice w schematach opisu obiektów w polskich bibliotekach cyfrowych wynikają przede wszystkim z faktu udostępniania przez BC różnorodnych typów dokumentów: od książek, przez inkunabuły po czasopisma, fotografię, plakaty, do zasobów muzealnych, jak obrazy czy archiwalia. Różnorodność bierze się także ze specyfiki instytucji tworzących czy współtworzących biblioteki cyfrowe, z ich doświadczenia i praktyk opracowania dokumentów. Niemałe znaczenie mają również sposoby tworzenia metadanych przez bibliotekarzy (redaktorów cyfrowych). Z drugiej strony digitalizacja przeprowadzana w tych instytucjach nie różni się bardzo od siebie pod względem technicznym, żywić należy nadzieję, że istnieje możliwość współpracy, wspólnego tworzenia i wykorzystywania standardów, a opisane wyniki analizy pomogą twórcom kolejnych bibliotek cyfrowych w jak najlepszym przygotowaniu metadanych dla udostępnianych obiektów. Piśmiennictwo [1] Dublin Core Metadata Element Set, Version 1.1 [dostęp on line]: http://dublincore.org/documents/dces/ [2] Informacja i dokumentacja - Zarządzanie dokumentami - Część 1: Zasady ogólne PN-ISO 15489-1, Polski Komitet Normalizacyjny, Warszawa, 2006.

78 The Dublin Core metadata element set, ver. 1.1 a potrzeby i oczekiwania... [3] G. Płoszajski, Grzegorz red., Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego, Biblioteka Główna Politechniki Warszawskiej, Warszawa, 2008. [dostęp on line: http://bcpw.bg.pw.edu.pl/publication/1113] [4] M. Nahotko, Metadane. Sposób na uporządkowanie intrenetu, Wydawnictwo Uniwersytetu Jagiellońskiego, Kraków, 2004 [5] M. Nahotko, Metadane dla czasopism elektronicznych, EBIB 1(19) 200.