Algorytmy generowania cyfrowych wtórników dokumentów bibliotecznych i ich wersji prezentacyjnych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Algorytmy generowania cyfrowych wtórników dokumentów bibliotecznych i ich wersji prezentacyjnych"

Transkrypt

1 Uniwersytet Warszawski Wydział Historyczny Aleksander Trembowiecki Nr albumu: 4504 Algorytmy generowania cyfrowych wtórników dokumentów bibliotecznych i ich wersji prezentacyjnych Analiza i ocena zastosowania praktycznego w polskich bibliotekach Praca magisterska na kierunku informacja naukowa i bibliotekoznawstwo Praca wykonana pod kierunkiem prof. dr hab. Barbary Sosińskiej-Kalaty Instytut Informacji Naukowej i Studiów Bibliologicznych Warszawa, maj 0

2

3 Oświadczenie kierującego pracą Oświadczam, że niniejsza praca została przygotowana pod moim kierunkiem i stwierdzam, że spełnia ona warunki do przedstawienia jej w postępowaniu o nadanie tytułu zawodowego. Data Podpis kierującego pracą Oświadczenie autora (autorów) pracy Świadom odpowiedzialności prawnej oświadczam, że niniejsza praca dyplomowa została napisana przez mnie samodzielnie i nie zawiera treści uzyskanych w sposób niezgodny z obowiązującymi przepisami. Oświadczam również, że przedstawiona praca nie była wcześniej przedmiotem procedur związanych z uzyskaniem tytułu zawodowego w wyższej uczelni. Oświadczam ponadto, że niniejsza wersja pracy jest identyczna z załączoną wersją elektroniczną. Data Podpis autora pracy

4

5 Streszczenie Przedmiotem pracy są wymagania i postulaty jakościowe stawiane polskiej digitalizacji sensu stricto. Przedstawiony został model minimalnych wymagań jakościowych zdefiniowany przez prawodawstwo (Rozporządzenie Rady Ministrów w sprawie minimalnych wymagań dla systemów teleinformatycznych) i najistotniejsze krajowe publikacje dotyczące digitalizacji. Postulowany model następnie porównano z faktycznym stanem jakości generowanych obiektów cyfrowych, którego obraz otrzymano na podstawie wyników badania ankietowego, któremu poddano wszystkie polskie biblioteki tworzące lub współtworzące biblioteki cyfrowe. W wyniku porównania stwierdzono, że w Polsce dominuje digitalizacja oparta na ujednoliconych parametrach niezależnie od typu dokumentów. Oprócz kwestii parametrów stosowanych w digitalizacji, w pracy poruszono także problematykę postępowania z plikami archiwalnymi, generowania formatów o charakterze prezentacyjnym, a także rolę metadanych i perspektywy dalszego rozwoju digitalizacji w Polsce. Słowa kluczowe digitalizacja, obiekt cyfrowy, dokument elektroniczny, dokumenty biblioteczne, format zapisu, biblioteka cyfrowa, Polska Dziedzina pracy (kody wg programu Socrates-Erasmus) 5400 bibliotekoznawstwo Tytuł pracy w języku angielskim: The algorithms for generating the digital duplicates of library documents and creating their presentation versions. Analysis and assessment of practical aplications in Polish libraries.

6

7 Spis treści Wstęp.... Digitalizacja sensu stricto w świetle obowiązującego prawa i oficjalnych zaleceń Digitalizacja zakres i pisownia terminu Zarys rozwoju digitalizacji w Polsce Digitalizacja sensu stricto w kontekście polskiego prawa Ustawy Rozporządzenia Digitalizacja krajowe zalecenia i dobre praktyki Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych Digitalizacja piśmiennictwa Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego Metodologia Próba badawcza Narzędzia badawcze Schemat ankiety Zaplecze sprzętowo-programowe badania Analiza wyników badania Wyniki badania Model digitalizacji Proszę wskazać stosowany w bibliotece model digitalizacji Przyczyna zdecydowania się na częściowy outsourcing Szacunkowy procent skanów zleconych na zewnątrz w stosunku do wykonywanych samodzielnie Parametry digitalizacji W jaki sposób ustalono parametry skanowania i format zapisu plików archiwalnych dla poszczególnych typów dokumentów? Jak ustalana jest rozdzielczość skanowania? Typy digitalizowanych dokumentów książki Książki czarno-biała treść Książki monochromatyczne Książki zawierające czarno-białe ilustracje Książki zawierające ilustracje w odcieniach szarości Książki zawierające kolorowe ilustracje Typy digitalizowanych dokumentów gazety... 96

8 3.4.. Gazety czarno-biała treść Gazety monochromatyczne Gazety zawierające czarno-białe ilustracje Gazety zawierające ilustracje w odcieniach szarości Gazety zawierające kolorowe ilustracje Typy digitalizowanych dokumentów czasopisma Czasopisma czarno-biała treść Czasopisma monochromatyczne Czasopisma zawierające czarno-białe ilustracje Czasopisma zawierające ilustracje w odcieniach szarości Czasopisma zawierające kolorowe ilustracje Typy digitalizowanych dokumentów rękopisy Rękopisy wyraźny kontrast Rękopisy niewyraźny kontrast Typy digitalizowanych dokumentów inkunabuły Typy digitalizowanych dokumentów stare druki Typy digitalizowanych dokumentów grafiki Grafiki czarno-białe Grafiki monochromatyczne Grafiki w odcieniach szarości Grafiki kolorowe Typy digitalizowanych dokumentów grafiki wielkoformatowe Grafiki wielkoformatowe czarno-białe Grafiki wielkoformatowe monochromatyczne Grafiki wielkoformatowe w odcieniach szarości Grafiki wielkoformatowe kolorowe Typy digitalizowanych dokumentów mapy Mapy czarno-białe z wyraźnym kontrastem Mapy czarno-białe z niewyraźnym kontrastem Mapy monochromatyczne Mapy w odcieniach szarości Mapy kolorowe Typy digitalizowanych dokumentów mapy wielkoformatowe Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem Mapy wielkoformatowe monochromatyczne Mapy wielkoformatowe w odcieniach szarości Mapy wielkoformatowe kolorowe... 4

9 3.3. Typy digitalizowanych dokumentów odbitki fotograficzne Odbitki fotograficzne monochromatyczne Odbitki fotograficzne w odcieniach szarości Odbitki fotograficzne kolorowe Typy digitalizowanych dokumentów negatywy, przezrocza Negatywy, przezrocza monochromatyczne Negatywy, przezrocza w odcieniach szarości Negatywy, przezrocza kolorowe Typy digitalizowanych dokumentów mikroformy Mikrofilmy Mikrofisze Typy digitalizowanych dokumentów prace licencjackie, magisterskie i doktorskie Prace licencjackie, magisterskie i doktorskie czarno-biała treść Prace licencjackie, magisterskie i doktorskie zawierające czarno-białe elementy graficzne Prace licencjackie, magisterskie i doktorskie zawierające elementy graficzne w odcieniach szarości Prace licencjackie, magisterskie i doktorskie zawierające kolorowe elementy graficzne Typy digitalizowanych dokumentów dokumenty urzędowe Dokumenty urzędowe czarno-biała treść Dokumenty urzędowe zawierające czarno-białe elementy graficzne Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości Dokumenty urzędowe zawierające kolorowe elementy graficzne Typy digitalizowanych dokumentów maszynopisy Maszynopisy wyraźny kontrast Maszynopisy niewyraźny kontrast Typy digitalizowanych dokumentów nuty Nuty wyraźny kontrast Nuty niewyraźny kontrast Typy digitalizowanych dokumentów rysunki techniczne Rysunki techniczne wyraźny kontrast Rysunki techniczne niewyraźny kontrast Typy digitalizowanych dokumentów inne, niż wskazane wcześniej Pliki archiwalne Jak postępują Państwo z plikami uzyskanymi w trakcie skanowania / fotografowania?... 7

10 3... Proszę wybrać stosowaną politykę długotrwałego przechowywania plików Proszę wskazać stosowane typy nośników, na których docelowo przechowywane są pliki Korekta plików archiwalnych Sposób postepowania ze skorygowanymi kopiami Sposób przeprowadzania korekty Czynności wykonywane w trakcie korekty Oprogramowanie stosowane do korekty skanów Pliki prezentacyjne DjVu PDF JPEG PNG Głęboka digitalizacja Metadane Proszę wskazać sposób wypełniania metadanych EXIF Czy korzystają Państwo z jednego (lub wielu) standardu metadanych administracyjnych, technicznych lub strukturalnych przy tworzeniu i zarządzaniu cyfrowymi obiektami (nie dotyczy EXIF)? Zestawienie otrzymanych wyników z zaleceniami Uwagi końcowe...47 Zakończenie Załącznik Załącznik... 9 Bibliografia Spis tabel... 40

11 Wstęp Może się wydawać, że o digitalizacji napisano już wszystko. Z ciekawostki promowanej głównie przez pasjonatów ewoluowała w Polsce do rozmiarów imponującego swoim zasięgiem zjawiska. Zjawiska, które doczekało się wielu publikacji, konferencji, stron internetowych i z którym od kilku lat związane są wielkie nakłady finansowe, w tym dedykowane programy ministerialne. Bardzo wnikliwie opisane zostały wszystkie najważniejsze aspekty digitalizacji od kwestii czysto organizacyjnych, poprzez techniczne (dotyczące zaplecza sprzętowoprogramowego), aż do społecznych skutków digitalizacji jako zjawiska definiującego nową jakość kontaktu użytkowników z cyfrowym medium (na długo przed pojawieniem zdobywających coraz większą popularność e-booków) oraz z drugiej strony generującego nowe minispołeczności skupiające miłośników elektronicznych publikacji. Gdyby spojrzeć z szerszej perspektywy na krajową digitalizację jako na pewien system, wszystko wydaje się tworzyć spójną, rozrastającą się dynamicznie całość. Czy jednak rzeczywiście tak jest? Niniejsza praca ma na celu rzucenie światła na pewną bardzo istotną lukę w tym systemie, a następnie dostarczenie danych, które być może przyczynią się w przyszłości do jej istotnego zredukowania. Luką tą jest brak jednolitej polityki wytwarzania wysokiej jakości obiektów cyfrowych zarówno w odniesieniu do duplikatów wzorca (czyli tzw. masterów), jak i wersji docelowych prezentacyjnych. Przy czym nie jest tak, że ten problem nie został wcześniej przez nikogo dostrzeżony. Owszem, dostrzeżony został, ale po pierwsze dość późno (w kraju funkcjonowało już kilkadziesiąt bibliotek cyfrowych), a po drugie próba zmierzenia się z nim była w najlepszym wypadku niewystarczająca. Za taką próbę niewątpliwie należy uznać ukazanie się w 008 r. publikacji Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego pod red. G. Płoszajskiego (opisanej szerzej w punkcie.4.3 pierwszego rozdziału niniejszej pracy), która przedstawiła zalecenia odnośnie do generowanych masterów, z podziałem na poszczególne grupy dokumentów prymarnych. Mimo swych niezaprzeczalnych walorów, wydawnictwo to ma też fundamentalną wadę niemal całkowicie pomija kwestię formatów prezentacyjnych. Problematyka odpowiedniego wygenerowania wersji prezentacyjnych właściwych dla danego typu dokumentu jest szalenie istotna z przynajmniej dwóch względów. Po pierwsze bezpośrednio wpływa na jakość obcowania użytkownika końcowego z dokumentem cyfrowym. Misją bibliotek jest szerzenie czytelnictwa, niezależnie od

12 tego, czy dotyczy książek tradycyjnych czy elektronicznych. Zapewnienie optymalnej jakości książki w wersji cyfrowej sprawi, że czytelnik nie zrazi się do nowego medium, a być może wręcz doceni możliwości, jakie niesie ze sobą nowa technologia. Po drugie poprawne wygenerowanie wersji prezentacyjnych (dotyczy to formatów hybrydowych, czyli PDF i DjVu) jest niejednokrotnie co najmniej tak samo czasochłonne i kosztowne jak proces skanowania i późniejszej obróbki masterów. Niewłaściwe przeprowadzenie konwersji może skutecznie zniweczyć ogromnie ważny dla bibliotek cel digitalizacji, czyli stworzenie namiastki obcowania z papierowym oryginałem. Przyczyn takiego niefrasobliwego podejścia do prezentacyjnego aspektu digitalizacji można upatrywać w pewnej niestabilności wśród formatów udostępnianych on-line. W przeciwieństwie do formatu TIFF, który od samego początku niezmiennie królował jako podstawowy format archiwalny, popularność konkretnych formatów prezentacyjnych (i ich kolejnych wersji, które znacznie różniły się między sobą funkcjonalnością) zmieniała się z biegiem czasu. Siłą rzeczy kwestia sposobu prezentacji obiektów cyfrowych zaczęła być więc traktowana przez specjalistów jako tymczasowa, a tym samym mniej istotna. Teoretycznie w każdej chwili można na podstawie bazowych masterów wygenerować dowolny format prezentacyjny, więc nadmierne skupianie się na ich umiejętnym tworzeniu pozornie nie ma większego sensu. Rozumowanie takie z praktycznego punktu widzenia jest błędne. Digitalizacja to zjawisko, które ciągle postępuje naprzód i nie lubi się oglądać za siebie. Wciąż setki tysięcy dokumentów czekają na zeskanowanie i po prostu nie ma kiedy wracać do tych zdigitalizowanych wcześniej. W praktyce nawet dokumenty zapisane we wczesnej wersji formatu DjVu, która jeszcze nie umożliwiała integrowania warstwy OCR, w wielu przypadkach najprawdopodobniej nigdy się tej warstwy nie doczekają. Jako argument przeciwko tworzeniu standardów dla udostępniania obiektów cyfrowych w oparciu o formaty prezentacyjne można wskazać ich relatywnie dużą różnorodność i dynamikę rozwoju, podczas gdy standardy powinny cechować się względną stabilnością. Należy jednakże mieć na uwadze, że przecież w świecie IT nie istnieją rozwiązania permanentne. Celowo wcześniej pisząc o królowaniu formatu TIFF użyto czasu przeszłego na świecie podejmowane są już pierwsze (lecz znaczące) próby zastępowania go formatem JPEG 000. Punktem wyjścia dla badań przedstawionych w niniejszej pracy była więc chęć sprawdzenia, jakie formaty prezentacyjne są obecnie generowane w polskich bibliotekach. Wiązała się z tym ściśle kwestia gotowości aktualnie posiadanych

13 masterów do ewentualnej konwersji należało więc dodatkowo zbadać, na jakich archiwalnych formatach biblioteki opierają swoje repozytoria. Parametry tych masterów z kolei determinowały jakość, jaką można otrzymać po konwersji w potencjalnych wersjach prezentacyjnych. Ostatnim elementem dopełniającym obraz całości była ogólna polityka postępowania z masterami, która bezpośrednio decyduje o możności późniejszego wygenerowania wersji prezentacyjnych. Posiadając już wstępne założenia, należało w pierwszej kolejności sprawdzić, jak problematyka wyboru konkretnych formatów zapisu (i ich parametrów) uregulowana jest w polskim ustawodawstwie i literaturze. Rozważaniom tym poświęcony jest rozdział pierwszy, który ma na celu ustalenie ram dla dalszych badań. Co prawda polskie prawo regulowało w niewielkim stopniu zakres możliwych do wykorzystania formatów, ale w momencie pisania niniejszej pracy odpowiednie rozporządzenie zostało już uchylone, a nowe wciąż nie wykroczyło poza fazę projektu. Tym samym jedynym źródłem, na którym zdecydowano się bazować w dalszej części pracy, były wspomniane Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego. W rozdziale drugim przedstawiono metodologię badania, któremu poddano wszystkie polskie biblioteki tworzące lub współtworzące biblioteki cyfrowe. Szczegółowo opisano wszystkie przygotowania, użyte narzędzia, sam proces przeprowadzenia badania oraz analizy i selekcji otrzymanych danych. Rozdział trzeci zawiera uporządkowane wyniki badania wraz z ich oceną i komentarzem, tzn. informacje dotyczące wykorzystywanych formatów archiwalnych (i ich parametrów) z podziałem na typy dokumentów, sposobów postępowania z masterami, rodzaje generowanych formatów prezentacyjnych, a także dodatkowe kwestie dotyczące m.in. stosowania głębokiej digitalizacji i metadanych. Na końcu rozdziału dokonano konfrontacji zaleceń znajdujących się w Standardach ( ) z faktycznymi parametrami masterów najczęściej stosowanymi przez polskie biblioteki. Ten bezprecedensowy zabieg miał na celu ukazanie faktycznego obrazu obecnej digitalizacji w odniesieniu do wymogów, jakie są jej stawiane przez ekspertów. Omawiana konfrontacja obnażyła słabe i mocne strony bibliotecznej digitalizacji, co może posłużyć jako punkt wyjściowy do działań na rzecz jej jakościowego zbliżenia do krajowych zaleceń i w dalszej perspektywie do światowych standardów. 3

14

15 . Digitalizacja sensu stricto w świetle obowiązującego prawa i oficjalnych zaleceń.. Digitalizacja zakres i pisownia terminu Idea procesu digitalizacji zdobywająca na świecie popularność już od lat osiemdziesiątych XX wieku w polskiej praktyce bibliotecznej zaistniała z dziesięcioletnim opóźnieniem, by na trwałe zapisać się w świadomości pracowników instytucji kultury na początku XXI wieku, w związku głośną z premierą Polskiej Biblioteki Internetowej oraz mniej nagłośnioną, ale zdecydowanie bardziej znaczącą dla rozwoju krajowej digitalizacji Wielkopolskiej Biblioteki Cyfrowej. Sformułowanie pracownicy instytucji kultury padło tu celowo, ponieważ społeczna świadomość istoty digitalizacji jest wciąż znikoma. Zakres pojęcia digitalizacja do dzisiaj budzi kontrowersje nawet wśród specjalistów i wraz z upowszechnianiem digitalizacji wśród instytucji kultury ma tendencje do rozszerzania się. Pierwsze definicje były dość ubogie np. według Encyklopedii PWN z 999 r. digitalizacja (cyfryzacja) to zmiana postaci sygnału ( ) z analogowej na cyfrową; przeprowadzana w procesie przetworzenia analogowocyfrowego 3. W książce Digitalizacja zbiorów bibliotecznych: teoria i praktyka autor tak ujęty proces określił mianem digitalizacji sensu stricto, która jest tylko elementem składowym digitalizacji sensu largo, uwzględniającej również obróbkę cyfrowych wtórników i tworzenie na ich podstawie dokumentów prezentacyjnych, a następnie ich udostępnianie 4. Publikacja Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego 5 z 008 r. wzbogaciła definicję o konieczność uwzględnienia opisu informacyjnego (metadanych) i aspekt długotrwałego utrzymania repozytorium cyfrowych wtórników. Z kolei w chronologicznie najmłodszej publikacji Digitalizacja piśmiennictwa 6, która ukazała się w listopadzie 00 r., charakterystyka digitalizacji Historia projektu. [W:] Polska Biblioteka Internetowa [on-line]. Tryb dostępu: [dostęp:.0.00 r.]. Informacje na temat projektu. [W:] Wielkopolska Biblioteka Cyfrowa [on-line]. Tryb dostępu: [dostęp:.0.00 r.]. 3 Cyfryzacja (digitalizacja). [W:] Encyklopedia PWN w trzech tomach. T.. Pod. red. A. Dyczkowskiego. Warszawa: Wydawnictwo Naukowe PWN, A. Trembowiecki: Digitalizacja zbiorów bibliotecznych : teoria i praktyka. Warszawa: Centrum Edukacji Bibliotekarskiej, Informacyjnej i Dokumentacyjnej, 006, s Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego. Pod red. G. Płoszajskiego [on-line]. Warszawa: Biblioteka Główna Politechniki Warszawskiej, 008, s.. Tryb dostępu: [dostęp: r.]. 6 Digitalizacja piśmiennictwa. Pod red. D. Paradowskiego. Warszawa: Biblioteka Narodowa, 00. 5

16 została rozbudowana o etap przygotowawczy planowanie, selekcję dokumentów, stworzenie zaplecza kadrowego, lokalowego, sprzętowego i programowego, a także transport dokumentów oryginalnych. Kłopotów przysporzyło nie tylko wyznaczenie zakresu digitalizacji, lecz także grafia terminu. W połowie pierwszego dziesięciolecia tego wieku toczył się spór między zwolennikami pisowni digitalizacja i dygitalizacja 7. Druga forma, chociaż jest bardziej poprawna z punktu widzenia zasad języka polskiego, w piśmiennictwie i praktyce używana jest zdecydowanie rzadziej. Spór nie doczekał się jednoznacznego rozstrzygnięcia, lecz za używaniem formy mniej poprawnej przemawiają między innymi: brak nowych publikacji używających formy dygitalizacja, popularność formy digitalizacja w Internecie, który jest źródłem wiedzy i platformą wymiany doświadczeń dla praktyków. Ponadto Google, który jest najpopularniejszą internetową wyszukiwarką, po użyciu w kwerendzie formy dygitalizacja podpowiada, że być może chodziło o digitalizację, funkcja Centrum Kompetencji w zakresie digitalizacji materiałów bibliotecznych, którą pełni Biblioteka Narodowa i która na tej podstawie przygotowała wspomniany wcześniej oficjalny podręcznik zatytułowany Digitalizacja piśmiennictwa. Ponadto językoznawcy nie negują już digitalizacji tak gwałtownie jak kilka lat temu i traktują ją jako oficjalny synonim formy zalecanej. Z powyższych względów w niniejszej pracy używana będzie forma mniej poprawna, lecz bardziej popularna i obecnie powszechnie używana także w bibliotekoznawstwie... Zarys rozwoju digitalizacji w Polsce W poprzednim punkcie wspomniano o premierach dwóch bibliotek cyfrowych jako cezurze upowszechniania się digitalizacji w Polsce. Każda z nich była równie istotna, lecz z perspektywy czasu ich doniosłość istotnie się różni. Uruchomienie Polskiej Biblioteki Internetowej grudnia 00 r. wiązało się z głośną kampanią medialną, ponieważ za funkcjonowanie PBI odpowiedzialne było Ministerstwo Spraw Wewnętrznych i Administracji, a finansowana była bezpośrednio z funduszy Skarbu Państwa. Promowano ją jako efekt działalności państwa na rzecz 7 M. Kowalska: Dygitalizacja zbiorów bibliotek polskich. Warszawa: Wydawnictwo SBP, 007, s

17 uczynienia wielkiego kroku naprzód w rozwoju polskiego społeczeństwa informacyjnego. Pomijając wszelkie kontrowersje, które powstały w związku z późniejszym funkcjonowaniem (i ostatecznie upadkiem projektu), PBI odegrała bardzo ważną rolę ideową. Obudziła społeczną świadomość możliwości korzystania ze źródeł informacji na całkiem nowym poziomie. Użytkownik preferujący Internet jako źródło wiedzy ponad tradycyjne dokumenty drukowane, mógł od tej pory przynajmniej teoretycznie mieć wgląd do elektronicznych wersji publikacji, po które wcześniej musiał się udać do biblioteki lub księgarni. Pojawienie się PBI nie sprawiło, że w polskim społeczeństwie dokonała się zmiana mentalności, było za to impulsem dla instytucji kultury (a w szczególności dla bibliotek) do zainteresowania się prawdopodobnie z uwagi na obawę przed spadkiem czytelnictwa w obliczu rozwoju nowych technologii wzbogaceniem usług o dostęp do tworzonych przez siebie pełnotekstowych baz danych. Przykład PBI bardziej jednak w tym przypadku odstraszał niż zachęcał do samodzielnych prób, ponieważ w ogólnej opinii digitalizacja, w wyniku której powstawały między innymi repozytoria PBI, była szalenie kosztowna 8. Premiera Wielkopolskiej Biblioteki Cyfrowej, która miała miejsce października 00 r., nie była nagłośniona i stanowiła bardziej wydarzenie branżowe niż medialne. Poznańskie Centrum Superkomputerowo-Sieciowe twórcy pionierskiej platformy dlibra 9, na której opiera się WBC zamiast inwestować w ogólnopolską reklamę swojego produktu skupili się na bardzo aktywnym uczestniczeniu w większości wtedy organizowanych konferencji, seminariów i sympozjów dla bibliotek i archiwów. Na przykładzie WBC demonstrowali możliwości, jakie stwarza dlibra i zachęcali do jej testowania. Należy dodać, że początkowo platforma PCSS była produktem darmowym, co tym bardziej zwiększyło jej popularność. Wraz z upowszechnieniem wiedzy o funkcjonowaniu i faktycznych kosztach stworzenia i utrzymania własnej biblioteki cyfrowej, popularność dlibry wśród instytucji kultury gwałtownie rosła, by niemal całkowicie obecnie zdominować polski rynek platform do obsługi bibliotek cyfrowych. Efektem ubocznym tego zjawiska było 8 PBI. Niestety to znowu o pieniądzach: krytyka wydatków na Polską Bibliotekę Internetową. [W:] 7thGuard.net [on-line]. Tryb dostępu: [dostęp: r.]. 9 Witaj na stronie projektu dlibra! [W:] dlibra [on-line]. Tryb dostępu: [dostęp: r.]. 7

18 oddolne powstanie ogólnokrajowej sieci bibliotek cyfrowych 0 realizowane przez multiwyszukiwanie za pomocą wbudowanego w dlibrę protokołu OAI-PMH. W rezultacie obecnie funkcjonują w Polsce 6 biblioteki cyfrowe, z czego około 90% pracuje na platformie dlibra. Można więc w przypadku infrastruktury programowej mówić o pewnym ujednoliceniu interfejsu bibliotek cyfrowych w kraju. Sytuacja ta dotyczy również metadanych opisowych, ponieważ dlibra niejako narzuca format Dublin Core. Na tym jednak ujednolicenie w sposobie funkcjonowania bibliotek cyfrowych i digitalizacji w zasadzie się kończy. Różnice rozpoczynają się już w momencie interpretacji pól wspomnianego formatu Dublin Core 3 i dotyczą praktycznie całego procesu szeroko rozumianej digitalizacji. W celu wpisania polskiej digitalizacji w ramy wewnętrznie spójnego systemu, Minister Kultury i Dziedzictwa Narodowego na podstawie założeń Programu digitalizacji dóbr kultury oraz gromadzenia, przechowywania i udostępniania obiektów cyfrowych w Polsce , powołał w dniu 9 października 009 r. cztery centra kompetencji: Biblioteka Narodowa w zakresie digitalizacji materiałów bibliotecznych, Narodowe Archiwum Cyfrowe w zakresie digitalizacji materiałów archiwalnych, Krajowy Ośrodek Badań i Dokumentacji Zabytków w zakresie digitalizacji zabytków i muzealiów, Narodowy Instytut Audiowizualny w zakresie digitalizacji materiałów audiowizualnych. Mają one być instytucjami wiodącymi w danym obszarze, stanowiąc wzór dla innych instytucji oraz prowadząc szkolenia z zakresu digitalizacji dziedzictwa kulturowego 4. Z uwagi na zakres niniejszej pracy, w jej dalszej części rozważania skupią się na działaniach Biblioteki Narodowej. Przez pierwszy rok funkcjonowania J. Franke: Digitalizacja dokumentów piśmienniczych strategie rozwoju. [W:] Cyfrowy świat dokumentu: wydawnictwa, biblioteki, muzea, archiwa. Pod red. H. Hollendra. Warszawa: Centrum Promocji Informatyki Sp. z o.o., 0, s Stan na dzień 6 lutego 0 r. Zestawienie polskich bibliotek cyfrowych. [W:] Federacja Bibliotek Cyfrowych [on-line]. Tryb dostępu: [dostęp: r.]. L. Defert-Wolf: Jak posługiwać się biblioteką cyfrową? [W:] Cyfrowy, op. cit., s Biblioteka Narodowa Centrum Kompetencji. [W:] Biblioteka Narodowa [on-line]. Tryb dostępu: [dostęp: r.]. 8

19 jako Centrum Kompetencji, BN zorganizowała między innymi seminarium dotyczące kwestii prawno-autorskich związanych z digitalizacją i opublikowała wspomniany w poprzednim punkcie poradnik Digitalizacja piśmiennictwa. Kolejnym krokiem w kierunku uporządkowania digitalizacji w Polsce jest ogłoszony przez MSWiA w dniu 7 lutego 0 r. Wieloletni Program Rządowy KULTURA+ 5, którego jednym z priorytetów jest digitalizacja. Głównym celem tego priorytetu jest umożliwienie dostępu do cyfrowych zasobów polskiego dziedzictwa kulturowego za pośrednictwem Internetu dla mieszkańców Polski, zwłaszcza wsi i małych miast. 6. Pomijając szereg nieścisłości w treści samego programu, niepokoić może szczególnie zapis, że w pierwszej kolejności nacisk zostanie położony na specjalistyczne wyposażenie pracowni w Centrach Kompetencji 7, co biorąc pod uwagę zaangażowanie Narodowego Instytutu Audiowizualnego (będącego przecież jednym z Centrów) w merytoryczne przygotowanie programu budzić może uzasadniony niesmak najbardziej zainteresowanych, czyli państwowych instytucji kultury niższego szczebla. Jeszcze więcej zastrzeżeń rodzi regulamin składania wniosków o dofinansowanie z Priorytetu Digitalizacja 8. Zgodnie z pkt 7 działu IX. Zobowiązania wnioskodawcy biblioteka, która otrzyma dofinansowanie z programu KULTURA+, obowiązana będzie przynajmniej 85% plików wygenerowanych dzięki temu dofinansowaniu udostępnić w Cyfrowej Bibliotece Narodowej Polona lub w innym portalu wskazanym przez Bibliotekę Narodową 9. Zamiast systematyzować polską digitalizację, MSWiA zmierza do jej scentralizowania. Automatycznie rodzi się pytanie: jaki scenariusz MSWiA przygotowało dla już istniejących regionalnych i instytucjonalnych bibliotek cyfrowych? W chwili obecnej trudno przewidzieć, jak będzie wyglądał krajobraz sieci polskich bibliotek cyfrowych za -3 lata, ponieważ działania Ministerstwa i Biblioteki Narodowej najwyraźniej zmierzają do jej wyeliminowania. Wydaje się, że najbardziej prawdopodobny scenariusz dla sieci to jej dalsza działalność, ale przy jednoczesnym Rusza Wieloletni Program Rządowy Kultura+. [W:] DOM KULTURY+ [on-line]. Tryb dostępu: [dostęp:.0.0 r.]. Wieloletni program rządowy KULTURA+ [on-line]. Tryb dostępu: [dostęp:.0.0 r.], s. 39. Ibidem, s. 38. Regulamin Programu Wieloletniego KULTURA+: Priorytet Digitalizacja [on-line]. Tryb dostępu: [dostęp: r.]. Ibidem, s. 0. 9

20 radykalnym obniżeniu dynamiki rozwoju oraz zdecydowany wzrost znaczenia Polony. Niewykluczone, że w dalszej przyszłości Polona wchłaniać będzie kolekcje już istniejących biblioteki cyfrowych, które z kolei będą zamykane..3. Digitalizacja sensu stricto w kontekście polskiego prawa Naszkicowana w poprzednim punkcie krótka historia digitalizacji w Polsce prowadzi do konkluzji, że brak jest jednolitej, narodowej strategii budowania cyfrowych repozytoriów. Instytucje chcące prowadzić digitalizację dowolnych zbiorów, muszą więc brać pod uwagę przede wszystkim uwarunkowania, jakie w tej kwestii stawia polskie prawo. Do niedawna reszta czynników była całkowicie fakultatywna i zależna wyłącznie od zapatrywań danego podmiotu prowadzącego digitalizację; mógł, lecz nie musiał stosować się do zewnętrznych zaleceń i dobrych praktyk. Sytuację na pewno zmieni (lecz w niewielkim stopniu 0 ) ogłoszenie Wieloletniego Programu Rządowego KULTURA+, którego jednym z załączników jest Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych. Wymóg jego stosowania wśród instytucji, które otrzymają ministerialne dofinansowanie jako wymagań minimalnych ujęty jest expressis verbis w pkt 7 lit. b w dziale V. Szczegółowe warunki finansowe i organizacyjne w Regulaminie PW KULTURA+: Priorytet Digitalizacja. Zanim jednak omówione zostaną podstawowe źródła zaleceń (ponieważ standardy krajowe de facto jeszcze nie istnieją), należy przeanalizować przepisy prawa polskiego mogące bezpośrednio wpłynąć na przebieg digitalizacji sensu stricto..3.. Ustawy Działalność bibliotek reguluje szczegółowo wiele ustaw, lecz przepisy mające wpływ bezpośrednio na proces digitalizacji znajdują się tylko w jednej ustawie o informatyzacji działalności podmiotów realizujących zadania publiczne. Już w art. pkt ustawa wprowadza pojęcia minimalnych wymagań stawianych systemom teleinformatycznym używanym do realizacji zadań publicznych oraz Krajowych Ram Interoperacyjności. Minimalne wymagania ( ) są katalogiem wymagań o charakterze organizacyjno-technicznym, którego stosowanie ma zagwarantować poziom 0 Zob. pkt.4.. Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych [on-line]. Tryb dostępu: bibliotecznych.doc [dostęp: r.]. Ustawa o informatyzacji działalności podmiotów realizujących zadania publiczne z dnia r. Dz. U. Nr 64 z 005 r., poz. 565 z późniejszymi zmianami. Stan na.0.0 r. 0

21 informatyzacji państwa zgodny z dalekosiężnymi planami informatyzacji państwa, koordynowanymi za pomocą Krajowych Ram Interoperacyjności, stanowiących z kolei zbiór uzgodnionych definicji, wymagań, reguł architektury systemów teleinformatycznych, procedur i zasad, których stosowanie umożliwi współdziałanie systemów informacyjnych jednostek administracji publicznej w procesach realizacji zadań publicznych drogą elektroniczną 3. Kolejną kwestią bezpośrednio związaną z dalszymi rozważaniami są definicje legalne zawarte w art. 3. Dokumentem elektronicznym wg ustawy jest stanowiący odrębną całość znaczeniową zbiór danych uporządkowanych w określonej strukturze wewnętrznej i zapisany na informatycznym nośniku danych 4. Za testy akceptacyjne ustawodawca uważa zaś udokumentowane wartości danych wejściowych wprowadzanych do systemu teleinformatycznego i powiązanych z nimi wartości oczekiwanych danych wyjściowych, opisujące zestawy poprawnych odpowiedzi systemu teleinformatycznego na podawane dane wejściowe, pozwalające na sprawdzenie poprawności wdrożenia oprogramowania interfejsowego 5. Art. 3 ust. zawiera przepis explicite nakazujący podmiotom, których dotyczy ustawa, stosowanie rozwiązań wyszczególnionych w minimalnych wymaganiach ( ). Kontrowersje mogące potencjalnie narosnąć wokół tego zapisu po części łagodzi ust. pkt tego artykułu, który zezwala na rozszerzenie katalogu zawartego w minimalnych wymaganiach ( ) o dodatkowe rozwiązania, które jednak muszą być zabezpieczone posiadaniem odpowiednich testów akceptacyjnych, wspomnianych w art. 3 pkt. Ostatnim przepisem omawianej ustawy, który należy wymienić w kontekście digitalizacji sencu stricto, jest art. 8 pkt. Zawiera on delegację ustawową nakładającą na Radę Ministrów obowiązek uchwalenia w drodze rozporządzenia wcześniej wspomnianych minimalnych wymagań dla systemów teleinformatycznych..3.. Rozporządzenia Uchwalone w dniu października 005 r. rozporządzenie Rady Ministrów w sprawie minimalnych wymagań dla systemów teleinformatycznych 6 stanowi akt Projekt rozporządzenia Rady Ministrów w sprawie Krajowych Ram Interoperacyjności, minimalnych wymagań dla rejestrów publicznych i wymiany informacji w formie elektronicznej oraz minimalnych wymagań dla systemów teleinformatycznych [on-line]. Tryb dostępu: [dostęp: r.], 3 pkt. Ustawa o informatyzacji... art. 3, pkt. Ibidem, pkt. Rozporządzenie Rady Ministrów w sprawie minimalnych wymagań dla systemów teleinformatycznych z dnia r. Dz. U. Nr z 005 r., poz. 766.

22 wykonawczy w stosunku do ustawy opisanej w punkcie.3.. Poza przepisami wprowadzającymi, zawiera dwa załączniki, z których drugi Formaty danych zapewniające dostęp do zasobów informacji udostępnianych za pomocą systemów teleinformatycznych używanych do realizacji zadań publicznych ma podstawowe znaczenie dla tematu poruszanego w niniejszej pracy, dlatego zostanie przytoczony w tabeli. Tab.. Formaty danych zapewniające dostęp do zasobów informacji udostępnianych za pomocą systemów teleinformatycznych używanych do realizacji zadań publicznych Lp. Nazwa skrócona standardu oraz jego wersja Oryginalna pełna nazwa standardu Opis standardu Organizacja określająca normę lub standard Nazwa normy, standardu lub dokumentu normalizacyjnego albo standaryzacyjnego A. Do przetworzenia informacji na dane w układzie bitowym stosuje się następujące formaty danych:. Do danych zawierających dokumenty tekstowe lub tekstowo-graficzne stosuje się co najmniej jeden z następujących formatów danych, umożliwiających ich przeglądanie i drukowanie przy użyciu popularnych przeglądarek i edytorów:..txt Dokumenty w postaci czystego (niesformatowanego) zbioru znaków zapisanych w standardzie Unicode UTF-8 jako pliki typu.txt..3.rtf wersja.6.pdf wersja.4.4.doc.5 3. Open Document wersja.0 3..jpg (.jpeg) Rich Text Format Specification Portable Document Format Open Document Format for Office Application Dokumenty w postaci sformatowanego tekstu jako pliki typu.rtf Dokumenty tekstowograficzne jako pliki typu.pdf w wersji 5 przeglądarki Adobe Reader standard obowiązuje wyłącznie dla odczytu dokumentu Dokumenty w postaci sformatowanego tekstu jako pliki typu.doc standard obowiązuje wyłącznie dla odczytu dokumentu Otwarty format dokumentów aplikacji biurowych Microsoft Corp. Adobe Systems Inc. Microsoft Corp. OASIS Do danych zawierających informację graficzną stosuje się co najmniej jeden z następujących formatów danych: Digital compression and coding of continuous-tone still images Pliki typu.jpg (Joint Photographic Experts Group) ISO ISO 098

23 gif wersja 98a 3.3.tif (.tiff) 3.4.png 3.5.svg Graphics Interchange Format Tagged Image File Format Portable Network Graphics Scalable Vector Graphics Pliki typu.gif Pliki typu.tif CompuServer Inc. Adobe Systems Inc. Pliki typu.png ISO ISO/IEC 5948:003 Grafika wektorowa W3C B. Do określenia układu informacji w dokumencie elektronicznym stosuje się następujące formaty danych:.. XML. Do definiowania układu informacji polegającego na określeniu elementów informacyjnych oraz powiązań między nimi stosuje się następujące formaty danych: XSD (schemat XML).3 GML Extensible Markup Language Geography Markup Language Standard uniwersalnego formatu tekstowego służącego do zapisu danych w formie elektronicznej Standard opisu definicji struktury dokumentów zapisanych w formacie XML Język Znaczników Geograficznych Źródło: Rozporządzenie Rady Ministrów w sprawie minimalnych wymagań dla systemów teleinformatycznych (Dz. U. Nr z 005 r., poz. 766). W3C W3C OGC Tabela nr nie uwzględnia punktów, 4 i 5 części A oraz punktu części B załącznika nr do rozporządzenia, ponieważ zawierają one wyszczególnienie formatów dla zadań nie objętych merytorycznym zakresem niniejszej pracy. Przed przejściem do szczegółowej analizy zawartości rozporządzenia, warto zastanowić się nad jego użytecznością z punktu widzenia instytucji kultury. Już sam tytuł budzi zastrzeżenia, ponieważ w treści aktu znajduje się enumeratywny katalog formatów. Katalog ten nie jest ani wyczerpujący, ani nie zawiera charakterystyki technicznej wymienionych formatów, ani tym bardziej ich nie konfrontuje ze sobą, nawet nie wspominając o konfrontacji z formatami nie ujętymi na liście. Używając sformułowania minimalne wymagania prawodawca sugeruje, że instytucja publiczna powinna korzystać z (jednego? kilku? na jakiej podstawie dokonać wyboru?) narzuconych formatów. Czy zatem formaty pominięte w rozporządzeniu należy rozumieć jako dodatkowe, które można ewentualnie zastosować obok tych wymienionych? A może nie uwzględniono ich w treści rozporządzenia, bo nie spełniają minimalnych wymogów? Prawodawca pisząc o minimalnych wymaganiach automatycznie wartościuje coś, co jest bardzo trudne bądź wręcz niemożliwe do 3

24 wartościowania, ponieważ każdy z formatów ma inną specyfikę i nadaje się do określonych zastosowań. Rada Ministrów w odpowiedzi na liczne zapytania odnośnie sposobu interpretacji katalogu formatów umieszczonego w rozporządzeniu, wydała oświadczenie, w którym nakazuje traktować wspomniany katalog jako katalog obowiązkowy, ale nie wykluczający stosowanie innych formatów. Padło również stwierdzenie, że żaden z tych formatów nie jest preferowany przez prawodawcę i należy je traktować na równi 7. Komunikat zamiast rozwiać wątpliwości, tylko je pogłębił. Skoro instytucja kultury ma obowiązek wybrać któryś z narzuconych formatów, to jaki jest sens dublowania dokumentów elektronicznych w innym (dodatkowym) formacie? Co gorsza, rozporządzenie nie zawiera rozróżnienia formatów ze względu na ich właściwości do przechowywania i udostępniania danych. Łatwo sobie wyobrazić ograniczenie całego procesu digitalizacji przy nikłej wiedzy praktycznej do formatu JPEG o wysokim stopniu kompresji i niskiej rozdzielczości. Chociaż z punktu widzenia idei digitalizacji cały proces okazałby się bezwartościowy, byłby całkowicie zgodny z minimalnymi wytycznymi. Prawodawca zdecydował się na zastosowanie podziału dychotomicznego na dane tekstowe i tekstowo-graficzne oraz stricte graficzne. Punkt załącznika koncentruje się na formatach zapisu pierwszej grupy danych. Analizując tę grupę należy pamiętać o tym, że rozporządzenie dotyczy przede wszystkim systemów używanych przez instytucje publiczne do realizacji ich podstawowych zadań, czyli obsługujących biurowe zaplecze administracji. Widać to szczególnie w przypadku punktu, gdzie gros formatów ma charakter stricte biurowy, a niekiedy wręcz związany z określonymi pakietami biurowymi. Dotyczy to przede wszystkim formatów: DOC (pkt A..4) stworzony przez Microsoft Corporation i przypisany do MS Word, edytora tekstu, będącego częścią pakietu MS Office 8, Open Document (pkt A..5) standard zapisu danych używany w popularnym bezpłatnym pakiecie biurowym OpenOffice.org Komunikat z dnia r. [W:] Ministerstwo Spraw Wewnętrznych i Administracji [on-line]. Tryb dostępu: [dostęp: r.]. DOC (computing). [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. OpenDocument (computing). [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 4

25 RTF (pkt A..) chociaż zaprojektowany został z myślą o łatwej wymianie danych między rozmaitymi aplikacjami i platformami 30, również związany jest głównie z produktami Microsoft Corporation. Wspomniane formaty teoretycznie mogą służyć w procesie digitalizacji do przechowywania i udostępniania danych, w praktyce unika się jednak takich rozwiązań. Używanie rozbudowanych pakietów biurowych do przeglądania dokumentów elektronicznych jest uciążliwe i mało wygodne. Samo oprogramowanie jest kosztowne, a użytkownicy na ogół nie wiedzą, że dokumenty zapisane w formacie MS Office można otwierać za pomocą odpowiednich bezpłatnych przeglądarek udostępnianych on-line przez Microsoft. Częściej spotkać można TXT 3 (pkt A..) oraz przede wszystkim PDF 3 (A..3), jako formaty prezentacyjne, w których zapisane są cyfrowe obiekty. Obydwa na ogół są wygenerowane na podstawie jednej z odmian formatu XML 33 (pkt B..), przez prawodawcę przedstawionego jako standard definiowania układu i wewnętrznej relacji w dokumentach, służący do długoterminowego przechowywania dokumentów tekstowych bądź tekstowo-graficznych. W punkcie 3 załącznika wymienione są formaty przeznaczone dla danych zawierających informacje graficzne. Z punktu widzenia digitalizacji, punkt ten zdecydowanie bardziej przystaje do realiów i wymogów dobrej praktyki, niż punkt wcześniejszy. Największe znaczenie ma tu format TIFF 34 (pkt A.3.3), będący standardem dla LTP 35. Zalecenie jego stosowania jest powszechnie przyjętym, stałym elementem polityki digitalizacji w odniesieniu zarówno do rozmaitych projektów, jak też w skali ogólnokrajowej 36. Jego bezstratność, bezproblemowość odczytu i obsługa przez wszystkie popularne programy graficzne sprawiają, że idealnie nadaje się jako format archiwalny, tzn. przeznaczony do przechowywania danych i będący bazą dla konwersji do rozmaitych formatów prezentacyjnych Rich Text Format. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. Text file. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. Portable Document Format. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. XML. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. Tagged Image File Format. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. LTP Long-Term Preservation (długotrwałe przechowywanie). Skrótem tym opatruje się zagadnienia skupiające się wokół problematyki przechowywania i zabezpieczania danych w dłuższej perspektywie czasowej. Zob. pkt.4.,

26 JPEG 37 (pkt A.3.) jest nie tylko formatem graficznym, ale również standardem w udostępnianiu dokumentów o charakterze graficznym. Na początku XXI wieku był najszerzej stosowanym formatem do prezentacji rozmaitych cyfrowych obiektów stosowano go zarówno do dokumentów o charakterze typowo graficznym (zdjęcia, plakaty, obrazy), ale też do dokumentów stricte tekstowych. Na dzień dzisiejszy z tej ostatniej wspomnianej grupy został niemal całkowicie wyparty przez formaty tekstowe lub hybrydowe 38, lecz wciąż za jego pomocą udostępnia się najwięcej graficznych obiektów cyfrowych. GIF 39 (pkt A.3.) i PNG 40 (pkt A.3.4) mają zbliżony zakres zastosowań najczęściej używa się ich do prezentacji rozmaitych elementów graficznych, przede wszystkim na stronach WWW. Dzieje się tak głównie za sprawą obsługi przez te formaty trybu przezroczystości i niewielkie rozmiary plików (mimo wewnętrznej bezstratności). W digitalizacji praktycznie się ich nie stosuje, co nie dziwi w przypadku GIF (możliwość zapisania do 56 kolorów), ale zastanawia w odniesieniu do PNG. Być może PNG czeka podobny los jak JPEG 000 4, który przez kilka pierwszych lat po premierze miał charakter niszowy, by obecnie przeżywać swój renesans. SVG 4 (pkt A.3.5) ma szerokie zastosowanie przy dokumentach born-digital 43, ponieważ służy za międzyplatformowy standard do przenoszenia danych graficznych zapisanych w sposób wektorowy. Głęboka digitalizacja, której końcowym efektem są obrazy wektorowe, ma miejsce niezmiernie rzadko i najczęściej występuje przy specjalistycznych projektach, których adresatami jest wąska grupa odbiorców (np. przy digitalizacji zasobów geodezyjnych). Z powyższej analizy wynika, że rozporządzenie skierowane było bardziej do administracji publicznej, niż do jednostek kultury zajmujących się digitalizacją, tym samym skazując organizatorów bibliotek cyfrowych na rozwiązania o dyskusyjnym walorze praktycznym JPEG. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. W. M. Kolasa: Formaty hybrydowe w bibliotekach cyfrowych [on-line]. Tryb dostępu: [dostęp:..00 r.]. GIF. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. PNG. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. JPEG 000. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. Scalable Vector Graphics [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:..00 r.]. Standardy..., op. cit., s. 9. 6

27 Omawiane rozporządzenie Rady Ministrów w sprawie minimalnych wymagań dla systemów teleinformatycznych zostało w całości uchylone przez art. 4 ustawy o zmianie ustawy o informatyzacji działalności podmiotów realizujących zadania publiczne oraz niektórych innych ustaw 44. Artykuł ten utrzymał w mocy wspomniane rozporządzenie do dnia wejścia w życie nowego rozporządzenia wydanego na podstawie znowelizowanej delegacji ustawowej zawartej w art. 8 ustawy o informatyzacji ( ), nie dłużej jednak, niż sześć miesięcy od wejścia w życie ustawy o zmianie ustawy o informatyzacji ( ), która zaczęła obowiązywać od dnia 6 czerwca 00 r. Do chwili obecnej nie uchwalono rozporządzenia mającego zastąpić dotychczasowe rozporządzenie Rady Ministrów w sprawie minimalnych wymagań ( ), więc de facto od dnia 7 grudnia 00 r. w Polsce nie istnieją żadne regulacje prawne określające minimalne wymagania stawiane m.in. obiektom cyfrowym powstałym w procesie digitalizacji. Zakładając, że nie wiadomo, kiedy zostanie uchwalone wciąż będące w fazie przygotowań rozporządzenie Rady Ministrów w sprawie Krajowych Ram Interoperacyjności, minimalnych wymagań dla rejestrów publicznych i wymiany informacji w formie elektronicznej oraz minimalnych wymagań dla systemów teleinformatycznych, wydaje się, że do tego momentu brak będzie jakichkolwiek obowiązujących zaleceń odnośnie digitalizacji realizowanej przez podmioty publiczne. Zasadniczo z prawnego punktu widzenia tak właśnie będzie, niemniej dowolność w określaniu parametrów technicznych prowadzonej digitalizacji w ciągu najbliższych przynajmniej pięciu lat zostanie formalnie w dużym stopniu ograniczona 45. Wspomniany projekt (w wersji po uzgodnieniach wewnątrz resortowych) rozporządzenia Rady Ministrów w sprawie Krajowych Ram Interoperacyjności ( ) umieszczony jest w internetowym serwisie Ministerstwa Spraw Wewnętrznych i Administracji 46, dzięki czemu można go przeanalizować w odniesieniu do wcześniej omówionego rozporządzenia Rady Ministrów w sprawie minimalnych wymagań ( ) Ustawa o zmianie ustawy o informatyzacji działalności podmiotów realizujących zadania publiczne z dnia.0.00 r. Dz. U. Nr 40 z 00 r., poz. 30. Zob. pkt.4.. Projekt rozporządzenia, op. cit. 7

28 Tab.. Formaty danych oraz standardy zapewniające dostęp do zasobów informacji udostępnianych za pomocą systemów teleinformatycznych używanych do realizacji zadań publicznych Lp. Format danych lub skrócona nazwa standardu Oryginalna pełna nazwa standardu Opis standardu Organizacja określająca normę lub standard Nazwa normy, standardu lub dokumentu normalizacyjnego albo standaryzacyjnego A. W celu udostępniania zasobów informacyjnych przez podmiot realizujący zadania publiczne stosuje się:. Do danych zawierających dokumenty tekstowe, tekstowo-graficzne lub multimedialne stosuje się co najmniej jeden z następujących formatów danych:..txt Dokumenty w postaci czystego (niesformatowanego) zbioru znaków zapisanych w standardzie Unicode UTF-8 jako pliki typu.txt ISO ISO/IEC rtf.3.pdf.4.doc.5.docx.6.odt.7 Open XML...jpg (.jpeg)..gif.3.tif (.tiff).4.geotiff.5.png.6.svg Rich Text Format Specification Portable Document Format Open Document Format for Office Application Office Open Document Dokumenty w postaci sformatowanego tekstu jako pliki typu.rtf Dokumenty tekstowograficzne jako pliki typu.pdf Dokumenty w postaci sformatowanego tekstu jako pliki typu.doc Dokumenty w postaci sformatowanego tekstu jako pliki typu.docx Otwarty format dokumentów aplikacji biurowych Otwarty standard ISO dokumentów elektronicznych Microsoft Corp. Adobe Systems Inc. Microsoft Corp. Microsoft Corp. OASIS ISO ISO/IEC 9500 Do danych zawierających informację graficzną stosuje się co najmniej jeden z następujących formatów danych: Digital compression and coding of continuous-tone still images Graphics Interchange Format Tagged Image File Format Geographic Tagged Image File Format Portable Network Graphics Scalable Vector Graphics Pliki typu.jpg (Joint Photographic Experts Group) Pliki typu.gif Pliki typu.tif Pliki typu.geotiff ISO ISO 098 CompuServer Inc. Adobe Systems Inc. NASA Jet Propulsion Laboratory GeoTIFF Revision.0 Pliki typu.png ISO ISO/IEC 5948:003 Grafika wektorowa W3C 8

29 B. Do określenia struktury i wizualizacji dokumentu elektronicznego stosuje się następujące formaty danych:. Do definiowania układu informacji polegającego na określeniu elementów informacyjnych oraz powiązań między nimi stosuje się następujące formaty danych:..xml Extensible Markup Language Standard uniwersalnego formatu tekstowego służącego do zapisu danych w formie elektronicznej W3C..xsd Extensible Markup Language Standard opisu definicji struktury dokumentów zapisanych w formacie XML W3C.3.gml Geography Markup Language Język Znaczników Geograficznych OGC Źródło: Projekt rozporządzenia Rady Ministrów w sprawie Krajowych Ram Interoperacyjności, minimalnych wymagań dla rejestrów publicznych i wymiany informacji w formie elektronicznej oraz minimalnych wymagań dla systemów teleinformatycznych. W tabeli nr nie ujęto punktów 3 i 4 części A oraz i 3 części B załącznika nr do projektu rozporządzenia. W porównaniu z wytycznymi zawartymi w rozporządzenia Rady Ministrów w sprawie minimalnych wymagań ( ), projekt rozporządzenia Rady Ministrów w sprawie Krajowych Ram Interoperacyjności ( ) nie wnosi większych zmian. Wciąż ma miejsce dychotomiczny podział formatów, bez wskazania ich pola zastosowania. Pkt A.. załącznika, dotyczący dokumentów tekstowych i tekstowo-graficznych, został wzbogacony o DOCX 47 (pkt A..5) i Open XML 48 (pkt A..7), jednocześnie Open Document zastąpiono jego faktycznym rozszerzeniem nadawanym plikom ODT. DOCX to nowsza wersja formatu DOC (związana z MS Office 007 i MS Office 00) i jednocześnie realizacja założeń standardu Open XML (również stworzonego przez Microsoft Corporation). Zakres zmian wydaje się więc mieć charakter kosmetyczny i tylko potwierdza wnioski wyciągnięte po analizie rozporządzenia Rady Ministrów w sprawie minimalnych wymagań ( ), czyli przeznaczenie rozporządzenia przede wszystkim do zastosowań w biurowym obrocie dokumentami. W punkcie dotyczącym dokumentów graficznych zmiany są jeszcze bardziej symboliczne, ponieważ do zestawienia wprowadzono tylko jeden dodatkowy format GeoTIFF 49 (pkt A..4). Słowo format ujęte zostało w cudzysłów, ponieważ GeoTIFF to nie tyle format, ile standard metadanych geograficznych (chociaż sposób jego zapisu What is the docx format? [W:] Docx File Extension (.docx) [on-line]. Tryb dostępu: [dostęp: r.]. Office Open XML. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. GeoTIFF. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 9

30 w załączniku do rozporządzenia może sugerować, że mamy do czynienia z osobnym formatem) umieszczanych w plikach TIFF. Oznaczenie omawianej wersji rozporządzenia jako projektu pozwala przypuszczać, że w ostatecznej postaci mogą jeszcze zajść zmiany, chociaż widoczne przywiązanie prawodawcy do już wcześniej narzuconych rozwiązań każe wątpić w jakiekolwiek radykalne posunięcia mogące uwzględnić specyficzne potrzeby podmiotów zajmujących się digitalizacją. Szczególnie zastanawia brak w spisie powszechnie przyjętych i cenionych formatów, jakimi są JPEG 000 i DjVu. Zgodnie z ustawą o informatyzacji działalności podmiotów realizujących zadania publiczne, instytucje korzystające ze wspomnianych formatów powinny posiadać zaświadczenia o pozytywnym zakończeniu odpowiednich testów akceptacyjnych, co jest nieuzasadnionym obciążeniem. Ostatnim aktem prawnym, który wydaje się mieć bezpośredni wpływ na obiekty cyfrowe wytwarzane przez instytucje publiczne, jest rozporządzenie Ministra Spraw Wewnętrznych i Administracji w sprawie niezbędnych elementów struktury dokumentów elektronicznych 50. Tytuł rozporządzenia sugeruje, że jego regulacje dotyczą wewnętrznej struktury dokumentów elektronicznych, co niestety nie pokrywa się z samą treścią rozporządzenia. ust. zawiera definicję legalną metadanych, po czym w kolejnych punktach ust. wylicza obowiązkowe pola metadanych opisujących dokumenty (m.in. identyfikator, twórcę, tytuł, datę, format, dostęp, typ itd.). Problem w tym, że prawodawca dość nietrafnie określił te metadane jako niezbędne elementy struktury dokumentów elektronicznych, co wskazuje na metadane strukturalne, faktycznie stanowiące wewnętrzny element dokumentów elektronicznych. Tymczasem wykaz pól wygląda bardziej na metadane opisowe i administracyjne, towarzyszące obiektom cyfrowym, ale fizycznie wprowadzone do systemu zarządzającego tym obiektem i nie stanowiące integralnego elementu jego struktury 5. W punkcie 7 expressis verbis zalecono zakres wartości zaczerpnięty z Dublin Core, który jest przecież jednym z najpopularniejszych standardów metadanych opisowych. Poza tym mowa tu o dokumentach elektronicznych, a nie o plikach, które to pojęcia nie są przecież tożsame. Zakres niniejszej pracy obejmuje wyłącznie generowanie, obróbkę i przechowywanie cyfrowych odwzorowań dokumentów oryginalnych, czyli 50 5 Rozporządzenie Ministra Spraw Wewnętrznych i Administracji w sprawie niezbędnych elementów struktury dokumentów elektronicznych z dnia r. Dz. U. Nr 06 z 006 r., poz. 57. Standardy..., op. cit., s

31 digitalizację sensu strico, więc wszelkie metadane, poza czysto technicznymi i strukturalnymi, nie mieszczą się w tym zakresie. W świetle przytoczonych argumentów można wysnuć zatem wniosek, że rozporządzenie nie wiąże osób zajmujących się wyłącznie digitalizacją sensu stricto. Problematyka zgodności metadanych przyjętych dla instytucjonalnych systemów repozytoryjnych oraz metadanych przyjętych w systemach realizujących funkcje biblioteki cyfrowej, których dotyczy omawiane rozporządzenie, związana jest przede wszystkim z zarządzaniem i udostępnianiem dokumentów elektronicznych, które są przejawami digitalizacji sensu largo..4. Digitalizacja krajowe zalecenia i dobre praktyki W punktach.4.. i.4.3. omówione zostaną zalecenia opracowane przez zespoły polskich autorytetów w dziedzinie digitalizacji i promowane przez Bibliotekę Narodową pełniącą rolę Centrum Kompetencji. Logika podpowiada, że mają one wyższy status niż jakikolwiek przykład dobrej praktyki, jednakże w świetle założeń Wieloletniego Programu Rządowego KULTURA+ 5, który całkowicie przejął finansowanie krajowych inicjatyw digitalizacyjnych, logiczne rozumowanie nie znajduje zastosowania. Jako realizację założeń KULTURY+, w lutym 0 r. ogłoszono nabór wniosków o dofinansowanie digitalizacji, którego regulamin narzuca obowiązek stosowania bardzo konkretnych rozwiązań przedstawionych w dokumencie zatytułowanym Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych 53. Biorąc pod uwagę fakt, że to właśnie KULTURA+ będzie odpowiadała do 05 r. za dynamikę i kształt rozwoju digitalizacji, to właśnie Katalog ( ) staje się faktycznym wyznacznikiem standardów, które będą obowiązywały..4.. Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych Z uwagi na doniosłość omawianego dokumentu, warto go przytoczyć w części zawierającej wytyczne dla wytwarzanych obiektów cyfrowych Zob. pkt.. Katalog..., op. cit. 3

32 Tab. 3. Techniczne wymagania Wieloletniego Programu Rządowego KULTURA+, stawiane digitalizacji prowadzonej w ramach dofinansowania Lp. Kryteria Obiekt Biblioteczny 3 4. Standardy techniczne, w tym parametry sprzętowe, oprogramowanie-zalecenia minimum Wymagane są co najmniej następujące parametry techniczne plików cyfrowych, będących wynikiem digitalizacji obiektów bibliotecznych.. Zalecenia minimalne dla tekstów drukowanych - książki, gazety, czasopisma bez ilustracji, rysunki, mapy monochromatyczne, nuty, dokumenty urzędowe (normy, monitory, rozporządzenia itp.), maszynopisy, prace licencjackie, magisterskie, doktorskie: a. Format: TIFF 6.0 z kompresją CCITT Group4 b. Rozdzielczość: 400 ppi c. Bity na piksel: d. Wzorce szarości/koloru: nie dotyczy. Zalecenia minimalne dla tekstów drukowanych z ilustracjami oraz rysunków, grafik i fotografii monochromatycznych: a. Format: TIFF 6.0, dopuszcza się kompresję bezstratną LZW b. Rozdzielczość: 300 ppi, lecz nie mniej niż 3000 pikseli na dłuższym wymiarze c. Bity na piksel: 8-bitowa skala szarości d. Wzorce szarości/koloru: Gray Gamma. 3. Zalecenia minimalne dla odbitek fotograficznych barwnych, rysunków i grafik kolorowych, miedziorytów, drzeworytów, rękopisów, inkunabułów i starych druków: a. Format: TIFF 6.0, dopuszcza się kompresję bezstratną LZW b. Rozdzielczość: 300 ppi, lecz nie mniej niż 3000 pikseli na dłuższym wymiarze c. Bity na piksel: 8 bitów na kolor 4-bit RGB d. Wzorce szarości/koloru: Adobe RGB Zalecenia minimalne dla mikrofilmów: a. Format: TIFF 6.0 z kompresją CCITT Group4 b. Rozdzielczość: jak dla mikrofilmowanego oryginału w granicach przenoszenia jego cech przez mikrofilm c. Bity na piksel: 8 bitów na kolor, 4-bit RGB albo 8-bitowa skala szarości d. Wzorce szarości/koloru: nie dotyczy 5. Zalecenia minimalne dla map wielkoformatowych, atlasów, plakatów: a. Format: TIFF 6.0, dopuszcza się kompresję bezstratną LZW b. Rozdzielczość: 300 ppi c. Bity na piksel: 8 bitów na kolor 4-bit RGB d. Wzorce szarości/koloru: Adobe RGB 998 3

33 3 5. Udostępnianie, w tym:. konwersja cyfrowa wtórna przygotowanie materiałów do udostępniania, cyfrowe przetworzenie materiałów wytworzonych w czasie konwersji cyfrowej pierwotnej (zmiana rozmiaru, naniesienie znaków wodnych, korekcja etc.);. udostępnienie materiałów użytkownikom przy zapewnieniu ich możliwie największej dostępności, najlepiej w internecie. 6. Zabezpieczenie danych (Ew. repozytoria cyfrowe) - zapis danych powstałych w wyniku konwersji cyfrowej na nośnikach pamięci masowej;. Przy udostępnianiu reprodukcji cyfrowych zaleca się utworzenie kopii pochodnych z oryginału cyfrowego: ( ) a. plik JPG dużej jakości z oryginału (o znacznej kompresji względem pliku TIFF) b. wytworzenie plików JPG o zmniejszonej rozdzielczości (w celu publikacji na stronie WWW zalecana jest rozdzielczość ekranowa) c. dla plików tekstowych wykonanie operacji OCR Wymagany jest zapis głównej kopii w formacie archiwalnym (TIFF) za pomocą systemu na odpowiednim medium przeznaczonym do plików archiwalnych. Format powinien być bezstratny, obraz zapisany w dużej rozdzielczości, którą otrzymano z urządzenia skanującego (według wskazań zawartych w pkt. 4). Plik należy uzupełnić metadanymi, zapisanymi w pliku graficznym (np. w formacie Exif). Kopie w formacie archiwalnym powinny zostać przekazane do bezpiecznego repozytorium cyfrowego, wskazanego przez Bibliotekę Narodową. Źródło: Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych. W tabeli pominięto punkty -3 Katalogu ( ), ponieważ odnoszą się one do sfery czysto organizacyjnej związanej z digitalizacją oraz do zaleceń odnośnie metadanych opisowych nie objętych tematyką niniejszej pracy. W punkcie 4 Katalogu ( ) podzielono obiekty biblioteczne na grupy, w stosunku do których należy stosować co najmniej zalecone minimalne parametry dla formatów archiwalnych ponieważ to ich dotyczy ten punkt, choć nie jest to ujęte explicite. Co ciekawe, zarówno sam podział, jak i wyliczenie obiektów wchodzących w skład poszczególnych grup, zostały zaczerpnięte z wspomnianej wcześniej i omówionej w punkcie.4.3. publikacji Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego 54, której zadaniem było wytyczenie zaleceń dla polskiej digitalizacji. Zakładając, że digitalizacja w skali ogólnokrajowej powinna docelowo tworzyć pewien ujednolicony system, chęć zachowania w Katalogu ( ) pełnej zgodności z rozwiązaniami przyjętymi w Standardach ( ), jest posunięciem zdecydowanie pozytywnym. Ponieważ ujęte w Katalogu ( ) wytyczne opisane są w Standardach ( ) w formie wzbogaconej o część zawierającą (oprócz wymagań minimalnych) także wymagania zalecane, ich szczegółowe omówienie znajduje się w punkcie.4.3. niniejszej pracy. 54 Standardy..., op. cit. 33

34 W kontekście ścisłego bazowania na zaleceniach Standardów ( ), dziwić może beztroska instytucji opracowujących Katalog ( ) w interpretowaniu wspomnianej publikacji. Przykładowo w oryginale dokumenty zaliczone do grupy A to książki, gazety, czasopisma bez ilustracji; rysunki; mapy monochromatyczne; rysunki techniczne (z wyraźnym kontrastem); nuty; dokumenty urzędowe (normy, monitory, rozporządzenia itp.); maszynopisy; prace licencjackie, magisterskie, doktorskie 55. Katalog ( ) przytacza opis tej grupy, lecz nie wiedzieć czemu opuszcza fragment rysunki techniczne (z wyraźnym kontrastem). Jest to o tyle istotne, że właśnie poziom kontrastu jest kryterium decydującym w zakwalifikowaniu pewnych dokumentów (rysunków technicznych, druków, map, nut) do pierwszej lub drugiej grupy. Kolejnym poważnym błędem Katalogu ( ) jest utożsamianie monochromatyczności z czernią i bielą, co niesie za sobą dość poważne konsekwencje. Do drugiej grupy dokumentów zalicza on teksty drukowane z ilustracjami oraz rysunki, grafiki i fotografie monochromatyczne. Grupa ta jest pewnego rodzaju połączeniem grup B i C opisanych w Standardach ( ). Tyle, że tam mowa jest m.in. o odbitkach fotograficznych czarno-białych, a nie monochromatycznych. Stare zdjęcia niejednokrotnie mają odcienie sepii, przez co są monochromatyczne, lecz zdigitalizowanie ich w odcieniach szarości (a właśnie w takim trybie powinny być wg Katalogu ( ) digitalizowane dokumenty z grupy drugiej) stoi w opozycji do idei digitalizacji, która ma za zadanie oddawać możliwie wiernie wygląd dokumentu oryginalnego. Odbitki fotograficzne barwne i monochromatyczne ujęte są także w Standardach ( ), lecz w grupie F, podlegającej digitalizacji w trybie co najmniej true color. Ponadto fakt, że do drugiej grupy w Katalogu ( ) zaliczono rysunki monochromatyczne bez podania kryterium związanego z kontrastem sprawia, że ten sam typ dokumentu występuje zarówno w grupie pierwszej jak i drugiej, co daje instytucji digitalizującej dowolność wyboru, co z kolei może doprowadzić do złego zakwalifikowania rysunków, a tym samym do nieprawidłowości w prowadzeniu digitalizacji. O ile wyżej wymienione mankamenty Katalogu ( ) mają charakter głównie problematyczny, o tyle zapis przy zaleceniach dla grupy czwartej (mikrofilmów) nosi znamiona ewidentnego błędu. I nie chodzi tu nawet o fakt, że zakres dokumentów należących do tej grupy ograniczono wyłącznie do mikrofilmów (z niewiadomych przyczyn nie uwzględniono innych mikroform), lecz o zalecenie, żeby stosować format Standardy..., op. cit., s. 05.

35 TIFF z kompresją CCITT G4. Tymczasem w dopuszczalnych trybach koloru wymieniono wyłącznie tryby, których akurat kompresja CCITT G4 nie obsługuje, ponieważ stosuje się ją wyłącznie do kompresji grafik bitonalnych. Prawdopodobnie chodziło o kompresję LZW, niemniej wersja z błędem wciąż obowiązuje i dostępna jest w takiej postaci na stronach Narodowego Instytutu Audiowizualnego. Ostatnią zagadką związaną z punktem 4 Katalogu ( ) jest całkowite pominięcie negatywów i przezroczy fotograficznych. I znowu powstaje pytanie, czy był to zabieg celowy (a jeśli tak, to czym spowodowany?), czy zwykłe przeoczenie. Punkt 5 dotyczy z kolei formatów prezentacyjnych tworzonych na podstawie archiwalnych plików TIFF i służących udostępnianiu obiektów cyfrowych, najlepiej w internecie. Jego podpunkty są (wybiórczo) zaczerpnięte z publikacji Digitalizacja piśmiennictwa 56. Podpunkt informuje, że przy udostępnianiu reprodukcji cyfrowych zaleca się utworzenie kopii pochodnych z oryginału cyfrowego. Jego intencją jest zalecenie udostępniania obiektów cyfrowych w formacie bardziej przyjaznym niż TIFF, którego pliki, w przypadku odwzorowania oryginałów o sporych wymiarach, mogą osiągać rozmiary sięgające kilkuset MB. Kolejne podpunkty zawierają bardziej konkretne wskazówki. Podpunkt.A zaleca generowanie pliku JPG dużej jakości z oryginału (o znacznej kompresji względem pliku TIFF). Zastrzeżenia budzi już sam sens podpunktu. Przede wszystkim przedstawiono JPEG jako format wiodący dla udostępniania najprawdopodobniej dla wszystkich rodzajów dokumentów oryginalnych, skoro nie ma żadnego wykazu, dla jakich dokumentów JPEG byłby wskazany, a dla jakich nie. Rozwiązanie takie było szeroko stosowane dziesięć lat temu 57 i obecnie trudno nazywać je dobrą praktyką. Niezrozumiały jest również postulat, żeby plik JPEG był względem TIFF znacznie skompresowany. JPEG jako format stratny automatycznie redukuje rozmiar obrazu przynajmniej kilkakrotnie. Sytuację wyjaśnia konfrontacja Katalogu ( ) z tekstem źródłowym, gdzie cytat przytoczony w podpunkcie.a okazuje się wyrwanym z kontekstu (a tym samym pozbawionym pierwotnego sensu) fragmentem. W punkcie 0. Digitalizacji piśmiennictwa mowa jest o zapisie wyników otrzymanych z urządzenia digitalizującego 58, gdzie zaleca się oprócz plików archiwalnych jednoczesne tworzenie Digitalizacja, op. cit., s. 97. Zob. pkt.3.. Digitalizacja, op. cit., s

36 plików JPG dużej jakości z oryginału (znaczna kompresja względem TIFF, bez zauważalnej dla oka różnicy, powoduje mniejsze rozmiary i ułatwia pracę na pliku) 59. Czyli nie chodzi tu o tworzenie plików przeznaczonych do udostępniania, a jedynie kopii pośrednich, przeznaczonych do dalszej obróbki. Wątpliwości zrodzone przez podpunkt.a dodatkowo potęguje podpunkt następny: wytworzenie plików JPG o zmniejszonej rozdzielczości (w celu publikacji na stronie WWW zalecana jest rozdzielczość ekranowa). Trudno znaleźć racjonalne wytłumaczenie dla powyższego zapisu w kontekście digitalizacji. Zasada przedstawiona w tym podpunkcie odnosi się głównie dla grafik i elementów graficznych tworzonych na potrzeby serwisów WWW. Jedyne chociaż bardzo luźne powiązanie z digitalizacją może stanowić konieczność tworzenia miniatur dla udostępnianych obiektów cyfrowych. Należy nadmienić, że miniatury te na ogół są generowane automatycznie. Umieszczanie on-line obiektów w rozdzielczości 7-96 ppi (czyli rozdzielczości ekranowej) może doprowadzić jedynie do zniechęcenia użytkowników fatalną jakością tych obiektów. Ponownie w poprawnej interpretacji pomaga tekst źródłowy, który zawiera pełne brzmienie podpunktu.b: jeśli celem digitalizacji jest udostępnianie i prezentacja materiału, wytworzenie plików JPG o zmniejszonej rozdzielczości (np. w celach publikacji WWW rozdzielczość ekranowa, rozdzielczość dla miniaturek itp.) 60. Jest to ciąg dalszy paragrafu dotyczącego plików automatycznie tworzonych, towarzyszących w miarę potrzeb bezstratnym plikom archiwalnym. Ostatni podpunkt (.C) zawiera jedynie zalecenie wykonywania OCR 6. Podsumowując punkt 5 teoretycznie powinien mieć zasadnicze znaczenie dla instytucji starających się o dofinansowanie. To właśnie obróbka plików TIFF i generowanie odpowiednich plików prezentacyjnych zajmuje najwięcej czasu i sprawia najwięcej kłopotów. Niestety, Katalog ( ) zamiast zaproponowania racjonalnych rozwiązań, swoimi niezrozumiałymi zapisami prawdopodobnie utrudni instytucjom poprawne rozliczenie potencjalnego dofinansowania i ocenę jakości digitalizacji przeprowadzonej z użyciem środków pozyskanych z KULTURY+. W trakcie studiowania jego kolejnych punktów, czytającemu towarzyszy nieodparte wrażenie, że całość została przygotowana bezrefleksyjnie, w wielkim pośpiechu i bez Digitalizacja, op. cit., s. 97. Ibidem. Ibidem, s

37 skonsultowania z Biblioteką Narodową jako Centrum Kompetencji w dziedzinie digitalizacji materiałów bibliotecznych. Ostatni punkt Katalogu ( ) dotyczy LTP. Tym razem explicite wymaga się zapisywania plików archiwalnych w formacie TIFF w jednej z bezstratnych odmian, w rozdzielczości takiej, jaką zdefiniowano w urządzeniu digitalizującym. Punkt dodatkowo nakazuje uzupełnienie metadanych zapisanych w pliku graficznym, co w praktyce robi się rzadko, ponieważ metadane techniczne generowane są automatycznie przez skaner lub aparat. Na metadane tego typu wskazuje powołanie się na przykładowy format Exif 6, gdyż twórcy Katalogu ( ) nie określili, o jaki typ metadanych w istocie chodzi..4.. Digitalizacja piśmiennictwa Gdy w 009 r. decyzją Ministra Kultury i Dziedzictwa Narodowego Biblioteka Narodowa stała się Centrum Kompetencji, posiadała już bardzo dobrze wyposażoną pracownię i spore doświadczenie uzyskane przy tworzeniu i prowadzeniu Cyfrowej Biblioteki Narodowej POLONA. W czasie pierwszego roku pełnienia nowej funkcji, BN przeprowadziła szereg szkoleń z zakresu digitalizacji, a także seminarium prawne dla bibliotekarzy cyfrowych 63. Jednak najważniejszym do tej pory osiągnięciem CK jest wydanie w listopadzie 00 r. Digitalizacji piśmiennictwa 64, pierwszego oficjalnego podręcznika mającego stanowić dla bibliotek kompendium wiedzy na temat digitalizacji. Tak w każdym razie w czasie konferencji Regionalne sieci współpracy strategie, narzędzia, realizacje reklamował tę książkę dyrektor Biblioteki Narodowej w przeddzień jej premiery. Po dokładnej analizie podręcznika należy uznać go za spory sukces, chociaż nacechowany dość nieoczekiwanym mankamentem. Bez wątpienia nie było jeszcze w Polsce wydawnictwa tak kompleksowo omawiającego prawie wszystkie aspekty digitalizacji. Bardzo dokładnie przeanalizowano cały proces digitalizacji od planowania, aż do zagadnień związanych z LPT. Wartość publikacji podnosi dodatkowo szczegółowa parametryzacja zaleceń, która chociaż pozornie sprawia wrażenie nadmiernie rozbudowanej, w praktyce na pewno sprawdzi się zdecydowanie bardziej Exchangeable image file format. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. Biblioteka Narodowa - Centrum Kompetencji w zakresie digitalizacji materiałów bibliotecznych [on-line]. Tryb dostępu: [dostęp: r.]. Digitalizacja, op. cit. 37

38 niż luźny wykaz ogólnych wskazówek. Ukoronowaniem ogromu pracy, jaka bez wątpienia została włożona przez zespół redakcyjny w przygotowanie podręcznika, jest umieszczony na końcu kilkustronicowy schemat workflow 65 wariantowy scenariusz postępowania prezentujący logiczną kolejność czynności podejmowanych przy realizacji projektów digitalizacyjnych. Niestety, obrazu całości dopełnia wcześniej wspomniany mankament, którym jest w zasadzie brak informacji na temat digitalizacji sensu stricto. Czytelnik z publikacji dowie się, w jaki sprzęt i oprogramowanie się zaopatrzyć, jak wszystko skalibrować, żeby osiągnąć optymalny efekt, ale nie dowie się np. jakich rozdzielczości użyć w stosunku do różnych rodzajów dokumentów, jakie formaty zapisu stosować dla wersji udostępnianej i dlaczego akurat te, a nie inne. W miejsce zaleceń pojawia się tylko jedno zdanie: tabelę pozwalającą na szybki, orientacyjny dobór podstawowych parametrów skanowania dla typowych rodzajów obiektów przedstawiono w publikacji Standardy w procesie digitalizacji obiektów dziedzictwa narodowego, pod redakcją Grzegorza Płoszajskiego ( ) 66. Całość problematyki została zatem oficjalnie delegowana do publikacji, która tym samym stała się komplementarna z Digitalizacją piśmiennictwa. Jest to decyzja niezrozumiała, jeśli weźmie się pod uwagę dogłębność i jednocześnie kompleksowość podręcznika BN. Nasuwa się pytanie, dlaczego nie zdecydowano się na przedruk wspomnianej tabeli wtedy czytelnik miałby wszystkie potrzebne informacje w jednym miejscu, a tak ma podręcznik dotyczący digitalizacji, ale o sednie digitalizacji piszący bardzo niewiele. Wśród informacji relewantnych dla dalszych rozważań, podręcznik zawiera: ) opis oprogramowania (w tym systemów operacyjnych) wykorzystywanego w procesie digitalizacji. Pokrótce omówiono najpopularniejsze programy graficzne, m.in. GIMP, Adobe Photoshop, IrfanView, ) wykaz przekształceń, którym mogą podlegać obiekty cyfrowe. Do przekształceń bezstratnych zaliczono kadrowanie, korekcję kolorów i obroty o kąty będące wielokrotnością 90. Wśród przekształceń stratnych wymieniono kompresję stratną oraz zmianę skali. Z kolei najpopularniejsze korekcje i modyfikacje to korekta jasności, kontrastu, kolorów i przekoszenia, wyostrzenie, zmiana głębi bitowej koloru, kadrowanie i wycinanie fragmentów obrazu, a także korekta artefaktów i zniekształceń, Digitalizacja, op. cit., s Ibidem, s.. 38

39 3) wprowadzenie do problematyki znaków wodnych (widocznych i niewidocznych) oraz OCR, 4) wzmiankę o najpopularniejszych formatach hybrydowych PDF i DjVu, 5) rozbudowany fragment dotyczący LTP prezentujący rozmaite rozwiązania w dziedzinie pamięci masowych. Wyróżniono m.in. pamięci flash, dyski optyczne (organizowane ręcznie lub automatycznie za pomocą zmieniarki), nośniki magnetooptyczne, dyski twarde, macierze dyskowe i media taśmowe, 6) opis modelu systemu do zarządzania całością procesu digitalizacji nazwanego na potrzeby podręcznika repozytorium. Sporo miejsca poświęcono także metodologii skanowania, która jednak nie została objęta badaniem opisanym w dalszej części niniejszej pracy Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego Potrzeba stworzenia krajowej strategii i standardów dla digitalizacji istniała w Polsce już od końca XX wieku, kiedy to instytucje kultury zaczęły poważnie interesować się możliwościami przenoszenia swoich zbiorów do środowiska zerojedynkowego. Biblioteka Narodowa wbrew powszechnym oczekiwaniom nie podejmowała żadnych znaczących kroków w tym kierunku, aż do momentu mianowania jej Centrum Kompetencji, czyli do 009 r. Ministerstwo Kultury i Dziedzictwa Narodowego, przed powołaniem Centrów Kompetencji, już w 006 r. próbowało usystematyzować błyskawicznie zdobywającą popularność digitalizację, poprzez powołanie Zespołu ds. digitalizacji 67. Zespół ten zasłynął głównie rzadkimi posiedzeniami, z których w zasadzie nic wiążącego nie wyniknęło. W ramach wspomnianego Zespołu działał Zespół roboczy ds. standardów technicznych digitalizowanych obiektów, którego osiągnięcia są z kolei nie do przecenienia. W wyniku prowadzonych prac, Zespół opracował wewnętrzny dokument zatytułowany Opracowanie standardów technicznych dla obiektów cyfrowych tworzonych przy digitalizacji dziedzictwa kulturowego, który stał się podstawą dla wydanej w 008 r. pracy zbiorowej Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego pod redakcją Grzegorza Płoszajskiego K. Ślaska, J. Potęga: Cyfrowa Biblioteka Narodowa Polona. [W:] Biuletyn EBIB, nr /006 [on-line]. Tryb dostępu: [dostęp: r.]. Standardy, op. cit. 39

40 Tytuł publikacji jest nieprzypadkowy. Jej autorzy odróżniają termin standardy jako bardziej odnoszący się do metadanych, od zaleceń, dotyczących aspektów technicznych digitalizacji 69. I faktycznie zdecydowana większość książki skupia się na problematyce metadanych ich rodzajach, charakterystyce i zakresie zastosowań. Można odnieść wrażenie, że według autorów metadane są dla digitalizacji sprawą absolutnie kluczową i decydującą o jakości, użyteczności i elastyczności w odniesieniu do archiwizacji, migracji, konwersji i w końcu udostępniania obiektów cyfrowych. Proponując scenariusz standaryzacji metadanych w polskiej digitalizacji, autorzy wykazali się dogłębną znajomością krajowych realiów, co zaowocowało bardzo racjonalnym podejściem do możliwości jego realizacji. Po prezentacji i szczegółowym omówieniu wiodących światowych standardów oraz pól ich stosowania, jako optymalne rozwiązanie zaproponowano: ) dla metadanych strukturalnych i technicznych przejściowo ABMPL 70, docelowo METS 7 ) dla metadanych strukturalnych związanych z dokumentami poddanymi OCR ALTO 7 3) dla metadanych technicznych MIX 73 lub standard własny na nim oparty. ABMPL przedstawiono jako rozwiązanie tymczasowe, będące pomostem między aktualną praktyką a docelowym standardem METS, który ze względu na swoją wszechstronność i elastyczność jest w wielu krajach standardem dominującym, ale niestety wymaga odpowiedniego oprogramowania. Dlatego też autorzy mieli świadomość, że zalecenie powszechnego stosowania standardu METS może okazać się pustym przepisem, gdyż w początkowym okresie mało kto zdoła się do niego zastosować 74. Podobna sytuacja ma miejsce w przypadku MIX, który pomimo jego niewątpliwych zalet trudno będzie wdrożyć ze względu na panującą w Polsce praktykę bazowania na standardzie EXIF, zakodowanym wewnątrz plików TIFF. Jednocześnie trudno oprzeć się na EXIF jako standardzie docelowym, ponieważ sposób Standardy, op. cit., s. 9. Ibidem, s.. Ibidem, s. 47. Ibidem, s. 67. Ibidem, s. 46. Ibidem, s

41 jego interpretacji i katalog generowanych pól znacznie różni się w zależności od producenta danego urządzenia 75. Dla tematyki poruszanej w niniejszej pracy, największe znaczenie ma punkt 7. Standardów ( ) Zestawienie tabelaryczne wymagań dotyczących parametrów plików graficznych rastrowych 76. Zawiera on zalecenia dla rastrowych plików archiwalnych, stanowiących podstawę dla LTP i wygenerowania wszelkich pochodnych formatów o charakterze prezentacyjnym. Wyliczenie opiera się na siedmiu grupach dokumentów, wobec których zastosowano różne kryteria utrwalenia plików archiwalnych. Ponadto każdorazowo oprócz wymagań minimalnych, dla każdej grupy przewidziano również wymagania zalecane. Katalog tych wymagań przedstawiono w tabeli Standardy, op. cit., s. 93. Ibidem, s

42 Tab. 4. Zestawienie wymagań dotyczących plików archiwalnych rastrowych Lista przykładowych dokumentów wymagania minimalne Format Rozdzielczość Bity na piksel Wzorce szarości / koloru wymagania zalecane wymagania minimalne wymagania zalecane wymagania minimalne wymagania zalecane wymagania minimalne GRUPA A: książki, gazety, czasopisma bez ilustracji; rysunki; mapy monochromatyczne; rysunki techniczne (z wyraźnym kontrastem); nuty; dokumenty urzędowe (normy, monitory, rozporządzenia itp.); maszynopisy; prace licencjackie, magisterskie, doktorskie GRUPA B: książki, gazety, czasopisma z ilustracjami w odcieniach szarości (ewentualnie pojedyncze strony jako uzupełnienie grupy A); rysunki techniczne, druki, mapy, nuty (z niewyraźnym kontrastem) GRUPA C: odbitki fotograficzne czarnobiałe; rysunki i grafiki czarno-białe lub w odcieniach szarości; (gdy użycie koloru nie jest uzasadnione szczególnymi cechami dokumentów, to także rękopisy; inkunabuły; stare druki) GEUPA D: fotografia (tylko negatywy i przezrocza), negatywy szklane o typowej wielkości TIFF 6.0 z kompresją CCITT Group4 TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 z kompresją CCITT Group4 TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW wymagania zalecane 400 ppi 600 ppi nie dotyczy nie dotyczy 300 ppi 400 ppi 300 ppi, lecz nie mniej niż 3000 pikseli na dłuższym wymiarze 300 ppi, lecz nie mniej niż 3000 pikseli na dłuższym wymiarze 400 ppi, lecz nie mniej niż 5000 pikseli na dłuższym wymiarze 600 ppi, lecz nie mniej niż 5000 pikseli na dłuższym wymiarze 8-bitowa skala szarości 8-bitowa skala szarości 8 bitów na kolor 4-bit RGB albo 8-bitowa skala szarości 6-bitowa skala szarości 6-bitowa skala szarości 6 bitów na kolor 48-bit RGB albo 6-bitowa skala szarości Grey Gamma. Grey Gamma. Grey Gamma. Grey Gamma. Adobe RGB 998 Grey Gamma.. albo Adobe RGB 998 lub lepszy

43 GRUPA E: mikrofilmy i mikrofisze: kopie zabezpieczające wykonane w technice fotograficznej GRUPA F: odbitki fotograficzne barwne, ew. monochromatyczne (sepia itp.); rysunki i grafiki kolorowe; obrazy; miedzioryty; drzeworyty; rękopisy; inkunabuły; stare druki; (gdy użycie koloru jest uzasadnione szczególnymi cechami dokumentów, to także, książki, czasopisma); obiekty muzealne małe i średniej wielkości, takie jak biżuteria, monety, medale, bibeloty, niewielkie rzeźby, narzędzia i przedmioty codziennego użytku, narzędzia produkcyjne, naczynia, militaria GRUPA G: mapy wielkoformatowe; atlasy; plakaty; duże obrazy; duże obiekty muzealne; malarstwo naścienne TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW TIFF 6.0 dopuszcza się kompresję bezstratną LZW jak dla mikrofilmowanego oryginału w granicach przenoszenia jego cech przez mikrofilm 300 ppi, lecz nie mniej niż 3000 pikseli na dłuższym wymiarze jak dla mikrofilmowanego oryginału w granicach przenoszenia jego cech przez mikrofilm 400 ppi, lecz nie mniej niż 5000 pikseli na dłuższym wymiarze 300 ppi 300 ppi Źródło: Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego. Pod red. G. Płoszajskiego. 8 bitów na kolor 4-bit RGB albo 8-bitowa skala szarości 8 bitów na kolor 4-bit RGB 8 bitów na kolor 4-bit RGB 8 bitów na kolor 4-bit RGB albo 8-bitowa skala szarości 6 bitów na kolor 48-bit RGB 6 bitów na kolor 48-bit RGB nie dotyczy Adobe RGB 998 Adobe RGB 998 nie dotyczy Adobe RGB 998 lub lepszy Adobe RGB 998 lub lepszy

44 Grupa A, ze względu na najmniejszą ilość informacji konieczną do zakodowania w formie rastra, nadaje się do zapisu w trybie -bitowego koloru. Zalecany format to wspomniany w punkcie.4. TIFF z dedykowaną dla czerni i bieli kompresją CCITT G4. Jedyna różnica między wymaganiami minimalnymi i zalecanymi to sugerowana rozdzielczość. Mimo, że tabela podaje konkretne wartości (odpowiednio 400 i 600 ppi), do parametru tego należy podchodzić bardzo ostrożnie i nie tyle sztywno bazować na proponowanych wartościach, ile umieć je samodzielnie dobrać w zależności od dokumentu. Pomocna w tym przypadku jest formuła opracowana w Cornell University 77 : dpi=3qi/0.039h (dla obrazów -bitowych) dpi=qi/0.039h (dla obrazów zapisanych w odcieniach szarości i kolorze) gdzie: dpi = rozdzielczość, z jaką należy skanować dany dokument QI = Quality Index, czyli wartość osiągana dla najmniejszego znaku w tekście. Nie powinien on być niższy niż 8 h = wysokość najmniejszego znaku w tekście Jeśli wyliczona na podstawie wzoru rozdzielczość skanowania jest niższa niż 400 ppi, należy użyć zaleconej wartości minimalnej. Należy w tym miejscu wyjaśnić pewien dualizm nomenklaturowy w kwestii jednostki rozdzielczości. Przyjęło się powszechnie określać ją w punktach na cal (z ang. dots per inch), w skrócie dpi. Jest to poprawna miara, niemniej warto wiedzieć, że jest to jednostka stosowana głównie przy określaniu rozdzielczości wydruku. Przy skanach i obrazach elektronicznych powinno się w zasadzie używać jednostki pikseli na cal (z ang. pixels per inch), czyli ppi. Z tego też względu w pracy zdecydowano się określać rozdzielczość w ppi. Głównym wyznacznikiem dla dokumentów w grupie B jest niewyraźny kontrast, który je dyskwalifikuje z możliwości zapisu w kolorze -bitowym. Poczynając od tej grupy, zgodnie z zaleceniami wszystkie kolejne powinny być zapisane w formacie TIFF z opcjonalnie włączoną bezstratną kompresją LZW. W pierwszej połowie poprzedniego dziesięciolecia takie postępowanie spotykało się z dezaprobatą wśród specjalistów (którzy preferowali czysty TIFF), lecz wraz z rozwojem urządzeń do digitalizacji Standardy, op. cit., s. 06.

45 i oferowanymi przez nie wysokimi rozdzielczościami, oszczędność nawet na jednym pliku może wynosić kilkaset MB, co w przeliczeniu na wiele tysięcy skanów daje oszczędności, których nie można bagatelizować. Grupę B można uznać za zbiór problematycznych przypadków, których stan i forma dyskwalifikują je z grupy pierwszej. W ich przypadku kolor -bitowy zastąpiono odcieniami szarości, w wersji minimalnej z głębią 8-bitową, w wersji optymalnej 6-bitową. Rozdzielczość 300 ppi w większości przypadków daje dobre rezultaty, niemniej zalecono 400 ppi. Gray Gamma. jest powszechnie uznanym wzorcem szarości, którego wartość odpowiada naturalnej luminancji ludzkiego oka. Grupa C zawiera katalog dokumentów o bardziej złożonej zawartości, niejednokrotnie bogatej w detale i niuanse dobrze widoczne dopiero po powiększeniu dokumentu. To tłumaczy jedyną różnicę (w porównaniu z grupą B) w zaleceniach wyrażającą się w dodatkowym wymogu utrzymania dłuższego wymiaru skanu na poziomie nie mniejszym niż 3000 pikseli (wartość zalecana 5000 pikseli). Warunek ten ma za zadanie zapewnić plikom archiwalnym odpowiednią wielkość reprezentowanego obrazu, którego rzeczywiste wymiary mogą być stosunkowo niewielkie. Poza tym wskazanie wspomnianej wartości jest też pomocne dla instytucji, które digitalizują za pomocą aparatów cyfrowych, gdzie rozdzielczość liniowa zastąpiona jest obiektową. Grupa D ogranicza się wyłącznie do fotograficznych negatywów i przezroczy, więc jako pierwsza wymaga (w przypadku negatywów barwnych) zastosowania trybu 8-bitowego koloru co w rezultacie daje 4-bitowy kolor RGB. Wartość zalecana ustalona jest na 6 bitów dla każdego koloru. Jako wzorzec koloru podany jest profil Adobe RGB 998, który wymaga kilku słów wyjaśnienia. Ogólnie przyjętym standardem prezentacji barw w Internecie jest aktualnie srgb 78, będący rozszerzoną wersją RGB. Stosuje się go powszechnie, gdy docelowym medium udostępnienia nie jest druk. Okazuje się, że dla potrzeb poligrafii srgb jest niewystarczający, ponieważ pokrywa zbyt wąski zakres barw z przestrzeni absolutnej (zaledwie 35%). Dlatego też popularność zdobył standard Adobe RGB 998, który reprezentuje około 50% barw. Przy wymaganiach zalecanych dla grup F i G widnieje zapis, że powinien być stosowany profil Adobe RGB 998 lub lepszy, co oznacza że zaleca się korzystanie także z Adobe Wide Gamut RGB (77% barw, w tym 8% spoza 78 srgb. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 45

46 przestrzeni absolutnej) oraz ProPhoto RGB (90%, w tym 3% spoza przestrzeni absolutnej) 79. Dla instytucji digitalizujących przede wszystkim w celu ochrony rzadkich i zniszczonych dokumentów, Adobe RGB 998 jest rozsądnym minimum. Powstaje pytanie, dlaczego mimo wszystko wciąż powszechnie praktykuje się zapisywanie plików w standardzie srgb, skoro Adobe RGB 998 ma większe możliwości i więcej pól zastosowań. Wśród głównych przyczyn można wskazać: nieprawidłową obsługę grafik o przestrzeni większej niż srgb przez popularne przeglądarki internetowe, dodatkową czynność w procesie digitalizacji, jaką jest konwersja do srgb, żeby użytkownik biblioteki cyfrowej miał kontakt z wiernym odwzorowaniem kolorystycznym. Problem polega na tym, że po usunięciu informacji nadmiarowych w trakcie konwersji obraz wynikowy może się różnić od pliku wzorcowego, ponieważ na ogół programy nie umożliwiają zdefiniowania parametrów konwersji 80, jeśli jednak program umożliwia ustawienie parametrów konwersji do srgb, to właściwe dobranie tych parametrów (nie wiążące się z widocznym pogorszeniem się odwzorowań barwnych obrazu w pliku wynikowym) niesie za sobą konieczność posiadania dużych umiejętności i wymaga specjalistycznej wiedzą od osoby zajmującej się konwersją. Prostym rozwiązaniem w tym przypadku byłoby tworzenie w jednym kroku odwzorowania wzorca w obu profilach, z czego srgb miałby charakter bazowy dla późniejszych konwersji do formatów prezentacyjnych. Niestety, takie rozwiązanie niesie za sobą ogromne koszty, ponieważ praktycznie podwaja zapotrzebowanie na ilość pamięci masowej zajmowanej przez wygenerowane pliki. Pewnym wyjściem z sytuacji mogłoby więc być kasowanie plików wzorcowych z profilem srgb po dokonaniu wszystkich przewidzianych konwersji, w przeciwieństwie do plików zawierających barwy opisane profilem Adobe RGB 998, które by zostały przeznaczone do LTP. Twórcy zaleceń nie chcieli jednak dodatkowo komplikować i tak już niełatwej materii, jaką jest problematyka odwzorowania barw i wszystkie jej konsekwencje, więc Standardy op. cit., s Canon 7D: srgb vs. Adobe RGB (998) Color Space. [W:] foto-biz.com [on-line]. Tryb dostępu: [dostęp: r.]. 46

47 postawili na profil bardziej przyszłościowy niż srgb, co uznać należy za dobre posunięcie. Grupa E również charakteryzuje się wąskim zakresem typów dokumentów, ponieważ ogranicza się do mikroform. Zamiast podawać minimalną i zalecaną rozdzielczość, zdecydowano się na uwagę jak dla mikrofilmowanego oryginału w granicach przenoszenia jego cech przez mikrofilm, co należy odczytywać w ten sposób, że rozdzielczość jest podyktowana typem dokumentu oryginalnego, który został zmikrofilmowany. Żeby ją ustalić, należy najpierw przyporządkować utrwalony dokument do jednej z pozostałych grup. Grupa F wydaje się najbardziej pojemna, ponieważ oprócz dokumentów o charakterze typowo archiwalnym i bibliotecznym, zawiera także obiekty muzealne. Stąd wcześniej wspomniane zalecenie, żeby w miarę potrzeb i możliwości używać najbardziej zaawansowanych profili barwnych. Ostatnia grupa to dokumenty wyselekcjonowane ze względu na swoje znaczne rozmiary. Zarówno rozdzielczość minimalna, jak i zalecana, wynoszą 300 ppi. Takie rozwiązanie niewątpliwie podyktowane wielkimi rozmiarami plików wygenerowanych przy użyciu rozdzielczości powyżej 300 ppi może jednak budzić pewne wątpliwości. Niejednokrotnie mapy (lub duże obiekty muzealne ) posiadają dużo detali, których 300 ppi nie jest w stanie właściwie oddać. O ile więc ta wartość jako wymaganie minimalne nie budzi zastrzeżeń, o tyle wartość zalecana powinna wynosić 400 ppi, a w uzasadnionych przypadkach nawet więcej. Faktem jest, że powstające w ten sposób pliki są bardzo trudne do obróbki i zajmują sporo miejsca, dlatego też w innych krajach powoli pojawia się tendencja do stosowania w roli formatu archiwalnego bezstratnej wersji JPEG 000 8, który generuje pliki o zdecydowanie mniejszych rozmiarach, chociaż jest bardziej kłopotliwy w przypadku obróbki i konwersji do innych formatów. Można odnieść wrażenie, że w Standardach ( ) nie została w stopniu satysfakcjonującym poruszona bardzo ważna kwestia dotycząca formatów prezentacyjnych. Na początku publikacji można natknąć się na dość nonszalancką uwagę: Jeśli więc czytelnik niniejszego opracowania spodziewa się, że znajdzie tu tylko tabelkę z wykazem formatów plików możliwych do zastosowania oraz ich parametrów technicznych, to powinien od razu przejść do czytania ostatniego 8 TIFF to JPEG 000? Preservation Planning at the Bavarian State Library Using a Collection of Digitized 6th Century Printings. [W:] D-Lib Magazine [on-line]. Tryb dostępu: [dostęp: r.]. 47

48 rozdziału 8. Po słowie zastosowania umieszczono przypis: to już zostało określone w Rozporządzeniu Rady Ministrów z dnia października 005 w sprawie minimalnych wymagań dla systemów teleinformatycznych (Dziennik Ustaw Nr, poz. 766, zał. i ), i stanowi ogólne ramy, w jakich należy się poruszać 83. Pomijając niefortunność stwierdzenia o ramach, w jakich należy się poruszać (co jest niezgodne z prawdą 84 ), to przecież właśnie dobór odpowiednich formatów prezentacyjnych, a następnie metodologia ich tworzenia, są na ogół najbardziej problematycznym, kosztownym i pochłaniającym czas (i moc obliczeniową komputerów) etapem w całym procesie digitalizacji. Wciąż brak jest źródeł, które w sposób wyczerpujący omówiłyby formaty prezentacyjne (wraz z ich wewnętrznymi odmianami) w połączeniu ze wskazówkami, do których typów dokumentów je stosować, jakiego oprogramowania do ich wygenerowania najlepiej użyć, żeby uniknąć przykrych niespodzianek oraz na co zwrócić uwagę w trakcie pracy z tymi formatami. Najprawdopodobniej przyczyną takiego stanu rzeczy jest potencjalnie szybka utrata aktualności, niemniej brak tego typu opracowań zmusza osoby zajmujące się digitalizacją do samodzielnego wypracowywania odpowiednich ścieżek technologicznych i jeszcze bardziej oddala krajową politykę digitalizacyjną od ujednolicenia Standardy, op. cit., s. 4. Ibidem. Zob. pkt

49 . Metodologia.. Próba badawcza Niniejsza praca dotyczy praktyki generowania obiektów cyfrowych w polskich bibliotekach, bez względu na rodzaj i wielkość tych bibliotek. Jedynym kryterium było ich usytuowanie na terytorium Rzeczypospolitej Polskiej. Ponieważ na dzień r. funkcjonowało w Polsce aż 8.34 samych bibliotek publicznych (wraz z filiami), należało zawęzić grupę potencjalnych respondentów. Tym bardziej, że chociaż digitalizacja na przestrzeni ostatnich lat stała się w Polsce popularną formą działalności bibliotek, wciąż zajmuje się nią stosunkowo niewielki ich odsetek. Ustalenie próby badawczej ułatwił fakt, że zdecydowana większość takich bibliotek udostępnia swoje obiekty za pomocą jednej z 5 działających na terenie kraju bibliotek cyfrowych. Podjęto decyzję, żeby badaniu poddać wszystkie biblioteki tworzące lub współtworzące biblioteki cyfrowe, wchodzące w skład Federacji Bibliotek Cyfrowych 3. Przyjęto następujące założenia: badaniem zostaną objęte nawet najmniejsze biblioteki, jeżeli zostały wymienione wśród instytucji współtworzących daną BC, jeśli wśród instytucji tworzących / współtworzących BC widniała nazwa uczelni, zakładano, że digitalizację nadzoruje biblioteka wyodrębniona w strukturze tej uczelni, archiwa i muzea, nawet jeśli tworzone / współtworzone przez nie BC wchodziły w skład FBC, nie zostały objęte badaniem. Pominięto również wszystkie organizacje, które nie posiadały w swojej strukturze wyraźnie wyodrębnionej biblioteki. W drodze powyższej eliminacji z 6 bibliotek cyfrowych, badaniem objęto 5, których wykaz wraz z tworzącymi je instytucjami znajduje się poniżej: Informacja Instytutu Książki i Czytelnictwa Biblioteki Narodowej o działalności bibliotek publicznych w 00 r. (Opracowano na podstawie danych Głównego Urzędu Statystycznego) [W:] Biblioteka Narodowa Biblioteki Publiczne w Liczbach [on-line]. Tryb dostępu: [dostęp:.0.0 r.]. Stan na dzień r. Liczba ta nie uwzględnia bibliotek cyfrowych tworzonych przez archiwa i muzea. 3 Zestawienie polskich bibliotek cyfrowych. [W:] Federacja Bibliotek Cyfrowych [on-line]. Tryb dostępu: [dostęp: r.]. 49

50 ) Akademicka Biblioteka Cyfrowa KRAKÓW (ABC KRAKÓW) Biblioteka Główna Akademii Górniczo-Hutniczej w Krakowie Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie ) ARMARIUM. dominikańska biblioteka cyfrowa (Armarium) Biblioteka Kolegium Filozoficzno-Teologicznego oo. Dominikanów w Krakowie 3) Bałtycka Biblioteka Cyfrowa (BBC) Miejska Biblioteka Publiczna w Słupsku Biblioteka Publiczna Gminy Wejherowo im. Aleksandra Labudy w Bolszewie Wojewódzka i Miejska Biblioteka Publiczna im. Josepha Conrada Korzeniowskiego w Gdańsku 4) Bialska Biblioteka Cyfrowa (BBC) Miejska Biblioteka Publiczna w Białej Podlaskiej 5) Bibliologiczna Biblioteka Cyfrowa (BBC UW) Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytetu Warszawskiego 6) Biblioteka Cyfrowa Instytutów PAN (BCIPAN) Centralna Biblioteka Matematyczna Instytutu Matematycznego PAN w Warszawie Centralna Biblioteka Geografii i Ochrony Środowiska Instytutu Geografii i Przestrzennego Zagospodarowania PAN w Warszawie 7) Biblioteka Cyfrowa Instytutu Łączności (BC IŁ) Instytut Łączności - Państwowy Instytut Badawczy w Warszawie 8) Biblioteka Cyfrowa Katedry Lingwistyki Formalnej Uniwersytetu Warszawskiego (BC KLF UW) Katedra Lingwistyki Formalnej Uniwersytetu Warszawskiego 9) Biblioteka Cyfrowa Książnicy Stargardzkiej (BCKS) Książnica Stargardzka 0) Biblioteka Cyfrowa Politechniki Krakowskiej (BCPK) Biblioteka Politechniki Krakowskiej 50

51 ) Biblioteka Cyfrowa Politechniki Lubelskiej (BCPL) Biblioteka Politechniki Lubelskiej ) Biblioteka Cyfrowa Politechniki Łódzkiej (ebipol) Biblioteka Politechniki Łódzkiej 3) Biblioteka Cyfrowa Politechniki Śląskiej (BCPS) Biblioteka Główna Politechniki Śląskiej w Gliwicach 4) Biblioteka Cyfrowa Politechniki Warszawskiej (BCPW) Biblioteka Główna Politechniki Warszawskiej 5) Biblioteka Cyfrowa Polskiego Instytutu Antropologii (BCPIA) Biblioteka Główna Instytutu Archeologii i Etnologii PAN w Warszawie Biblioteka Instytutu Etnologii i Antropologii Kulturowej Uniwersytetu Warszawskiego Biblioteka Instytutu Sztuki PAN w Warszawie Polski Instytut Antropologii w Warszawie Biblioteka Polskiego Towarzystwa Ludoznawczego we Wrocławiu 6) Biblioteka Cyfrowa - Regionalia Ziemi Łódzkiej (BC-RZŁ) Wojewódzka i Miejska Biblioteka Publiczna im. Marszałka Józefa Piłsudskiego w Łodzi 7) Biblioteka Cyfrowa UMCS (BC UMCS) Biblioteka Główna Uniwersytetu Marii Curie Skłodowskiej w Lublinie 8) Biblioteka Cyfrowa Uniwersytetu Łódzkiego (BCUŁ) Biblioteka Uniwersytetu Łódzkiego 9) Biblioteka Cyfrowa Uniwersytetu Warmińsko-Mazurskiego (BCUWM) Biblioteka Uniwersytecka, Uniwersytet Warmińsko-Mazurski w Olsztynie 0) Biblioteka Cyfrowa Uniwersytetu Wrocławskiego (BCUWr) Biblioteka Uniwersytecka we Wrocławiu ) Chełmska Biblioteka Cyfrowa (ChBC) Chełmska Biblioteka Publiczna im. Marii Pauliny Orsetti w Chełmie ) Cyfrowa Biblioteka Diecezjalna w Sandomierzu (CBDSandomierz) Biblioteka Diecezjalna w Sandomierzu 3) Cyfrowa Biblioteka Narodowa (CBN Polona) 5

52 Biblioteka Narodowa w Warszawie 4) Cyfrowa Ziemia Sieradzka (CZS) Powiatowa Biblioteka Publiczna w Sieradzu 5) Cyfrowy Dolny Śląsk (CDŚ) Dolnośląska Biblioteka Publiczna im. Tadeusza Mikulskiego we Wrocławiu Jeleniogórskie Centrum Informacji i Edukacji Regionalnej - Książnica Karkonoska w Jeleniej Górze Powiatowa i Miejska Biblioteka Publiczna im. Mikołaja Reja w Oleśnicy Powiatowa i Miejska Biblioteka Publiczna w Oławie Miejska Biblioteka Publiczna im. Marii Dąbrowskiej w Świebodzicach Miejska Biblioteka Publiczna w Zgorzelcu 6) Dolnośląska Biblioteka Cyfrowa (DBC) Biblioteka Główna Akademii Medycznej im. Piastów Śląskich we Wrocławiu Biblioteka Główna Akademii Muzycznej im. Karola Lipińskiego we Wrocławiu Biblioteka Główna Akademii Wychowania Fizycznego we Wrocławiu Biblioteka Główna Politechniki Opolskiej Biblioteka Główna Politechniki Wrocławskiej Biblioteka Główna Uniwersytetu Ekonomicznego we Wrocławiu Biblioteka Główna Uniwersytetu Przyrodniczego we Wrocławiu Biblioteka Państwowej Wyższej Szkoły Teatralnej Filia we Wrocławiu Biblioteka Państwowej Wyższej Szkoły Zawodowej im. Angelusa Silesiusa w Wałbrzychu Biblioteka Państwowej Wyższej Szkoły Zawodowej im. Witelona w Legnicy Biblioteka Państwowej Wyższej Szkoły Zawodowej w Głogowie Biblioteka Państwowej Wyższej Szkoły Zawodowej w Nysie Biblioteka Papieskiego Wydziału Teologicznego we Wrocławiu Biblioteka Wyższej Szkoły Wojsk Lądowych im. gen. Tadeusza Kościuszki we Wrocławiu Dolnośląska Biblioteka Pedagogiczna we Wrocławiu Zakład Narodowy im. Ossolińskich we Wrocławiu 7) e-biblioteka Uniwersytetu Warszawskiego (e-buw) Biblioteka Instytutu Historycznego Uniwersytetu Warszawskiego 5

53 Biblioteka Uniwersytecka w Warszawie Biblioteka Wydziału Prawa i Administracji Uniwersytetu Warszawskiego 8) Elbląska Biblioteka Cyfrowa (EBC) Biblioteka Elbląska im. Cypriana Norwida 9) Iławska Biblioteka Cyfrowa (IBC) Miejska Biblioteka Publiczna w Iławie 30) Internetowa Biblioteka Wzornictwa (IBW) Instytut Wzornictwa Przemysłowego w Warszawie 3) Jagiellońska Biblioteka Cyfrowa (JBC) Biblioteka Jagiellońska w Krakowie 3) Kolbuszowska Biblioteka Cyfrowa (KBC) Miejska i Powiatowa Biblioteka Publiczna w Kolbuszowej 33) Krośnieńska Biblioteka Cyfrowa (KBC Krosno) Krośnieńska Biblioteka Publiczna 34) Księgozbiór Wirtualny Federacji Bibliotek Kościelnych FIDES (KWBK FIDES) Biblioteka im. Jana Pawła II Wyższego Seminarium Duchownego Diecezji Legnickiej w Legnicy Biblioteka Zgromadzenia Księży Misjonarzy w Krakowie Biblioteka Wyższego Seminarium Duchownego Metropolii Warmińskiej HOSIANUM w Olsztynie 35) Kujawsko-Pomorska Biblioteka Cyfrowa (KPBC) Biblioteka Główna Uniwersytetu Kazimierza Wielkiego w Bydgoszczy Biblioteka Główna Uniwersytetu Mikołaja Kopernika w Toruniu Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy Biblioteka Collegium Medicum im. Ludwika Rydygiera UMK w Bydgoszczy Biblioteka Miejska im. Wiktora Kulerskiego w Grudziądzu Biblioteka Państwowej Wyższej Szkoły Zawodowej we Włocławku Miejsko-Powiatowa Biblioteka Publiczna w Rypinie Wojewódzka Biblioteka Publiczna - Książnica Kopernikańska w Toruniu 36) Małopolska Biblioteka Cyfrowa (MBC) 53

54 Biblioteka Książąt Czartoryskich w Krakowie Biblioteka Muzeum Narodowego w Krakowie Miejska Biblioteka Publiczna w Chrzanowie Miejska Biblioteka Publiczna im. Juliusza Słowackiego w Tarnowie Miejska Biblioteka Publiczna w Olkuszu Wojewódzka Biblioteka Publiczna w Krakowie 37) Mazowiecka Biblioteka Cyfrowa (MBC) Biblioteka Publiczna m. st. Warszawy 38) Nowohucka Biblioteka Cyfrowa (NHBC) Nowohucka Biblioteka Publiczna w Krakowie 39) Opolska Biblioteka Cyfrowa (OBC) Wojewódzka Biblioteka Publiczna im. Emanuela Smołki w Opolu 40) Pedagogiczna Biblioteka Cyfrowa (PBC) Biblioteka Główna Uniwersytetu Pedagogicznego im. KEN w Krakowie Biblioteka Instytutu Informacji Naukowej i Bibliotekoznawstwa Uniwersytetu Pedagogicznego w Krakowie Pedagogiczna Biblioteka Wojewódzka im. Hugona Kołłątaja w Krakowie Publiczna Biblioteka Pedagogiczna Książnica Pedagogiczna im. Alfonsa Parczewskiego w Kaliszu 4) Podkarpacka Biblioteka Cyfrowa (PBC) Biblioteka Akademicka Wyższej Szkoły Informatyki i Zarządzania w Rzeszowie Biblioteka Główna Politechniki Rzeszowskiej Biblioteka Uniwersytetu Rzeszowskiego Wojewódzka i Miejska Biblioteka Publiczna w Rzeszowie 4) Podlaska Biblioteka Cyfrowa (PBC) Biblioteka Archidiecezjalnego Wyższego Seminarium Duchownego w Białymstoku Biblioteka Główna Uniwersytetu Medycznego w Białymstoku Biblioteka Politechniki Białostockiej Biblioteka Uniwersytecka im. Jerzego Giedroycia w Białymstoku Biblioteka Uniwersytetu Muzycznego Fryderyka Chopina. Wydział Instrumentalno-Pedagogiczny w Białymstoku 54

55 Książnica Podlaska im. Łukasza Górnickiego w Białymstoku 43) Pomorska Biblioteka Cyfrowa (PBC) Biblioteka Akademii Sztuk Pięknych w Gdańsku Biblioteka Akademii Wychowania Fizycznego i Sportu im. Jędrzeja Śniadeckiego w Gdańsku Biblioteka Gdańska Polskiej Akademii Nauk Biblioteka Główna Akademii Morskiej w Gdyni Biblioteka Główna Akademii Muzycznej im. Stanisława Moniuszki w Gdańsku Biblioteka Główna Gdańskiego Uniwersytetu Medycznego Biblioteka Główna Politechniki Gdańskiej Biblioteka Główna Uniwersytetu Gdańskiego Biblioteka Pedagogiczna w Kartuzach Miejska Biblioteka Publiczna w Gdyni Ośrodek Informacji Naukowej - Biblioteka Naukowa Morskiego Instytutu Rybackiego w Gdyni Pedagogiczna Biblioteka Wojewódzka im. Gdańskiej Macierzy Szkolnej w Gdańsku Pedagogiczna Biblioteka Wojewódzka w Słupsku 44) Radomska Biblioteka Cyfrowa (RBC) Biblioteka Radomskiego Towarzystwa Naukowego Miejska Biblioteka Publiczna im. Józefa A. i Andrzeja S. Załuskich w Radomiu 45) Sanocka Biblioteka Cyfrowa (SBC) Miejska Biblioteka Publiczna im. Grzegorza z Sanoka w Sanoku 46) Śląska Biblioteka Cyfrowa (ŚBC) Biblioteka Akademii Sztuk Pięknych w Katowicach Biblioteka Centrum Dziedzictwa Przyrody Górnego Śląska w Katowicach Biblioteka Główna Akademii im. Jana Długosza w Częstochowie Biblioteka Główna Akademii Muzycznej im. Karola Szymanowskiego w Katowicach Biblioteka Główna Akademii Techniczno-Humanistycznej w Bielsku-Białej 55

56 Biblioteka Główna Akademii Wychowania Fizycznego im. Jerzego Kukuczki w Katowicach Biblioteka Główna Politechniki Częstochowskiej Biblioteka Główna Uniwersytetu Ekonomicznego w Katowicach Biblioteka Główna Uniwersytetu Opolskiego Biblioteka Górnośląskiej Wyższej Szkoły Pedagogicznej w Mysłowicach Biblioteka Miejska w Cieszynie Biblioteka Pałacu Młodzieży w Katowicach Biblioteka Publiczna im. Wł. Biegańskiego w Częstochowie Biblioteka Śląska Biblioteka Śląskiego Uniwersytetu Medycznego w Katowicach Biblioteka Uniwersytetu Śląskiego w Katowicach Biblioteka Wyższej Szkoły Administracji w Bielsku-Białej Biblioteka Wyższej Szkoły Bankowej w Poznaniu Wydział Zamiejscowy w Chorzowie Biblioteka Wyższej Szkoły Biznesu w Dąbrowie Górniczej Biblioteka Wyższej Szkoły Humanitas w Sosnowcu Biblioteka Wyższej Szkoły Lingwistycznej w Częstochowie Książnica Beskidzka w Bielsku-Białej Książnica Cieszyńska Miejska Biblioteka Publiczna im. Jerzego Fusieckiego w Zabrzu Miejska Biblioteka Publiczna w Bytomiu Miejska Biblioteka Publiczna w Czeladzi Miejska Biblioteka Publiczna w Dąbrowie Górniczej Miejska Biblioteka Publiczna w Jastrzębiu-Zdroju Miejska Biblioteka Publiczna w Jaworznie Miejska Biblioteka Publiczna w Piekarach Śląskich Miejska Biblioteka Publiczna w Rudzie Śląskiej Miejska Biblioteka Publiczna w Sosnowcu Miejska Biblioteka Publiczna w Tarnowskich Górach Miejska Biblioteka Publiczna w Żorach Miejska i Gminna Biblioteka Publiczna w Głubczycach Miejska i Powiatowa Biblioteka Publiczna im. Ryszarda Knicla w Raciborzu Miejska i Powiatowa Biblioteka Publiczna w Wodzisławiu Śląskim 56

57 Miejsko-Powiatowa Biblioteka Publiczna w Pszczynie Pedagogiczna Biblioteka Wojewódzka im. Józefa Lompy w Katowicach Powiatowa Biblioteka Publiczna w Gliwicach Powiatowa i Miejska Biblioteka Publiczna w Rybniku 47) Świętokrzyska Biblioteka Cyfrowa (ŚBC) Wojewódzka Biblioteka Publiczna im. Witolda Gombrowicza w Kielcach 48) Tarnowska Biblioteka Cyfrowa (TBC) Miejska Biblioteka Publiczna im. J. Słowackiego w Tarnowie 49) Wejherowska Biblioteka Cyfrowa (WBC) Powiatowa i Miejska Biblioteka Publiczna im. Aleksandra Majakowskiego w Wejherowie 50) Wielkopolska Biblioteka Cyfrowa (WBC) Biblioteka Główna Akademii Muzycznej im. Ignacego Jana Paderewskiego w Poznaniu Biblioteka Główna Akademii Sztuk Pięknych w Poznaniu Biblioteka Główna Akademii Wychowania Fizycznego w Poznaniu Biblioteka Główna i Centrum Informacji Naukowej Uniwersytetu Przyrodniczego w Poznaniu Biblioteka Główna Politechniki Poznańskiej Biblioteka Główna Uniwersytetu Ekonomicznego w Poznaniu Biblioteka Główna Uniwersytetu Medycznego w Poznaniu Biblioteka Instytutu Historii UAM w Poznaniu Biblioteka Instytutu Zachodniego w Poznaniu Biblioteka Kórnicka PAN w Poznaniu Biblioteka Poznańskiego Towarzystwa Przyjaciół Nauk w Poznaniu Biblioteka Publiczna im. Stefana Rowińskiego w Ostrowie Wielkopolskim Biblioteka Raczyńskich w Poznaniu Biblioteka Uniwersytecka w Poznaniu Centralna Biblioteka Wojskowa im. Marszałka Józefa Piłsudskiego w Warszawie Powiatowa Biblioteka Publiczna w Szamotułach 5) Zachodniopomorska Biblioteka Cyfrowa POMERANIA (ZBC POMERANIA) Biblioteka Główna Akademii Morskiej w Szczecinie 57

58 Biblioteka Główna Pomorskiego Uniwersytetu Medycznego w Szczecinie Biblioteka Główna Uniwersytetu Szczecińskiego Biblioteka Główna Zachodniopomorskiego Uniwersytetu Technologicznego w Szczecinie Biblioteka Politechniki Koszalińskiej Koszalińska Biblioteka Publiczna im. Joachima Lelewela Książnica Pomorska w Szczecinie Miejska Biblioteka Publiczna im. Galla Anonima w Kołobrzegu Miejska Biblioteka Publiczna w Szczecinie Publiczna Biblioteka Pedagogiczna Zachodniopomorskiego Centrum Doskonalenia Nauczycieli w Szczecinie 5) Zielonogórska Biblioteka Cyfrowa (ZBC) Biblioteka Sztuki Uniwersytetu Zielonogórskiego Biblioteka Uniwersytecka Uniwersytetu Zielonogórskiego Wojewódzka i Miejska Biblioteka Publiczna im. C. Norwida w Zielonej Górze Wyłoniono w ten sposób 86 potencjalnych respondentów. Po opracowaniu wykazu, dokładnie przeanalizowano dostępne w Internecie informacje o każdej z instytucji, w celu zdobycia adresów , pod które należało wysłać zaproszenie do wzięcia udziału w badaniu. Żeby ograniczyć do minimum sytuację, w której wspomniane zaproszenie będzie później przesyłane z działu do działu w poszukiwaniu kompetentnej osoby, skupiono się na wyszukaniu danych kontaktowych do osób bezpośrednio odpowiedzialnych za digitalizację w danej instytucji. Zastosowano następujący tryb postępowania: na stronie WWW każdej instytucji objętej badaniem, szukano w strukturze organizacyjnej komórki zajmującej się digitalizacją. Następnie: gdy taka komórka istniała, zaproszenie kierowano do kierownika tej komórki lub (gdy nie znaleziono informacji o jego adresie ) na adres ogólny komórki. Jeśli on również nie był podany, wysyłano zaproszenie na ogólny adres biblioteki, gdy brak było informacji o wyspecjalizowanej komórce, a biblioteka była jedną z kilku współtworzących daną BC, zaproszenie wysyłano do działu zajmującego się komputeryzacją w danej bibliotece, 58

59 gdy nie stwierdzono istnienia wspomnianej komórki, a jednocześnie BC tworzona była tylko przez tę jedną instytucję, prośbę wysyłano na adres znaleziony w danych kontaktowych umieszczonych bezpośrednio w danej bibliotece cyfrowej. Ustalona próba badawcza miała więc charakter nieprobabilistyczny i chociaż z jednej strony stanowiła pewną całość, z drugiej jednak od początku obarczona była wysokim ryzykiem niewielkiej ilości zwrotów. Główną przyczyną nie była w tym wypadku kompleksowość badania (która również stanowiła istotny negatywny czynnik, o czym będzie mowa w następnym punkcie), lecz fakt, że wiele instytucji współtworzących biblioteki cyfrowe uczestniczy w tych projektach w sposób bierny, tzn. wyłącznie poprzez dostarczanie dokumentów do digitalizacji. Niestety nie istniał żaden sposób, który pozwalałby na wyeliminowanie takich bibliotek ze zbioru instytucji objętych badaniem. Brak tu było jakiegokolwiek schematu a najbardziej oczywisty, polegający na wyeliminowaniu bibliotek z mniejszych miejscowości byłby nie dość że kłopotliwy (ponieważ wymagałby ustalenia kryterium wielkości miejscowości, a następnie ponownego przefiltrowania grupy), to z gruntu obarczony błędem. Niejednokrotnie biblioteki z mniejszych miejscowości na własną rękę samodzielnie digitalizują całkiem spore ilości materiałów, podczas gdy duże biblioteki decydują się na całkowity outsourcing. Żeby więc apriorycznie nie zawęzić grupy potencjalnych respondentów, zdecydowano się na objęcie badaniem wszystkich bibliotek występujących w wykazie Federacji Bibliotek Cyfrowych... Narzędzie badawcze Przed wyborem odpowiedniego narzędzia badawczego, fundamentalne znaczenie miała odpowiedź na pytanie jaki jest cel badania. Już na etapie tworzenia koncepcji pracy założono, że celem tym będzie konfrontacja zaleceń opisanych w punkcie.4.3 z obecną biblioteczną praktyką digitalizowania dokumentów oraz próba całościowej oceny najpopularniejszych rozwiązań. Zatem jako tryb badawczy zastosowano dedukcję, gdzie rolę hipotezy (teorii oczekiwań) pełniły założenia ujęte w Standardach w procesie digitalizacji obiektów dziedzictwa kulturowego 4. Zdecydowano się na metodę ilościową przyjmując, że grupa badawcza będzie miała za zadanie wskazać stosowane przez siebie szczegółowe praktyki w kwestii 4 Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego. Pod red. G. Płoszajskiego [dokument elektroniczny]. Warszawa: Biblioteka Główna Politechniki Warszawskiej, 008. Tryb dostępu: [dostęp: r.]. 59

60 digitalizacji. Następnie wszystkie wyniki miały zostać poddane analizie i w ostatniej fazie skonfrontowane z krajowymi zaleceniami. Zakres badania został dodatkowo poszerzony (w stosunku do zaleceń, gdzie mowa jest głównie o metadanych i parametrach plików archiwalnych) o szczegółowe dane dotyczące generowanych plików prezentacyjnych (docelowych obiektów cyfrowych) i metody przechowywania całej cyfrowej produkcji. Zabieg ten miał na celu spojrzenie na digitalizację w polskich bibliotekach z szerszej perspektywy i próbę oceny, czy jakiekolwiek zmiany są potrzebne, a jeśli tak czy realne byłoby ich wdrożenie na obecnym etapie, gdy biblioteki posiadają własne ścieżki technologiczne, z których raczej nie będą chciały rezygnować. Metoda ilościowa implikowała wykorzystanie ankiety ze zmiennymi i predefiowanymi wartościami (tam, gdzie tylko istniała taka możliwość), które miały ułatwić ukazanie skali określonych praktyk w postaci liczb reprezentujących częstotliwość występowania najpopularniejszych wartości. Zastosowanie Standardów ( ) jako hipotezy wiązało się z przygotowaniem ankiety o wysokim stopniu szczegółowości. Nie wystarczyło przykładowo zapytać respondentów o parametry skanowania pewnego typu dokumentów, lecz żeby móc skonfrontować wyniki z zaleceniami należało rozbić poszczególne typy dokumentów na podgrupy (rodzaje dokumentów), z których każda zawierała własny zbiór pytań. Poza tym osobie zajmującej się digitalizacją trudno odpowiedzieć na pytanie, z jaką rozdzielczością skanuje wszystkie książki, w jakim trybie i przy jakiej głębi koloru. Parametry te znacznie się od siebie różnią, w zależności od charakterystyki danej książki bądź grupy książek. Zatem pozorne uproszczenie pytań tylko skomplikowałoby udzielenie właściwej odpowiedzi. Ponieważ od początku było wiadomo, że ankieta będzie miała złożoną strukturę i będzie zawierała kilkadziesiąt pytań, powstała kwestia jej potencjalnych zwrotów. Ilość i szczegółowość pytań należało więc zrównoważyć zmniejszeniem do absolutnego minimum liczby pytań otwartych i przejrzystością konstrukcji, która automatycznie wymusiła wykorzystanie pytań warunkowych. Należało respondentom umożliwić wyklikanie jak największej części ankiety. To z kolei pociągało za sobą przygotowanie wszystkich możliwych wartości (odpowiedzi) dla danej zmiennej (pytania). Oprócz tego w wielu przypadkach użytkownik miał możliwość ręcznego wprowadzenia wartości nie uwzględnionej w ankiecie. Kolejnym dylematem była anonimowość ankiety. Można było wyposażyć ją w listę wszystkich respondentów, z której każdy mógłby wybrać instytucję, którą 60

61 reprezentuje, można też było zostawić miejsce przeznaczone do samodzielnego wpisania nazwy instytucji. Zdecydowano się jednak na pełną anonimowość. Niejednokrotnie instytucje digitalizują dokumenty własnym sumptem w sposób, który stoi w opozycji do współczesnych dobrych praktyk i istniało prawdopodobieństwo, że osoba wypełniająca ankietę będzie bała się potencjalnej odpowiedzialności za wskazane dane, bądź będzie wybierała odpowiedzi postulatywne, nie mające wiele wspólnego z faktycznym procesem digitalizacji w danej instytucji. Anonimowość pozwalała na pewną swobodę i niezobowiązujące podejście respondenta, co oczywiście mogło mieć również swoje negatywne aspekty. Niemniej wydaje się, że zalety wybranego rozwiązania przeważały nad mankamentami, stąd informację o anonimowości bardzo wyraźnie wyeksponowano już w tekście wprowadzającym do ankiety (wyświetlającym się respondentom po wejściu na stronę WWW z ankietą)..3. Schemat ankiety I. Tekst wprowadzający Szanowni Państwo, Niniejsza ankieta jest anonimowa i dotyczy digitalizacji sensu stricto, tzn. etapu od rozpoczęcia skanowania, poprzez wytworzenie i zachowanie plików archiwalnych, aż po wygenerowanie odpowiednich formatów prezentacyjnych. Nie porusza ona zagadnień związanych z całą otoczką digitalizacji (tzn. etapów przygotowawczych i związanych z udostępnianiem). Jej celem jest zbadanie aktualnie przyjętych w Polsce sposobów postępowania ze zdigitalizowanymi dokumentami, czyli stosowanych parametrów skanów / fotografii w zależności od zasobu, generowanych formatów i oprogramowania służącego do pracy z otrzymanymi plikami graficznymi. Wypełnienie ankiety powinno zająć Państwu od 0 do 45 minut w zależności od różnorodności zbiorów, które Państwo digitalizują. Ponadto ankieta nie zawiera pytań opisowych. Uprzejmie proszę o jej wypełnienie do dnia 4 czerwca 0 r. Uwaga proszę o przemyślane odpowiedzi, ponieważ ankieta nie zawiera mechanizmu powrotu do poprzedniej strony. Gdy Państwo stwierdzicie, że po drodze mogły wystąpić błędne odpowiedzi, proszę wypełnić ankietę jeszcze raz pod uwagę brana będzie wyłącznie ostatnia wersja. Z góry dziękuję za czas poświęcony na wypełnienie ankiety Aleksander Trembowiecki 6

62 II. Ankieta Objaśnienie: wartość warunkowa jej wybór skutkuje pojawieniem się dodatkowych pytań o wartość jednokrotnego wyboru (można wskazać tylko jedną w obrębie grupy) wartość wielokrotnego wyboru (można wskazać więcej niż jedną w obrębie grupy) pole tekstowe występujące na ogół, gdy respondent wybrał wartość inną niż wymienione RODZAJ DOKUMENTU grupa zmiennych wraz z wartościami: <rodzaj_dokumentu> Rozdzielczość (ppi) Tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor Wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 Adobe Wide Gamut RGB ProPhoto RGB Nie wiem Inny wzorzec niż wymienione Inny wzorzec niż wymienione Pierwotny format zapisu TIFF bez kompresji TIFF z kompresją CCITT TIFF z kompresją LZW TIFF z kompresją JPEG Rodzaj generowanych plików TIFF jednostronicowe wielostronicowe JPEG bez kompresji JPEG z kompresją JPEG 000 bez kompresji JPEG 000 z kompresją RAW 6

63 DNG BMP PNG PDF bez wewnętrznej kompresji grafik PDF z wewnętrzną kompresją bezstratną grafik PDF z wewnętrzną kompresją stratną grafik Inny format Inny format </rodzaj_dokumentu> Strona : Model digitalizacji Proszę wskazać stosowany w bibliotece model digitalizacji o Samodzielne skanowanie / fotografowanie dokumentów o Całkowity outsourcing o Częściowy outsourcing Przyczyna zdecydowania się na częściowy outsourcing związana z rodzajem dokumentów związana z formatem dokumentów związana z pozyskaniem funduszy celowych na digitalizację inna przyczyna Inna przyczyna Szacunkowy procent skanów zleconych na zewnątrz w stosunku do wykonywanych samodzielnie o do 0% o -5% o 6-50% o 5-75% o powyżej 75% Strona : Parametry digitalizacji W jaki sposób ustalono parametry skanowania i format zapisu plików archiwalnych dla poszczególnych typów dokumentów? na podstawie własnych doświadczeń na podstawie cudzych doświadczeń na podstawie krajowych zaleceń na podstawie zagranicznych zaleceń / standardów w inny sposób Inny sposób Jak ustalana jest rozdzielczość skanowania? Pytanie nie dotyczy digitalizacji za pomocą aparatu cyfrowego (w takim przypadku proszę je pominąć). na podstawie widocznych cech indywidualnych dokumentu na podstawie przynależności dokumentu do określonej grupy, dla której wcześniej przyjęto pewną stałą rozdzielczość 63

64 jest obliczana dla każdego dokumentu (grupy dokumentów), np. na podstawie wysokości najmniejszego znaku w inny sposób Inny sposób Strona 3: Typy digitalizowanych dokumentów książki Książki czarno-biała treść RODZAJ DOKUMENTU Książki monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Książki zawierające czarno-białe ilustracje RODZAJ DOKUMENTU Książki zawierające ilustracje w odcieniach szarości RODZAJ DOKUMENTU Książki zawierające kolorowe ilustracje RODZAJ DOKUMENTU Strona 4: Typy digitalizowanych dokumentów gazety Gazety czarno-biała treść RODZAJ DOKUMENTU Gazety monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Gazety zawierające czarno-białe ilustracje RODZAJ DOKUMENTU Gazety zawierające ilustracje w odcieniach szarości RODZAJ DOKUMENTU Gazety zawierające kolorowe ilustracje RODZAJ DOKUMENTU Strona 5: Typy digitalizowanych dokumentów czasopisma Czasopisma czarno-biała treść RODZAJ DOKUMENTU Czasopisma monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Czasopisma zawierające czarno-białe ilustracje RODZAJ DOKUMENTU Czasopisma zawierające ilustracje w odcieniach szarości 64

65 RODZAJ DOKUMENTU Czasopisma zawierające kolorowe ilustracje RODZAJ DOKUMENTU Strona 6: Typy digitalizowanych dokumentów rękopisy Rękopisy wyraźny kontrast RODZAJ DOKUMENTU Rękopisy niewyraźny kontrast RODZAJ DOKUMENTU Strona 7: Typy digitalizowanych dokumentów inkunabuły Inkunabuły RODZAJ DOKUMENTU Strona 8: Typy digitalizowanych dokumentów stare druki Stare druki RODZAJ DOKUMENTU Strona 9: Typy digitalizowanych dokumentów grafiki (w tym m.in. rysunki, obrazy, plakaty do formatu A włącznie) Grafiki czarno-białe RODZAJ DOKUMENTU Grafiki monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Grafiki w odcieniach szarości RODZAJ DOKUMENTU Grafiki kolorowe RODZAJ DOKUMENTU Strona 0: Typy digitalizowanych dokumentów grafiki wielkoformatowe (w tym m.in. rysunki, obrazy, plakaty powyżej formatu A) Grafiki wielkoformatowe czarno-białe RODZAJ DOKUMENTU Grafiki wielkoformatowe monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Grafiki wielkoformatowe w odcieniach szarości 65

66 RODZAJ DOKUMENTU Grafiki wielkoformatowe kolorowe RODZAJ DOKUMENTU Strona : Typy digitalizowanych dokumentów mapy (do formatu A włącznie) Mapy czarno-białe z wyraźnym kontrastem RODZAJ DOKUMENTU Mapy czarno-białe z niewyraźnym kontrastem RODZAJ DOKUMENTU Mapy monochromatyczne RODZAJ DOKUMENTU Mapy w odcieniach szarości RODZAJ DOKUMENTU Mapy kolorowe RODZAJ DOKUMENTU Strona : Typy digitalizowanych dokumentów mapy wielkoformatowe (powyżej formatu A) Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem RODZAJ DOKUMENTU Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem RODZAJ DOKUMENTU Mapy wielkoformatowe monochromatyczne RODZAJ DOKUMENTU Mapy wielkoformatowe w odcieniach szarości RODZAJ DOKUMENTU Mapy wielkoformatowe kolorowe RODZAJ DOKUMENTU Strona 3: Typy digitalizowanych dokumentów odbitki fotograficzne Odbitki fotograficzne monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Odbitki fotograficzne w odcieniach szarości RODZAJ DOKUMENTU Odbitki fotograficzne kolorowe RODZAJ DOKUMENTU 66

67 Strona 4: Typy digitalizowanych dokumentów negatywy, przezrocza Negatywy, przezrocza monochromatyczne (np. w sepii) RODZAJ DOKUMENTU Negatywy, przezrocza w odcieniach szarości RODZAJ DOKUMENTU Negatywy, przezrocza kolorowe RODZAJ DOKUMENTU Strona 5: Typy digitalizowanych dokumentów mikroformy Mikrofilmy RODZAJ DOKUMENTU Mikrofisze RODZAJ DOKUMENTU Mikrokarty RODZAJ DOKUMENTU Strona 6: Typy digitalizowanych dokumentów prace licencjackie, magisterskie, doktorskie Prace czarno-biała treść RODZAJ DOKUMENTU Prace zawierające czarno-białe elementy graficzne RODZAJ DOKUMENTU Prace zawierające elementy graficzne w odcieniach szarości RODZAJ DOKUMENTU Prace zawierające kolorowe elementy graficzne RODZAJ DOKUMENTU Strona 7: Typy digitalizowanych dokumentów dokumenty urzędowe Dokumenty urzędowe czarno-biała treść RODZAJ DOKUMENTU Dokumenty urzędowe zawierające czarno-białe elementy graficzne RODZAJ DOKUMENTU Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości RODZAJ DOKUMENTU Dokumenty urzędowe zawierające kolorowe elementy graficzne RODZAJ DOKUMENTU 67

68 Strona 8: Typy digitalizowanych dokumentów maszynopisy Maszynopisy z wyraźnym kontrastem RODZAJ DOKUMENTU Maszynopisy z niewyraźnym kontrastem RODZAJ DOKUMENTU Strona 9: Typy digitalizowanych dokumentów nuty Nuty z wyraźnym kontrastem RODZAJ DOKUMENTU Nuty z niewyraźnym kontrastem RODZAJ DOKUMENTU Strona 0: Typy digitalizowanych dokumentów rysunki techniczne Rysunki techniczne z wyraźnym kontrastem RODZAJ DOKUMENTU Rysunki techniczne z niewyraźnym kontrastem RODZAJ DOKUMENTU Strona : Typy dokumentów inne, niż wskazane wcześniej Inny typ dokumentów Proszę podać typ dokumentu RODZAJ DOKUMENTU Inny typ dokumentów Proszę podać typ dokumentu RODZAJ DOKUMENTU Inny typ dokumentów Proszę podać typ dokumentu RODZAJ DOKUMENTU Inny typ dokumentów Proszę podać typ dokumentu RODZAJ DOKUMENTU Inny typ dokumentów Proszę podać typ dokumentu RODZAJ DOKUMENTU Strona : Pliki archiwalne Jak postępują Państwo z plikami uzyskanymi w trakcie skanowania / fotografowania? 68

69 o Pliki archiwalne objęte są polityką długotrwałego przechowywania Proszę wybrać stosowaną politykę długotrwałego przechowywania plików o Outsourcing o Samodzielne przechowywanie o Model mieszany Proszę wskazać stosowane typy nośników, na których docelowo przechowywane są pliki Pojedyncze dyski optyczne Dyski optyczne obsługiwane przez zmieniarkę Pojedyncze dyski magnetooptyczne Dyski magnetooptyczne obsługiwane przez zmieniarkę Niezorganizowane dyski twarde Macierze dyskowe NAS Nośniki taśmowe Inny typ nośników Proszę opisać nośnik używany do LTP o Pliki archiwalne po stworzeniu na ich podstawie wersji prezentacyjnych są kasowane o Stosowany jest inny model postępowania Proszę opisać model postępowania z plikami archiwalnymi Korekta plików archiwalnych o Obrazy zapisane w plikach archiwalnych nie są korygowane o Obrazy zapisane w plikach archiwalnych są korygowane Sposób przeprowadzania korekty o Wsadowo o Ręcznie o W sposób mieszany Czynności wykonywane w trakcie korekty Kadrowanie Korekcja kolorów Obrót o kąty będące wielokrotnością 90 st. Zmiana wymiarów obrazów Zmiana rozdzielczości Zmiana głębi bitowej koloru Obrót o dowolny kąt (korekta przekoszenia) Korekcja jasności Korekcja kontrastu Korekcja nasycenia Korekcja ostrości Eliminacja artefaktów i zniekształceń Inne czynności Proszę wymienić dodatkowe czynności korekcyjne Oprogramowanie stosowane do korekty skanów Oprogramowanie dostarczone przez producenta skanera / aparatu 69

70 Adobe Photoshop Adobe Photoshop Elements GIMP Corel Photo-Paint Corel Paint Shop Pro IrfanView ACDSee Inny program Proszę podać nazwę posiadanego oprogramowania o Korygowane są wyłącznie kopie plików archiwalnych, oryginały przechowywane są w formie niezmienionej Sposób postepowania ze skorygowanymi kopiami o Podobnie jak oryginały objęte są polityką długotrwałego przechowywania o Są kasowane po dokonaniu docelowej konwersji na formaty prezentacyjne o Stosowany jest inny model postępowania Proszę opisać model postępowania z kopiami Strona 3: Pliki prezentacyjne DjVu Oprogramowanie stosowane do generowania i edycji plików DjVu DocumentExpress Desktop DocumentExpress Professional DocumentExpress Enterprise DjVuLibre PDFDjVu Inny program Proszę podać nazwę posiadanego programu Proszę zaznaczyć, z których profili Państwo korzystają Normal Electronic Photo Bitonal Manuscript Drawing Map Własny profil Trudno powiedzieć Proszę podać przeciętną rozdzielczość stosowaną dla formatu Czy w wygenerowanych plikach tworzone są systemy zakładek odzwierciedlające strukturę dokumentu (np. rozdziały)? o Tak we wszystkich plikach o Tak, ale tylko w niektórych plikach o Nie 70

71 PDF W jaki sposób zabezpieczają Państwo pliki DjVu? Wygenerowane pliki nie są zabezpieczone Pliki posiadają znak wodny Pliki są zabezpieczone w inny sposób Proszę opisać sposób ochrony plików Czy poddają Państwo pliki DjVu OCRowi? o Nie o Tak za pomocą mechanizmu wbudowanego w DocumentExpress o Tak proces OCR jest realizowany przez zewnętrzne oprogramowanie (np. ABBYY FineReader) o Tak przy zastosowaniu modelu mieszanego (mechanizm wbudowany w DocumentExpress oraz oprogramowanie zewnętrzne w zależności od dokumentu/grupy dokumentów) Czy posiadają Państwo w swoich repozytoriach pliki DjVu zawierające tekst, lecz nie poddane OCR? o Nie o Tak Jaki procent wszystkich posiadanych przez Państwa plików DjVu stanowią nierozpoznane pliki DjVu zawierające tekst? o do 0% o -5% o 6-50% o 5-75% o powyżej 75% Czy zamierzają Państwo w przyszłości poddać OCRowi nierozpoznane pliki DjVu? o Nie o Tak o Trudno powiedzieć Oprogramowanie stosowane do generowania i edycji plików PDF Adobe Acrobat Standard Adobe Acrobat Pro ABBYY FineReader Inny program Proszę podać nazwę posiadanego programu Proszę zaznaczyć, które typy PDF Państwo generują Standardowy PDF PDF/X PDF/A PDF/E PDF/VT PDF/UA Trudno powiedzieć Proszę podać przeciętną rozdzielczość stosowaną dla formatu 7

72 JPEG Czy w wygenerowanych plikach tworzone są systemy zakładek odzwierciedlające strukturę dokumentu (np. rozdziały)? o Tak we wszystkich plikach o Tak, ale tylko w niektórych plikach o Nie W jaki sposób zabezpieczają Państwo pliki PDF? Wygenerowane pliki nie są zabezpieczone Pliki posiadają znak wodny Pliki są chronione przed modyfikacją Pliki są chronione przed drukowaniem Pliki są chronione przed kopiowaniem Pliki są zabezpieczone w inny sposób Proszę opisać sposób ochrony plików Czy poddają Państwo pliki PDF OCRowi? o Nie o Tak za pomocą mechanizmu wbudowanego w Adobe Acrobat o Tak proces OCR jest realizowany przez zewnętrzne oprogramowanie (np. ABBYY FineReader) o Tak przy zastosowaniu modelu mieszanego (mechanizm wbudowany w Adobe Acrobat oraz oprogramowanie zewnętrzne w zależności od dokumentu/grupy dokumentów) Czy posiadają Państwo w swoich repozytoriach pliki PDF zawierające tekst, lecz nie poddane OCR? o Nie o Tak Jaki procent wszystkich posiadanych przez Państwa plików PDF stanowią nierozpoznane pliki PDF zawierające tekst? o do 0% o -5% o 6-50% o 5-75% o powyżej 75% Czy zamierzają Państwo w przyszłości poddać OCRowi nierozpoznane pliki PDF? o Nie o Tak o Trudno powiedzieć Jaki charakter mają wygenerowane pliki JPEG? o Kompresja stratna o Kompresja bezstratna o Kompresja stratna lub bezstratna w zależności od dokumentu / grupy dokumentów Proszę podać przeciętną rozdzielczość stosowaną dla formatu W jaki sposób zabezpieczają Państwo pliki JPEG? Wygenerowane pliki nie są zabezpieczone 7

73 Pliki posiadają widoczny znak wodny Pliki posiadają niewidoczny znak wodny Pliki są zabezpieczone w inny sposób Proszę opisać wspomniany inny sposób ochrony JPEG 000 Jaki charakter mają wygenerowane pliki JPEG 000? o Kompresja stratna o Kompresja bezstratna o Kompresja stratna lub bezstratna w zależności od dokumentu / grupy dokumentów Proszę podać przeciętną rozdzielczość stosowaną dla formatu W jaki sposób zabezpieczają Państwo pliki JPEG 000? Wygenerowane pliki nie są zabezpieczone Pliki posiadają widoczny znak wodny Pliki posiadają niewidoczny znak wodny Pliki są zabezpieczone w inny sposób Proszę opisać wspomniany inny sposób ochrony PNG Proszę podać przeciętną rozdzielczość stosowaną dla formatu W jaki sposób zabezpieczają Państwo pliki PNG? Wygenerowane pliki nie są zabezpieczone Pliki posiadają widoczny znak wodny Pliki posiadają niewidoczny znak wodny Pliki są zabezpieczone w inny sposób Proszę opisać wspomniany inny sposób ochrony GIF Proszę podać przeciętną rozdzielczość stosowaną dla formatu W jaki sposób zabezpieczają Państwo pliki GIF? Wygenerowane pliki nie są zabezpieczone Pliki posiadają widoczny znak wodny Pliki posiadają niewidoczny znak wodny Pliki są zabezpieczone w inny sposób Proszę opisać wspomniany inny sposób ochrony Inny format Proszę podać nazwę formatu Proszę podać przeciętną rozdzielczość stosowaną dla formatu W jaki sposób zabezpieczają Państwo pliki w tym formacie? Wygenerowane pliki nie są zabezpieczone Pliki posiadają widoczny znak wodny Pliki posiadają niewidoczny znak wodny Pliki są zabezpieczone w inny sposób Proszę opisać wspomniany inny sposób ochrony 73

74 Strona 4: Głęboka digitalizacja Czy stosują Państwo głęboką digitalizację, tzn. wyekstrahowanie tekstu za pomocą OCR i następnie zredagowanie otrzymanych wyników? o Nie o Tak Proszę podać szacunkowy procentowy udział dokumentów poddanych głębokiej digitalizacji w stosunku do ogółu zdigitalizowanych dokumentów o do 0% o -5% o 6-50% o 5-75% o powyżej 75% Proszę wskazać format archiwalny (przeznaczony do długotrwałego przechowywania), w jakim zapisywany jest materiał uzyskany w wyniku głębokiej digitalizacji. DOC (DOCX) RTF ODT HTML (XHTML) XML TXT Inny format Proszę podać używany format archiwalny Jakie formaty prezentacyjne tworzone są w wyniku głębokiej digitalizacji? PDF DjVu DOC (DOCX) RTF ODT HTML (XHTML) Inny format Proszę podać używany format prezentacyjny Jak traktowany jest układ treści zawarty w dokumencie oryginalnym, podczas tworzenia formatu prezentacyjnego? o Wersja elektroniczna posiada odtworzony oryginalny układ treści (gdy format to umożliwia) o Wersja elektroniczna posiada zmieniony układ treści Strona 5: Metadane Proszę wskazać sposób wypełniania metadanych EXIF o Metadane są fabrycznie zdefiniowane i w całości automatycznie generowane przez system obsługujący skaner / aparat cyfrowy o Metadane są fabrycznie zdefiniowane i automatycznie generowane przez system obsługujący skaner / aparat cyfrowy, a następnie automatycznie lub ręcznie modyfikowane 74

75 o Zakres i wartości metadanych są z góry definiowane przez osoby zajmujące się digitalizacją o Trudno powiedzieć Czy korzystają Państwo z jednego (lub wielu) standardu metadanych administracyjnych, technicznych lub strukturalnych przy tworzeniu i zarządzaniu cyfrowymi obiektami (nie dotyczy EXIF)? Nie, metadane są generowane automatycznie, a zarządzanie odbywa się na podstawie fizycznego lub logicznego umiejscowienia plików archiwalnych Wykorzystywany jest standard danych administracyjnych Proszę podać wykorzystywane standardy metadanych administracyjnych. Wykorzystywany jest standard danych technicznych Proszę podać wykorzystywane standardy metadanych technicznych Wykorzystywany jest standard danych strukturalnych Proszę podać wykorzystywane standardy metadanych strukturalnych Wykorzystywany jest inny rodzaj metadanych Proszę podać inne wykorzystywane standardy metadanych Trudno powiedzieć Strona 6: Ewentualne uwagi Jeśli mają Państwo uwagi związane z przedmiotem badania niniejszej ankiety bądź z samą ankietą, bardzo proszę je opisać.4. Zaplecze sprzętowo-programowe badania Zasadniczą kwestią był wybór platformy, która była w stanie spełnić wszystkie założenia funkcjonalne stawiane ankiecie. Konieczność wykorzystania wielu zmiennych warunkowych już na wstępie wykluczyła najpopularniejsze komercyjne systemy prowadzenia sondaży on-line. Inne z kolei posiadały ograniczenia jeśli chodzi o obszerność serwowanych ankiet. W efekcie postanowiono samodzielnie stworzyć platformę służącą do przeprowadzenia badania. Zdecydowano się na wykorzystanie systemu zarządzania treścią 5 Joomla! 6 wyposażonego w komponent BreezingForms 7. Komponent ten teoretycznie pozwalał w bardzo intuicyjny sposób konstruować nawet zaawansowane formalnie ankiety o dowolnej wielkości i z nieograniczoną ilością zmiennych warunkowych. Jak się szybko okazało, faktycznie stworzone ankiety mogą być bardzo kompleksowe, ale wtedy nie radzą sobie z nimi najpopularniejsze przeglądarki. 5 Inaczej CMS (z ang. Content Management System) aplikacja internetowa służąca do tworzenia i obsługi serwisów internetowych. 6 Joomla! [on-line]. Tryb dostępu: [dostęp: r.]. 7 Joomla! Extensions [on-line]. Tryb dostępu: [dostęp: r.]. 75

76 Ponieważ PHP 8 (język programowania, w którym napisano BreezingForms ) odpowiadał za generowanie wyglądu samego formularza, a za jego zachowanie i interakcję z respondentem JavaScript 9, każda przeglądarka odmawiała posłuszeństwa już na wczesnym etapie konstruowania ankiety. Wynikało to z faktu, że kod PHP przetwarzany jest przez serwer, natomiast JavaScript przez przeglądarkę użytkownika im więcej pętli i warunków zawierał kod ankiety, tym więcej miał do odebrania i przetworzenia komputer użytkownika. W tym momencie narodził się pomysł podzielenia ankiety na strony. Nie można było jednak podzielić faktycznie jednej ankiety na strony, ponieważ i tak do pamięci przeglądarki respondenta załadowałaby się od razu jej całość. Należało więc jedną ankietę podzielić na szereg mniejszych (z których każda miała zawierać taką ilość kodu, która będzie mogła być obsłużona nawet przez słabsze komputery), a następnie zasymulować ich integralność i stworzyć system nawigacji między poszczególnymi stronami. Efekt taki osiągnięto umieszczając na dole każdej strony przycisk następna strona, który odpowiadał nie tyle za przejście na kolejną stronę, ile za wysłanie wartości wskazanych na tej stronie na wcześniej zadeklarowany adres , zapisanie tych wartości w bazie danych i na koniec faktyczne wywołanie następnej ankiety emulującej kolejną stronę. Rozwiązanie to miało również tę zaletę, że uwzględniało przypadki niepełnego wypełnienia całej ankiety, o czym będzie mowa w punkcie.5. Komponent BreezingForms rejestrował wszystkie IP, z których łączono się z ankietą, co ułatwiło przefiltrowanie respondentów, o czym również będzie szerzej mowa w punkcie.5. Największym minusem był brak możliwości powrotu do poprzedniej strony bez jednoczesnej utraty wcześniej wprowadzonych wyników. W zasadzie radziła sobie z tym tylko jedna przeglądarka (Google Chrome), więc uznano, żeby opcji tej nie umieszczać w ankiecie. Z tego też względu w tekście wprowadzającym do ankiety poproszono o rozwagę przy jej wypełnianiu i zaznaczono, że nie będzie możliwości cofania się do poprzedniej strony. Jako rozwiązanie zastępcze zaproponowano ponowne wypełnienie ankiety prawidłowymi wartościami w takim wypadku brana pod uwagę była zawsze ostatnia wersja udzielonej odpowiedzi. Wszystkie zasady analizy badania omówiono w punkcie.5. Największym kompromisem, na który trzeba było pójść w trakcie oprogramowywania ankiety, była rezygnacja z reguł walidujących. Reguły te miałyby w tym przypadku za zadanie pilnować udzielenia odpowiedzi na wszystkie pytania 8 PHP. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 9 JavaScript. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 76

77 znajdujące się na stronie; użytkownik nie byłby w stanie przejść do następnej strony bez odpowiedzenia na wszystkie pytania uznane za obowiązkowe. Niestety, reguły te miały postać skryptów napisanych w języku JavaScript (czyli obciążających system respondenta), a ponadto przy wystąpieniu pytań warunkowych działały niestabilnie lub nie działały w ogóle. W efekcie wśród zwrotów nagminnie występowała sytuacja, gdy na ważne pytania nie udzielono odpowiedzi lub udzielono niepełnej (przy pytaniu warunkowym). Całość pytań logicznie podzielono na 6 stron (ankiet), z czego strony 3- zawierały typy digitalizowanych dokumentów po jednym na każdej stronie. Dodatkowo na stronach 3- w nagłówku umieszczono wykaz numerów stron wraz ze znajdującym się nich typem dokumentu, żeby respondent mógł z góry sobie zaplanować, które wybrać. Na etapie projektowania ankiety brano pod uwagę łatwość jej późniejszej analizy, co także miało wielkie znaczenie podczas wyboru odpowiedniej platformy. Wybór padł na BreezingForms również dlatego, że wyposażony był w funkcję grupowego eksportu zadanego zakresu rekordów (wyników badania) m.in. do formatu CSV 0. Po wyeksportowaniu wystarczyło taki plik zaimportować do programu MS Excel, uruchomić w nim filtrowanie danych i w ten sposób otrzymano bardzo wygodne narzędzie do analizowania otrzymanych wyników badania..5. Analiza wyników badania Ankietę rozesłano do wszystkich respondentów w dniach 0- czerwca 0 r., wyznaczając koniec badania na 4 czerwca. Po tym terminie ankieta przestała być widoczna w Sieci strona automatycznie uległa zablokowaniu. Zanim zostanie podana liczba respondentów, należy się na chwilę cofnąć do istotnej informacji, która była zasygnalizowana w poprzednim punkcie, a mianowicie specyficznej budowy ankiety. Gdyby on-line umieszczona była jedna bardzo rozbudowana ankieta, jej wyniki zostałyby zarejestrowane w całości dopiero po kliknięciu przez respondenta przycisku Wyślij. Tymczasem zastosowany model sprawił, że szczątkowe wyniki były rejestrowane (na dwa sposoby poprzez wysłanie ich mailem i zapisanie w bazie danych) przy każdym przejściu respondenta na następną stronę. W efekcie pewien odsetek ankiet został wypełniony tylko w części. Były też takie przypadki, kiedy respondenci przejrzeli całą ankietę, ale nie udzielili żadnej odpowiedzi. 0 CSV (format pliku). [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 77

78 W związku z tym trzeba było się zdecydować, jak traktować ankiety wypełniono tylko częściowo. Przyjęto następujące zasady: postanowiono, że takie ankiety zostaną dopuszczone do analizy w zakresie, w jakim zostały wypełnione, tzn. jeśli przykładowo udzielono odpowiedzi tylko na dwóch pierwszych stronach, respondent taki brany był pod uwagę wyłącznie podczas zliczania zwrotów ze stron i ankiety. Dotyczy to także przypadków, kiedy system zarejestrował obejrzenie z danego adresu IP całej ankiety, ale odpowiedzi udzielono tylko na początkowych stronach w takich przypadkach uznano, że respondent zakończył swój udział w badaniu na ostatniej wypełnionej przez siebie stronie, każda ze stron stanowi odrębną całość, więc dla każdej obliczano indywidualną liczbę zwrotów, gdy odnotowano kilkakrotne wypełnienie ankiety z jednego adresu IP, brano pod uwagę tylko ostatnią (chronologicznie) udzieloną wersję odpowiedzi. Wyjątkiem od tej zasady była sytuacja, gdy podczas takiego ostatniego wypełnienia (bądź też obejrzenia ) ankiety na danej stronie nie zaznaczono żadnej odpowiedzi, podczas gdy w trakcie wcześniejszej sesji taka odpowiedź się pojawiła. W tym przypadku brano pod uwagę wersję z odpowiedzią, a ignorowano późniejszą pustą. Osobnym problemem było odfiltrowanie zwrotów, które nie wzięły udziału w analizie. Były to: wspomniane ankiety wypełnione wielokrotnie z tego samego adresu IP, które zawierały chronologicznie wcześniejsze wersje odpowiedzi, ankiety, które wypełniono co prawda z różnych adresów IP, lecz zarejestrowanych na tę samą instytucję. Założono, że był to ten sam respondent, ale ponowne wypełnienie ankiety nastąpiło z innego komputera. W takich przypadkach również zastosowano zasadę pozostawienia odpowiedzi chronologicznie najmłodszych, przypadki, kiedy ankietę w całości obejrzano bez przystąpienia do jej wypełnienia. Pomimo powyższych czynności trudno jednoznacznie stwierdzić, czy wśród pozostawionych respondentów wciąż nie występują duble. Na ogół biblioteki posiadają zarejestrowane na siebie stałe adresy IP, niektóre jednak korzystają 78

79 z dynamicznej adresacji. Sytuację dodatkowo komplikowało wypełnianie ankiety przez pracowników wieczorami, najprawdopodobniej z domowych komputerów, niejednokrotnie korzystających z łączności mobilnej. Proces eliminacji zdublowanych i pustych zwrotów oraz ich liczbowy stosunek do wysłanych zaproszeń do wzięcia udziału w badaniu ilustruje tabela 5. Tab. 5. Proces ustalania grupy respondentów przed rozpoczęciem analizy wyników badania Etap Liczba respondentów Rozesłanie zaproszeń do wzięcia udziału w badaniu 86 Obliczenie zwrotów w momencie zamknięcia badania Usunięcie zwrotów z dodatkowych adresów IP danej instytucji - 0 Usunięcie pustych zwrotów - 3 Ustalenie początkowej grupy respondentów objętych badaniem 88 Z tabeli 5 wynika, że w wyniku rozesłania 86 zaproszeń, na stronę z ankietą zajrzało respondentów, czyli 60% adresatów zaproszenia. Po odjęciu 3 respondentów, do analizy badania zakwalifikowano odpowiedzi 88 respondentów, co stanowi 47% całej próby badawczej. Należy zauważyć, że adresaci z 75 instytucji nawet nie zajrzeli na stronę z ankietą, co może się wiązać z m.in. problemem, który zasygnalizowano w punkcie., czyli dużą liczbą bibliotek uczestniczących w bibliotekach cyfrowych w sposób bierny. Na ogół brak w nich pracowników, którzy byliby w stanie odpowiedzieć na zawarte w ankiecie pytania, które wymagały dużej wiedzy teoretycznej i praktycznej. Być może jedną z przyczyn był tu z zaproszeniem, w którym zasygnalizowano, że badanie będzie wymagało specjalistycznej wiedzy od osoby wypełniającej ankietę. Niestety, w grupie wspomnianych 88 respondentów znajdują się nie tylko tacy, którzy wypełnili ankietę w całości, lecz także respondenci, którzy udzielili odpowiedzi na pytania zawarte na chociażby pierwszej stronie. Tabela 6 zawiera analizę tej grupy z podziałem na strony ankiety, po których poszczególni respondenci przerwali badanie. 79

80 Tab. 6. Liczba respondentów z podziałem na stron ankiety Ostatnia wypełniona strona ankiety Liczba respondentów Strona 88 Strona 80 Strona 3 6 Strona 4 56 Strony Strona 0 54 Strony Strony 8-5 Strony 3-6 (cała ankieta) 50 Z tabeli 6 wynika, że na liczbę 88 respondentów, całą ankietę wypełniło raptem 50 bibliotek, czyli 38 zrezygnowało z badania już w trakcie jej wypełniania. Trudno powiedzieć, czym było to spowodowane w przypadku dalszych stron, natomiast utrata zainteresowania po dwóch pierwszych pytaniach była tak duża, że istnieje duże prawdopodobieństwo, że odstraszającym czynnikiem w tym wypadku była szczegółowość pytań objawiająca się w pełni dopiero od trzeciej strony. Dzięki specyficznej budowie ankiety, fakt przerwania jej wypełniania na dowolnym etapie nie sprawił, że udzielone już odpowiedzi stały się bezwartościowe jak wspomniano w poprzednim punkcie, każda strona była traktowana oddzielnie. Przy omawianiu wyników każdorazowo pojawia się informacja o ilości respondentów również z tego powodu, że niektórzy po prostu ominęli część pytań. Poza problemem pytań, na które nie udzielano odpowiedzi, trzeba też było rozstrzygnąć kwestię pytań, które wymagały od respondentów wpisania pewnej uśrednionej wartości (na ogół liczby ppi dla danego typu dokumentu / formatu zapisu), zamiast której odpowiadali oni zakresami wartości przyjętych w danej instytucji. Celowo nie umieszczono w ankiecie predefiniowanych wartości liczbowych, gdyż doświadczenie pokazuje (a wyniki badania to potwierdzają), że biblioteki indywidualnie podchodzą do ppi, w niektórych przypadkach przyjmując wielkości bardzo nietypowe. Podjęto więc decyzję, że gdy w odpowiedzi zamiast liczby wpisano zakres, traktowany on był jak dwie skrajne jego wartości. Jeśli więc przykładowo podany był zakres ppi, przyjęto, że dana biblioteka wykorzystuje dwie wartości 300 i 600 dpi. Bywało też tak, że podawano kilka wartości (maksymalnie trzy) oddzielone przecinkami w takich przypadkach brano pod uwagę wszystkie wymienione wartości. 80

81 Bardzo często niestety pojawiała się także sytuacja, gdy w ogóle nie wpisywano żadnej wartości zarówno przy ppi, jak i przy wybraniu wariantu odpowiedzi nie uwzględnionego w predefiniowanych wartościach, co wiązało się z automatycznym pojawieniem się okienka tekstowego przeznaczonego na wprowadzenie nieuwzględnionej wartości. Jako jaskrawy przykład można tu wskazać stronę ankiety, gdzie należało wybrać typ dokumentu nie uwzględniony na wcześniejszych stronach (o ile występował). Zdarzało się, że respondent zaznaczał pole innego dokumentu, ale już nie pisał, co to za dokument i jakie parametry przyjęto przy jego digitalizacji. Ponieważ wartość informacyjna takich odpowiedzi była zerowa, pominięto je. Z uwagi na cel badania (konfrontacja wyników z zaleceniami), analizując uzyskane wyniki główny nacisk położono na wyłonienie wartości modalnych dominant i porównaniu ich ze Standardami ( ). Niemniej w przypadku pojawienia się nietypowych wartości skrajnych, podjęta została próba ich interpretacji w kontekście odpowiedzi danego respondenta udzielonych na inne pytania. 8

82 3. Wyniki badania W celu zapewnienia przejrzystości podczas prezentacji wyników otrzymanych na podstawie analizy wypełnionych ankiet, kolejne pytania będą przedstawiane wg następującego schematu: treść pytania rodzaj pytania (jednokrotnego lub wielokrotnego wyboru) liczba respondentów wyniki wraz z uwagami i spostrzeżeniami. W punkcie 3.6 wyłonione dominanty zostaną porównane z zaleceniami zawartymi w Standardach ( ). Wszystkie wykresy obrazujące rozkład odpowiedzi ze względu na ich ilość zdecydowano się usunąć ze zrębu głównego pracy i przenieść do załącznika nr który zaczyna się na s. 53. W trakcie omawiania otrzymanych wyników będą się pojawiały odwołania do odpowiedniego wykresu. Dla ułatwienia w każdym takim przypadku umieszczony został dodatkowo przypis dolny wraz z odpowiednim numerem strony, na której ten wykres się znajduje. Wykresy nie uwzględniają wartości, które nie zostały zaznaczone przez żadnego z respondentów. Ponadto przy pytaniach wielokrotnego wyboru nie analizowano wszystkich kombinacji wybranych wartości, a jedynie częstotliwość występowania poszczególnych wartości składowych (za wyjątkiem przypadków uznanych za najbardziej interesujące lub zaskakujące). 3.. Model digitalizacji Pierwsza strona ankiety nie miała bezpośredniego związku z konfrontacją z zaleceniami ze Standardów ( ) na podstawie otrzymanych odpowiedzi planowano przede wszystkim uzyskać odpowiedź na pytanie, czy posiadanie własnej pracowni ma wpływ na parametry tworzenia cyfrowych wtórników, a także jakie względy odpowiadają za zdecydowanie się na outsourcing Proszę wskazać stosowany w bibliotece model digitalizacji Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: 88 8

83 Aż 63 respondentów wybrało samodzielne skanowanie. Na częściowy outsourcing zdecydowało się 8, a całkowity outsourcing 7 (zał., rys. ). Wynika z tego, że w kraju dominuje model samodzielnej kontroli nad każdym aspektem digitalizacji. Wszystko wskazuje na to, że jest to podejście preferowane przez Ministerstwo Kultury i Dziedzictwa Narodowego, ponieważ ministerialny program KULTURA+ expressis verbis stawia na stworzenie specjalistycznych, dobrze wyposażonych pracowni digitalizacyjnych ( ). W pierwszym etapie (pierwsze dwa lata realizacji priorytetu) zadanie dotyczyć będzie rozwoju infrastruktury, w kolejnych latach realizacji Programu główny nacisk położony będzie na sam proces digitalizacji. Na taką pełną samodzielność mogą sobie jednak pozwolić tylko najlepiej wyposażone pracownie, pozostałe muszą iść na kompromis i korzystać z częściowego outsourcingu. W przypadku braku własnej pracowni najbardziej racjonalnym wyjściem wydaje się być całkowity outsourcing Przyczyna zdecydowania się na częściowy outsourcing Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: 8 Dominantą jest częściowy outsourcing związany z typem digitalizowanych dokumentów respondentów (zał., rys. ). Może to mieć związek z większymi wymogami jakościowymi i technicznymi w przypadku digitalizacji niektórych dokumentów. Minimalnie mniej popularną przyczyną jest format dokumentów 0 respondentów. Dobrej jakości skaner A kosztuje powyżej pięćdziesięciu tysięcy euro, a jeśli biblioteka poważnie myśli o samodzielnej digitalizacji większych dokumentów (np. gazet, grafik, map), powinna dysponować skanerem przynajmniej A, który jest ponad dwukrotnie droższy. Rzadko która biblioteka posiada sprzęt tego typu, więc outsourcing digitalizacji wielkoformatowych dokumentów jeszcze długo będzie popularnym rozwiązaniem. Pozyskanie funduszy celowych jako przyczynę wskazało 9 respondentów. Co ciekawe, dzieje się tak bez względu na fakt, czy dana instytucja posiada własną pracownię do digitalizacji. Najczęściej chodzi o digitalizację konkretnej kolekcji dokumentów, która wykracza poza ustalone bieżące plany pracy dla własnej pracowni. Wieloletni program rządowy KULTURA+ [dokument elektroniczny]. Tryb dostępu: [dostęp:.0.0 r.], s

84 Inną przyczynę częściowego outsourcingu wskazało 3 respondentów, z czego tylko w rozwinięciu opisał ją jako brak własnej pracowni. Prawdopodobnie chodzi tu o sytuację, gdy biblioteka digitalizuje zbiory, jednocześnie nie posiadając dedykowanej pracowni; wtedy na ogół skanuje się dokumenty w niewielkim zakresie (determinowanym przez inne obowiązki osoby skanującej), podstawowy ciężar digitalizacji przerzucając na wykonawców zewnętrznych Szacunkowy procent skanów zleconych na zewnątrz w stosunku do wykonywanych samodzielnie Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: 7 Spośród 7 respondentów korzystających z częściowego outsourcingu, największa grupa 7 (4%) zleca na zewnątrz digitalizację ponad 75% ogółu digitalizowanych w swojej bibliotece dokumentów (zał., rys. 3). Po 4 respondentów wskazało przedziały -5% i 6-50%, natomiast do 0%. Wynika z tego, że na ogół częściowym outsourcingiem objęta jest spora część digitalizowanych dokumentów (co sprawia wrażenie systemowości tego rozwiązania, tzn. stałego przypisania pewnej grupy dokumentów do digitalizacji na zlecenie), natomiast do rzadkości należą przypadki, gdy biblioteki niewielką część ogółu swojej produkcji obiektów cyfrowych powierzają firmom trzecim. 3.. Parametry digitalizacji Za pomocą pytań znajdujących się na drugiej stronie ankiety próbowano ustalić, w jaki sposób biblioteki decydują o parametrach, z jakimi digitalizowane są poszczególne dokumenty / grupy dokumentów W jaki sposób ustalono parametry skanowania i format zapisu plików archiwalnych dla poszczególnych typów dokumentów? Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: 80 Mimo wielokrotnego łączenia poszczególnych modeli przez respondentów, wartością modalną jest ustalanie parametrów na podstawie własnych doświadczeń 5 respondentów (zał., rys. 4). Najprawdopodobniej ma to związek z dominującym modelem samodzielnej digitalizacji osoby zajmujące się skanowaniem same są w stanie ocenić, jakie parametry okażą się optymalne. 84

85 Drugie miejsce zajęło posiłkowanie się cudzymi doświadczeniami 3 respondentów. W chwili obecnej nie obserwuje się już podczas konferencji wystąpień poświęconych technicznym zagadnieniom digitalizacji temat ten był popularny, gdy digitalizacja dopiero zaczynała gościć w bibliotekach. Bardzo popularne były wtedy rozmaite fora dyskusyjne i publikacje próbujące wytypować optymalne parametry dla digitalizacji poszczególnych typów dokumentów. Jako że, jak już wspomniano, obecnie raczej nie obserwuje się tego typu publikacji, można się jedynie domyślać, że chodzi o cudze doświadczenia, z którymi zapoznano się już jakiś czas temu (i które pomogły opracować własny model) lub z którymi osoby zajmujące się digitalizacją zapoznały się w sposób nieformalny, np. poprzez kontakty ze specjalistami od digitalizacji z innych instytucji lub poprzez rozmaite fora internetowe. Aż 5 respondentów korzysta z krajowych zaleceń, co jest sporą liczbą biorąc pod uwagę fakt, że pojawiły się stosunkowo niedawno w postaci Standardów ( ) i wydarzeniu temu nie towarzyszył taki rozgłos, jak przykładowo wydaniu Digitalizacji piśmiennictwa. Oczywiście przy założeniu, że wybierając krajowe zalecenia respondenci faktycznie mieli na myśli Standardy ( ). Co ciekawe, 7 spośród tych 5 respondentów wskazało krajowe zalecenia jako jedyną politykę ustalania parametrów skanowania. Mniej popularne okazało się przyjmowanie rozwiązań zagranicznych zdecydowało się na nie respondentów. Trzech respondentów wskazało na inny sposób ustalania parametrów digitalizacji, lecz tylko jeden z nich go skonkretyzował: na podstawie wytycznych głównego koordynatora projektu Jak ustalana jest rozdzielczość skanowania? Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: 80 Największa grupa 50 respondentów wybrała ustalanie rozdzielczości skanowania na podstawie widocznych cech indywidualnych dokumentu (zał., rys. 5). To najbardziej naturalny sposób decydowania o rozdzielczości i co najwyżej może zastanawiać casus pozostałych 30 respondentów, którzy nie uwzględnili tej opcji. Cechy konkretnego dokumentu powinny być zawsze brane pod uwagę, nawet jeśli wiodącą jest inna polityka dot. rozdzielczości przyjęta w danej instytucji; indywidualne dobieranie rozdzielczości w niektórych przypadkach wydaje się nieodzowne i powinno być traktowane komplementarnie z innymi metodami. Digitalizacja piśmiennictwa. Pod red. D. Paradowskiego. Warszawa: Biblioteka Narodowa,

86 Trzydziestu czterech respondentów definiuje rozdzielczość na podstawie przynależności danego dokumentu do określonej grupy, dla której wcześniej przyjęto pewną stałą wartość. Jest to bardzo rozsądne podejście, ponieważ znacznie przyspiesza proces skanowania. Oczywiście z zastrzeżeniem omówionym w poprzednim akapicie. W ramach każdej większej grupy zawsze trafi się jakiś egzemplarz, który wymaga trochę innego podejścia, żeby optymalnie wydobyć z niego wszystkie możliwe do cyfrowego uwiecznienia cechy. Nie zaskakuje niestety mała liczba respondentów (3), którzy rozdzielczość obliczają dla każdego dokumentu (grupy dokumentów), np. na podstawie wysokości najmniejszego znaku. Zaprezentowana w punkcie.4.3 pierwszego rozdziału formuła opracowana w Cornell University jest na tyle mało popularna, że zapewne niewielu specjalistów od digitalizacji zatrudnionych w bibliotekach w ogóle się z nią zetknęło. Pozostaje mieć nadzieję, że w przyszłości takie matematyczne (a tym samym bardziej obiektywne) podejście znajdzie więcej zwolenników. Siedmiu respondentów wskazało na inny niż wspomniane wyżej sposób obliczania rozdzielczości, z czego 6 rozwinęło swój wybór: ) stała rozdzielczość ) z góry, wcześniej, ustalona jest rozdzielczość, jaka ma być stosowana przy skanowaniu 3) przeznaczenie skanów 4) rozdzielczość stała 300 dpi 5) niektóre obiekty traktowane są indywidualnie, większość zgodnie ze standardami na podstawie norm 6) nie jest obliczana Odpowiedzi i 4 sugerują, że dla wszystkich typów dokumentów stosowana jest jednakowa rozdzielczość (i rzeczywiście reszta odpowiedzi respondenta, który określił stałą rozdzielczość jako 300 ppi, konsekwentnie to potwierdza). Dziwić może ustalanie rozdzielczości w zależności od przeznaczenia skanów (odpowiedź 3) w końcu niezależnie od celów prowadzonej digitalizacji należy tak ją organizować, żeby nie było konieczności wracania do już raz zeskanowanych dokumentów. Można się tylko domyślać, że chodzi o skanowanie ad hoc od razu do formatów prezentacyjnych z zamiarem udostępnienia pierwotnych skanów. Niestety trudno zweryfikować tę tezę, ponieważ respondent po drugiej stronie przerwał wypełnianie ankiety. 86

87 Odpowiedź 5 jest o tyle ciekawa, że powołuje się na standardy ustalone na bazie norm. W poprzednim rozdziale ustalono, że w Polsce nie ma jeszcze opracowanych obowiązujących standardów (są zalecenia), a tym bardziej norm. Chyba, że respondent miał na myśli zagraniczne standardy i normy. Niemniej odpowiedź mieści się bardziej w zakresie objętym pytaniem omawianym w punkcie 3... Odpowiedzi i 6 są na tyle enigmatyczne, że ciężko je zinterpretować, choćby nawet w przybliżeniu Typy digitalizowanych dokumentów książki Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 6 Poczynając od tego punktu, aż do punktu 3.0 analizowane będą typy digitalizowanych dokumentów. Należy jednak z całą mocą zaznaczyć, że punkt ciężkości przy konstruowaniu ankiety nie został położony na uzyskaniu odpowiedzi na pytanie co biblioteki digitalizują?, lecz jak biblioteki digitalizują?. Pozornie nadmierna szczegółowość pytań i zaawansowany mechanizm pytań warunkowych mogły sprawiać wrażenie, że w istocie jest na odwrót, lecz nie widziano innej możliwości uzyskania danych potrzebnych do skonfrontowania aktualnej praktyki z zaleceniami. Stąd też na kolejnych stronach ankiety znalazły się prawie wszystkie typy dokumentów wyczerpujące katalog umieszczony w Standardach ( ), a wraz z nimi wszystkie zmienne razem z wartościami pozwalającymi na dokładne stwierdzenie, jakie są parametry digitalizacji wspomnianych dokumentów. Należy jednak zaznaczyć, że pominięto obiekty o charakterze muzealnym, wymienione w grupach F i G 3, a plakaty i obrazy zakwalifikowano do jednego typu grafik. Rozszerzono również katalog dokumentów uwzględnionych w grupie E o mikrokarty. Początkowo brano pod uwagę podział dokumentów wg grup zdefiniowanych w Standardach ( ), a następnie stworzenie ankiety skoncentrowanej na uzyskaniu parametrów digitalizacji dla każdej grupy, jednak z uwagi na bogactwo typów i rodzajów dokumentów wchodzących w skład poszczególnych grup (a tym samym potencjalne bogactwo podejść do ich digitalizacji), zdecydowano się kosztem znacznego zwiększenia objętości ankiety podzielić pytania wg typów tych dokumentów. Żeby ułatwić respondentom wypełnianie ankiety, starano się przy rodzajach dokumentów (w ramach danego typu) do minimum ograniczyć ilość zmiennych 3 Zob. tabela 4, s

88 i wartości poprzez zastosowanie tego samego schematu, niezależnie od typu i rodzaju dokumentu. Tak więc identyczny katalog pytań zastosowany był zarówno do czarnobiałych książek bez ilustracji, jak i do kolorowych grafik wielkoformatowych. W wyniku tego zabiegu ankieta mogła momentami sprawiać osobliwe wrażenie (np. w przypadku wspomnianych czarno-białych książek, kiedy to respondent miał w katalogu możliwych odpowiedzi m.in. 48-bitową głębię koloru i wzorzec ProPhoto RGB). Po raz kolejny jednak rzeczywistość przerosła oczekiwania i respondenci wskazywali naprawdę zaskakujące kombinacje parametrów. Co prawda w każdym przypadku mające charakter wartości granicznych, niemniej zasługujące na komentarz, ponieważ mimo swojej oryginalności są to rozwiązania przyjęte i praktykowane w niektórych polskich bibliotekach. Wspomniany stały katalog pytań obejmował (po zaznaczeniu danego rodzaju dokumentu) 4 : rozdzielczość w ppi tryb i głębię koloru od bita do 48-bitowego koloru wzorce koloru od braku wzorca do ProPhoto RGB pierwotny format zapisu oraz w przypadku wskazania TIFF wybór jednostronicowej lub wielostronicowej wersji tego formatu. Liczbę bibliotek digitalizujących poszczególne rodzaje książek ukazuje rys. 6 (zał. ). Dominantą są książki zawierające czarno-białą treść wskazało je 49 respondentów. Na przyczynę ich popularności mogą składać się m.in. relatywnie największa ilość tego rodzaju dokumentów znajdująca się w zbiorach, niewielkie wymagania techniczne stawiane urządzeniom i najmniej kłopotliwa kwestia doboru odpowiednich parametrów dla cyfrowych matryc wzorca. Po wnikliwej analizie także innych rodzajów książek wskazanych przez respondentów stwierdzono, że wspomniane niewielkie wymagania techniczne wydają się jednak nie mieć w tym przypadku zastosowania. Każdy z respondentów, który zaznaczył ten rodzaj książek, wskazał także przynajmniej jeden z pozostałych ich rodzajów, mających niewątpliwie większe wymagania sprzętowe. Kłopotów mógł przysporzyć podział książek na zawierające czarno-białe ilustracje (38 respondentów) oraz na zawierające ilustracje w odcieniach szarości 4 88 Katalog wszystkich wartości dla poszczególnych pytań znajduje się w schemacie ankiety pkt.3, s. 6.

89 (30 respondentów) uwaga ta zresztą nie dotyczy wyłącznie książek, lecz wszystkich typów dokumentów, gdzie ma miejsce analogiczny podział. Z technicznego punktu widzenia zdecydowana większość książek posiadająca wyłącznie ilustracje pozornie wydrukowane w odcieniach szarości, tak naprawdę posiada ilustracje czarno białe, a wszelkie odcienie uzyskuje się poprzez manipulację rastrem drukarskim. Gdy raster jest wystarczająco niewielki, wymaga podczas digitalizacji bardzo zbliżonych (lub takich samych) zabiegów, jak ilustracje w odcieniach szarości stąd zasadność rozgraniczenia. Digitalizowanie książek zawierających kolorowe ilustracje zadeklarowało 38 respondentów (ex aequo z książkami zawierającymi czarno-białe ilustracje), a książek monochromatycznych 4. W przypadku wielu typów dokumentów, ich monochromatyczny rodzaj jest na ogół najmniej popularny. Bierze się to stąd, że o monochromatyczności na ogół decyduje kolor nośnika (papieru), czyli przynależność dokumentu do takiej grupy determinuje jego wiek lub specjalny zabieg wydawniczy, co automatycznie znacznie zawęża procent udziału takich dokumentach w stosunku do reszty zbiorów Książki czarno-biała treść Dominantą dla rozdzielczości skanowania okazało się w tym przypadku 300 ppi wartości tej używało 5 spośród 9 respondentów (zał., rys. 7). Wyniki całego badania ukazują, że 300 ppi jest najpopularniejszą, najbardziej uniwersalną rozdzielczością, niezależnie od typu i rodzaju dokumentów. I faktycznie 300 ppi zalecane jest zarówno przy OCR, przy wszelkiego rodzaju wydrukach, składzie komputerowym i nawet przy konwersji np. do DjVu. Poza tym pojedynczy respondenci podali takie wartości jak 50, 00, 400 i 600 ppi. O ile 600 ppi jest nawet wskazane przy skanowaniu w trybie -bitowym, o tyle 50 ppi wręcz gwarantuje niedokładne odwzorowanie oryginału, niezależnie od przyjętej głębi koloru. W trakcie konstruowania ankiety obawiano się, że zastosowanie jednakowego schematu charakterystyk dla każdego rodzaju dokumentu doprowadzi do osobliwych sytuacji, kiedy to respondent będzie miał np. do wyboru dla czarno-białych dokumentów nawet 48-bitową głębię koloru i model ProPhoto RGB, co może zaważyć na niskiej ocenie kompetencji autora ankiety. Tymczasem już analiza pierwszego rodzaju dokumentu rozwiała obawy o zasadność wspomnianych obaw. W przypadku stosowanej głębi koloru dla książek zawierających wyłącznie czarno-biały tekst, z 4 89

90 repondentów najwięcej, bo 6, wskazało 4-bitowy kolor (zał., rys. 8). Druga w kolejności była 8-bitowa skala szarości (0), następnie tryb -bitowy (9), 6-bitowa skala szarości (5) i 48-bitowy kolor (aż 4 respondentów). Obrazu całości dopełnia analiza stosowanych wzorców koloru. Na 40 respondentów najwięcej (4) zadeklarowało, że nie wie, jakie wzorce są stosowane przez ich bibliotekę. Jedenastu wskazało srgb, po 7 brak wzorca (dotyczący koloru -bitowego) i Grey Gamma, 3 Adobe RGB 998 i po ProPhoto RGB oraz inny model, niż predefiniowany (zał., rys. 9). W tym ostatnim przypadku jako inny model respondent wpisał nie używamy do skali szarości dla zwykłej książki, co trudno zinterpretować. Warto przez chwilę zastanowić się nad przytoczonymi wynikami w zakresie głębi koloru i użytych wzorców. Jeszcze kilka lat temu najprawdopodobniej bezkonkurencyjny byłby -bitowy kolor, w najlepszym wypadku 8-bitowa skala szarości w kombinacji z Grey Gamma. Przyczyn należy upatrywać we wciąż taniejących nośnikach danych, które nie wymagają już tak skrupulatnego liczenia się z miejscem zajmowanym przez pliki archiwalne. Obecnie można zaobserwować tendencję używania 4-bitowej głębi koloru do prawie wszystkich zastosowań, podobnie jak miało to miejsce w przypadku 300 dpi. Jest to niewątpliwie zaleta, ponieważ kolor niesie ze sobą dodatkowe informacje, które giną przy uboższych trybach. Powstaje pytanie czy faktycznie warto generować tak duże pliki zawierające nominalnie tylko czarno-białą treść. W przypadku jakiejkolwiek korekty takich plików (np. w celu konwersji do innego formatu) najwygodniej najpierw je przekonwertować do odcieni szarości lub czerni i bieli, ponieważ wtedy można lepiej zapanować nad wszelkimi nieoczywistymi artefaktami i zniekształceniami widocznymi na skanach. Również w przypadku konwersji do najpopularniejszego obecnie w polskich bibliotekach cyfrowych formatu DjVu, kolor tekstu jest na ogół zmieniany na jednolicie czarny, a wszystkie wielobarwne elementy są przesuwane do warstwy tła i niepotrzebnie zwiększają rozmiar pliku. Jak widać nie zawsze dodatkowa informacja niesiona przez kolor jest tak naprawdę pożądana. Mowa tu była o typowej, 4-bitowej głębi koloru. Skoro już ona może budzić wątpliwości, jak więc traktować głębię 48-bitową, która wiąże się z dwukrotnie większymi plikami (w porównaniu do 4 bitów)? Trudno tu znaleźć jakieś logiczne uzasadnienie. Analogicznie sytuacja wygląda w przypadku wzorców koloru. Wzorzec srgb jest domyślnie ustawiany przez producentów skanerów i programów graficznych, nic 90

91 więc dziwnego, że jest najpopularniejszy (niezależnie od typu i rodzaju dokumentów), na ogół idąc w parze z 4-bitowym kolorem. Każdy, kto się decyduje na bardziej zaawansowany wzorzec, powinien posiadać solidne przygotowanie teoretyczne, praktyczne i do tego posiadać coś, co w skrócie można określić jako fotograficzna wrażliwość, tzn. umiejętność wynajdywania kolorystycznych niuansów w obserwowanych obrazach. Dzieje się tak dlatego, że niewłaściwe użycie Adobe RGB 998 (lub ProPhoto RGB) może wręcz skutkować pogorszeniem jakości obrazu. Mowa tu o zakresie odwzorowania kolorów, którego w przypadku książek zawierających wyłącznie czarno-białą treść po prostu nie ma. I znowu jeśli już srgb wydaje się nadmiarowy, jak odnieść się do pomysłu digitalizowania takich dokumentów z zastosowaniem bardziej zaawansowanych wzorców? Osobną kwestią jest wysoki procent respondentów, którzy zadeklarowali brak wiedzy odnośnie używanych wzorców koloru. Świadczyć on może zarówno o braku teoretycznego przygotowania respondentów, jak i o małej wadze, jaką przykładają do tego parametru. Zwykło się uważać, że o jakości skanu (poza właściwościami samego urządzenia) decyduje jego rozdzielczość i głębia koloru. I w większości przypadków tak faktycznie jest. Jeśli uznać za prawdziwe domniemanie, że najpopularniejszym ustawieniem fabrycznym dla koloru jest srgb, taki wzorzec na ogół jest wystarczający. Sprawa się komplikuje przy digitalizacji dokumentów kolorowych, gdzie kolor jest głównym nośnikiem informacji, czyli np. zdjęć, map, plakatów. Wtedy wybór odpowiedniego wzorca może stać się kluczowy. Na szczęście praktyka pokazuje, że jeśli już ktoś digitalizuje tego typu wymagające dokumenty, posiada odpowiednio wysokie ku temu kwalifikacje i świadomość zakresów odwzorowań oferowanych przez poszczególne wzorce. Jako pierwotny format zapisu najwięcej 3 z 45 respondentów wskazało TIFF (zał., rys.0). Następne w kolejności są ex aequo bezstratny JPEG i PDF bez wewnętrznej kompresji grafik po 5 respondentów. TIFF z kompresją LZW stosowany jest przez 3 respondentów, a TIFF z kompresją JPEG, stratny JPEG, PNG, PDF z wewnętrzną bezstratną kompresją grafik oraz inny format niż wcześniej zdefiniowane zaznaczyło po respondencie. We wszystkich światowych standardach i wymaganiach stawianych digitalizacji, TIFF wskazywany jest jako podstawowy, referencyjny format zapisu dla matryc wzorca. Jego jedyną wadą jest wielkość generowanych plików, poza tym ma same zalety dlatego i w niniejszym badaniu zajmuje pierwsze miejsce wśród najczęściej wskazywanych pierwotnych formatów zapisu skanów. PDF bez wewnętrznej kompresji 9

92 grafik to najczęściej plik PDF potraktowany jako kontener dla pojedynczych plików TIFF, czyli alternatywa dla wielostronicowej wersji TIFF. Z 7 respondentów, którzy wybrali jedną z odmian TIFF, 6 używa wersji jednostronicowej, a wspomnianej w poprzednim akapicie wielostronicowej (zał., rys. ). Z dwóch rozwiązań grupujących pojedyncze pliki TIFF żadne nie wydaje się być pozbawione wad. W przypadku PDF żeby cokolwiek zrobić z danym skanem, najpierw trzeba go wyekstrahować. Tak więc jako pojemnik na pliki graficzne PDF sprawdza się całkiem dobrze, ale już w przypadku potencjalnej konwersji do innych formatów pojawia się kłopot, ponieważ dochodzi dodatkowy etap. Natomiast wielostronicowe wersje TIFF są zarówno problematyczne w obsłudze przez programy graficzne, jak i sprawiają problemy przy konwersji. Obydwa rozwiązania są też kłopotliwe z czysto logistycznego punktu widzenia generują bardzo duże rozmiary pojedynczych plików. Ma to duże znaczenie w przypadku uszkodzenia nośnika, na którym są zapisane łatwiej odratować kilkadziesiąt mniejszych plików, niż jeden spory. Powyższe rozważania dotyczą nie tylko czarno-białych książek, ale mają charakter bardziej ogólny, więc należy je mieć na uwadze podczas analizy wyników badania opisywanych w dalszych punktach Książki monochromatyczne Z 7 respondentów, 7 wskazało rozdzielczość 300 ppi, a 600 ppi (zał., rys. ). W przypadku tego rodzaju dokumentów, gdy monochromatyczność najczęściej wynika z barwy samego papieru, 300 ppi jest rozsądną wielkością, ponieważ pozwala oddać niuanse wizualne skanowanego oryginału. Przy głębi koloru nastąpił rozkład dwumodalny z 3 respondentów po 6 wybrało 8-bitową skalę szarości i 4-bitowy kolor (zał., rys. 3). Po wybrało natomiast 6-bitową skalę szarości i 48-bitowy kolor. Wśród wzorców koloru znów dominantą został srgb wybrało go 6 spośród respondentów (zał., rys. 4). Po respondentów wybrało Grey Gamma i Adobe RGB 998, a ProPhoto RGB. osoba zaznaczyła, że nie wie, który wzorzec jest używany. Najpopularniejszym formatem zapisu został TIFF 8 na 3 respondentów wybrało jego wersję standardową, a z kompresją LZW (zał., rys. 5). Wśród pojedynczych odpowiedzi padły: TIFF z kompresją JPEG, bezstratny JPEG oraz inny format. Co ciekawe, ten dodatkowy format został określony jako DjVu. Czyli format 9

93 stricte prezentacyjny został potraktowany w tym przypadku jako format archiwalny. W pierwszej chwili takie rozwiązanie może się to wydawać co najmniej mało praktyczne, ale warto rozważyć pewną teoretyczną sytuację: zakładając, że format JPEG 000 zostanie w którymś momencie powszechnie uznany za mogący konkurować na polu LTP z TIFF, DjVu (ze swoim profilem photo) stanie się znaczącą alternatywą dla JPEG 000, ponieważ obydwa formaty używają bardzo podobnego faletkowego algorytmu kompresji 5. Można zaryzykować stwierdzenie, że DjVu stanie się wtedy dla JPEG 000 tym, czym PDF jest dla TIFF, czyli pojemnikiem na pojedyncze obrazy. Oczywiście jest to tylko teoria, która bazuje na domniemaniu, że biorąca udział w badaniu biblioteka stosująca DjVu jako format służący do LTP używa profilu photo. W przypadkach korzystania z innych profili, skanowany obraz ulega tak poważnym transformacjom, że trudno wtedy traktować poważnie DjVu jako platformę LTP. Dość rzadko spotykanym rozwiązaniem jest też TIFF z kompresją JPEG. W tym wypadku w pliku TIFF osadzony jest obraz JPEG, czyli TIFF stanowi tak naprawdę kontener dla obrazu (bądź obrazów) JPEG. Najważniejszą zaletą takiego rozwiązania wydaje się być potencjalna wielostronicowość połączona z natywną obsługą przez oprogramowanie graficzne (ale oczywiście tylko takie, które radzi sobie z taką odmianą plików TIFF). Najwyraźniej jednak inna cecha zaważyła na wyborze tej odmiany TIFF w przypadku respondenta, który wskazał to rozwiązanie, ponieważ jednocześnie zaznaczył, że w jego bibliotece produkowana jest jednostronicowa wersja TIFF. Tak samo odpowiedziało pozostałych 9 respondentów, tym samym nikt nie wybrał odpowiedzi uwzględniającej wielostronicową wersję TIFF (zał., rys. 6). W kolejnych punktach wersja wielostronicowa będzie pojawiała się relatywnie rzadko, zazwyczaj wszyscy respondenci wskazywali jednostronicową odmianę Książki zawierające czarno-białe ilustracje Podobnie jak w przypadku książek zawierających wyłącznie czarno-biały tekst, także i tutaj dominuje szeroka rozpiętość stosowanych rozdzielczości. Na 9 respondentów 6 wskazało 300 ppi, pozostałe jednostkowe przypadki to 00, 400, 450 i 600 ppi (zał., rys. 7). Czyli dolna wartość graniczna została nieznacznie podniesiona, najprawdopodobniej ze względu na większe wymagania elementów graficznych. 5 JPEG 000. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 93

94 Najwięcej, bo 3 z 35 respondentów wybrało 4-bitowy kolor. używa 8-bitowej skali szarości, 6 6-bitowej skali szarości, 4 -bitowego koloru i 3 48-bitowego koloru (zał., rys. 8). Spośród wzorców koloru najwięcej respondentów wybrało srgb z 3 respondentów (zał., rys. 9). Następne w kolejności były Grey Gamma 5, Adobe RGB 998 4, ProPhoto RGB i brak wzorca (dla -bitowego koloru) po. osoba zaznaczyła inny wzorzec, ale niestety nie określiła jego nazwy. W 0 przypadkach zadeklarowano brak wiedzy w zakresie stosowanego wzorca. Najpopularniejszym pierwotnym formatem zapisu okazał się TIFF z 36 respondentów, 7 wybrało jego standardową wersję, z kompresją LZW i z kompresją JPEG (zał., rys. 0). Tylko osoba zaznaczyła, że generowane są wielostronicowe pliki TIFF, 7 wybrało popularną jednostronicową (zał., rys. ). Inne wybrane formaty to bezstratny JPEG oraz bezstratny JPEG 000, PNG i PDF bez wewnętrznej kompresji grafik po. Znów w jednym przypadku pojawił się też dodatkowy format DjVu. W kontekście całego badania zastanawia mała popularność PNG, który został tak zaprojektowany, żeby łączyć zalety JPEG (odwzorowanie szerokiej palety barw i niewielkie rozmiary plików) i GIF (obsługa transparentności) Książki zawierające ilustracje w odcieniach szarości Trzynastu z siedemnastu respondentów podało jako rozdzielczość skanowania 300 ppi, wzrósł też procentowy udział rozdzielczości 600 ppi 3 respondentów (zał., rys. ). Pojedynczy respondenci wpisali 400 i 450 ppi. Przyczyn zwiększenia liczby przypadków stosowania 600 ppi należy upatrywać w powiązaniu z zapisem w odcieniach szarości wartość ta gwarantuje bardzo dobre odwzorowanie szczegółów bez jednoczesnego drastycznego wzrostu rozmiaru plików. Głębię koloru zdominował 4-bitowy kolor wskazało go na 9 respondentów (zał., rys. 3). Minimalnie mniej respondentów wybrało 8-bitową skalę szarości, 8 6-bitową skalę szarości, i po tryb -bitowy i 48-bitowy kolor. Niepokoić może dolna wartość graniczna; stosowanie -bitowego trybu do zapisu odcieni szarości, nawet przy zastosowaniu wysokiej rozdzielczości, prowadzi do utraty cennych danych i zniekształcania obrazu oryginalnego dokumentu. Jedynym wyjątkiem może tu być wcześniej wspomniany przypadek skanowania dokumentów, gdzie raster tylko symuluje odcienie szarości. 94

95 Najpopularniejszym wzorcem koloru okazał się srgb wybrało go spośród 7 respondentów (zał., rys. 4). W 6 przypadkach wskazano Grey Gamma, w Adobe RGB 998 i ProPhoto RGB, w brak wzorca i wzorzec inny niż wymienione (chociaż nie wpisano jego nazwy). Ośmiu respondentów nie wiedziało, który wzorzec jest używany. Dwudziestu z dwudziestu dziewięciu respondentów wybrała standardowy TIFF jako pierwotny format zapisu, 4 wskazało TIFF z kompresją LZW, z kompresją JPEG, a pozostałe pojedyncze przypadki uwzględniały stratny i bezstratny JPEG, PNG oraz inny format, którym ponownie okazał się DjVu (zał., rys. 5). W 4 z 5 przypadków używano jednostronicowej wersji TIFF, tylko osoba zadeklarowała wersję wielostronicową (zał., rys. 6) Książki zawierające kolorowe ilustracje Szesnastu z dwudziestu dwóch respondentów zadeklarowało używanie do digitalizacji książek z kolorowymi ilustracjami rozdzielczości 300 ppi, 600 ppi, a 400 ppi (zał., rys. 7). O ile 600 ppi w przypadku dokumentów w odcieniach szarości wydaję się optymalną wielkością, dla standardowych dokumentów kolorowych taką wielkością jest 300 ppi. Zapewnia bardzo dobry stosunek odwzorowania szczegółów oryginału do wielkości generowanych plików. 600 ppi teoretycznie przenosi dwa razy więcej informacji, ale na ogół są to informacje nadmiarowe, ponieważ nawet współczesne maszyny poligraficzne rzadko kiedy drukują z taką jakością (oczywiście nie dotyczy to wydawnictw albumowych i ozdobnych, które rządzą się swoimi prawami). Niemniej jeśli biblioteka dysponuje dużą ilości wolnej przestrzeni na swoich nośnikach i może pozwolić sobie na stosowanie 600 ppi w stosunku do omawianych dokumentów, powinna jak najbardziej z tej możliwości korzystać, ponieważ trudno przewidzieć, jakie wymagania będą miały przyszłe formaty prezentacyjne. W zakresie stosowanej głębi kolorów, 7 z 35 respondentów wskazało 4-bitowy kolor, 7 48-bitowy kolor, a 8-bitową i 6-bitową skalę szarości po respondencie (zał., rys. 8). W tym miejscu nie można się powstrzymać od negatywnego komentarza; stosowanie odcieni szarości do kolorowych dokumentów może i jest mniej wymagające od strony sprzętowej i generuje mniejsze rozmiary plików, ale jest też krótkowzroczne. Nie powinno się apriorycznie ograniczać informacji niesionych przez cyfrowe matryce wzorca, ponieważ kłóci się to z ideą digitalizacji. 95

96 Najczęściej wykorzystywanym wzorcem koloru okazał się srgb 5 z 33 respondentów (zał., rys. 9). 5 osób zaznaczyło Adobe RGB 998, 3 ProPhoto RGB, Grey Gamma (zapewne mający związek z wcześniej omawianymi odcieniami szarości) i inny niż wymienione (lecz nie opisany). respondentów nie wiedziało, który wzorzec jest wykorzystywany. TIFF po raz kolejny okazał się najpopularniejszym pierwotnym formatem zapisu używało go 7 z 37 respondentów (zał., rys. 30). Pozostałe odpowiedzi to: bezstratny JPEG 4 respondentów, TIFF z LZW 3, stratny JPEG, PDF bez wewnętrznej kompresji i format inny niż wymienione (DjVu) oraz PNG. Na 7 respondentów 5 używało jednostronicowej wersji TIFF, wielostronicowej (zał., rys. 3) Typy digitalizowanych dokumentów gazety Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 56 Modalną wśród rodzajów digitalizowanych gazet zostały gazety zawierające kolorowe ilustracje 0 respondentów (zał., rys. 3). Nieznacznie mniej respondentów zadeklarowało digitalizację gazet zawierających wyłącznie czarno-białą treść oraz czarno-białe ilustracje po 9. Gazety w odcieniach szarości digitalizuje 8 przebadanych bibliotek, a gazety monochromatyczne 8. Biorąc pod uwagę specyfikę gazet, można było oczekiwać większego udziału ich monochromatycznej odmiany (wystarczy poprzeglądać w polskich bibliotekach cyfrowych gazety z ostatnich kilkudziesięciu lat). Być może mimo zażółcenia papieru zaliczono je do jednego z pozostałych rodzajów Gazety czarno-biała treść Z 0 respondentów najwięcej bo 6 używa rozdzielczości 300 ppi (zał., rys. 33). Dwóch respondentów korzysta z 600 ppi, a po z 00 i 400 ppi. W zakresie głębi koloru dominantą jest 4-bitowy kolor (8 z 7 respondentów), 6-bitowa skala szarości jest przyjęta w 4 bibliotekach, a tryb -bitowy i 8-bitowa skala szarości w 3 (zał., rys. 34). W przypadku odnotowano 48-bitowy kolor. Najczęściej wykorzystywanym wzorcem koloru jest srgb (7 z 6 respondentów), 3 biblioteki nie używają go w ogóle (z racji na tryb -bitowy), a Grey Gamma i Adobe RGB 998 znalazło zastosowania w pojedynczych przypadkach (zał., rys. 35). Pięciu respondentów nie wiedziało, jaki wzorzec koloru jest wykorzystywany. 96

97 W przypadku gazet zawierających czarno-białą treść wykorzystuje się dość bogaty wachlarz pierwotnych formatów zapisu (zał., rys. 36): najwięcej respondentów ( z 9) używa podstawowej wersji TIFF. Pozostałe formaty, czyli TIFF z kompresją LZW, TIFF z kompresją JPEG, JPEG bez kompresji, JPEG z kompresją, PDF bez wewnętrznej kompresji grafik, PDF z wewnętrzną bezstratną kompresją grafik oraz DjVu wskazali pojedynczy respondenci. Jedenaście z dwunastu przypadków wykorzystania formatu TIFF bazuje na jego jednostronicowej odmianie, na wielostronicowej (zał., rys. 37) Gazety monochromatyczne Na 4 respondentów, którzy odpowiedzieli na pytanie o przyjętą rozdzielczość, wszyscy podali wartość 300 ppi, a jeden dodatkowo 600 ppi (zał., rys. 38). W przypadku głębi koloru, 5 z 8 respondentów wybrało 4-bitowy kolor, 4 8-bitową skalę szarości, a tryb -bitowy (zał., rys. 39). Jest to więc kolejny przypadek, gdy z góry zakłada się celowe pominięcie pewnych cech dokumentu w jego cyfrowej postaci, ponieważ monochromatyczny w tym przypadku nie oznacza czarno-biały (co wyraźnie było zaznaczone w ankiecie). Najczęściej wykorzystywanym wzorcem koloru był srgb 4 z 8 respondentów (zał., rys. 40). Po respondentów wybrało brak wzorca i Grey Gamma, a ProPhoto RGB. osoby nie wiedziały, który wzorzec jest używany. Najpopularniejszym formatem zapisu był TIFF z 8 respondentów 4 wskazało jego standardową wersję, a wersję z kompresją LZW (zał., rys. 4). Pojedyncze przypadki obejmowały bezstratny JPEG, PDF bez wewnętrznej kompresji grafik oraz format dodatkowy DjVu. Pięciu spośród sześciu respondentów wykorzystuje jednostronicową wersję TIFF, a wielostronicową (zał., rys. 4) Gazety zawierające czarno-białe ilustracje Wśród 0 respondentów 8 korzystało z rozdzielczości 300 ppi, a po jednym z 00, 400 i 600 ppi (zał., rys. 43). Najpopularniejszą głębią koloru został 4-bitowy kolor 8 z 8 respondentów, 5 wskazało 8-bitową skalę szarości, 3 48-bitowy kolor, po tryb -bitowy i 6-bitową skalę szarości (zał., rys. 44). Wśród wzorców koloru najczęściej wskazywano srgb (9 z 8 respondentów), w dalszej kolejności Grey Gamma przypadki i brak wzorca oraz Adobe RGB 998 po osobie (zał., rys. 45). Siedmiu respondentów nie wiedziało, jaki wzorzec jest używany. 97

98 Dominantą dla pierwotnego formatu zapisu został TIFF 4 na 9 respondentów wykorzystuje jego wersję standardową, z kompresją LZW, pojedyncze przypadki objęły bezstratny JPEG, PDF bez wewnętrznej kompresji, oraz jako dodatkowy format DjVu (zał., rys. 46). Piętnastu z szesnastu respondentów używa jednostronicowej wersji TIFF, wielostronicowej (zał., rys. 47) Gazety zawierające ilustracje w odcieniach szarości Spośród 0 respondentów 8 wpisało jako używaną rozdzielczość 300 ppi, 600 ppi, a 400 ppi (zał., rys. 48). Pytanie o głębię koloru zdominował 4-bitowy kolor (9 z 8 respondentów), 5 razy wymieniono 8-bitową i 6-bitową skalę szarości, a po razie tryb -bitowy i 48-bitowy kolor (zał., rys. 49). Z wzorców koloru najczęściej wymieniano srgb 9 z 7 respondentów, wskazało Grey Gamma, a brak wzorca, Adobe RGB 998 i ProPhoto RGB po respondencie (zał., rys. 50). Pięć osób nie wiedziało, który wzorzec koloru jest używany. Pierwotny format zapisu zdominowany został przez TIFF 0 z 7 respondentów używa jego wersji standardowej, a 4 z kompresją LZW (zał., rys. 5). Tylko w przypadkach była to wielostronicowa odmiana, w jednostronicowa (zał., rys. 5). Inne formaty, które wybrali pojedynczy respondenci, to JPEG w wersji stratnej i bezstratnej, PDF bez wewnętrznej kompresji grafik i dodatkowy format DjVu Gazety zawierające kolorowe ilustracje W przypadku gazet z kolorowymi ilustracjami wskazywano tylko dwie rozdzielczości 300 ppi, której używa 7 z 0 respondentów oraz 600 ppi 4 respondentów (zał., rys. 53). 4-bitowy kolor ponownie zdominował odpowiedzi na pytanie o stosowaną głębię koloru używa go 5 z 0 respondentów (zał., rys. 54). Wśród pozostałych odpowiedzi znalazł się 48-bitowy kolor (3 respondentów) i niestety 6-bitowa () i 8-bitowa skala szarości (). W przypadku książek z kolorowymi ilustracjami skanowanie w odcieniach szarości trudno usprawiedliwić. W przypadku gazet w grę wchodzić może ich duży format. W polskich bibliotekach cyfrowych gazety ilościowo dominują wśród innych obiektów cyfrowych, zatem zaoszczędzenie kilkunastu MB na jednej stronie (przy formatach A3 i większych) bardzo szybko generuje bardzo duże oszczędności w skali całego repozytorium. Inną przyczyną zdecydowania się na skalę szarości może być sprzęt skaner wielkoformatowy nie obsługujący koloru jest zdecydowanie tańszy od jego kolorowego odpowiednika. W takich przypadkach odpowiedź na pytanie czy 98

99 kupić tańszy skaner i digitalizować, czy też nie kupić skanera w ogóle i nie digitalizować wydaje się dość prosta. Z drugiej jednak strony to właśnie gazety ulegają największej degradacji poprzez zaczytywanie i użyty do ich produkcji kwaśny papier, więc za kilka lat może się okazać, że jedyne istniejące egzemplarze to te cyfrowe, pozbawione koloru. Chociaż patrząc z jeszcze innego, bardziej praktycznego punktu widzenia, można sobie zadać pytanie o to, ile z tych najstarszych, najbardziej zniszczonych gazet posiada kolorowe ilustracje? Kolor w przypadku gazet to domena kilku ostatnich lat, więc może nie ma powodu, żeby demonizować (obecnie) ich skanowanie w odcieniach szarości? Lecz znowu takie podejście zakłada, że w przyszłości ktoś zeskanuje je ponownie tym razem w kolorze. A przecież dobrze przeprowadzona digitalizacja to taka, której nie trzeba powtarzać. W odniesieniu do powyższych rozważań, bardzo zaskakują odpowiedzi na pytanie o stosowany wzorzec koloru. z 9 respondentów wskazało srgb, Adobe RGB 998, a ProPhoto RGB (zał., rys. 55). 6 respondentów nie wiedziało, który wzorzec jest stosowany w ich bibliotece. Wśród odpowiedzi brak jest wzorca odpowiedniego dla skali szarości (Grey Gamma). Szczegółowa analiza odpowiedzi ujawniła, że respondenci używający skali szarości jako wzorzec wskazali srgb bądź zaznaczyli, że nie wiedzą, jaki wzorzec jest używany. O ile ten drugi przypadek zanadto nie dziwi 6, o tyle srgb jako wzorzec dla skali szarości to ewidentna pomyłka. Pytanie tylko, kiedy respondent się pomylił: wskazując głębię, czy też wzorzec koloru. Wśród odpowiedzi udzielonych przez 0 respondentów na pytanie o pierwotny format zapisu, wskazało na TIFF standardowy, a z kompresją LZW, ponadto po razie wystąpiły: stratny JPEG, PDF bez wewnętrznej kompresji grafik, PDF z wewnętrzną kompresją grafik stratną i bezstratną oraz DjVu jako dodatkowy format (zał., rys. 56). Na 3 respondentów, używa TIFF w wersji wielostronicowej, pozostali jednostronicowej (zał., rys. 57) Typy digitalizowanych dokumentów czasopisma Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 55 Najpopularniejszym digitalizowanym rodzajem czasopism są czasopisma zawierające czarno-białe ilustracje digitalizuje je 8 z 55 respondentów (zał., 6 Zob. pkt

100 rys. 58). 7 zaznaczyło czasopisma zawierające czarno-biały tekst oraz czasopisma zawierające kolorowe ilustracje. Czasopisma zawierające ilustracje w odcieniach szarości wskazało 3 respondentów, a monochromatyczne Czasopisma czarno-biała treść Jako rozdzielczość skanowania 9 z 0 respondentów wpisało 300 ppi, a 400 ppi (zał., rys. 59). W przypadku pytania o głębię koloru najczęściej wybierano 4-bitowy kolor (7 z 6 respondentów), w dalszej kolejności pojawiła się 8-bitowa (5) i 6-bitowa skala szarości (3), tryb -bitowy () i 48-bitowy kolor (zał., rys. 60). W zakresie wzorców koloru 6 z 5 respondentów wskazało srgb, a po brak wzorca, Grey Gamma i Adobe RGB 998 (zał., rys. 6). Brak wiedzy w kwestii wzorca zadeklarowało 5 respondentów. Najczęściej stosowanym pierwotnym formatem zapisu został TIFF na 7 respondentów wskazało jego wersję standardową, a z kompresją LZW (zał., rys. 6). Tylko z nich korzysta z formatu w wersji wielostronicowej, 3 wybrało jednostronicową (zał., rys. 63). Poza TIFF, pojedynczy respondenci używali także JPEG bez kompresji, PDF bez wewnętrznej kompresji grafik i DjVu Czasopisma monochromatyczne Przy pytaniu o rozdzielczość skanowania, wszyscy respondenci (5) wpisali 300 ppi, a z nich dodatkowo jeszcze 600 ppi (zał., rys. 64). Najczęściej stosowaną głębią koloru był 4-bitowy kolor 4 z 6 respondentów, następnie 8-bitowa skala szarości 3, tryb -bitowy i 6-bitowa skala szarości (zał., rys. 65). Najpopularniejszym wzorcem koloru był srgb 5 z 6 respondentów, wybrało brak wzorca, a po Grey Gamma, Adobe RGB 998 i ProPhoto RGB (zał., rys. 66). Był to jeden z nielicznych przypadków, kiedy żaden z respondentów nie zadeklarował braku informacji o stosowanym wzorcu koloru. Wśród używanych pierwotnych formatów zapisu dominował TIFF 3 z 6 respondentów używało jego wersji standardowej, a wersji z kompresją CCITT (zał., rys. 67). Wszyscy respondenci korzystali z jednostronicowej odmiany tego formatu (zał., rys. 68). Spośród innych formatów respondent podał tylko DjVu Czasopisma zawierające czarno-białe ilustracje W przypadku rozdzielczości, po raz kolejny 300 ppi ugruntowało swoją pozycję najbardziej wszechstronnego lidera używa jej 9 na 0 respondentów (zał., rys. 69). 00

101 Poza tym po razie wystąpiły 400 i 600 ppi. Podobna sytuacja miała miejsce przy głębi koloru tu również liderem był jak dotąd najpopularniejszy 4-bitowy kolor 7 z 6 respondentów (zał., rys. 70). Mniej popularne były: 8-bitowa skala szarości (5), 6-bitowa skala szarości (3), 48-bitowy kolor () i tryb -bitowy (). Wśród wzorców koloru najczęściej wskazywano srgb (8 z 7 respondentów), następnie Grey Gamma i Adobe RGB 998 (3) oraz brak wzorca () rys. 7 (zał. ). Znowu można zaobserwować brak konsekwencji w udzielaniu odpowiedzi; tylko raz zaznaczono tryb -bitowy, ale brak wzorca stosowany przy tym formacie pojawił się razy. Po analizie tych dwóch przypadków stwierdzono, że w jednym dane są spójne (tryb -bitowy + brak wzorca), natomiast w drugim w ogóle nie podano głębi koloru, tylko sam wzorzec (a raczej jego brak). Niestety, takie sytuacje były nie do uniknięcia bez reguł walidacyjnych, których nie dało się zastosować bez jednoczesnego zachwiania bezproblemowego funkcjonowania ankiety w starszych przeglądarkach 7. Najpopularniejszy pierwotny format zapisu tu również nie sprawił niespodzianki był nim TIFF na 8 respondentów 4 używa jego standardowej wersji, wersji z kompresją LZW i wersji standardowej, ale umieszczanej w strukturze PDF, czyli PDF bez wewnętrznej kompresji grafik (zał., rys. 7). Z 5 respondentów tylko zaznaczył, że używa TIFF w wersji wielostronicowej (zał., rys. 73). Poza wspomnianymi odmianami TIFF, respondent wskazał DjVu jako pierwotny format Czasopisma zawierające ilustracje w odcieniach szarości Najpopularniejszą rozdzielczością przy tego rodzaju czasopismach zostało 300 ppi wskazało ją 8 z 9 respondentów (zał., rys. 74). Pozostałe rozdzielczości to 600 ppi () i 400 ppi. Należy w tym miejscu zaznaczyć, że 600 ppi w obydwu przypadkach podawane było w parze z 300 ppi, co wskazuje na indywidualne podejście tych respondentów do poszczególnych egzemplarzy. Jeśli chodzi o głębię koloru, nastąpił rozkład dwumodalny na 3 respondentów po 6 wskazało kolor 4-bitowy i 8-bitową skalę szarości (zał., rys. 75). Rzadziej używane opcje to tryb -bitowy () dość ryzykowny i mogący dać zadowalające rezultaty wyłącznie przy zastosowaniu wysokiej rozdzielczości (mowa o dokumentach z elementami skali szarości uzyskanej za pomocą rastra, a nie wygenerowanej za pomocą barwników drukarskich), 6-bitowa skala szarości () oraz 48-bitowy kolor (). Najpopularniejszym wzorcem koloru był srgb wybrało go 8 z 3 respondentów 7 Zob. pkt.4. 0

102 (zał., rys. 76). Po respondentów wskazało brak wzorca, Grey Gamma i Adobe RGB 998. Dwie osoby nie wiedziały, który wzorzec jest stosowany. W odniesieniu do pierwotnego formatu zapisu ma miejsce sytuacja analogiczna do czasopism z czarno-białymi ilustracjami, czyli dominują 3 odmiany TIFF: 9 z 3 respondentów używa wersji standardowej, z kompresją LZW, a wersji obudowanej formatem PDF (zał., rys. 77). Żaden z respondentów nie używał wielostronicowej wersji formatu (zał., rys. 78). Poza wspomnianymi formatami pojawił się też DjVu () Czasopisma zawierające kolorowe ilustracje Dla omawianego rodzaju czasopism najczęściej występującą rozdzielczością skanowania było 300 ppi używa jej 7 z 9 respondentów (zał., rys. 79). 600 ppi pojawiło się w odpowiedziach 3-krotnie, a 450 ppi -krotnie. Co ciekawe, 600 ppi w dwóch przypadkach występuje jako druga, wyższa wartość, a w jednym jako wartość autonomiczna, co oznacza, że w danej instytucji wszystkie czasopisma z kolorowymi elementami skanowane są w tej bardzo bezkompromisowej rozdzielczości. Po dokładniejszym przeanalizowaniu wszystkich odpowiedzi tego respondenta okazało się, że wysoką rozdzielczość skanów kompensuje relatywnie niewielkimi (w porównaniu z TIFF) rozmiarami plików poprzez bazowanie na stratnej wersji JPEG. W przypadku stosowanych głębi koloru, najpopularniejszy był 4-bitowy kolor wybrało go z 6 respondentów (zał., rys. 80). W dalszej kolejności znajduje się 48-bitowy kolor (4) oraz 6-bitowa () i 8-bitowa skala szarości (). Ponieważ pod względem formalnym gazety i czasopisma są do siebie zbliżone, także tutaj mają zastosowanie uwagi odnośnie skanowania kolorowych dokumentów w odcieniach szarości, poczynione przy okazji gazet zawierających kolorowe ilustracje 8. Wśród wzorców koloru najwięcej respondentów ( z 6) wskazało srgb, następnie Adobe RGB 998 (3) i ProPhoto RGB () zał., rys. 8. Czasopisma z kolorowymi ilustracjami zgromadziły największy wachlarz wskazanych wartości wśród pierwotnych formatów zapisu. Najwięcej, bo z 6 respondentów stosuje standardowy TIFF, TIFF z kompresją LZW, stratny JPEG i DjVu, a pojedynczy respondenci bezstratny JPEG i PDF bez wewnętrznej kompresji grafik (zał., rys. 8). W z 3 przypadkach stosuje się wielostronicową odmianę TIFF, w pozostałych jednostronicową (zał., rys. 83). 8 0 Zob. pkt

103 3.6. Typy digitalizowanych dokumentów rękopisy Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 55 Poczynając od niniejszego punktu, aż do punktu 3.8 opisane zostaną bardzo specyficzne typy dokumentów. Ich specyfika poza cechami czysto fizycznymi przejawia się w ich unikatowości. Bardzo często są to jedyne występujące egzemplarze, stąd ich digitalizacja powinna charakteryzować się wyjątkowo rygorystycznymi parametrami, które pozwolą odwzorować maksymalnie dużą ilość cech możliwych do odwzorowania w postaci cyfrowej. Ma to też związek z ochroną tych dokumentów dobre cyfrowe kopie pozwalają ograniczyć do absolutnego minimum udostępnianie oryginałów. Rękopisy podzielono na dwa rodzaje z wyraźnym (6 respondentów) i niewyraźnym kontrastem ( respondentów), ponieważ (teoretycznie) każdy z tych rodzajów wymaga innego podejścia i innego parametryzowania procesu digitalizacji (zał., rys. 84). Celowo nie dzielono rękopisów na czarno-białe, monochromatyczne, w skali szarości i kolorowe, ponieważ założenie było takie, że każdy rękopis ze swej natury jest kolorowy, nawet jeśli jest sporządzony czarnym atramentem na białym papierze. Wszelkie pozornie nieistotne niuanse z grafologicznego punktu widzenia mogą mieć duże znaczenie Rękopisy wyraźny kontrast Pytanie o rozdzielczość podzieliło grupę 8 respondentów na pół po 4 wskazało 300 i 600 ppi (zał., rys. 85). W zakresie głębi koloru dominował 4-bitowy kolor 0 z 4 respondentów, w dalszej kolejności 48-bitowy kolor (4) i 6-bitowa skala szarości () rys. 86 (zał. ). Podczas skanowania najczęściej korzystano z wzorca srgb (0 z 4 respondentów), w przypadkach z Adobe RGB 998, a w z ProPhoto RGB (zał., rys. 87). Dwie osoby nie wiedziały, który wzorzec jest wykorzystywany. W kontekście uwag zamieszczonych w punkcie 3.6 może zaskakiwać korzystanie z 6-bitowej skali szarości. Po szczegółowej analizie odpowiedzi na pozostałe pytania respondentów, którzy zadeklarowali skanowanie w tym trybie okazuje się, że przynajmniej w jednym przypadku takie postępowanie wydaje się być przemyślaną strategią i zależy od indywidualnych cech danego rękopisu. Wynika to z faktu, że respondent ten oprócz skali szarości zaznaczył też 4-bitowy i 48-bitowy kolor, więc 03

104 zdecydowanie się na skalę szarości na pewno determinowane jest racjonalnymi i dobrze przemyślanymi przesłankami. Drugi przypadek trudno wytłumaczyć, ponieważ po pierwsze respondent zaznaczył 6-bitową skalę szarości jako jedyną używaną do tego rodzaju rękopisów głębię koloru, a po wtóre jako wzorzec koloru zaznaczył srgb, przez co jego odpowiedź przestała być spójna. z 6 respondentów jako pierwotny format zapisu podało standardowy TIFF (zał., rys. 88). Pozostałe wybierane formaty, czyli TIFF z kompresją LZW, stratny i bezstratny JPEG, PDF bez wewnętrznej kompresji, RAW i DjVu pojawiały się w zestawieniu tylko jednokrotnie. Wątpliwości budzi pomysł wykorzystania do tak unikatowych zbiorów JPEG w stratnej wersji. Warto tu też zaznaczyć, że wśród dotychczas badanych sposobów digitalizacji rozmaitych dokumentów, po raz pierwszy pojawił się format RAW, stosowany do zapisu obrazów wykonanych cyfrowym aparatem. Tylko respondent na zaznaczył, że korzysta z wielostronicowej odmiany TIFF (zał., rys. 89) Rękopisy niewyraźny kontrast Podobnie jak w poprzednim punkcie, tak i tutaj dominanta rozłożyła się na 300 i 600 ppi (rozdzielczość taką podało po 3 z 7 osób), oprócz tego respondent wpisał 400 ppi (zał., rys. 90). Dominującą głębią koloru był 4-bitowy kolor wskazało go 8 z 0 respondentów (zał., rys. 9). Poza tym po respondentów wskazało 6-bitową skalę szarości i 48-bitowy kolor. Jako wzorzec koloru 8 z 0 respondentów wybrało srgb, Adobe RGB 998, a nie wiedziało, który wzorzec jest stosowany (zał., rys. 9). W odniesieniu do skanowania rękopisów z niewyraźnym kontrastem w skali szarości, po przeanalizowaniu obydwu przypadków okazało się, że byli to ci sami respondenci, co w poprzednim punkcie i zaznaczyli dokładnie te same opcje, co wcześniej. Rozkład odpowiedzi przy pierwotnym formacie zapisu uległ niewielkiej zmianie, w przeciwieństwie do zakresu samych wartości. Tradycyjnie najpopularniejsza jest standardowa wersja TIFF 8 z respondentów, po respondentów wybrało stratny JPEG i DjVu, a pojedyncze przypadki objęły TIFF z kompresją LZW, bezstratny JPEG, RAW i PDF bez wewnętrznej kompresji grafik (zał., rys. 93). Na 7 respondentów wszyscy korzystali z jednostronicowej wersji TIFF (zał., rys. 94). 04

105 3.7. Typy digitalizowanych dokumentów inkunabuły Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 55 W punkcie 3.6 wspomniano już o wyjątkowości inkunabułów. Są tak rzadkie i drogocenne, że dobrą praktyką jest digitalizowanie każdego z istniejących egzemplarzy, nawet jeśli miałoby to doprowadzić do dublowania się tytułów. Przy ich digitalizacji należy dysponować odpowiednim sprzętem, warunkami i kwalifikacjami personelu. Tym bardziej więc zaskakuje, że ten typ dokumentów wskazało aż 8 respondentów (zał., rys. 95). z 3 używa przy tym rozdzielczości 300 ppi, a 600 ppi (zał., rys. 96). Mając na uwadze unikalność inkunabułów, 300 ppi nie wydaje się wartością za niską, niemniej warto się w takich przypadkach pokusić o 400 lub więcej ppi. Cyfrowe matryce zajmą więcej miejsca, ale przecież będzie ich relatywnie niewiele. W świetle otrzymanych wyników nie niska rozdzielczość niepokoi najbardziej, lecz skanowanie inkunabułów w 6-bitowej skali szarości, do czego przyznało się dwóch respondentów (zał., rys. 97). Co prawda z wszystkich 7, którzy odpowiedzieli na pytanie o głębię kolorów, większość (4) używa 4-bitowego koloru, a 48-bitowego koloru, lecz fakt pozostaje faktem używanie skali szarości w przypadku inkunabułów jest ewidentnym błędem. Błędem, który w przyszłości być może już nie będzie miał szansy naprawienia. Wzorca srgb używa 3 z 7 respondentów, po Adobe RGB 998 i ProPhoto 998, a nie wiedziało, który wzorzec jest stosowany (zał., rys. 98). Ze standardowej wersji TIFF korzysta 4 z 7 respondentów, a po z TIFF z kompresją LZW, JPEG bez kompresji, RAW i PDF bez wewnętrznej kompresji grafik (zał., rys. 99). W 4 na 5 przypadków używano formatu TIFF w wersji jednostronicowej, w wielostronicowej (zał., rys. 00) Typy digitalizowanych dokumentów stare druki Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 55 Digitalizacja starych druków nie musi mieć już tak restrykcyjnego charakteru jak w przypadku inkunabułów, ponieważ i sam typ dokumentu nie jest już tak wyjątkowy (mimo, że wciąż są to zbiory bardzo cenne i delikatne). Prawdopodobnie dlatego stare druki są skanowane w prawie trzykrotnie większej liczbie przypadków na 55 05

106 wskazało je respondentów, co jest całkiem imponującym wynikiem (zał., rys. 0). Z 3 respondentów 8 digitalizuje je z rozdzielczością 300 ppi, 4 z 600 ppi, a z 400 ppi (zał., rys. 0). Na 9 przypadków w 4 stosuje się 4-bitowy kolor, w 4 6-bitową skalę szarości, w 8-bitową skalę szarości i 48-bitowy kolor (zał., rys. 03). Wykorzystywane wzorce koloru zdominował srgb 9 z 8 respondentów, oprócz tego w pojedynczych przypadkach pojawił się Adobe RGB 998 i ProPhoto RGB (zał., rys. 04). Zaskakująco wielu (bo aż 7) respondentów nie wiedziało, z którego wzorca korzysta ich biblioteka. Wybór pierwotnego formatu zapisu w większości przypadków nie budzi zastrzeżeń z respondentów 5 wybrało TIFF, po TIFF z kompresją LZW, bezstratny i stratny JPEG, a pojedyncze osoby zaznaczyły RAW, PDF bez wewnętrznej kompresji grafik i DjVu (zał., rys. 05). Wspomniane zastrzeżenia może budzić używanie stratnej wersji JPEG, która być może nieźle by się sprawdziła jako format prezentacyjny, ale nie jako format bazowy. Wybór ten jest efektem beztroski lub źle pojmowanej oszczędności miejsca na nośnikach. Tylko osoba z 6 zaznaczyła, że wykorzystuje wielostronicową wersję TIFF (zał., rys. 06) Typy digitalizowanych dokumentów grafiki Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 55 Grafiki potraktowano podczas konstruowania ankiety jako wspólny mianownik dla rysunków, obrazów, plakatów i innych dokumentów o zbliżonym charakterze. Ze względu na ich zróżnicowane formaty, zdecydowano się na podział do formatu A włącznie i powyżej A (grafiki wielkoformatowe pkt 3.0). Analogiczny zabieg ma miejsce w punktach 3. i 3., gdzie omówiono wyniki badania w odniesieniu do map i map wielkoformatowych. Podział ten wynika z faktu, że skanowanie dużych formatów niejednokrotnie pociąga za sobą kompromisy w kwestii doboru parametrów. Pojedynczy skan może osiągnąć wielkość kilkuset megabajtów, co czyni go wiernym wobec wzorca, ale jednocześnie sprawia, że jest bardzo niepraktyczny przy konwersji i obróbce. Rozgraniczenia dokonano z nadzieją, że wszelkie wspomniane kompromisy uwidocznią się w przypadku dokumentów wielkoformatowych i jednocześnie ułatwią respondentom wskazanie trafniejszych parametrów digitalizacji, jeśli stosowane są podwójne standardy zależne od formatu oryginału. 06

107 Najczęściej digitalizowanym rodzajem grafik do formatu A włącznie okazały się grafiki kolorowe (7 respondentów), następnie czarno-białe (4), w odcieniach szarości (3) i monochromatyczne (6) zał., rys Grafiki czarno-białe Na 7 respondentów 6 skanuje czarno-białe grafiki z rozdzielczością 300 ppi, a 600 ppi (zał., rys. 08). W przypadku głębi koloru po raz pierwszy podczas analizy ankiety pojawił się rozkład trójmodalny na 3 respondentów po 4 wskazało 8-bitową i 6-bitową skalę szarości oraz 4-bitowy kolor (zał., rys. 09). Pojedyncze przypadki objęły także tryb -bitowy i 48-bitowy kolor. Niespodzianki nie sprawił za to najpopularniejszy wzorzec koloru, ponieważ po raz kolejny został nim srgb używa go 7 z 3 respondentów (zał., rys. 0). Oprócz niego wymieniono także Adobe RGB 998 (3), Grey Gamma i brak wzorca (po ). Trzy osoby nie wiedziały, który wzorzec jest używany. Pierwotny format zapisu prawie w całości został zdominowany przez TIFF: z 4 respondentów stosowało jego standardową wersję, a po wersję z kompresją LZW i z kompresją JPEG (zał., rys. ). Poza TIFF pojedynczy respondenci wskazali także bezstratny JPEG i DjVu. Żaden z respondentów nie korzysta z wielostronicowej odmiany TIFF (zał., rys. ) Grafiki monochromatyczne Biorąc pod uwagę stosunkowo niewielką grupę respondentów deklarujących digitalizowanie monochromatycznych grafik (6 bibliotek), dobór parametrów cechował się dużą różnorodnością, która mogła wskazywać na brak ujednoliconego podejścia do skanowania tego rodzaju dokumentów. I tak przy rozdzielczości nastąpił rozkład dwumodalny na 4 respondentów po wpisało 300 i 600 ppi (zał., rys. 3). Z 6 respondentów 3 stosowało 4-bitową głębię koloru, a po 8-bitową i 6-bitową skalę szarości (zał., rys. 4). W przypadku wzorców koloru, srgb i Adobe RGB 998 otrzymało po głosy (na 5 respondentów) rys. 5. respondentów nie wiedziało, który wzorzec koloru jest stosowany. Bogactwo pierwotnych formatów zapisu wzięło się stąd, że prawie każdy z 6 respondentów używa więcej niż jednego formatu prawdopodobnie w zależności od potrzeb i konkretnego dokumentu. Najwięcej, bo 3 korzysta z TIFF, po z TIFF z kompresją LZW i bezstratnego JPEG, a pojedynczy respondenci z TIFF z kompresją CCITT (co jest o tyle dziwne, że przy pytaniu o głębię koloru nikt nie zaznaczył trybu 07

108 -bitowego, który jako jedyny jest w stanie skorzystać z algorytmów CCITT 9 ), stratny JPEG i DjVu (zał., rys. 6). Wszyscy z 5 respondentów używają jednostronicowej odmiany TIFF (zał., rys. 7) Grafiki w odcieniach szarości Grafiki w odcieniach szarości 4 z 6 respondentów skanuje z rozdzielczością 300 ppi, a w 600 ppi (zał., rys. 8). W odpowiedziach dominował 4-bitowy kolor 6 z 3 respondentów, ale niewiele rzadziej pojawiła się 6-bitowa (5) i 8-bitowa skala szarości (4) rys. 9. Na 3 respondentów, 6 korzystało z wzorca srgb, 3 z Adobe RGB 998, a z Grey Gamma (zał., rys. 0). W 4 przypadkach nie wiedziano, który wzorzec koloru jest stosowany. Najpopularniejszym pierwotnym formatem zapisu okazał się TIFF w grupie 3 respondentów wskazano go 0 razy (zał., rys. ). Po razy zaznaczano TIFF z kompresją LZW, bezstratny i stratny JPEG i DjVu, respondent zaznaczył TIFF z kompresją CCITT, ale znów nie wiadomo, jak traktować tę odpowiedź, skoro wcześniej przy pytaniu o głębię koloru nie pojawił się -bitowy kolor. Na respondentów wszyscy używali jednostronicowej odmiany TIFF (zał., rys. ) Grafiki kolorowe W odniesieniu do dokumentów kolorowych po raz pierwszy pojawił się przypadek, kiedy rozdzielczość skanowania została zdominowana przez tak wysoką wartość 600 ppi (4 z 7 respondentów), a do tej pory najpopularniejsza, czyli 300 ppi, zajęła drugą pozycję (3 respondentów) zał., rys. 3. Takie wyjątkowe potraktowanie grafik może wywołać pozytywne zaskoczenie, które potrwa jednak tylko do chwili, gdy podda się analizie odpowiedzi na pytanie o głębię koloru. Co prawda z 7 respondentów zaznaczyło 4-bitowy kolor, a 4 48-bitowy kolor, ale aż 3 6-bitową skalę szarości (zał., rys. 4). Po bardziej szczegółowym przeanalizowaniu odpowiedzi wspomnianych 3 respondentów okazuje się, że tylko z nich oprócz wspomnianej 6-bitowej skali szarości wskazał też 4-bitowy kolor. Pozostałe osoby używają do kolorowych grafik wyłącznie skali szarości, a z nich dodatkowo praktykuje to w połączeniu z rozdzielczością 300 ppi. Najpopularniejszym wzorcem koloru okazał się srgb (9 z 7 respondentów), poza tym zaznaczano Adobe RGB 998 (4) i ProPhoto RGB () zał., rys. 5. Sześciu respondentów nie potrafiło wskazać stosowanego wzorca koloru Zob. pkt.4..

109 Zgodnie z wcześniejszymi podejrzeniami, respondenci (7) podczas odpowiadania na pytanie o pierwotny format zapisu zaznaczyli rekordowy zakres odpowiedzi. Najwięcej osób tradycyjnie wybrało TIFF (), następny w kolejności był bezstratny JPEG (3), TIFF z kompresją LZW i stratny JPEG () oraz TIFF z kompresją CCITT, RAW, PNG, PDF bez wewnętrznej kompresji grafik i DjVu () zał., rys. 6. Tylko z 3 respondentów wykorzystuje wielostronicową odmianę TIFF (zał., rys. 7) Typy digitalizowanych dokumentów grafiki wielkoformatowe Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 54 W przypadku digitalizacji dokumentów, które w nazwie typu mają przymiotnik wielkoformatowe, spodziewano się przede wszystkim mniejszego udziału wysokich rozdzielczości i większego udziału formatów innych niż standardowy TIFF. W szczególności mowa o RAW, który jest natywnym formatem zapisu dla aparatów cyfrowych, często stosowanych właśnie do digitalizowania dokumentów o sporych wymiarach. Jak się okaże w kolejnych punktach, przewidywania potwierdziły się tylko częściowo. Najwięcej, bo 9 respondentów zadeklarowało digitalizację kolorowych grafik wielkoformatowych, 6 czarno-białych, 5 w odcieniach szarości i monochromatycznych (zał., rys. 8) Grafiki wielkoformatowe czarno-białe Przy pytaniu o stosowaną rozdzielczość, wśród 4 odpowiedzi pojawiła się tylko jedna wartość 300 ppi (zał., rys. 9). W 3 z 6 przypadków grafiki skanuje się w 4-bitowym kolorze, w w 6-bitowej skali szarości i tylko jeden respondent zaznaczył tryb -bitowy (zał., rys. 30). Wśród wzorców koloru dominował srgb 4 z 6 respondentów, poza tym w pojedynczych przypadkach wskazywano brak wzorca, Grey Gamma i Adobe RGB 998 (zał., rys. 3). Wśród pierwotnych formatów zapisu pojawił się tylko TIFF (5 z 6 respondentów) i stratny JPEG () zał., rys. 3. We wszystkich 5 przypadkach używano TIFF w wersji jednostronicowej (zał., rys. 33). 09

110 3.0.. Grafiki wielkoformatowe monochromatyczne Podobnie jak w przypadku czarno-białych wielkoformatowych grafik, tutaj też pojawia się wyłącznie rozdzielczość 300 ppi używali jej podczas skanowania respondenci (czyli wszyscy, którzy zaznaczyli ten rodzaj grafik) zał., rys. 34. Każdy z nich wskazał inną głębię koloru 6-bitową skalę szarości i 4-bitowy kolor (zał., rys. 35), natomiast obydwaj zaznaczyli srgb (co niestety w jednym przypadku jest niespójne z wcześniejszą odpowiedzią) zał., rys. 36. Jako pierwotny format zapisu jeden respondent stosuje TIFF (jednostronicowy zał., rys. 38), a drugi stratną wersję JPEG (zał., rys. 37) Grafiki wielkoformatowe w odcieniach szarości Na 4 respondentów, wszyscy jako rozdzielczość skanowania wpisali 300 ppi, a dodatkowo wpisał jeszcze 600 ppi (zał., rys. 39). 3 z 5 respondentów jako głębię koloru stosuje 6-bitową skalę szarości, 4-bitowy kolor, a 8-bitową skalę szarości (zał., rys. 40). Trzech z grupy 5 respondentów używa wzorca srgb (3), pozostali Grey Gamma (zał., rys. 4). Czterech z nich jako pierwotny format zapisu wybrało TIFF jednostronicowy (zał., rys. 43), a jeden stratną wersję JPEG (zał., rys. 4) Grafiki wielkoformatowe kolorowe Kolorowe grafiki wielkoformatowe charakteryzowały się najszerszym zakresem rozdzielczości stosowanych przez grupę 7 respondentów: 300 ppi 5 oraz 00, 40 i 600 ppi po respondencie (zał., rys. 44). Dość nietypową wielkością jest 40 ppi i może zastanawiać wybór akurat takiej a nie innej rozdzielczości, ale jest to natywna rozdzielczość, którą charakteryzują się niektóre aparaty cyfrowe. Z 9 respondentów 5 digitalizuje w 4-bitowym kolorze, a po w 6-bitowej skali szarości i 48-bitowym kolorze (zał., rys. 45). Była już o tym wcześniej mowa, ale trudno zaakceptować fakt skanowania kolorowych grafik dużego formatu w odcieniach szarości. Przecież dla tego rodzaju dokumentów kolor ma kluczowe znaczenie i jeśli biblioteka nie dysponuje odpowiednim sprzętem, powinna ich digitalizację zlecić na zewnątrz. Celowo argument oszczędzania na przestrzeni dyskowej (taśmowej) nie jest brany pod uwagę na pytanie, czy lepiej kolorową wielkoformatową grafikę zeskanować w skali szarości czy w ogóle, odpowiedź wcale nie jest oczywista. Wzorce koloru zostały zdominowane przez srgb wskazało je 7 z 9 respondentów, wybrał ProPhoto RGB, a nie wiedział, który wzorzec jest stosowany 0

111 (zał., rys. 46). Najwięcej, bo 5 osób z 9 korzysta z formatu TIFF, ze stratnej wersji JPEG, a po z TIFF z kompresją LZW i bezstratnej wersji JPEG (zał., rys. 47). Wszyscy z 6 respondentów stosują jednostronicową wersję TIFF (zał., rys. 48). 3.. Typy digitalizowanych dokumentów mapy Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 Mapy mają wiele wspólnego z grafikami. Główna różnica polega na tym, że w przypadku map punkt ciężkości z odwzorowania koloru przenosi się na odwzorowanie detali; niejednokrotnie znajdujące się na nich drobne nazwy geograficznie i legenda wymagają odpowiednio dobranej rozdzielczości, którą najlepiej obliczyć na podstawie najmniejszego znajdującego się na mapie znaku. Ponieważ w zbiorach biblioteki posiadają liczne czarno-białe mapy znajdujące się w różnym stanie, podjęto decyzję o rozbiciu tego rodzaju map na grupy z wyraźnym i niewyraźnym kontrastem i to zarówno w przypadku map do formatu A włącznie, jak i wielkoformatowych. Podobnie jak w przypadku grafik, tak i tutaj najwięcej respondentów zaznaczyło mapy kolorowe (3), następnie czarno-białe z wyraźnym kontrastem (6), w odcieniach szarości (5), czarno-białe z niewyraźnym kontrastem (3) i monochromatyczne () zał., rys Mapy czarno-białe z wyraźnym kontrastem Zdecydowana większość, bo 4 z 5 respondentów, którzy udzielili odpowiedzi na to pytanie, jako średnią rozdzielczość przyjętą dla tego rodzaju dokumentów podało 300 ppi, a 600 ppi (zał., rys. 50). Mapy skanowane są w 4-bitowym kolorze (3 z 6 respondentów), 6-bitowej () i 8-bitowej skali szarości () rys. 5. Połowa z 6 respondentów używa jako wzorca koloru srgb, Grey Gamma, a w przypadku respondent nie wiedział, który wzorzec jest stosowany w jego bibliotece (zał., rys. 5). Pierwotnym formatem zapisu w 5 z 6 przypadków jest TIFF (jednostronicowy zał., rys. 54), a w stratny JPEG (zał., rys. 53). Stosowanie JPEG (i to z kompresją) w przypadku map nie jest najlepszym pomysłem, chyba, że w połączeniu z wysoką rozdzielczością w innym przypadku nawet jeśli stopień kompresji jest niewielki, mogą powstać zniekształcenia obrazu skutecznie uniemożliwiające odczytanie detali. Na szczęście w tym konkretnym przypadku JPEG

112 zapisywany był z rozdzielczością 600 ppi, co powinno zneutralizować większość zniekształceń związanych ze stratną kompresją Mapy czarno-białe z niewyraźnym kontrastem Spośród 3 respondentów, którzy odpowiedzieli na to pytanie, wszyscy wpisali jako rozdzielczość skanowania 300 ppi (zał., rys. 55). Dwóch z nich wybrało 4-bitowy kolor, a pojedyncze przypadki objęły 8-bitową i 6-bitową skalę szarości (zał., rys. 56). Dwóch z 3 respondentów używa wzorca srgb, a nie wiedział, który wzorzec jest stosowany (zał., rys. 57). Wszyscy trzej jako pierwotny format zapisu stosują bezstratny TIFF (zał., rys. 58) w wersji jednostronicowej (zał., rys. 59) Mapy monochromatyczne Ponieważ tylko respondentów zadeklarowało digitalizację tego rodzaju map, zakres wskazanych wartości jest symboliczny: w obydwu przypadkach stosowana jest rozdzielczość 300 ppi (zał., rys. 60), każdy z respondentów skanuje z inną głębią koloru jeden w 6-bitowej skali szarości, drugi w 4-bitowym kolorze (zał., rys. 6), w obydwu przypadkach stosowanym wzorcem jest srgb (zał., rys. 6) i jako pierwotny format zapisu bezstratny TIFF (zał., rys. 63) w wersji jednostronicowej (zał., rys. 64). Porównanie parametrów digitalizacji opisanych w punktach 3.. i 3..3 przyniosło dość interesujące rezultaty: w zasadzie brak jest widocznych różnic w podejściu do map w zależności od ich kontrastu. Z drugiej strony w obydwu przypadkach stosowane ustawienia są tak przyzwoite, że na pewno zapewnią wysoką jakość docelowych cyfrowych matryc Mapy w odcieniach szarości Na 4 respondentów 3 razy podano rozdzielczość 300 ppi, razy 600 ppi, a raz 400 ppi (zał., rys. 65). W przypadku głębi koloru, 6-bitową skalę szarości i 4-bitowy kolor wybrało po respondentów z 5, a wskazał 8-bitową skalę szarości (zał., rys. 66). Dominującym wzorcem był srgb (3 z 5 respondentów), raz wskazano Grey Gamma, a osoba nie wiedziała, który wzorzec koloru jest stosowany (zał., rys. 67). TIFF w swojej nieskompresowanej wersji wykorzystywany jest przez 4 z 5 respondentów, a w postaci skompresowanej algorytmem LZW przez respondenta (zał., rys. 68). We wszystkich 5 przypadkach jest to jednostronicowa odmiana tego formatu (zał., rys. 69).

113 3..5. Mapy kolorowe 5 z 8 respondentów digitalizuje kolorowe mapy z rozdzielczością 300 ppi (zał., rys. 70). Rozdzielczość 600 ppi pojawiła się w odpowiedziach 3 razy, a 40 i 400 ppi po razie. Tym razem skala szarości nie wystąpiła w odpowiedziach na pytanie o głębię koloru 0 z respondentów wybrało 4-bitowy kolor, a 48-bitowy kolor pojawił się w 3 przypadkach (zał., rys. 7). Szczęśliwie dobór wzorców koloru nie zaburzył integralności udzielonych odpowiedzi 9 na respondentów stosuje srgb, a pojedyncze przypadki obejmują Adobe RGB 998 i ProPhoto RGB (zał., rys. 7). Brak wiedzy odnośnie stosowanego wzorca zaznaczyło respondentów. Najpopularniejszym pierwotnym formatem zapisu został standardowy TIFF używa go 0 z 3 respondentów (zał., rys. 73). Pojedynczy respondenci zaznaczyli również TIFF z kompresją LZW, stratny JPEG i RAW. We wszystkich wystąpieniach TIFF była to wersja jednostronicowa (zał., rys. 74). 3.. Typy digitalizowanych dokumentów mapy wielkoformatowe Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 Z uwagi na horrendalny koszt urządzeń mogących sprostać dużym formatom przy zachowaniu wysokiej jakości cyfrowego odwzorowania, wielkoformatowe mapy są digitalizowane w nielicznych przypadkach. Najwięcej respondentów (8) digitalizuje mapy kolorowe, w dalszej kolejności czarno-białe z wyraźnym kontrastem i w odcieniach szarości (3), czarno-białe z niewyraźnym kontrastem () i monochromatyczne () zał., rys Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem Na respondentów, którzy odpowiedzieli na pytanie o rozdzielczość digitalizowanych map, obydwaj podali 300 ppi (zał., rys. 76). W przypadku głębi kolorów, na 3 respondentów używa 6-bitowej skali szarości, a 4-bitowego koloru (zał., rys. 77), stosując odpowiednio wzorzec Grey Gamma () i srgb () zał., rys. 78. We wszystkich 3 przypadkach pierwotnym formatem zapisu jest TIFF (zał., rys. 79) w wersji jednostronicowej (zał., rys. 80). 3

114 3... Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem W przypadku map z niewyraźnym kontrastem parametry są w zasadzie niemal identyczne jak te podane w punkcie 3.., czyli respondentów używało 300 ppi (zał., rys. 8), z czego jeden skanował w 6-bitowej skali szarości, a drugi w 4-bitowym kolorze (zał., rys. 8), używając odpowiednio Grey Gamma i srgb (zał., rys. 83). W obydwu przypadkach pierwotnym formatem zapisu jest TIFF (zał., rys. 84) w wersji jednostronicowej (zał., rys. 85) Mapy wielkoformatowe monochromatyczne Omawiany rodzaj map digitalizował tylko z respondentów. Używa w tym celu rozdzielczości 300 ppi (zał., rys. 86), 4-bitowego koloru (zał., rys. 87) i wzorca srgb (zał., rys. 88), a rezultat zapisuje w formacie TIFF (zał., rys. 89) w wersji jednostronicowej (zał., rys. 90) Mapy wielkoformatowe w odcieniach szarości Z 3 respondentów, podczas skanowania map ustawia rozdzielczość 300 ppi, a 600 ppi (zał., rys. 9); stosuje 4-bitowy kolor i wzorzec srgb, 6-bitową skalę szarości i wzorzec Grey Gamma (zał., rys. 9, 93). Wszyscy trzej korzystają z formatu TIFF ze standardowego, z kompresją LZW (zał., rys. 94), we wszystkich 3 przypadkach jest to wersja jednostronicowa (zał., rys. 95) Mapy wielkoformatowe kolorowe Na 5 respondentów, 4 skanuje najbardziej wymagający rodzaj map wielkoformatowych w 300 ppi, a nawet w 600 ppi (zał., rys. 96). Żaden z 7 respondentów nie poszedł na kompromis i dlatego wskazano wyłącznie 4-bitowy (5) i 48-bitowy kolor (), nie stwierdzono stosowania skali szarości zał., rys. 97. Pięciu z 8 respondentów korzysta z wzorca srgb, po z Adobe RGB 998 i ProPhoto RGB, w przypadku respondent nie potrafił podać, który wzorzec jest stosowany przez jego bibliotekę (zał., rys. 98). Wszyscy z 8 respondentów zapisywali matryce w formacie TIFF 7 w jego wersji nieskompresowanej, a z kompresją LZW (zał., rys. 99), przy czym wszyscy używali jednostronicowej odmiany formatu (zał., rys. 00). 4

115 3.3. Typy digitalizowanych dokumentów odbitki fotograficzne Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 Odbitki fotograficzne pomimo pozornego podobieństwa do grafik, znacznie różnią się od nich formalnie. Mniej zróżnicowany jest nośnik, na którym są utrwalone, na ogół ich format jest niewielki. Tyle, że podobnie jak w przypadku grafik kluczem do ich właściwej digitalizacji jest możliwie wierne odwzorowanie kolorystyki i szczegółów, co niejednokrotnie pociąga za sobą skanowanie w bardzo wysokich rozdzielczościach. Najpopularniejszym rodzajem odbitek wśród respondentów były odbitki w odcieniach szarości (5), następnie kolorowe (4) i monochromatyczne (8) zał., rys. 0. Celowo nie wyodrębniono odbitek czarno-białych, gdyż z uwagi na charakter ich powstawania, takowe po prostu nie istnieją. Oczywiście mogą zdarzyć się pojedyncze egzemplarze, gdzie z różnych względów pojawi się tylko czerń i biel, jednak za dokumenty czarno-białe przyjęto takie, gdzie użyto czarnego barwnika naniesionego na białe tło Odbitki fotograficzne monochromatyczne 5 z 7 respondentów stosuje do digitalizowania tego rodzaju odbitek rozdzielczość 300 ppi, 600 ppi, a w jednym przypadku dodatkowo pojawiło się nawet.00 ppi (zał., rys. 0). W porównaniu do wszystkich wcześniej omawianych dokumentów są to zgodnie z przewidywaniami spore wielkości. W dużej mierze wynikają one z niewielkiego formatu konkretnych odbitek; użycie rozdzielczości 600 ppi i wyższej umożliwia późniejsze znaczne powiększenie obrazu bez widocznych pikseli. Po bardziej szczegółowej analizie pozostałych odpowiedzi respondenta używającego 00 ppi dodatkowo okazało się, że rozdzielczość ta nie była równoważona niewielką głębią barwną, ponieważ szła w parze z 4-bitowym kolorem, którego używało również 5 innych respondentów (na 9, którzy udzielili odpowiedzi na pytanie o głębię koloru) zał., rys. 03. Reszta przypadków objęła 6-bitową (3) i 8-bitową skalę szarości (). Najczęściej stosowanym wzorcem koloru był srgb (7 z 9 respondentów), dodatkowo raz wskazano Adobe RGB 998 (zał., rys. 04), a respondentów nie wiedziało, który wzorzec jest używany. Najwięcej respondentów (4 z 9) zapisuje matryce w nieskompresowanym formacie TIFF, 3 w TIFF z kompresją LZW, bezstratnym JPEG, a pojedynczy 5

116 respondenci używają TIFF z kompresją CCITT (chociaż brak w odpowiedziach informacji o trybie -bitowym), stratny JPEG i RAW (zał., rys. 05). Z 6 respondentów, którzy odpowiedzieli na pytanie o odmianę TIFF, wszyscy wskazali wersję jednostronicową (zał., rys. 06) Odbitki fotograficzne w odcieniach szarości W przypadku rozdzielczości, odpowiedzi 0 respondentów rozłożyły się po połowie: 5 stosuje 300 ppi, a pozostałych ppi (zał., rys. 07). Bardziej zróżnicowany jest zakres wartości głębi koloru: na 5 respondentów 7 używa 4-bitowego koloru, 5 6-bitowej skali szarości, 3 8-bitowej skali szarości, a 48-bitowego koloru (zał., rys. 08). Najczęściej wskazywanym wzorcem koloru był srgb 9 z 5 respondentów, Grey gamma i Adobe RGB 998 zaznaczone zostały po razy (zał., rys. 09). Cztery osoby nie wiedziały, który wzorzec jest stosowany. Wśród formatów zapisu dominantą został standardowy TIFF, którego używa z 5 respondentów, znacznie wyprzedzając TIFF z kompresją LZW i stratny JPEG (po ) oraz TIFF z kompresją CCITT, bezstratny JPEG i RAW (po przypadku) zał., rys. 0. Na respondentów wszyscy zaznaczyli TIFF jednostronicowy (zał., rys. ) Odbitki fotograficzne kolorowe Najbardziej wymagający (pod względem kompetencji personelu digitalizującego) rodzaj odbitek najczęściej skanowany jest z rozdzielczością 300 ppi (5 z 8 respondentów), minimalnie rzadziej w 600 ppi (4) zał., rys.. Co prawda w przypadku głębi koloru dominuje 4-bitowy kolor ( z 4 respondentów), ale wśród pozostały odpowiedzi pojawia się także 48-bitowy kolor (3) oraz niestety 6-bitowa skala szarości () zał., rys. 3. Na dodatek nie jest to głębia dodatkowa, używana wyłącznie w wyjątkowych sytuacjach, ale jedyna, z jaką ten respondent skanuje kolorowe odbitki. Trudno oprzeć się wrażeniu, że taka digitalizacja to zwykła strata czasu. Przecież całkiem niezłej jakości skanery, potrafiące nie najgorzej odwzorować kolory, mieszczą się w kwocie 500 zł, więc trudno znaleźć tu jakiekolwiek sensowne usprawiedliwienie takiej praktyki. Bo na pewno nie jest nim duży format odbitek, który rzadko przekracza A5. Dominującym wzorcem został srgb (0 z 4 respondentów), jako wzorzec dodatkowy dwukrotnie zaznaczono Adobe RGB 998, a 4 respondentów zaznaczyło brak informacji o używanym wzorcu (zał., rys. 4). 8 z 4 respondentów jako 6

117 pierwotny format zapisu wskazało TIFF bez kompresji, 3 TIFF z kompresją LZW i JPEG bez kompresji, JPEG z kompresją, a TIFF z kompresją CCITT (zał., rys. 5). Jako ciekawostkę należy zauważyć brak w zestawieniu formatu RAW. Okazuje się, że respondent używający tego formatu zaznaczył tylko odbitki monochromatyczne i w odcieniach szarości (digitalizując je w 4-bitowym kolorze), z pominięciem odbitek kolorowych. Sytuacja ma zabarwienie paradoksalne, ale może się wiązać z brakiem kolorowych odbitek w zbiorach danej biblioteki. Wszyscy z 0 respondentów deklarujących bazowanie na formacie TIFF używają jego jednostronicowej odmiany (zał., rys. 6) Typy digitalizowanych dokumentów negatywy, przezrocza Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 Negatywy i przezrocza mimo, że tak mocno związane z odbitkami fotograficznymi wymagają całkiem innego podejścia oraz, przede wszystkim, całkiem innego sprzętu. Cena dobrej jakości skanera do negatywów zdecydowanie przewyższa cenę porządnego skanera formatu A3, co automatycznie redukuje liczbę potencjalnych respondentów. Kolejną przyczyną niewielkiej popularności tego typu dokumentów jest ich rzadkie występowanie w zbiorach. I tak na 53 respondentów, raptem 7 digitalizuje negatywy i przezrocza w odcieniach szarości, 4 monochromatyczne, a tylko 3 kolorowe (zał., rys. 7). Jest to pierwszy do tej pory przypadek, kiedy kolorowa odmiana typu dokumentu jest najrzadziej digitalizowana Negatywy, przezrocza monochromatyczne Niestety, w przypadku negatywów i przezroczy (niezależnie od rodzaju) respondenci wyjątkowo wybiórczo potraktowali badanie i rzadko który udzielał odpowiedzi na szczegółowe pytania. Z tego powodu nieznana jest rozdzielczość, z jaką skanowane są monochromatyczne negatywy, ponieważ żaden respondent jej nie wpisał. W przypadku głębi koloru po jednej osobie wskazało tryb -bitowy, 6-bitową skalę szarości i 4-bitowy kolor (zał., rys. 8). Tylko odpowiedź pojawiła się przy pytaniu o wzorzec koloru i był to srgb (zał., rys. 9). Największą frekwencją w przypadku omawianego rodzaju dokumentów cieszył się pierwotny format zapisu wszyscy 4 respondenci wskazali bezstratny TIFF (w wersji jednostronicowej zał., rys. ), oraz dodatkowo w pojedynczych przypadkach PNG i PDF bez wewnętrznej kompresji grafik (zał., rys. 0). 7

118 3.4.. Negatywy, przezrocza w odcieniach szarości Na pytanie o rozdzielczość odpowiedziały osoby jedna wskazała 300 ppi, a druga 4000 (zał., rys. ). Druga ze wspomnianych wartości nie jest miarą rozdzielczości, a długością większego wymiaru wyrażoną w pikselach, charakterystyczną dla cyfrowych aparatów fotograficznych, które posługują się rozdzielczością obiektową, a nie liniową. W przypadku głębi koloru, po z 5 respondentów wybrało 6-bitową skalę szarości i 4-bitowy kolor, a po 8-bitową skalę szarości i 48-bitowy kolor (zał., rys. 3). Wśród wzorców koloru pojawiły się srgb (3 z 5 respondentów) i Adobe RGB 998 (), a osoby nie wiedziały, który wzorzec wskazać (zał., rys. 4). Pierwotny format zapisu zdominował TIFF nieskompresowany (5 z 6 respondentów) w wersji jednostronicowej (zał., rys. 6) i z kompresją LZW (zał., rys. 5) Negatywy, przezrocza kolorowe Tylko respondent udzielił odpowiedzi na pytanie o rozdzielczość i podał 4000 pikseli dla większego wymiaru (zał., rys. 7). W kwestii przyjętej głębi koloru, 3 respondenci zgodnie wskazali 4-bitowy kolor (zał., rys. 8) w połączeniu z wzorcem srgb (zał., rys. 9). Jednocześnie każdy z tych respondentów podał inny pierwotny format zapisu i były to: TIFF bez kompresji i z kompresją LZW oraz JPEG bez kompresji (zał., rys. 30). W obydwu wspomnianych przypadkach TIFF był w wersji jednostronicowej (zał., rys. 3) Typy digitalizowanych dokumentów mikroformy Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 W punkcie 3.4 wspomniano, że do digitalizacji negatywów i przezroczy wymagane są specjalistyczne skanery. Jeszcze bardziej zaawansowane urządzenia wykorzystywane są przy mikroformach. Właściwie każda większa biblioteka wciąż posiada jakiś rodzaj mikroform, jakkolwiek na ogół leżą one półkach. Wynika to z tego, że albo czytniki służące do ich przeglądania już od lat nie działają, albo po prostu młode pokolenie czytelników nie jest nimi zainteresowane. Stąd jeśli biblioteki posiadają wartościowe mikroformy, bardzo często decydują się na ich skanowanie (głównie w drodze outsourcingu) nawet w przypadkach, kiedy obok tych mikroform mają oryginalne dokumenty, które na nich zostały uwiecznione. Dzieje się tak głównie ze 8

119 względu na wygodę, szybkość i niższe koszty, chociaż takie rozwiązanie niesie również za sobą pewne mankamenty 0. W zaleceniach umieszczonych w Standardach ( ) podano tylko rodzaje mikroform mikrofilmy i mikrofisze. Żeby uzupełnić typologię, podczas konstruowania ankiety dodano także mikrokarty. Okazało się jednak, że jest to tak mało popularna mikroforma, że nie zaznaczył jej żaden z respondentów. Digitalizacja mikrofisz również jest rzadko spotykana, gdyż prowadzi ją tylko biblioteka, za to aż 8 respondentów zaznaczyło mikrofilmy (zał., rys. 3) Mikrofilmy W przypadku mikrofilmów przy rozdzielczości pojawiła się tylko odpowiedź 300 ppi (zał., rys. 33). Być może wynika to z zasady, że rozdzielczość skanowania mikrofilmów ustalana jest na podstawie typu uwiecznionego na nich dokumentu oryginalnego. Więcej respondentów (6) wypowiedziało się przy okazji głębi koloru po z nich używa 6-bitowej skali szarości i 4-bitowego koloru, a po 8-bitowej skali szarości i 48-bitowego koloru (zał., rys. 34). z 5 respondentów stosuje wzorzec srgb, a po brak wzorca i Adobe RGB 998 (zał., rys. 35). Dwóch respondentów nie wiedziało, który wzorzec jest stosowany w ich bibliotekach. Wśród pierwotnych formatów zapisu najpopularniejszy jest nieskompresowany TIFF (5 z 7 respondentów), ponadto pojedyncze przypadki objęły TIFF z kompresją LZW, JPEG bez kompresji, RAW i PDF bez wewnętrznej kompresji grafik (zał., rys. 36). Na 6 wspomnianych przypadków stosowania formatu TIFF, tylko w jest to odmiana wielostronicowa (zał., rys. 37) Mikrofisze Jak już wspomniano, tylko respondent zadeklarował digitalizację mikrofisz i używa do tego następujących parametrów: rozdzielczość 300 ppi (zał., rys. 38), 8-bitowa skala szarości (zał., rys. 39), wzorzec Grey Gamma (zał., rys. 40) i format zapisu TIFF (zał., rys. 4) w wersji jednostronicowej (zał., rys. 4). 0 A. Trembowiecki: Digitalizacja zbiorów bibliotecznych : teoria i praktyka. Warszawa: Centrum Edukacji Bibliotekarskiej, Informacyjnej i Dokumentacyjnej, 006, s Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego. Pod red. G. Płoszajskiego [dokument elektroniczny]. Warszawa: Biblioteka Główna Politechniki Warszawskiej, 008, s. 05. Tryb dostępu: [dostęp: r.]. 9

120 3.6. Typy digitalizowanych dokumentów prace licencjackie, magisterskie i doktorskie Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 W przeciwieństwie do wszystkich wcześniej omawianych typów dokumentów, które w zasadzie były niezależne od rodzaju biblioteki, prace licencjackie, magisterskie i doktorskie związane są głównie z bibliotekami uczelnianymi, co oczywiście zawęża grupę respondentów. Dodatkowo niektóre z tych bibliotek nie digitalizują prac w ogóle, umieszczając na swoich serwerach (najczęściej intranetowych) wyłącznie prace nowsze, dostarczone od razu w formie elektronicznej (born-digital), do czego od pewnego czasu zobowiązują studentów uczelniane przepisy. Różnice w ilości respondentów digitalizujących poszczególne rodzaje prac były stosunkowo niewielkie, lecz bardziej dziwi fakt, że w ogóle się pojawiły. Trudno stwierdzić, jak je interpretować. Czy skoro respondent nie zaznaczył prac z elementami w odcieniach szarości, to znaczy, że jego biblioteka ich nie digitalizuje, nawet jeśli występują w zbiorach na równi z innymi rodzajami (a występują na pewno)? Wśród badanych respondentów 8 digitalizuje prace z kolorowymi elementami graficznymi, 6 z czarno białymi elementami graficznymi i po 5 prace zawierające wyłącznie czarnobiałą treść i prace z elementami w odcieniach szarości (zał., rys. 43) Prace licencjackie, magisterskie i doktorskie czarno-biała treść Na pytanie o rozdzielczość skanowania odpowiedziało respondentów, w obu przypadkach podając 300 ppi (zał., rys. 44). z 5 respondentów jako głębi koloru używa 6-bitowej skali szarości, a pojedynczy respondenci wskazali tryb -bitowy, 8-bitową skalę szarości i 4-bitowy kolor (zał., rys. 45). Wśród wzorców koloru Grey Gamma i srgb stosowane są przez (z 5) respondentów, a brak wzorca i Adobe RGB 998 padły w odpowiedziach jednokrotnie (zał., rys. 46). W 4 z 5 przypadków używany jest TIFF bez kompresji, a w TIFF z kompresją LZW i PDF z wewnętrzną kompresją bezstratną grafik (zał., rys. 47). Wszyscy respondenci (5) stosują TIFF w wersji jednostronicowej (zał., rys. 48) Prace licencjackie, magisterskie i doktorskie zawierające czarno-białe elementy graficzne Wszyscy 3 respondenci skanują ten rodzaj prac w rozdzielczości 300 ppi, a dodatkowo w 600 ppi (zał., rys. 49). Wśród głębi koloru przeważał 4-bitowy 0

121 kolor (3 z 6 respondentów), poza nim w odpowiedziach padała także 8-bitowa skala szarości (), tryb -bitowy i 6-bitowa skala szarości () zał., rys. 50. Połowa z 6 respondentów stosuje przy tym wzorzec srgb, po osoby Grey Gamma i Adobe RGB 998 oraz tryb -bitowy (zał., rys. 5). osoba nie wiedziała, który wzorzec jest stosowany w jej bibliotece. Wyniki w odniesieniu do pierwotnego formatu zapisu są bardzo zbliżone do punktu z 6 respondentów korzysta z nieskompresowanej wersji TIFF, a po TIFF z kompresją LZW i PDF z wewnętrzną kompresją bezstratną grafik (zał., rys. 5). We wszystkich 6 przypadkach stosowania formatu TIFF, była to odmiana jednostronicowa (zał., rys. 53) Prace licencjackie, magisterskie i doktorskie zawierające elementy graficzne w odcieniach szarości Odpowiedzi udzielone na pytanie o rozdzielczość skanowania są identyczne jak w punkcie 3.6., czyli na 3 respondentów wszyscy używają 300 ppi, a dodatkowo 600 ppi (zał., rys. 54). Pozycją lidera wśród najczęściej używanej głębi koloru 4-bitowy kolor podzielił się z 8-bitową skalą szarości (po z 5 respondentów), pojedyncze wartości obejmowały też 6-bitową skalę szarości i 48-bitowy kolor (zał., rys. 55). Najpopularniejszym wzorcem koloru wybrano Grey Gamma (3 z 5 respondentów), następnie srgb () i Adobe RGB 998 oraz ProPhoto RGB (), a osoba nie wiedziała, który wzorzec wskazać (zał., rys. 56). 4 z 5 respondentów zapisuje matryce w formacie TIFF, a pojedyncze przypadki obejmują TIFF z kompresją LZW i PDF z wewnętrzną kompresją bezstratną grafik (zał., rys. 57). Każdy z 4 respondentów korzysta z jednostronicowej odmiany TIFF (zał., rys. 58) Prace licencjackie, magisterskie i doktorskie zawierające kolorowe elementy graficzne Po raz trzeci w przypadku rozdzielczości powtórzyły się wyniki znane z punktów 3.6. i na 3 respondentów wszyscy skanują w 300 ppi, a dodatkowo w 600 ppi (zał., rys. 59). Zakres wartości przy głębi koloru zmniejszył się do 4-bitowego (7 z 8 respondentów) i 48-bitowego koloru () zał., rys. 60. Stosowane wzorce niestety nie do końca współgrają ze wspomnianymi wartościami głębi koloru co prawda z 8 respondentów 4 wskazało srgb, ale wśród pojedynczych przypadków pojawia się Adobe RGB 998, ProPhoto RGB i nie pasujący tu Grey Gamma (zał.,

122 rys. 6). 3 respondentów nie wiedziało, który wzorzec jest używany w ich bibliotekach. Pierwotny format zapisu zdominowany został po raz kolejny przez nieskompresowany TIFF (5 z 8 respondentów), dwukrotnie zaznaczono bezstratny JPEG, a po razie TIFF z kompresją LZW i PDF z wewnętrzną bezstratną kompresją grafik (zał., rys. 6). Wszyscy spośród 6 respondentów korzystają z jednostronicowej odmiany TIFF (zał., rys. 63) Typy digitalizowanych dokumentów dokumenty urzędowe Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 53 O ile omawiane wcześniej prace licencjackie, magisterskie i doktorskie są domeną bibliotek uczelnianych, o tyle dokumenty urzędowe najczęściej spotkać można w bibliotekach publicznych, gdzie są gromadzone w charakterze dokumentów życia społecznego. Najczęściej digitalizowane są dokumenty z kolorowymi elementami graficznymi (), następnie te zawierające wyłącznie czarno-białą treść (0) oraz zawierające elementy graficzne w czerni i bieli, a także w odcieniach szarości (po 5) zał., rys Dokumenty urzędowe czarno-biała treść 4 z 5 respondentów skanuje ten rodzaj dokumentów z rozdzielczością 300 ppi, a z 00 ppi (zał., rys. 65). W zakresie głębi koloru 6 z 9 respondentów wskazało 4-bitowy kolor, tryb -bitowy, a pojedynczy respondenci 8-bitową i 6-bitową skalę szarości (zał., rys. 66). Dominującym wzorcem był srgb (5 z 9 respondentów), w dalszej kolejności zaznaczano tryb -bitowy (), Grey Gamma i Adobe RGB 998 () zał., rys. 67. osoba nie wiedziała, który wzorzec jest wykorzystywany do tego rodzaju dokumentów. Najwięcej respondentów (6 z 9) zapisuje pliki matrycowe w nieskompresowanym formacie TIFF, następnie w PDF bez wewnętrznej kompresji grafik (), bezstratnej i stratnej wersji JPEG oraz DjVu () zał., rys. 68. Na 6 przypadków stosowania TIFF, zawsze była to jego jednostronicowa odmiana (zał., rys. 69) Dokumenty urzędowe zawierające czarno-białe elementy graficzne Na 3 respondentów, skanuje dokumenty z rozdzielczością 300 ppi, a 00 ppi (zał., rys. 70). Z 4 respondentów połowa stosuje 4-bitowy kolor, a pozostali

123 8-bitową i 6-bitową skalę szarości (zał., rys. 7), wykorzystując przy tym wzorzec srgb (3 z 4 respondentów) i Grey Gamma () rys. 7. Zagadkową kwestią pozostaje sposób, w jaki z respondentów łączy wzorzec srgb z 6-bitową skalą szarości. Wszyscy 4 respondenci zapisują matryce w formacie TIFF, a z nich dodatkowo w DjVu (zał., rys. 73). Przy pytaniu o odmianę formatu TIFF, odpowiedzi udzieliło 3 respondentów każdy z nich wykorzystuje odmianę jednostronicową (zał., rys. 74) Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości W odpowiedzi na pytanie o ustawianą rozdzielczość, padła tylko jedna wartość: 300 ppi używa jej 4 respondentów (zał., rys. 75). W przypadku głębi koloru, z 4 respondentów zaznaczyło 4-bitowy kolor, a pozostali 8-bitową i 6-bitową skalę szarości (zał., rys. 76), przy czym 3 z nich używa wzorca srgb, a Grey Gamma (zał., rys. 77). 3 z 4 respondentów jako pierwotny formatu zapisu wykorzystuje standardowy format TIFF (jednostronicowy zał., rys. 79), a pojedyncze przypadki obejmują także TIFF z kompresją LZW oraz format DjVu (zał., rys. 78) Dokumenty urzędowe zawierające kolorowe elementy graficzne Podobnie jak w poprzednim punkcie w odpowiedziach 7 respondentów pojawiła się tylko jedna rozdzielczość 300 ppi (zał., rys. 80). Głębia koloru zdominowana została przez 4-bitowy kolor (8 z 0 respondentów), ale relatywnie często stosowany jest też 48-bitowy kolor (3) zał., rys. 8. Najpopularniejszym wzorcem jest srgb (8 z 0 respondentów), poza tym pojedyncze zaznaczenia uwzględniały Adobe RGB 998 i ProPhoto RGB (zał., rys. 8). Jedna osoba nie wiedziała, który wzorzec wskazać. Wśród pierwotnych formatów zapisu najczęściej stosowany jest nieskompresowany TIFF (8 z 0 respondentów), pozostałe formaty, tzn. TIFF z kompresją LZW, stratny JPEG i DjVu, zaznaczyło po respondencie (zał., rys. 83). Na 9 przypadków korzystania z TIFF, tylko w był to TIFF wielostronicowy (zał., rys. 84) Typy digitalizowanych dokumentów maszynopisy Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 5 3

124 Maszynopisy są nietypowe ze względu na ich dość niecodzienną pozycję wśród innych dokumentów; ich dystynktywną cechą jest narzędzie, za pomocą którego opatrzono je treścią. Jeszcze w latach 80. XX wieku maszyny do pisania były tak popularne, że stanowiły podstawowe urządzenie utrwalające tekst wszelkiego typu dokumentów urzędowych, prac magisterskich i doktorskich, a nawet niskonakładowych publikacji. Wśród respondentów mógł więc powstać dylemat, do której grupy dokumentów maszynopisy zaliczyć czy np. do jednej z wcześniej wymienionych (czyli ze względu na rodzaj niesionych treści), czy po prostu do maszynopisów. Dla potrzeb badania maszynopisy podzielone zostały na dwa rodzaje z wyraźnym (8 respondentów) i niewyraźnym kontrastem (9 respondentów) zał., rys Maszynopisy wyraźny kontrast Na 5 respondentów wszyscy skanują maszynopisy w rozdzielczości 300 ppi, a dodatkowo w 600 ppi (zał., rys. 86). 5 z 8 respondentów jako podstawowej głębi koloru używa 4-bitowego koloru, po trybu -bitowego i 6-bitowej skali szarości, a 8-bitowej skali szarości (zał., rys. 87). Najpopularniejszym wzorcem jest srgb (5 z 8 respondentów), następnie brak wzorca i Grey Gamma (po ) oraz Adobe RGB 998 (). Jedna osoba nie wiedziała, który wzorzec jest używany (zał., rys. 88). Wszystkich 8 respondentów wskazało jako główny format zapisu nieskompresowany TIFF (w wersji jednostronicowej zał., rys. 90), a dodatkowo DjVu (zał., rys. 89) Maszynopisy niewyraźny kontrast W przypadku rozdzielczości tych dokumentów, wyjątkowo rzuca się w oczy różnica w podejściu do ich digitalizowania w zależności od kontrastu zawartości z tłem strony. Pięciu respondentów wyłoniło dominanty 300 i 600 ppi, poza tym pojawiły się pojedynczo wartości 400 i 450 ppi (zał., rys. 9). 4-bitowy kolor zdominował głębię koloru (5 z 9 respondentów), poza nim zaznaczano 6-bitową skalę szarości (3), tryb -bitory i 8-bitową skalę szarości () zał., rys z 9 respondentów jako głównego wzorca używa srgb, Grey Gamma, a nie stosuje wzorca (zał., rys. 93). Jeden respondent nie potrafił wskazać wzorca. TIFF po raz kolejny został najpopularniejszych pierwotnym formatem zapisu zaznaczyło go 8 z 9 respondentów (we wszystkich przypadkach była to odmiana jednostronicowa rys. 95), pozostałe pojedynczo występujące formaty to stratny JPEG i DjVu (zał., rys. 94). 4

125 3.9. Typy digitalizowanych dokumentów nuty Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 5 Nuty są stosunkowo rzadko digitalizowanym typem dokumentów, co zapewne po części wynika z niewielkiego procentowego ich udziału w stosunku do reszty bibliotecznych zbiorów. Podobnie jak w przypadku maszynopisów, podzielono je na rodzaje ze względu na wyraźny (5 respondentów) i niewyraźny kontrast (3) zał., rys Nuty wyraźny kontrast Każdy z 3 respondentów, którzy odpowiedzieli na to pytanie, używa podczas digitalizacji rozdzielczości 300 ppi (zał., rys. 97). W kwestii głębi koloru zwraca uwagę brak trybu -bitowego i skali szarości; 3 z 4 respondentów stosuje 4-bitowy, a nawet 48-bitowy kolor (zał., rys. 98). Wzorzec srgb zaznaczyła połowa z 4 respondentów, poza tym w przypadku zaznaczono ProPhoto RGB, a w brak informacji o przyjętym wzorcu (zał., rys. 99). Najczęściej wymienianym formatem zapisu został TIFF (3 z 5 respondentów) w wersji jednostronicowej (zał., rys. 30), poza tym pojedynczo wskazane formaty to bezstratny JPEG i RAW (zał., rys. 300) Nuty niewyraźny kontrast Dwóch respondentów, którzy odpowiedzieli na pytanie o rozdzielczość ustawianą podczas digitalizacji, wpisało 300 ppi (zał., rys. 30), obydwaj wybrali także 4-bitowy kolor (zał., rys. 303), przy wzorcu jeden wskazał srgb, a drugi zaznaczył brak informacji o używanym wzorcu koloru (zał., rys. 304). W przypadku nut o niewyraźnym kontraście brak dominującego formatu zapisu, ponieważ każdy z 3 respondentów zaznaczył inny format, czyli TIFF (jednostronicowy zał., rys. 306), JPEG bez kompresji i RAW (zał., rys. 305) Typy digitalizowanych dokumentów rysunki techniczne Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 5 Rysunki techniczne były ostatnim predefiniowanym typem dokumentu, który został przedstawiony respondentom do wyboru. Analogicznie do punktów 3.8 i 3.9, 5

126 rysunki techniczne podzielono na te z wyraźnym (4 respondentów) i niewyraźnym kontrastem (3) zał., rys Rysunki techniczne wyraźny kontrast Na pytanie o rozdzielczość odpowiedziało respondentów, w obu przypadkach wpisując 300 ppi, a w dodatkowo 600 ppi (zał., rys. 308). Pomimo skromnej ilości respondentów (4), przy pytaniu o głębię koloru pojawiła się duża rozpiętość stosowanych rozwiązań: 6-bitowa skala szarości (), tryb -bitowy, 8-bitowa skala szarości i 4-bitowy kolor () zał., rys W przypadku stosowanego wzorca koloru 3 z 4 respondentów zaznaczyło Grey Gamma, a po brak wzorca i srgb (zał., rys. 30). Wszyscy 4 respondenci jako pierwotny format zapisu wskazali jednostronicowy TIFF (zał., rys. 3), a dodatkowo zaznaczył PDF z wewnętrzną bezstratną kompresją grafik (zał., rys. 3) Rysunki techniczne niewyraźny kontrast Na podstawie odpowiedzi udzielonych na pytanie o rozdzielczość skanowania niestety nie da się wyznaczyć modalnej, ponieważ każdy z respondentów wpisał inną rozdzielczość (300 i 400 ppi), a dodatkowo podał 600 ppi (zał., rys. 33). z 3 respondentów zaznaczyło 4-bitowy kolor, poza którym po razie pojawiły się także 8-bitowa i 6-bitowa skala szarości (zał., rys. 34), co wiązało się z korzystaniem z wzorca Grey Gamma ( z 4 respondentów) i srgb () zał., rys. 35. Na 3 respondentów, wszyscy używają TIFF (w wersji jednostronicowej zał., rys. 37), a dodatkowo PDF z wewnętrzną bezstratną kompresją grafik (zał., rys. 36). 3.. Typy digitalizowanych dokumentów inne, niż wskazane wcześniej Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: brak Jako uzupełnienie dla typów dokumentów opisanych w punktach , jedną stronę ankiety przeznaczono na 5 typów dokumentów, które nie zostały ujęte wcześniej. Niestety, mimo wyraźnego zaznaczenia w zaproszeniu do wzięcia udziału w badaniu, że ankieta nie dotyczy dokumentów audio-wizualnych, na stronie ankiety pojawiły się wyłącznie dokumenty tego typu lub dokumenty, których nazwy nie wpisano (co było równoznaczne z nieudzieleniem odpowiedzi). Ponieważ wartość tych odpowiedzi z punktu widzenia celów badania była zerowa, postanowiono całkowicie je pominąć. 6

127 3.. Pliki archiwalne Na podstawie danych zebranych w punktach powstała charakterystyka stosowanych w polskich bibliotekach formatów służących do przechowywania plików archiwalnych wraz z podziałem na typy dokumentów, więc celem serii pytań zawartych w podpunktach było określenie sposobów postępowania z wygenerowanymi plikami archiwalnymi, z naciskiem na ich przechowywanie i obróbkę Jak postępują Państwo z plikami uzyskanymi w trakcie skanowania / fotografowania? Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: 5 47 (9%) respondentów zadeklarowało, że wszystkie pliki archiwalne objęte są polityką długotrwałego przechowywania, że pliki archiwalne, po stworzeniu na ich podstawie wersji prezentacyjnych, są kasowane i że stosowany jest inny model postępowania (zał., rys. 38). Tylko w jednym z tych dwóch przypadków opisano wspomniany inny model postępowania: kopia na nośniku optycznym oraz na serwerze backupu (po wyczerpaniu miejsca na dyskach, jeśli w budżecie nie będzie możliwości rozbudowy, pozostanie okresowo kontrolowana kopia na nośnikach optycznych). Trudno nie oprzeć się wrażeniu, że pomimo zadeklarowania tego modelu jako nie mieszczącego się w zakresie wyznaczonym przez dwie wcześniej przytoczone predefiniowane wartości model ten jednak mieści się w polityce długotrwałego przechowywania, ponieważ wyeliminowanie redundantnego elementu LTP nie sprawia, że całość LTP automatycznie przestaje mieć miejsce. Stosowanie polityki długotrwałego przechowywania masterów wydaje się logicznym następstwem digitalizacji, jednak respondentów zaznaczyło, że digitalizacja służy wyłącznie wytworzeniu plików prezentacyjnych, tym samym pozbawiona jest całej swojej sfery archiwistycznej. I chociaż nasuwa się pytanie, czym może być podyktowany taki model postępowania, trudno znaleźć jakąś sensowną odpowiedź, tym bardziej, że argument wysokich kosztów LTP w świetle obecnych cen nośników optycznych wydaje się być już tylko mitem. Przechowywanie cyfrowych matryc chociażby z czysto praktycznego punktu widzenia jest przede wszystkim wygodne, gdyż ułatwia wszelkie przyszłościowe konwersje i eliminuje potencjalne ponowne angażowanie dokumentów oryginalnych. 7

128 3... Proszę wybrać stosowaną politykę długotrwałego przechowywania plików Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: 49 Najwięcej, bo 46 (94%) respondentów samodzielnie przechowuje mastery, z częściowego outsourcingu korzysta, a zdecydował się na całościowy outsourcing (zał., rys. 39). Sytuacja ta w ciągu najbliższych lat najprawdopodobniej ulegnie radykalnej zmianie w związku z wymogami Wieloletniego Programu Rządowego Kultura +, który na swoich beneficjentów nakłada obowiązek przekazania do podmiotów wskazanych przez Operatora egzemplarza kopii wzorcowej zdigitalizowanych obiektów ( ) przy użyciu nośników magnetycznych (tj. dyski twarde lub taśmy magnetyczne). Zatem udział modelu samodzielnego LTP zostanie zmniejszony kosztem jednego z dwóch pozostałych modeli, co na pewno należy traktować jako pozytywne zjawisko. Niemal zawsze samodzielne przechowywanie masterów wiąże się z trzymaniem ich w budynku biblioteki, nawet jeśli prowadzona jest celowa redundancja kopii rozmieszczonych w różnych częściach tego budynku. Najbezpieczniejszy model LTP zakłada przynajmniej odległe od siebie miejsca przechowywania kopii, co w tym przypadku będzie szczególnie ułatwione. Jeszcze kilka lat temu firmy będące potentatami na rynku krajowej digitalizacji energicznie przygotowywały ofertę odpłatnego przechowywania masterów (co niosło za sobą bardzo zaawansowane technologicznie zabezpieczenia), ale najwyraźniej polskie biblioteki wciąż nie są gotowe na model opierający się na outsourcingu. Powód jest prozaiczny zakup nawet sporej ilości dysków optycznych (na ogół dokonywany adhoc) jest bez porównania tańszy od stałej opłaty za hostowanie plików matrycowych Proszę wskazać stosowane typy nośników, na których docelowo przechowywane są pliki Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: 48 W treści pytania celowo zaznaczono, że chodzi o docelowe przechowywanie, żeby wykluczyć możliwe wątpliwości respondentów, ponieważ w trakcie digitalizacji twarde dyski / macierze dyskowe zawsze są pierwotnym miejscem zapisu. Wśród predefiniowanych wartości umieszczono nie tylko najczęściej spotykane rozwiązania, 8 Regulamin Programu Wieloletniego KULTURA+: Priorytet Digitalizacja [dokument elektroniczny]. Tryb dostępu: [dostęp: r.].

129 ale też te stosunkowo rzadkie, opisywane na ogół przez specjalistów. Nie było żadnym zaskoczeniem, że najpopularniejszym sposobem archiwizowania masterów wciąż okazuje się wypalanie ich na dyskach optycznych (30 respondentów), przechowywanie na luźnych dyskach twardych (9) lub w macierzach dyskowych (6). W dalszej kolejności stosuje się NAS (czyli systemy dysków twardych podłączane bezpośrednio do sieci logicznej) 3 i nośniki taśmowe (6), dyski magnetooptyczne obsługiwane przez zmieniarkę () oraz 3 rozwiązania nie uwzględnione podczas konstruowania ankiety, z czego w przypadkach opisano je jako stosowanie nośników Blu-ray (zał., rys. 30). Należy tu nadmienić, że Blu-ray, pomimo dużej pojemności i stosunkowo młodej technologii, są dyskami optycznymi, więc można je było zaliczyć do bardziej odpowiedniej kategorii. Dominacja dysków optycznych nie dziwi są niedrogie i nawet te specjalistyczne bardzo wysokiej jakości nie przekraczają kilku złotych za sztukę. Do niedawna ceny dysków twardych również były na tak niskim poziomie (w przeliczeniu na zł za GB), że niejednokrotnie bardziej opłacało się kupić jeden duży dysk twardy zamiast wielu optycznych. Wskutek katastrofy naturalnej w Tajlandii, która miała miejsce w październiku 0 r., uległy zniszczeniu fabryki największych światowych dostawców dysków twardych 4, co spowodowało, że z dnia na dzień ich ceny uległy nawet podwojeniu. Okazało się wtedy, że mimo tak zaporowych cen, popyt zmalał tylko nieznacznie, więc nie przewiduje się powrotu poziomu cen sprzed katastrofy, co z kolei w dalszej perspektywie może sprawić, że pojedyncze dyski twarde nie będą już tak chętnie wykorzystywane w archiwizacji masterów. Macierze dyskowe są optymalnym rozwiązaniem przy wszelkich zaawansowanych systemach archiwizacji są elastyczne i zdecydowanie lepiej chronią dane niż wcześniej omawiane popularniejsze rozwiązania. Ich największymi wadami są cena i w przypadku rozbudowy dostęp do modeli dysków identycznych z już posiadanymi. Na zastanawiającą ciekawostkę zakrawa fakt, że pomimo dużej liczby respondentów korzystających z macierzy (6), we wszystkich przypadkach nie było to rozwiązanie autonomiczne, lecz zawsze połączone z innymi najczęściej z pojedynczymi dyskami optycznymi. 3 4 Network Attached Storage. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. Powódź winduje ceny. W Polsce drożeją dyski twarde. [W:] wyborcza.biz [on-line]. Tryb dostępu: W_Polsce_drozeja_dyski_ twarde.html [dostęp: r.]. 9

130 Typowe rozwiązania NAS (które należy odróżnić od kompleksowych macierzy NAS, zaliczanych podczas badania do macierzy dyskowych) są stosunkowo drogie, nieelastyczne i na ogół kojarzone raczej z multimedialnymi zastosowaniami. Rozwiązania taśmowe z kolei, poza wysokimi cenami urządzeń i samych nośników, są problematyczne w obsłudze. Wszelkiego typu systemy zmieniarek do dysków optycznych lub magnetooptycznych to rozwiązania bardzo kosztowne, które zestawione z alternatywnym darmowym ręcznym podawaniem nośników na ogół nie są nawet brane pod uwagę Korekta plików archiwalnych Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: 5 Było to pierwsze z pytań, które skupiły się na postępowaniu z masterami, a konkretnie na ich korygowaniu. Brak ingerencji w plik matrycowy powstały bezpośrednio w efekcie zeskanowania / sfotografowania dokumentu zadeklarowało 30 respondentów (zał., rys. 3). Jest to sposób postępowania zalecany przez specjalistów, ponieważ pozwala uniknąć negatywnych skutków źle przeprowadzonej korekty, czy to związanych ze źle skalibrowanym sprzętem, czy też z tzw. czynnikiem ludzkim. Jedenastu respondentów zamiast modyfikować mastery, ogranicza się wyłącznie do korygowania ich kopii, co ma na celu polepszenie jakości obrazu w docelowych plikach prezentacyjnych. Rzadko udaje się zeskanować dokument w taki sposób, żeby nie wymagał korekty przekoszenia albo drobnych czynności mających uwypuklić jasność, kontrast, nasycenie itp. Najrozsądniejszym kompromisem wydaje się wtedy pozostawienie matryc w takiej postaci, w jakiej je pierwotnie wygenerowano i dokonanie wszelkich zmian właśnie na ich kopiach. Dziesięciu respondentów wybrało bezpośrednie korygowanie źródłowych plików matrycowych, co ma tę zaletę, że w przypadku ponownej konwersji do innego formatu nie trzeba będzie zaczynać od powtórnego skorygowania konwertowanych skanów. Jest to zaleta i oszczędność czasu, ale tylko wtedy, kiedy faktycznie jakość obrazu zawartego na skanie uległa obiektywnej poprawie. Pozostaje jeszcze kwestia przeprowadzonych czynności, gdyż niektóre są na tyle inwazyjne, że bardzo głęboko ingerują w strukturę całego obrazu, zmuszając oprogramowanie graficzne do przeliczenia wartości każdego piksela, niejednokrotnie z pomocą mechanizmu interpolacji. Wtedy nawet jeśli jakość odwzorowanego obrazu lepiej się prezentuje, to 30

131 zachodzi ryzyko, że w trakcie korekty mogły ulec zniszczeniu lub zniekształceniu jakieś istotne detale Sposób postepowania ze skorygowanymi kopiami Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: W przypadku korzystania z modelu zakładającego korygowanie wyłącznie kopii masterów, powstaje pytanie, co następnie dzieje się z tymi skorygowanymi kopiami. Siedmiu z respondentów obejmuje je podobnie jak same mastery programem LTP (zał., rys. 3). Dzięki temu w przyszłości zapewniony będzie łatwy dostęp zarówno do pierwotnego pliku, jak i jego poprawionej wersji, co wydaje się optymalnym, chociaż zasobożernym rozwiązaniem. Trzech respondentów po wykonaniu docelowej konwersji usuwa skorygowane kopie, a w przypadku stosowany jest inny model, przez respondenta nazwany modelem mieszanym, w którym zapewne decyzja o kasowaniu lub archiwizowaniu skorygowanych kopii podyktowana jest dodatkowymi czynnikami Sposób przeprowadzania korekty Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: Celem tego pytania było uzyskanie informacji w zakresie stopnia zautomatyzowania procesu korekty skanów w polskich bibliotekach. Okazuje się, że respondentów bazuje na ręcznym modyfikowaniu skanów. Takie indywidualne podejście jest czasochłonne i mało efektywne, ale pozwala optymalnie skorygować każdy plik. 8 respondentów wybrało opcję trybu mieszanego, czyli korekty ręcznej połączonej w pewnych warunkach z wsadową. Tyko w przypadku zaznaczono całkowite poleganie na korekcie wsadowej, co jest wielce ryzykownym modelem, chociaż pozwalającym wyeliminować najczęstsze wąskie gardło digitalizacji, czyli długotrwałość ręcznego poprawiania plików (zał., rys. 33) Czynności wykonywane w trakcie korekty Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: Wykaz najpopularniejszych przekształceń, którym mogą ulegać mastery, umieszczono 3

132 w punktach Digitalizacji piśmiennictwa 5. Przy konstruowania ankiety wzięto częściowo pod uwagę podział przekształceń tam zawarty (w zakresie przekształceń bezstratnych) i na tej podstawie zdefiniowano wartości przedstawione respondentom do wyboru. Wśród przekształceń bezstratnych, najpopularniejszym zabiegiem jest kadrowanie stosują je wszyscy respondenci (zał., rys. 34). Następne w kolejności są korekcja kolorów 3 respondentów i obrót o kąt będący wielokrotnością Najpopularniejszą inwazyjną czynnością podczas korygowania jest obrót o dowolny kąt (korekta przekoszenia) 8 respondentów. Podczas obracania grafiki algorytmy nadają nową wartość praktycznie każdemu pikselowi, co prowadzi do bezpowrotnej utraty pewnych informacji zawartych w oryginale. Pozostałe zaznaczane czynności to: korekcja jasności i kontrastu (4), ostrości co najmniej tak radykalna dla obrazu, jak korekta przekoszenia (), nasycenia (0), eliminacja artefaktów i zniekształceń (9), zmiana wymiarów obrazów (8), zmiana rozdzielczości (6), zmiana głębi bitowej koloru oraz w przypadku dodatkowe czynności nie ujęte w predefiniowanych odpowiedziach. Niestety, respondent nie określił, jakie to czynności. Gdy spojrzy się na ilość bardzo istotnych przekształceń, którym poddawane są mastery, tym bardziej doniosły wydaje się postulat ich nienaruszalności i pracy na kopiach. Algorytmy czołowych programów graficznych ulegają ciągłej ewolucji i stają się coraz doskonalsze. Czynność, która obecnie zniekształca korygowany obraz (polepszając jego walory wizualne), w przyszłości może przynieść zamierzony efekt przy jednoczesnym znacznym zminimalizowaniu inwazyjności w informacje zakodowane w tym obrazie Oprogramowanie stosowane do korekty skanów Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: Pytanie o stosowane oprogramowanie jest o tyle istotne, że praktycznie każdy program dysponuje innymi algorytmami na wykonywanie podobnych czynności. Może to prowadzić do sytuacji, gdzie taka sama korekta tego samego pliku zastosowana z takimi samymi parametrami, w rezultacie da różniące się jakościowo wyniki. Przeprowadzając analizę porównawczą jakości algorytmów w najpopularniejszych 5 3 Digitalizacja, op. cit., s. 3-6.

133 programach graficznych stosowanych w bibliotekach, możemy uzyskać informację o orientacyjnej jakości wynikowych plików. Najczęściej używanym przez respondentów oprogramowaniem służącym do korygowania skanów jest Adobe Photoshop 0 respondentów (zał., rys. 35). Jest to najbardziej zaawansowany program graficzny znajdujący się na rynku, którego możliwości wykraczają daleko poza podstawowe poprawianie obrazów. Niestety, jest to okupione bardzo wysokimi kosztami. W dalszej kolejności zaznaczano oprogramowanie dostarczone przez producenta skanera / aparatu oraz program nie występujący na predefiniowanej liście (9). O programach spoza listy mowa będzie w następnym akapicie. Po 6 respondentów zaznaczyło GIMP i IrfanView, 5 Corel Photo-Paint, Corel Paint Shop Pro i Adobe Photoshop Elemenents. Respondenci wśród programów nie ujętych w ankiecie podawali XnView (5), FastStone Image Viewer (), FastStone Image Resizer, Picasa, Paint.NET i... DocumentExpress Editor (). W przypadku ostatniego programu zapisanie go w poczet programów graficznych jest o tyle niefortunne, że nie zezwala on na manipulowanie właściwościami grafiki, lecz co najwyżej na manipulowanie sposobami jej konwersji do formatu DjVu Pliki prezentacyjne Rodzaj pytania: wielokrotnego wyboru Liczba respondentów: 50 Pliki prezentacyjne determinują formę, w jakiej użytkownik ma kontakt ze zdigitalizowanym dokumentem. Ich rola może nie jest tak fundamentalna jak masterów, ale trudno oprzeć się wrażeniu, że mimo wszystko są deprecjowane. Rozmaite standardy, zalecenia i normy skupiają się głównie na formatach służących do LTP, a tymczasem to właśnie prawidłowe generowanie i konwersja do formatów prezentacyjnych jest wyznacznikiem jakości obcowania użytkownika z cyfrowymi obiektami i chociaż wielu specjalistom trudno to zaakceptować w szerszej perspektywie z punktu widzenia użytkownika ma większe znaczenie. Dlaczego więc wciąż tak mało się o nich mówi i pisze? Na to pytanie niniejsza praca nie odpowie. Odpowie za to na kilka innych, które być może pomogą w nakreśleniu modelu korzystania przez polskie biblioteki z możliwości oferowanych przez pliki prezentacyjne. Nie jest tajemnicą, że w polskich bibliotekach cyfrowych króluje format DjVu (40 z 50 respondentów), w dalszej kolejności PDF (6), JPEG (4), PNG () i JPEG

134 () zał., rys respondentów zaznaczyło format inny niż podany na liście, ale w polu przeznaczonym na jego nazwę wpisano wyłącznie formaty przeznaczone do zapisu materiałów audio-wizualnych (tzn. MP3, FLV, WMV), w związku z czym podczas dalszych rozważań nie wzięto ich pod uwagę. W kolejnych podpunktach przybliżone zostaną szczegółowe parametry generowania formatów prezentacyjnych, które rzucą światło na ich potencjalną jakość i stopień przyjazności dla użytkowników DjVu DjVu jest jednym z dwóch najpopularniejszych formatów hybrydowych (drugim jest PDF). Mimo oszałamiającej kariery, jaką ze względu na swoje unikalne właściwości 6 zrobił w polskich bibliotekach cyfrowych, wciąż poza Polską jest formatem dość egzotycznym. W efekcie nie jest wspierany przez najpopularniejsze czytniki e-booków 7, a rynek oprogramowania do jego generowania i edycji ogranicza się w zasadzie do produktów właściciela formatu, czyli obecnie firmy Caminova. Najczęściej wykorzystywanym programem do obsługi formatu jest DocumentExpress Professional (5 z 34 respondentów), dalsze pozycje zajmują DocumentExpress Enterprise (9), DjVu Libre (8), DocumentExpress Desktop i PDFDjVu (4) oraz inne oprogramowanie (3), gdzie w przypadkach był to DjVu Solo, a w DocumentExpress Editor (zał., rys. 37). Popularność DE Professional wynika zarówno z tego, że jest to jedyny kompletny pakiet do obsługi DjVu, jak i z tego, że jest sprzedawany w komplecie z wersją Enterprise. Enterprise to wersja nastawiona na bardzo duże projekty (dlatego kosztuje ok. 0 razy drożej niż Professional), ponieważ jej siła tkwi w obsłudze zadań wsadowych i gorących folderów, a także możliwości jej indywidualnego oprogramowania w celu dalszej automatyzacji procesu konwersji. Największą wadą wszystkich wersji DocumentExpress jest wbudowany moduł OCR, którego działanie pozostawia wiele do życzenia, a efektów tego działania nie da się korygować. Wyłącznie Enterprise pozwala na skorzystanie z zewnętrznego oprogramowania OCR, a i to w sposób wielce niewygodny A. Trembowiecki: Digitalizacja, op. cit., s Comparison of e-book readers. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp:.0.0 r.]. A. Trembowiecki: Polskie biblioteki cyfrowe A.D. 00: kształtowanie paradygmatu. W: Cyfrowy świat dokumentu: wydawnictwa, biblioteki, muzea, archiwa. Pod red. H. Hollendra. Warszawa: Centrum Promocji Informatyki Sp. z o.o., 0, s

135 DE Desktop to odchudzona (a tym samym tańsza) wersja Professional, pozbawiona m.in. opcji OCR. DjVu Libre jest bezpłatnym, wzorowanym na funkcjonalności DE Enterprise, zestawem bibliotek i programów. Żeby w pełni wykorzystać możliwości tego pakietu, należy samemu napisać odpowiednią aplikację, lub obsługiwać go z wiersza poleceń np. za pomocą plików wsadowych. Największą wadą DjVu Libre jest całkowity brak mechanizmu OCR dla konwertowanych map bitowych. PDFDjVu jest darmowym programem stworzonym na bazie DjVu Libre i jak sama nazwa wskazuje służy do konwersji plików PDF do DjVu, wraz z zachowaniem niewidzialnej warstwy tekstowej oryginału. Jest on bardzo przydatny, gdyż w kombinacji z popularnym programem do OCR (ABBYY FineReader) pozwala otrzymywać dokumenty DjVu z wysokiej jakości OCRem, co niejednokrotnie eliminuje konieczność posiadania zaporowo drogiego DE Enterprise. Twórcy PDFDjVu wciąż rozwijają ten program, ponieważ posiada on jeszcze wiele błędów (np. w niektórych przypadkach nieprawidłowo rozpoznaje polskie znaki diakrytyczne). DjVu Solo to chronologicznie najstarszy generator DjVu firmy LizardTech (wcześniejszego właściciela formatu DjVu), który obecnie już nie jest oficjalnie dystrybuowany i co najwyżej znaleźć go można w rozmaitych serwisach hostujących oprogramowanie. Jego funkcje ograniczone są do absolutnego minimum, ale jest za to darmowy. Pytanie o stosowany profil konwersji miało na celu przybliżenie dominującego charakteru plików DjVu. Najwięcej, bo 0 z 34 respondentów korzysta z profilu normal, który jest domyślnie ustawiony w programach DocumentExpress Desktop i Professional (zał., rys. 38). W zupełności wystarcza do większości zastosowań, sprawnie rozdzielając wierzchnią wektorową warstwę od bitmapowego tła. W 7 przypadkach stosowany jest profil photo, który nie tworzy warstwy wektorowej, ale za to bardzo dokładnie kompresuje całą konwertowaną bitmapę algorytmem zbliżonym do JPEG 000. Dzięki operacjom na warstwach możliwym w DE Enterprise i DjVu Libre, można ten profil wzbogacić dodatkowo o niewidzialną warstwę tekstowa, dzięki czemu powstaje plik prezentacyjny bardzo wysokiej jakości z przeszukiwalnym tekstem. W dalszej kolejności wymieniano profil samodzielnie stworzony (9), electronic (5), manuscript (4), bitonal i drawing (), oraz map (). 7 respondentów nie potrafiło odpowiedzieć, który profil jest stosowany. W przypadku przeciętnej rozdzielczości przyjętej dla DjVu, z 3 respondentów zostaje przy domyślnych 300 ppi, a pojedyncze odpowiedzi obejmują także 50, 00 i 600 ppi (zał., rys. 39). Gdy chodzi o podawanie rozdzielczości DjVu, niemal 35

136 zawsze jest mowa o rozdzielczości wydzielonej warstwy tekstowej. Stąd powszechnie panujące marketingowe przekonanie, że im wyższa rozdzielczość dokumentu źródłowego, tym bardziej wielkość pliku DjVu może ulec zmniejszeniu, co w pewnych warunkach może rzeczywiście być zgodne z rzeczywistością. Należy mieć jednak na uwadze, że format DjVu to także tło, którego rozdzielczość np. w przypadku profilu normal równa jest /3 rozdzielczości warstwy tekstowej. Żeby jednak zbytnio nie komplikować i tak już bardzo rozbudowanej ankiety, poprzestano wyłącznie na najbardziej rozpowszechnionym znaczeniu rozdzielczości dla DjVu. Kolejną kwestią, na którą należy zwrócić uwagę jest fakt, że o ile w przypadku profilu normal domyślna wielkość 300 ppi nie robi wrażenia, o tyle w profilu photo, gdzie występuje tylko jedna warstwa, 300 ppi to naprawdę sporo. Następne pytanie koncentrowało się na wewnętrznej strukturze plików DjVu, tzn. wzbogacaniu ich o systemy zakładek pozwalających wygodniej poruszać się po treści wielostronicowych publikacji. Okazuje się, że na 35 respondentów, w ogóle nie stosuje tego typu wartości dodanej (zał., rys. 330). Powodem może być nieintuicyjny i niewygodny sposób edycji zakładek w plikach DjVu (mowa o oprogramowaniu firmy Caminova) lub po prostu używanie formatu DjVu głównie w przypadku niewielkich objętościowo dokumentów (np. gazet), które zakładek nie potrzebują. Jeszcze innym powodem może być brak czasu na takie szczegółowe pochylanie się nad każdym dokumentem w sytuacji, gdy biblioteka wytwarza ich wiele tysięcy. respondentów zaznaczyło, że dodaje systemy zakładek, ale tylko w niektórych przypadkach, natomiast zadeklarowało, że zakładki są tworzone we wszystkich plikach DjVu. Kwestią wspólną dla wszystkich analizowanych formatów prezentacyjnych jest ich sposób ochrony. Biblioteki z różnych względów decydują się na ograniczenie wtórnego obrotu zdigitalizowanymi dokumentami, ew. odgórne zdefiniowanie katalogu czynności, których użytkownik nie będzie mógł wykonać z danym plikiem. Potencjalny zestaw zabezpieczeń jest inny dla niemal każdego formatu. W przypadku DjVu 4 z 30 respondentów w ogóle nie zabezpiecza plików, 3 zaznaczyło zabezpieczanie znakiem wodnym, a 4 zabezpieczanie w inny sposób, z czego wymieniono: zabezpieczenie hasłem, dystrybucję WWW i archiwizowanie (zał., rys. 33). Pomijając ostatnie sposoby, które trudno sensownie zinterpretować, powstaje pytanie o ideę zabezpieczania plików DjVu hasłami. Po co digitalizować dokumenty i umieszczać je on-line, gdy nie można ich otworzyć bez podania hasła? 36

137 Najprawdopodobniej były ku temu jakieś racjonale powody, niestety respondent ich nie uwzględnił w swojej odpowiedzi. Szalenie ważną sprawą związaną nie tylko z formatem DjVu, ale z digitalizacją w ogóle, jest OCR. Od jakości rozpoznania tekstu niejednokrotnie zależy w ogóle możliwość wyszukania danego dokumentu. Uwaga ta jest szczególnie doniosła w przypadku gazet, dla których nawet najlepszy i najbardziej szczegółowy opis bibliograficzny jest z punktu widzenia czytelnika nieprzydatny. 8 z 35 respondentów wzbogaca pliki DjVu o OCR za pomocą mechanizmu wbudowanego w DocumentExpress, 7 w ogóle nie dodaje warstwy OCR, 7 innych stosuje w tym celu bardziej wyrafinowany silnik autorstwa innej firmy, a 3 korzysta z modelu mieszanego, tzn. modułu OCR oferowanego przez DocumentExpress oraz w zależności od konkretnego dokumentu / grupy dokumentów programu do OCR innej firmy (zał., rys. 33). Jak już wspomniano mechanizm OCR wbudowany w DocumentExpress jest bardzo niedokładny, ale z prostymi dokumentami radzi sobie całkiem dobrze. W przypadku układów wielokolumnowych korzystanie z niego całkowicie traci sens, gdyż na ogół zwraca przypadkowe ciągi znaków. Wykorzystanie bardziej zaawansowanego programu zewnętrznego wymaga albo posiadania DE Enterprise, albo DjVu Libre / PDFDjVu (oraz dużej ilości czasu i cierpliwości). Gdy respondent wybrał jeden z modeli uwzględniających poddawanie OCRowi plików DjVu, pojawiało się pytanie o posiadanie w swoich repozytoriach plików DjVu nie poddanych OCRowi (czyli np. utworzonych w przeszłości, gdy format DjVu nie umożliwiał jeszcze generowania warstwy OCR). Na 6 respondentów połowa takie pliki wciąż posiada (zał., rys. 333), więc kolejne pytanie dotyczyło procentu takich nierozpoznanych plików w stosunku do ogółu posiadanych plików DjVu. U większości respondentów (5) stanowią one do 0% wszystkich plików, respondentów zaznaczyło przedział -5%, a po % i 5-75%, (zał., rys. 334). Ostatnie pytanie odnośnie nierozpoznanej części plików dotyczyło ewentualnych szans poddania ich OCRowi w przyszłości. 7 z 3 respondentów nie potrafiło jednoznacznie odpowiedzieć, 4 zadeklarowało wzbogacenie ich o warstwę OCR, a wykluczyło wracanie do tych plików (zał., rys. 335). 37

138 3.3.. PDF PDF mimo, że starszy od DjVu, wciąż jest bardzo popularny a poza granicami Polski na pewno zdecydowanie popularniejszy od swojego konkurenta. Wspierają go czytniki e-booków, a od niedawna wtyczkę służącą do jego obsługi zaczęto integrować z nowymi przeglądarki internetowymi, dzięki czemu jest w niezbędnym zakresie obsługiwany przez cienkiego klienta (w czym DjVu nie może się z nim równać, gdyż wciąż wymaga ręcznego zainstalowania odpowiedniej aplikacji). Chociaż z dokumentami born-digital radzi sobie lepiej niż DjVu, w przypadku map bitowych ustępuje pola rywalowi, co jest bezpośrednim powodem dominacji DjVu w polskich bibliotekach cyfrowych. Mimo wszystko wciąż jest stosowany w digitalizacji i nic nie zapowiada, żeby miało to się kiedykolwiek zmienić. Pierwsze pytanie dotyczyło oprogramowania, za pomocą którego pliki są generowane i edytowane. W tym miejscu miała miejsce spora niespodzianka, ponieważ najwięcej respondentów ( z 5) używa do tego celu ABBYY FineReader, czyli zaawansowanego programu OCR, a nie jednego z produktów właściciela formatu, firmy Adobe (zał., rys. 336). Pojawiły się one dopiero w dalszej kolejności; 0 respondentów korzysta z Adobe Acrobat Standard, 7 z Adobe Acrobat Pro, a 6 z innego programu. Wśród wspomnianych innych programów wymieniono 3: ABBYY PDF Transformer, PDF Creator (czyli wirtualna drukarka wyłącznie generująca pliki PDF, lecz nie dająca możliwości ich późniejszej edycji) oraz CorelDraw X4 (pakiet graficzny, posiadający możliwość eksportu do formatu PDF, ale podobnie jak PDF Creator nie obsługujący edycji wygenerowanych plików). Odpowiednikami profili DjVu są typy plików PDF. Respondentom dano do wyboru wszystkie popularne typy, lecz na 5 osób aż 4 zaznaczyły standardowy PDF, dodatkowo PDF/A (odmianę archiwalną), a nie wiedziała, który typ jest generowany w jej bibliotece (zał., rys. 337). W przypadku PDF kwestia rozdzielczości nie jest tak złożona, jak przy DjVu jeśli zadeklarowano pewną wartość, to dotyczy ona wprost grafik osadzonych w dokumencie. Dlatego też 300 ppi wykorzystywane przez 4 na 6 respondentów to bardzo przyzwoity wynik, zapewniający wysoką jakość grafik (zał., rys. 338). Inne wartości, które podali pojedynczy respondenci to 44, 50, 00, 400 i 600 ppi. Jeśli chodzi o wzbogacanie plików systemem zakładek, z 3 respondentów ich nie dodaje, 7 robi to we wszystkich wygenerowanych plikach, a 5 tylko w niektórych (zał., rys. 339). 38

139 Kwestia zabezpieczeń PDF jest bardziej rozbudowana niż we wszystkich pozostałych formatach razem wziętych. Na przestrzeni lat PDF ulegał rozmaitym modyfikacjom i ulepszeniom, co zaowocowało bardzo prostymi w implementacji mechanizmami zabezpieczeń, pozwalającymi szczegółowo decydować o sposobie, w jaki użytkownik będzie korzystał z danego dokumentu. 7 z 6 respondentów w ogóle nie używa zabezpieczeń, natomiast wśród bibliotek je stosujących najpopularniejsze są: ochrona przed modyfikacją (9), ochrona przed drukowaniem i kopiowaniem (4) oraz znak wodny (3). W przypadku jako dodatkowy sposób ochrony podano wewnętrzny mechanizm platformy dlibra, obsługującej większość polskich bibliotek cyfrowych (zał., rys. 340). I znowu można zrozumieć biblioteki chcące uchronić wytworzone przez siebie PDFy przed modyfikowaniem i dalszym umieszczaniem ich w Internecie (być może w zmodyfikowanej formie), ale czym umotywować wyłączenie możliwości wydruku? Przecież wielu użytkowników dłuższe teksty czyta nie bezpośrednio z monitora, ale w formie tradycyjnej, po uprzednim ich wydrukowaniu. Podobnie jak w przypadku PDF, także i tutaj duży nacisk położono na zagadnienia związane z OCRem. Okazuje się, że 0 z 5 bibliotek w ogóle nie stosuje OCR, 8 robi to z zastosowaniem oprogramowania nie będącego produktem firmy Adobe, 4 za pomocą mechanizmu (wielce niedoskonałego) wbudowanego w Adobe Acrobat, a wykorzystując model mieszany (Adobe Acrobat + oprogramowanie do OCR) zał., rys. 34. Dziesięć z 6 bibliotek poddających pliki OCRowi posiada w swoich repozytoriach pliki nie rozpoznane (zał., rys. 34), które w 7 przypadkach nie przekraczają 0% całych zasobów PDF, w jest ich -5%, a w powyżej 75%, co jest bardzo wysokim odsetkiem (zał., rys. 343). Odnośnie rozpoznania tych plików w przyszłości 4 respondentów nie potrafiło udzielić odpowiedzi czy to nastąpi, a po 3 zadeklarowało przeprowadzenie OCR i pozostawienie już istniejących plików bez zmian (zał., rys. 344). Do ciekawostek należy zaliczyć fakt, że wśród respondentów planujących rozpoznać w przyszłości pliki PDF jest również ten, który zaznaczył, że nierozpoznane pliki stanowią ponad 76% wszystkich zasobów PDF znajdujących się w repozytorium jego biblioteki JPEG Rola JPEG jako formatu prezentacyjnego na przestrzeni lat uległa radykalnej zmianie. Początkowo używany był przy dowolnego typu dokumentach (czego 39

140 najlepszym przykładem jest Polska Biblioteka Internetowa 9 ), by wraz z upływem czasu wyspecjalizować się w dokumentach jednokartkowych o charakterze graficznym. Siła JPEG polega na jego powszechności, elastyczności i niewielkich rozmiarach plików. Może być wygenerowany za pomocą dowolnego programu graficznego (osobną kwestią jest zróżnicowana jakość służących do tego algorytmów) i otwierany na dowolnym cienkim kliencie. JPEG występuje w dwóch podstawowych odmianach: stratnej oraz mniej popularnej bezstratnej. 8 z 5 respondentów zaznaczyło stosowanie obu tych odmian w zależności od potrzeb, 5 wykorzystuje wyłącznie wersję stratną, a bezstratną (zał., rys. 345). Najczęściej wykorzystywaną rozdzielczością jest 300 ppi (połowa z 8 respondentów), co jest wysoką wartością biorąc pod uwagę fakt, że w przypadku grafik umieszczanych na stronach internetowych dominującą rozdzielczością jest 7-96 ppi (zał., rys. 346). Pojedyncze przypadki obejmowały również 00, 50, 00 i 400 ppi. Jedyne zabezpieczenie, jakie oferuje sam format, to osadzenie widocznego lub niewidocznego znaku wodnego. z 4 respondentów nie zabezpiecza JPEG, chociaż część z nich w niektórych przypadkach decyduje się na widoczny znak wodny (4) zał., rys W przypadku respondent jako inny sposób zabezpieczenia podał bardzo ciekawy mechanizm: pojedyncza strona dzielona jest na fragmenty przesyłane do przeglądarki w losowej kolejności PNG Format PNG, który z założenia miał być kompromisem między GIF a JPEG, pomimo wielu lat funkcjonowania na rynku, wciąż nie osiągnął takiej popularności, na jaką wydaje się zasługiwać. Z osób, które stosują go przy udostępnianiu on-line, tylko jedna odpowiedziała na pytanie o rozdzielczość i wpisała 50 ppi (zał., rys. 348). Obydwaj respondenci zabezpieczają pliki jeden za pomocą widzialnego, a drugi niewidzialnego znaku wodnego (zał., rys. 349) Polska Biblioteka Internetowa Strona główna. [W:] Polska Biblioteka Internetowa [on-line]. Tryb dostępu: [dostęp: r.].

141 3.4. Głęboka digitalizacja Jeszcze kilka lat temu głęboka digitalizacja była zjawiskiem występującym niezmiernie rzadko. Nastąpił prawdziwy boom na digitalizowanie wszystkiego, co się tylko da i liczyła się przede wszystkim ilość, która zazwyczaj wiązała się z wartością zadeklarowaną w danym projekcie o dofinansowanie. Z każdym dniem biblioteki jednak zbliżają się do chwili, kiedy skończą się zbiory, które można i przede wszystkim warto digitalizować. Co wtedy? Specjaliści twierdzą, że nastąpi era przeniesienia punktu ciężkości na digitalizowanie materiałów audio-wizualnych i przestrzennych. Lecz biorąc pod uwagę rozwój rynku książki i ewolucję nawyków czytelniczych, istnieje duże prawdopodobieństwo, że kolejnym etapem (który nie będzie oderwany od rzeczywistych potrzeb użytkowników) może okazać się głęboka digitalizacja już zdigitalizowanych zbiorów. W chwili obecnej obiekty cyfrowe zgromadzone w polskich bibliotekach cyfrowych nie przedstawiają dla właścicieli czytników e-booków (których popularność lawinowo rośnie) praktycznie żadnej wartości. Albo są zapisane w formacie DjVu, albo w PDF, który służy za kontener dla skanów. W żadnym z tych przypadków nie da się w sensowny sposób wykorzystać czytnika zbudowanego w oparciu o technologię E-Ink 0, który przecież z założenia powinien do tego służyć. Jedynym sensownym wyjściem z tej sytuacji jest pozyskanie warstwy tekstowej z już zdigitalizowanych dokumentów (w głównej mierze chodzi tu o książki), poddanie jej redakcji, a następnie zapisanie w możliwie dużej liczbie formatów przeznaczonych do czytania na urządzeniach przenośnych. Czasy prostego zeskanowania i automatycznego rozpoznania mechanizmem OCR bezpowrotnie mijają i należy już dziś mieć tego świadomość. Z tych względów w ankiecie jedną stronę dedykowano sprawdzeniu, jak popularna jest obecnie w Polsce głęboka digitalizacja. Niszowość głębokiej digitalizacji w kraju potwierdzona została przez raptem 6 (na 50) respondentów, którzy ją stosują (zał., rys. 350). W 4 z 5 przypadków procentowy udział dokumentów poddanych głębokiej digitalizacji w stosunku do ogółu zdigitalizowanych dokumentów nie przekroczył 0%, a w zamknął się w przedziale -5% (zał., rys. 35), co jest zaskakująco wysokim odsetkiem. Największą wartością dokumentów utworzonych w wyniku głębokiej digitalizacji jest rozpoznany i zredagowany tekst, więc oczywiście mastery w jej przypadku nie mogą mieć postaci plików bitmapowych. Połowa z 4 respondentów jako podstawowy format archiwalny 0 E Ink. [W:] Wikipedia [on-line]. Tryb dostępu: [dostęp: r.]. 4

142 wskazała DOC / DOCX, czyli format związany z program MS Word, który pozwala przechowywać dowolne dane i świetnie sprawdza się jako platforma wyjściowa dla rozmaitych konwersji (zał., rys. 35). Pozostałe przypadki objęły formaty XML i TXT. Kolejne pytanie dotyczyło generowanych formatów prezentacyjnych, gdzie wśród 5 respondentów po 3 razy zaznaczono PDF i DjVu (zał., rys. 353), co tylko dowodzi, że w przypadku born-digital, a taki charakter mają dokumenty poddane głębokiej digitalizacji, PDF sprawdza się przynajmniej tak samo dobrze (o ile nie lepiej) niż DjVu. Można wysnuć teorię, że przypadki zastosowania DjVu bardziej wiążą się tu z przyjętą w danej bibliotece konwencją generowania głównie plików tego jednego typu, niż jakimiś bardziej racjonalnymi przesłankami. Ostatnie pytanie wiązało się z ułożeniem treści w docelowych plikach prezentacyjnych. Jedno podejście zakłada wierne odtworzenie układu treści i elementów graficznych tak, jak w oryginalnym dokumencie, drugie natomiast bardziej liberalne oderwane jest od oryginału, ponieważ wygląd stron determinowany jest przez właściwości urządzenia, na którym dokument jest otwarty. Okazuje się, że żadna z tych opcji nie ma przewagi wśród 4 respondentów głosy podzieliły się po połowie (zał., rys. 354) Metadane W nawiązaniu do punktu.4.3 niniejszej pracy, gdzie opisana została publikacja Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego, postanowiono sprawdzić, na ile metadane istotne są w praktyce digitalizacyjnej polskich bibliotek. Jak już wspomniano, w publikacji tej metadane przedstawiono jako sprawę kluczową dla utworzenia sprawnego, jednolitego ogólnokrajowego systemu cyfrowych repozytoriów. Na podstawie prostych pytań spróbowano ocenić świadomość istnienia różnego typu metadanych i być może umiejętność ich efektywnego wykorzystania w bibliotekach Proszę wskazać sposób wypełniania metadanych EXIF Rodzaj pytania: pytanie jednokrotnego wyboru Liczba respondentów: 50 Pierwsze pytanie dotyczyło sposobu, w jaki wypełniane są metadane EXIF (zaszytych w plikach zapisanych w formacie TIFF i JPEG). Sygnałem, że metadane w przypadku bibliotecznej digitalizacji niekoniecznie są traktowane priorytetowo, jest największy odsetek respondentów (9 osób), który nie potrafił na nie odpowiedzieć 4

143 (zał., rys. 355). Czternastu respondentów zaznaczyło, że zakres i wartości metadanych są z góry definiowane, 3 że metadane są fabrycznie zdefiniowane i w całości automatycznie generowane przez system obsługujący skaner / aparat cyfrowy, a 4 że metadane są fabrycznie zdefiniowane i automatycznie generowane przez system obsługujący skaner / aparat cyfrowy, a następnie automatycznie lub ręcznie modyfikowane Czy korzystają Państwo z jednego (lub wielu) standardu metadanych administracyjnych, technicznych lub strukturalnych przy tworzeniu i zarządzaniu cyfrowymi obiektami (nie dotyczy EXIF)? Rodzaj pytania: pytanie wielokrotnego wyboru Liczba respondentów: 47 Ponownie największa grupa respondentów (5) nie potrafiła udzielić odpowiedzi (zał., rys. 356). 8 razy zadeklarowano, że metadane są generowane automatycznie, a zarządzanie odbywa się na podstawie fizycznego lub logicznego umiejscowienia plików archiwalnych, czyli w praktyce na podstawie wykazu nośników i zapisanych na nich masterów. Tylko w nielicznych wypadkach zaznaczono korzystanie z metadanych administracyjnych (3), technicznych () lub innych (). Niestety, ani razu nie podano nazwy używanego standardu, co najwyżej w przypadku innego standardu wpisano wewnętrzne ustalenia biblioteki, co również niewiele mówi Zestawienie otrzymanych wyników z zaleceniami Podstawowym celem niniejszej pracy było naszkicowanie aktualnego obrazu najczęściej używanych w polskich bibliotekach parametrów stosowanych przy digitalizacji rozmaitych zbiorów oraz porównanie tego obrazu z zaleceniami zawartymi w Standardach ( ). Zestawienie ma charakter tabeli (stanowiącej załącznik nr ), gdzie zalecenia skonfrontowano z wartościami modalnymi otrzymanymi w wyniku badania. Wyniki podzielono na grupy zdefiniowane w Standardach ( ) i przytoczone w punkcie.4.3. (tabela 4 ). Największy problem stanowiło zaliczenie pewnych rodzajów dokumentów do konkretnych grup. Na potrzeby badania katalog rodzajów dokumentów został rozszerzony w stosunku do tego umieszczonego w zaleceniach, więc należało w miarę precyzyjnie je porozmieszczać. W tym momencie z całą mocą wypłynęła kwestia, która nie rzucała się w oczy podczas wcześniejszej analizy zaleceń umieszczonych Zob. s

144 w Standardach ( ). Jeśli omawia się możliwe typy dokumentów bibliotecznych i parametry, które powinny towarzyszyć ich digitalizacji w oderwaniu od konkretnych przypadków dokumentów, mogą umknąć aspekty bardziej zasadnicze niż dobór odpowiedniej rozdzielczości i głębi koloru. W tym przypadku wadliwy okazuje się niestety już sam podział na grupy i wszystkie konsekwencje, które z nim się wiążą. Mankament ten najwyraźniej widać, gdy staramy się do właściwej grupy przyporządkować dwa przykładowe rodzaje dokumentów: dokumenty urzędowe z kolorowymi elementami graficznymi i kolorowe odbitki fotograficzne. Pierwszy przypadek wymaga na pewno podstawowego wzorca i głębi koloru połączonego z niewygórowaną rozdzielczością, drugi najlepiej wzorca Adobe RGB 998 (lub lepszego), 48-bitowego koloru i minimum 300 ppi. W obydwu przypadkach mamy do czynienia z kolorem, ale każdy z nich wymaga całkiem innego podejścia. Tymczasem okazuje się, że w zaleceniach dla wszystkich kolorowych dokumentów (z pewnymi wyjątkami) przewidziano tylko grupę F, gdzie proponowane parametry w zasadzie są bardziej odpowiednie dla odbitek fotograficznych niż prostej poligrafii. Kolejną poważną wadą zaleceń jest dedykowanie jednej grupy wyłącznie dla dokumentów wielkoformatowych niezależnie od rodzaju tych dokumentów. Czy naprawdę mapę wielkoformatową czarno-białą i kolorową powinno się digitalizować z takimi samymi ustawieniami? Zarówno zdrowy rozsądek, jak i praktyka przyjęta w bibliotekach podpowiadają, że niekoniecznie. Niemniej, żeby nie wprowadzać drastycznych przetasowań między grupami, pozostawiono wszystkie dokumenty wielkoformatowe w grupie G. Kłopoty sprawiły też dokumenty monochromatyczne, które przecież nie są tożsame z czernią i bielą, a bardziej kojarzą się z sepią (co potwierdza przykładowy wykaz dokumentów w grupie F). Tymczasem w ramach jednego zestawienia monochromatyczność była traktowana niejednolicie, co utrudniło przydzielenie dokumentów do odpowiednich grup. Założono więc, że monochromatyczność nie będąca ani czernią i bielą, ani skalą szarości (ponieważ posiadają one własne grupy) potraktowana zostanie jako kolor, stąd obecność dokumentów monochromatycznych w grupie F. Analiza zestawienia zaleceń z wynikami badania w przypadku grupy A na pierwszy rzut oka może sprawiać druzgocące wrażenie, że polskie biblioteki nie wiedzą, jak dobrać tak podstawowy parametr, jakim jest rozdzielczość. Problem jest jednak bardziej skomplikowany w zaleceniach proponowane parametry należy traktować łącznie, czyli w przypadku grupy A zalecenie nie brzmi: z dostępnych formatów 44

145 najlepiej używać TIFF, rozdzielczość ustawić minimum na 400 ppi, a optymalny tryb dla grupy A to bit na piksel. Należy je raczej odczytywać: mastery powinny być w najgorszym przypadku zapisywane w formacie TIFF przy jedoczesnej minimalnej rozdzielczości 400 ppi ustawionej dla -bitowego trybu. Różnica pozornie niewielka, ale pozwala spojrzeć na zestawienia z innego punktu widzenia; biblioteki co prawda na ogół nie stosują trybu -bitowego i 400 ppi (lub więcej), ale za to przyjęły w to miejsce 4-bitowy kolor, przy którym rozdzielczość 300 ppi jest wystarczająca (dla dokumentów z grupy A). Powstaje więc zasadnicze pytanie: czy digitalizowanie czarno-białych dokumentów w kolorze jest postępowaniem wbrew zaleceniom, czy tylko przejawem zastosowania parametrów jakościowo wyższych? Warto zwrócić uwagę, że jedyną wartością nominalnie niższą od zalecanych jest rozdzielczość, której jak wcześniej wspomniano nie można porównywać w przypadku -bitowego i 4-bitowego koloru. Ponownie zdroworozsądkowe rozumowanie nakazuje przychylić się do drugiej możliwości, co automatycznie determinuje wniosek, że w przypadku każdego rodzaju dokumentów z grupy A stosowane w bibliotekach parametry zapewniają zdecydowanie wyższą jakość masterów niż nawet zalecane w Standardach ( ). Przyczyn takiego stanu rzeczy można upatrywać w omawianych wcześniej niskich cenach pamięci masowych, może w normalizacji parametrów digitalizacji w ogóle, a może po prostu w większej świadomości, która przychodzi wraz z doświadczeniem. W przypadku grupy B, która skupia w sobie dokumenty nieco bardziej złożone wizualnie, miejsce ma analogiczna sytuacja jak w grupie A w zdecydowanej większości bibliotek zamiast zalecanej skali szarości dominuje kolor. Tym razem jednak nie ma wątpliwości co do rozdzielczości we wszystkich rodzajach dokumentów zadeklarowano co najmniej 300 ppi. Biorąc pod uwagę, że sugerowane 300 ppi w zaleceniach zestawione było ze skalą szarości, ponownie stosowane rozwiązania przewyższyły wartości proponowane. Grupa C zawiera dokumenty o charakterze stricte graficznym, z wyłączeniem ich kolorowych (i monochromatycznych) rodzajów. Ponownie wartości modalne przewyższyły zalecane, miejscami nawet bardzo znacznie (np. 600 ppi, srgb i Adobe RGB 998 zamiast sugerowanych 400 ppi, 6-bitowej skali szarości i Grey Gamma). Grupa D odnosi się do wąskiego zakresu dokumentów: negatywów i przezroczy. Tym razem modalne nie do końca sprostały wartościom zalecanym. Obecność bezstratnej wersji JPEG przy kolorowych negatywach i przezroczach (zamiast TIFF) 45

146 można wytłumaczyć tym, że na pytanie o format zapisu odpowiedziało tylko respondentów i każdy co prawda zaznaczył TIFF, ale dodatkowo skazał także JPEG. Trudno powiedzieć, który z tych formatów jest wiodący, lecz można zaryzykować stwierdzenie, że w tym konkretnym przypadku warunek zgodności z zaleceniami jest spełniony, gdyż każdy z respondentów używa TIFF. Przy głębi koloru ma miejsce podobna sytuacja dla negatywów i przezroczy monochromatycznych respondent podał tryb -bitowy. Niestety, ponownie wiąże się to z małą liczbą respondentów, która ma tendencje promowania rozmaitych wartości granicznych. W trakcie omawiania poszczególnych dokumentów wskazywano co bardziej jaskrawe anomalie, których trudno uniknąć przy takiej liczbie badanych. Na ogół ginęły one jednak przy modalnych, co wyjątkowo w tym wypadku nie miało miejsca. O ile w zakresie formatu zapisu i głębi koloru można wytłumaczyć wartości niższe od zalecanych, o tyle w przypadku wzorców koloru sprawa jest jasna przy żadnym z rodzajów negatywów i przezroczy nie osiągnięto nawet wymagań minimalnych, które zakładały dla koloru wzorzec Adobe RGB 998, podczas gdy respondenci tradycyjnie bazują na srgb. Grupa E, mimo tego, że zawiera wyłącznie mikroformy, sprawiła najwięcej problemów. Podczas opracowywania ankiety brano pod uwagę zrobienie wyjątku dla mikroform i zastosowanie odmiennego, niż we wszystkich innych typach dokumentów, schematu pytań o parametry. Zalecenia np. nie przewidują tu konkretnej rozdzielczości, a jedynie odsyłają do rozdzielczości stosowanej dla utrwalonego typu dokumentu. Podobnie problematyczny był dobór wzorca. Ostatecznie jednak podjęto decyzję o nie wychodzeniu poza przyjęty schemat pytań, co przyniosło pozytywne rezultaty w postaci konkretnych wartości, których jednak częściowo nie da się skonfrontować z zaleceniami. Pozostałe modalne (format zapisu i głębia koloru) spełniają wymagania Standardów ( ). W przypadku najliczniejszej grupy F skupiającej kolorowe typy dokumentów (poza dokumentami wielkoformatowymi) trudno mówić o jakichś niespodziankach. Najpopularniejsza w wynikach całego badania kombinacja formatu TIFF, 300 ppi, 4-bitowego koloru i wzorca srgb także i tutaj zdominowała wszystkie modalne. Za każdym razem deklarowano używanie zalecanego formatu TIFF w wersji nieskompresowanej. We wszystkich wypadkach podano rozdzielczość minimum 300 ppi, czyli równą minimalnej, a w 4 nawet 600 ppi, czyli o 00 ppi więcej od zalecanej. Głębia koloru również nie osiągnęła wartości gorszych niż minimalne. Dla porządku należy dodać, że w przypadkach oprócz 4-bitowego koloru stosowano także 46

147 6-bitową skalę szarości w obydwu przypadkach dotyczyło to dokumentów monochromatycznych. W zakresie wzorca koloru tylko w przypadku została osiągnięta wartość minimalna, czyli Adobe RGB 998, która dodatkowo wystąpiła w przypadku dwumodalnym, razem z srgb. O wątpliwościach w przydzielaniu dokumentów do grupy G pisano już wcześniej. Jest to jedyna grupa, w której czynnikiem decydującym był wyłącznie duży format. Z tych względów znalazły się w niej dokumenty wielkoformatowe, niezależnie od ich charakteru i rodzaju, co od samego początku budziło zastrzeżenia i nieuchronnie prowadziło do powstania nieprawidłowości przy konfrontacji z zaleceniami. Przy formacie zapisu wszystko było jasne wszędzie występuje TIFF, a jedynie w przypadku grafik monochromatycznych respondent zaznaczył stratną wersję JPEG jako jedyny stosowany przez siebie format. Ponieważ na pytanie w tym konkretnym przypadku odpowiedziało tylko respondentów i drugi podał TIFF, siłą rzeczy stratny JPEG wszedł do zestawienia jako część wartości dwumodalnej. Wyjątkowo zgodnie wypadły wyniki porównania rozdzielczości we wszystkich przypadkach modalna równa była wartości minimalnej i zalecanej, czyli 300 ppi. Nieprawidłowości, które wspomniano w poprzednim akapicie pojawiły się już przy okazji głębi koloru. Z wspomnianych wcześniej względów w grupie znalazły się nie tylko kolorowe dokumenty, więc pomimo minimalnej wartości równej 4-bitowemu kolorowi, wśród modalnych znalazła się m.in. 6-bitowa skala szarości, lecz wyłącznie przy grafikach monochromatycznych i w odcieniach szarości oraz przy czarno-białych mapach. Pomijając dyskusyjne grafiki monochromatyczne, czy błędem jest stosowanie 6-bitowej skali szarości do grafik czarno-białych i w odcieniach szarości? Tym samym trudno uznać, że w tych konkretnych przypadkach wartości minimalne nie zostały osiągnięte, a wręcz przeciwnie użycie skali szarości w aż 6-bitowej wersji uznać należy za bardzo dobrą praktykę. Analogicznie sytuacja wygląda przy wzorcach ze skalą szarości związany jest Grey Gamma, który wymyka się sklasyfikowaniu jako będący tu poniżej wartości minimalnej. Odnośnie pozostałych przypadków żaden nie sprostał nawet minimalnej wartości, ponieważ wszędzie zaznaczono stosowanie srgb Uwagi końcowe Zestawienie wyników badania z zaleceniami pozwoliło zaobserwować kilka szalenie interesujących zjawisk. Przede wszystkim udowodniło, że w niepamięć odeszły czasy, kiedy liczono się z każdym zapisanym gigabajtem danych. Przytłaczająca większość dokumentów skanowana jest przede wszystkim w kolorze w wysokiej 47

148 rozdzielczości 300 ppi, gwarantującej optymalny stosunek szczegółowości zapisanych obrazów do wielkości plików, a to wszystko zapisane w nieskompresowanej wersji formatu TIFF, który świetnie nadaje się zarówno do LTP, jak i do wszelkiego typu konwersji. Z drugiej jednak strony bardzo mało bibliotek używa 48-bitowego koloru, który pozwala utrwalić zdecydowanie pełniejszą informację o barwach, za pomocą których opisany jest skan. Być może pokutuje tu kwestia przyzwyczajeń; wielu specjalistów od digitalizacji zajmuje się nią już od co najmniej kilku lat, kiedy to 4-bitowy kolor określany był wręcz jako true color (z j. ang. prawdziwy kolor ) i uważany za w pełni oddający barwy oryginalnego dokumentu. Na dobrą sprawę niewprawne oko nie zauważy różnicy między skanem wykonanym z 48-bitową głębią i jego 4-bitowym odpowiednikiem, za to na pewno każdy zauważy różnicę w wielkości plików w przypadku nieskompresowanej wersji TIFF, 48-bitowy kolor generuje dwa razy większe rozmiary. Inną przyczyną małej popularności 48-bitowej głębi koloru jest duża popularność skanerów średniej klasy, którym obce są niuanse kolorystyczne, które są z kolei domeną urządzeń z najwyższej półki cenowej. W wypadku skanowania z 48-bitową głębią za pomocą przeciętnej jakości skanerów, jedyną zaświadczającą o tym cechą będzie rozmiar plików. Chciałoby się w tym miejscu przytoczyć slogan reklamowy jednego z proszków do prania: skoro nie widać różnicy, to po co przepłacać? Nieuzasadnione przejście z 4-bitowego na 48-bitowy kolor to przecież gotowy przepis na podwojenie wydatków na LTP. Kolejnym ciekawym zjawiskiem jest problem wzorców kolorystycznych. Zadziwiająco wielu respondentów odpowiedziało, że po prostu nie wie, który z wzorców jest wykorzystywany. Świadczyć to może o powszechności bardziej rzemieślniczego, a mniej fotograficznego podejścia do digitalizacji. Dla kogoś, kto nie ma specjalistycznego przygotowania z zakresu teorii koloru i cyfrowego odwzorowania barw, wzorzec lepszy niż srgb może być jednoznaczny z przysporzeniem sobie kłopotów. Jak więc w wielkim skrócie wygląda aktualny obraz digitalizacji sensu stricto? Wygląda bardzo obiecująco. Skończyły się dni panowania odcieni szarości, wszędzie dominuje kolor, z czego tylko należy się cieszyć. Niestety jednocześnie uwypuklił się problem kwalifikacji personelu zajmującego się digitalizacją. Na podstawie wyników badania da się wyczuć potrzebę organizowania zakrojonych na szeroką skalę specjalistycznych kursów pozwalających na upowszechnienie się wspomnianego 48

149 fotograficznego podejścia do dokumentów. Wtedy nie dość, że wzrośnie jakość cyfrowych obiektów umieszczanych on-line (która na dzień dzisiejszy jest szalenie zróżnicowana), to wzrośnie też świadomość personelu w kwestii możliwości operowania światłem i kolorem w celu uzyskiwania optymalnych skanów i ograniczenia do minimum późniejszej korekty. A wtedy upowszechnienie się wzorców lepszych niż srgb nastąpi już samoczynnie. 49

150 Zakończenie Może nasunąć się pytanie, czemu miała służyć konfrontacja zaleceń ze stanem faktycznym przedstawiającym produkcję obiektów cyfrowych w polskiej digitalizacji bibliotecznej. Przede wszystkim Standardy w procesie digitalizacji obiektów dziedzictwa kulturowego są, ze względów wspomnianych w pierwszym rozdziale, najistotniejszą krajową publikacją w tej dziedzinie. Można zaryzykować stwierdzenie, że dążą do uzyskania statusu dokumentu określającego prawdziwe (a nie tylko postulowane) standardy dla digitalizacji i tym samym wyznaczającego kierunek jej rozwoju. Żeby jednak mówić o rozwoju, trzeba najpierw poznać stan aktualny, który w przyszłości będzie punktem odniesienia dla pomiaru dynamiki tego rozwoju. Dotychczasowe badania i ankiety dotyczyły spraw bardziej globalnych, związanych z makrodigitalizacją. Czyli przede wszystkim gdzie się digitalizuje i co się digitalizuje. Kwestia jak się digitalizuje w zasadzie nie istnieje w publikacjach, a jeśli już, to dotyka tylko spraw najbardziej podstawowych, skupiając się podobnie jak Standardy ( ) na formacie i rozdzielczości masterów. O faktycznie używanych formatach prezentacyjnych, ich odmianach i zabezpieczeniach nie mówi się w zasadzie nic. To samo dotyczy kwestii OCR do tej pory nikt nie był w stanie określić, czy udostępniane obiekty cyfrowe na ogół są poddawane temu procesowi, a jeśli tak to czy wszystkie i jakiej jakości jest to OCR. Istotne pytania, na które nikt wcześniej nie usiłował uzyskać tak kompleksowej odpowiedzi, można mnożyć. W niniejszej pracy spróbowano odpowiedzieć przynajmniej na część z nich. Zgromadzony materiał badawczy celowo jest nadmiarowy w takim sensie, że zasygnalizowano tylko najważniejsze kwestie, które z niego wynikają. Sama gruntowna analiza relacji łączących poszczególne aspekty digitalizacji, które poruszono w ankiecie, pozwoliłaby sporządzić niejedno wartościowe opracowanie, prawdopodobnie obfitujące w zaskakujące obserwacje. Żeby potencjalnym zainteresowanym umożliwić samodzielną analizę materiału źródłowego, załącznik nr 3 do niniejszej pracy stanowi nośnik elektroniczny z dokumentami w formacie MS Excel, zawierającymi wszystkie zmienne i ich wartości, na podstawie których przygotowano zestawienia i wykresy zawarte w trzecim rozdziale. Arkusz, w którym znajdują się wszystkie udzielone przez respondentów odpowiedzi, zaopatrzony jest w odpowiednie filtry oraz objaśnienia dla wszystkich zmiennych, których nazwy z racji użycia ich w kodzie ankiety musiały zostać zapisane w skrótowej formie. 50

151 Obraz polskiej digitalizacji sensu stricto wyłaniający się z zawartych we wcześniejszych rozdziałach rozważań jest optymistyczny. Nie poparty żadnymi odgórnymi (znaczącymi) strategiami, potencjalnie ograniczany przez nienadążającą za realiami legislaturę i usilnie kształtowany lekko oderwanymi od rzeczywistości publikacjami, prezentuje się jednak zadziwiająco jednolicie i spójnie. To prawda jest zachowawczy i wszelkiego typu nowinki i trendy nabierające za granicą dużego znaczenia, najprawdopodobniej jeszcze kilka lat będą musiały w naszym kraju poczekać na swoją kolej, ale już w pojedynczych przypadkach się pojawiają i można się z tego tylko cieszyć. Specjalistyczne kursy dla pracowników bibliotek zajmujących się digitalizacją, czyli coś, co w innych krajach jest powszechnie praktykowane, w Polsce wciąż jeszcze nie ma racji bytu. Ze szkoleń organizowanych przez Bibliotekę Narodową można wynieść podstawową wiedzę z zakresu jak skanować, co skanować i skąd brać na to pieniądze. Kształtowania umiejętności przykładowego odróżnienia skanu prześwietlonego od niedoświetlonego i świadomego doboru optymalnego wzorca koloru dla konkretnego dokumentu bibliotekarz tam nie znajdzie. Taki stan rzeczy jest główną przyczyną zachowawczości krajowych rozwiązań, więc istnieje duża szansa, że wspomniana w punkcie 3.7 konieczność wprowadzenia szkoleń kierowanych do zaawansowanych operatorów sprzętu reprograficznego byłaby w stanie znacznie przyspieszyć ewolucję digitalizacji w Polsce w kierunku wyznaczonym przez Standardy ( ). Podobnie sytuacja wygląda w odniesieniu do metadanych innych niż opisowe (które muszą się pojawić chociażby na etapie umieszczania obiektów cyfrowych online). Najczęściej personel digitalizujący zbiory albo wie o nich niewiele, albo po prostu ich nie używa, ponieważ nie zdaje sobie z prawy, jakie korzyści mogą z tego płynąć. Paradoksalnie brak bazowania na metadanych w zarządzaniu masterami jest sytuacją lepszą, niż mnogość już istniejących rozwiązań. Specjaliści z centrów kompetencji mają tu duże pole do popisu; mogą spróbować zaprojektować spójną (i realistyczną) strategię ogólnokrajowego systemu wymiany danych między repozytoriami właśnie na bazie któregoś ze standardów metadanych. Wyłącznie w takim przypadku informacje, które zajmują ponad połowę objętości Standardów ( ), zaczną mieć jakiekolwiek znaczenie i przestaną być jedynie przyczynkiem do akademickiej dyskusji o rodzajach i roli metadanych w digitalizacji. Chyba największym zaskoczeniem, które miało miejscu po przeanalizowaniu wyników badania, był całkowicie marginalny udział formatu JPEG 000 zarówno 5

152 jako formatu archiwalnego, jak i prezentacyjnego. Jego największą zaletą, oczywiście poza relatywnie niewielkimi rozmiarami plików i pozornie bezstratną prezentacją dokumentu oryginalnego, jest niesamowita elastyczność. Wystarczy zeskanować dokument (mowa o dokumentach jednostronicowych), zapisać w formacie JPEG 000 i ten sam plik może od razu służyć za plik archiwalny, jak i być prezentowany on-line, bez dodatkowych konwersji. Lecz znowu wymagałoby to przedstawienia bibliotecznym specjalistom ds. digitalizacji zalet nowego formatu, a centra kompetencji (które takie działania mają w swojej gestii) zajmują się bardziej doniosłymi działaniami. Kolejne interesujące zagadnienie, które wypłynęło w trakcie analizy wyników badania to kwestia OCR. Jeszcze w styczniu 0 r. na XVII edycji seminarium z cyklu Digitalizacja: Problemy cyfryzacji dokumentów piśmienniczych w bibliotekach, muzeach, archiwach przedstawiciel Poznańskiego Centrum Superkomputerowo- Sieciowego (twórcy platformy dlibra) na pytanie o możliwość wyposażenia jego produktu w mechanizm jednoczesnego przeszukiwania pełnotekstowego we wszystkich bibliotekach cyfrowych zbudowanych na dlibrze odparł, że nie widzi takiej potrzeby. Swoją odpowiedź uzasadnił rzekomo niewielkim procentem ogółu dokumentów poddawanych OCR-owi. Wyniki badania wskazują natomiast na całkiem inny stan rzeczy OCR stosowany jest w ponad ¾ obiektów, które dają taką możliwość (mowa o formatach PDF i DjVu). Mało tego, niewykluczone, że w wielu przypadkach dokumenty do tej pory nierozpoznane zostaną w przyszłości poddane temu procesowi. Na koniec warto jeszcze wspomnieć o potencjalnej przyszłości digitalizacji w Polsce. Na myśl przychodzi od razu jedno słowo: zmiany. Polska digitalizacja będzie potrzebowała prędzej czy później głębokich zmian. I to zmian tak fundamentalnych, jak podejście do dokumentu. W tej chwili digitalizowany dokument to coś, co trzeba zeskanować, przekonwertować, umieścić on-line i zabrać się za następny. Przyszłość i postęp technologiczny wymusi na bibliotekach rewizję tego podejścia i bardziej drobiazgowe pochylenie się nad każdym dokumentem w szczególności mowa tu o książkach. OCR stanie się tylko punktem wyjścia, dojdzie redakcja otrzymanych wyników i konwersja nie do jednego, ale kilku formatów przyjaznych dla najpopularniejszych na rynku czytników e-booków. Obecnie biblioteki cyfrowe narzucają użytkownikom konkretny format, lecz najprawdopodobniej w przyszłości role te się odwrócą i jeśli biblioteki będą chciały rzeczywiście zawalczyć o nowych użytkowników w zerojedynkowej rzeczywistości, będą musiały nauczyć się słuchać tych użytkowników i podążać za ich czytelniczymi nawykami. 5

153 Załącznik nr Wykresy Rys.. Model digitalizacji stosowany w bibliotece 7; 8% 8; 0% Samodzielne skanowanie / fotografowanie dokumentów Całkowity outsourcing Częściowy outsourcing 63; 7% Rys.. Przyczyna korzystania z częściowego outsourcingu związana z rodzajem dokumentów związana z formatem dokumentów 0 związana z pozyskaniem funduszy celowych na digitalizację 9 inna przyczyna 3 Rys. 3. Szacunkowy procent skanów zleconych na zewnątrz w stosunku do wykonywanych samodzielnie ; % 7; 4% 4; 3% do 0% - 5% 6-50% powyżej 75% 4; 4% 53

154 Rys. 4. Sposób ustalania parametrów skanowania i formatu zapisu plików archiwalnych na podstawie własnych doświadczeń 5 na podstawie cudzych doświadczeń 3 na podstawie krajowych zaleceń 5 na podstawie zagranicznych zaleceń / standardów w inny sposób 3 Rys. 5. Sposób ustalania rozdzielczości skanowania na podstawie widocznych cech indywidualnych dokumentu 50 na podstawie przynależności dokumentu do określonej grupy, dla której wcześniej przyjęto pewną stałą rozdzielczość 34 jest obliczana dla każdego dokumentu (grupy dokumentów), np. na podstawie wysokości najmniejszego znaku 3 w inny sposób 7 Rys. 6. Liczba respondentów digitalizujących książki Książki - czarno-biała treść 49 Książki monochromatyczne 4 Książki zawierające czarno-białe ilustracje 38 Książki zawierające ilustracje w odcieniach szarości 30 Książki zawierające kolorowe ilustracje 38 Rys. 7. Książki czarno-biała treść: rozdzielczość 50 ppi 00 ppi 300 ppi ppi 600 ppi 54

155 Rys. 8. Książki czarno-biała treść: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor Rys. 9. Książki czarno-biała treść: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 ProPhoto RGB Nie wiem Inny wzorzec niż wymienione Rys. 0. Książki czarno-biała treść: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW TIFF z kompresją JPEG JPEG bez kompresji JPEG z kompresją PNG PDF bez wewnętrznej kompresji grafik PDF z wewnątrzną kopresją bezstratną grafik Inny format Rys.. Książki czarno-biała treść: rodzaj generowanych plików TIFF ; 4% jednostronicowe wielostronicowe 6; 96% 55

156 Rys.. Książki monochromatyczne: rozdzielczość 300 ppi ppi Rys. 3. Książki monochromatyczne: tryb i głębia koloru 8-bitowa skala szarości 6 6-bitowa skala szarości 4-bitowy kolor 6 48-bitowy kolor Rys. 4. Książki monochromatyczne: wzorce koloru Grey Gamma srgb Adobe RGB 998 ProPhoto RGB Nie wiem 6 Rys. 5. Książki monochromatyczne: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW TIFF z kompresją JPEG JPEG bez kompresji Inny format 8 Rys. 6. Książki monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 0; 00% 56

157 Rys. 7. Książki zawierające czarno-białe ilustracje: rozdzielczość 00 ppi 300 ppi 400 ppi 450 ppi 600 ppi 6 Rys. 8. Książki zawierające czarno-białe ilustracje: tryb i głębia koloru bit (czerń i biel) 4 8-bitowa skala szarości 6-bitowa skala szarości 6 4-bitowy kolor 3 48-bitowy kolor 3 Rys. 9. Książki zawierające czarno-białe ilustracje: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 ProPhoto RGB Nie wiem Inny wzorzec niż wymienione Rys. 0. Książki zawierające czarno-białe ilustracje: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW TIFF z kompresją JPEG JPEG bez kompresji JPEG 000 bez kompresji PNG PDF bez wewnętrznej kompresji grafik Inny format 7 57

158 Rys.. Książki zawierające czarno-białe ilustracje: rodzaj generowanych plików TIFF ; 4% jednostronicowe wielostronicowe 7; 96% Rys.. Książki zawierające ilustracje w odcieniach szarości: rozdzielczość 300 ppi ppi 450 ppi 600 ppi 3 Rys. 3. Książki zawierające ilustracje w odcieniach szarości: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 8 4-bitowy kolor 48-bitowy kolor Rys. 4. Książki zawierające ilustracje w odcieniach szarości: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma 6 srgb Adobe RGB 998 ProPhoto RGB Nie wiem 8 Inny wzorzec niż wymienione 58

159 Rys. 5. Książki zawierające ilustracje w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 0 TIFF z kompresją LZW 4 TIFF z kompresją JPEG JPEG bez kompresji JPEG z kompresją PNG Inny format Rys. 6. Książki zawierające ilustracje w odcieniach szarości: rodzaj generowanych plików TIFF ; 4% jednostronicowe wielostronicowe 4; 96% Rys. 7. Książki zawierające kolorowe ilustracje: rozdzielczość 300 ppi ppi 600 ppi 6 Rys. 8. Książki zawierające kolorowe ilustracje: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 7 48-bitowy kolor 7 59

160 Rys. 9. Książki zawierające kolorowe ilustracje: wzorce koloru Grey Gamma srgb Adobe RGB 998 ProPhoto RGB Nie wiem Inny wzorzec niż wymienione Rys. 30. Książki zawierające kolorowe ilustracje: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją PNG PDF bez wewnętrznej kompresji grafik Inny format Rys. 3. Książki zawierające kolorowe ilustracje: rodzaj generowanych plików TIFF ; 7% jednostronicowe wielostronicowe 5; 93% Rys. 3. Liczba respondentów digitalizujących gazety Gazety - czarno-biała treść Gazety monochromatyczne Gazety zawierające czarno-białe ilustracje Gazety zawierające ilustracje w odcieniach szarości Gazety zawierające kolorowe ilustracje

161 Rys. 33. Gazety czarno-biała treść: rozdzielczość 00 ppi 300 ppi ppi 600 ppi Rys. 34. Gazety czarno-biała treść: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości bitowa skala szarości 4 4-bitowy kolor 8 48-bitowy kolor Rys. 35. Gazety czarno-biała treść: wzorce koloru nie dotyczy (dla koloru -bitowego) 3 Grey Gamma srgb 7 Adobe RGB 998 Nie wiem 5 Rys. 36. Gazety czarno-biała treść: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW TIFF z kompresją JPEG JPEG bez kompresji JPEG z kompresją PDF bez wewnętrznej kompresji grafik PDF z wewnątrzną kopresją bezstratną grafik Inny format 6

162 Rys. 37. Gazety czarno-biała treść: rodzaj generowanych plików TIFF ; 8% jednostronicowe wielostronicowe ; 9% Rys. 38. Gazety monochromatyczne: rozdzielczość 300 ppi ppi Rys. 39. Gazety monochromatyczne: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 4 4-bitowy kolor 5 Rys. 40. Gazety monochromatyczne: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb ProPhoto RGB Nie wiem 4 Rys. 4. Gazety monochromatyczne: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji PDF bez wewnętrznej kompresji grafik Inny format 4 6

163 Rys. 4. Gazety monochromatyczne: rodzaj generowanych plików TIFF ; 7% jednostronicowe wielostronicowe 5; 83% Rys. 43. Gazety zawierające czarno-białe ilustracje: rozdzielczość 00 ppi 300 ppi 400 ppi 600 ppi 8 Rys. 44. Gazety zawierające czarno-białe ilustracje: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor Rys. 45. Gazety zawierające czarno-białe ilustracje: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 Nie wiem 7 9 Rys. 46. Gazety zawierające czarno-białe ilustracje: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji PDF bez wewnętrznej kompresji grafik Inny format 4 63

164 Rys. 47. Gazety zawierające czarno-białe ilustracje: rodzaj generowanych plików TIFF ; 6% jednostronicowe wielostronicowe 5; 94% Rys. 48. Gazety zawierające ilustracje w odcieniach szarości: rozdzielczość 300 ppi ppi 600 ppi Rys. 49. Gazety zawierające ilustracje w odcieniach szarości: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości bitowy kolor 9 48-bitowy kolor Rys. 50. Gazety zawierające ilustracje w odcieniach szarości: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 9 Adobe RGB 998 ProPhoto RGB Nie wiem 5 64

165 Rys. 5. Gazety zawierające ilustracje w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją PDF bez wewnętrznej kompresji grafik Inny format 4 0 Rys. 5. Gazety zawierające ilustracje w odcieniach szarości: rodzaj generowanych plików TIFF ; 4% jednostronicowe wielostronicowe ; 86% Rys. 53. Gazety zawierające kolorowe ilustracje: rozdzielczość 300 ppi 600 ppi 4 7 Rys. 54. Gazety zawierające kolorowe ilustracje: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 5 48-bitowy kolor 3 Rys. 55. Gazety zawierające kolorowe ilustracje: wzorce koloru srgb Adobe RGB 998 ProPhoto RGB Nie wiem 6 65

166 Rys. 56. Gazety zawierające kolorowe ilustracje: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją PDF bez wewnętrznej kompresji grafik PDF z wewnątrzną kopresją bezstratną grafik PDF z wewnętrzną kompresją stratną grafik Inny format Rys. 57. Gazety zawierające kolorowe ilustracje: rodzaj generowanych plików TIFF ; 5% jednostronicowe wielostronicowe ; 85% Rys. 58. Liczba respondentów digitalizujących czasopisma Czasopisma - czarno-biała treść 7 Czasopisma monochromatyczne 6 Czasopisma zawierające czarno-białe ilustracje 8 Czasopisma zawierające ilustracje w odcieniach szarości 3 Czasopisma zawierające kolorowe ilustracje 7 Rys. 59. Czasopisma czarno-biała treść: rozdzielczość 300 ppi ppi 66

167 Rys. 60. Czasopisma czarno-biała treść: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 5 6-bitowa skala szarości 3 4-bitowy kolor 7 48-bitowy kolor Rys. 6. Czasopisma czarno-biała treść: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 6 Adobe RGB 998 Nie wiem 5 Rys. 6. Czasopisma czarno-biała treść: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji PDF bez wewnętrznej kompresji grafik Inny format Rys. 63. Czasopisma czarno-biała treść: rodzaj generowanych plików TIFF ; 7% jednostronicowe wielostronicowe 3; 93% 67

168 Rys. 64. Czasopisma monochromatyczne: rozdzielczość 300 ppi ppi Rys. 65. Czasopisma monochromatyczne: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 3 6-bitowa skala szarości 4-bitowy kolor 4 Rys. 66. Czasopisma monochromatyczne: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 5 Adobe RGB 998 ProPhoto RGB Rys. 67. Czasopisma monochromatyczne: pierwotny format zapisu TIFF bez kompresji 3 TIFF z kompresją CCITT Inny format Rys. 68. Czasopisma monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% 68

169 Rys. 69. Czasopisma zawierające czarno-białe ilustracje: rozdzielczość 300 ppi 400 ppi 600 ppi 9 Rys. 70. Czasopisma zawierające czarno-białe ilustracje: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor Rys. 7. Czasopisma zawierające czarno-białe ilustracje: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 Nie wiem Rys. 7. Czasopisma zawierające czarno-białe ilustracje: pierwotny format zapisu TIFF bez kompresji 4 TIFF z kompresją LZW PDF bez wewnętrznej kompresji grafik Inny format Rys. 73. Czasopisma zawierające czarno-białe ilustracje: rodzaj generowanych plików TIFF ; 7% jednostronicowe wielostronicowe 4; 93% 69

170 Rys. 74. Czasopisma zawierające ilustracje w odcieniach szarości: rozdzielczość 300 ppi 400 ppi 600 ppi 8 Rys. 75. Czasopisma zawierające ilustracje w odcieniach szarości: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor 6 6 Rys. 76. Czasopisma zawierające ilustracje w odcieniach szarości: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 Nie wiem 8 Rys. 77. Czasopisma zawierające ilustracje w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW PDF bez wewnętrznej kompresji grafik Inny format 9 Rys. 78. Czasopisma zawierające ilustracje w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% 70

171 Rys. 79. Czasopisma zawierające kolorowe ilustracje: rozdzielczość 300 ppi 450 ppi 600 ppi 3 7 Rys. 80. Czasopisma zawierające kolorowe ilustracje: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor 4 Rys. 8. Czasopisma zawierające kolorowe ilustracje: wzorce koloru srgb Adobe RGB 998 ProPhoto RGB Nie wiem 3 3 Rys. 8. Czasopisma zawierające kolorowe ilustracje: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją PDF bez wewnętrznej kompresji grafik Inny format Rys. 83. Czasopisma zawierające kolorowe ilustracje: rodzaj generowanych plików TIFF ; 5% jednostronicowe wielostronicowe ; 85% 7

172 Rys. 84. Liczba respondentów digitalizujących rękopisy Rękopisy - wyraźny kontrast 6 Rękopisy - niewyraźny kontrast Rys. 85. Rękopisy wyraźny kontrast: rozdzielczość 300 ppi 600 ppi 4 4 Rys. 86. Rękopisy wyraźny kontrast: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor 0 48-bitowy kolor 4 Rys. 87. Rękopisy wyraźny kontrast: wzorce koloru srgb 0 Adobe RGB 998 ProPhoto RGB Nie wiem Rys. 88. Rękopisy wyraźny kontrast: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją RAW PDF bez wewnętrznej kompresji grafik Inny format 7

173 Rys. 89. Rękopisy wyraźny kontrast: rodzaj generowanych plików TIFF ; 8% jednostronicowe wielostronicowe ; 9% Rys. 90. Rękopisy niewyraźny kontrast: rozdzielczość 300 ppi ppi 600 ppi 3 Rys. 9. Rękopisy niewyraźny kontrast: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor 8 Rys. 9. Rękopisy niewyraźny kontrast: wzorce koloru srgb Adobe RGB 998 Nie wiem 8 Rys. 93. Rękopisy niewyraźny kontrast: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją RAW PDF bez wewnętrznej kompresji grafik Inny format 8 73

174 Rys. 94. Rękopisy niewyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 7; 00% Rys. 95. Liczba respondentów digitalizujących inkunabuły Inkunabuły 8 Rys. 96. Inkunabuły: rozdzielczość 300 ppi 600 ppi Rys. 97. Inkunabuły: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor 4 48-bitowy kolor Rys. 98. Inkunabuły: wzorce koloru srgb 3 Adobe RGB 998 ProPhoto RGB Nie wiem 74

175 Rys. 99. Inkunabuły: pierwotny format zapisu TIFF bez kompresji 4 TIFF z kompresją LZW JPEG bez kompresji RAW PDF bez wewnętrznej kompresji grafik Rys. 00. Inkunabuły: rodzaj generowanych plików TIFF ; 0% jednostronicowe wielostronicowe 4; 80% Rys. 0. Liczba respondentów digitalizujących stare druki Stare druki Rys. 0. Stare druki: rozdzielczość 300 ppi ppi 600 ppi 4 Rys. 03. Stare druki: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4 4-bitowy kolor 4 48-bitowy kolor 75

176 Rys. 04. Stare druki: wzorce koloru srgb Adobe RGB 998 ProPhoto RGB Nie wiem 7 9 Rys. 05. Stare druki: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją RAW PDF bez wewnętrznej kompresji grafik Inny format 5 Rys. 06. Stare druki: rodzaj generowanych plików TIFF ; 6% jednostronicowe wielostronicowe 5; 94% Rys. 07. Liczba respondentów digitalizujących grafiki Grafiki czarno-białe 4 Grafiki monochromatyczne 6 Grafiki w odcieniach szarości 3 Grafiki kolorowe 7 Rys. 08. Grafiki czarno-białe: rozdzielczość 300 ppi ppi 76

177 Rys. 09. Grafiki czarno-białe: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor bitowy kolor Rys. 0. Grafiki czarno-białe: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 Nie wiem Rys.. Grafiki czarno-białe: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW TIFF z kompresją JPEG JPEG bez kompresji Inny format Rys.. Grafiki czarno-białe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys. 3. Grafiki monochromatyczne: rozdzielczość 300 ppi 600 ppi 77

178 Rys. 4. Grafiki monochromatyczne: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 3 Rys. 5. Grafiki monochromatyczne: wzorce koloru srgb Adobe RGB 998 Nie wiem Rys. 6. Grafiki monochromatyczne: pierwotny format zapisu TIFF bez kompresji 3 TIFF z kompresją CCITT TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją Inny format Rys. 7. Grafiki monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% 78

179 Rys. 8. Grafiki w odcieniach szarości: rozdzielczość 300 ppi ppi Rys. 9. Grafiki w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 4 6-bitowa skala szarości 5 4-bitowy kolor 6 Rys. 0. Grafiki w odcieniach szarości: wzorce koloru Grey Gamma srgb 6 Adobe RGB Nie wiem 4 Rys.. Grafiki w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 0 TIFF z kompresją CCITT TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją Inny format Rys.. Grafiki w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% 79

180 Rys. 3. Grafiki kolorowe: rozdzielczość 300 ppi ppi 4 Rys. 4. Grafiki kolorowe: tryb i głębia koloru 6-bitowa skala szarości 3 4-bitowy kolor 48-bitowy kolor 4 Rys. 5. Grafiki kolorowe: wzorce koloru srgb 9 Adobe RGB ProPhoto RGB Nie wiem 6 Rys. 6. Grafiki kolorowe: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją CCITT TIFF z kompresją LZW JPEG bez kompresji 3 JPEG z kompresją RAW PNG PDF bez wewnętrznej kompresji grafik Inny format 80

181 Rys. 7. Grafiki kolorowe: rodzaj generowanych plików TIFF ; 8% jednostronicowe wielostronicowe ; 9% Rys. 8. Liczba respondentów digitalizujących grafiki wielkoformatowe Grafiki wielkoformatowe czarno-białe 6 Grafiki wielkoformatowe monochromatyczne Grafiki wielkoformatowe w odcieniach szarości 5 Grafiki wielkoformatowe kolorowe 9 Rys. 9. Grafiki wielkoformatowe czarno-białe: rozdzielczość 300 ppi 4 Rys. 30. Grafiki wielkoformatowe czarno-białe: tryb i głębia koloru bit (czerń i biel) 6-bitowa skala szarości 4-bitowy kolor 3 Rys. 3. Grafiki wielkoformatowe czarno-białe: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 4 Adobe RGB 998 8

182 Rys. 3. Grafiki wielkoformatowe czarno-białe: pierwotny format zapisu TIFF bez kompresji 5 JPEG z kompresją Rys. 33. Grafiki wielkoformatowe czarno-białe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% Rys. 34. Grafiki wielkoformatowe monochromatyczne: rozdzielczość 300 ppi Rys. 35. Grafiki wielkoformatowe monochromatyczne: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor Rys. 36. Grafiki wielkoformatowe monochromatyczne: wzorce koloru srgb Rys. 37. Grafiki wielkoformatowe monochromatyczne: pierwotny format zapisu TIFF bez kompresji JPEG z kompresją 8

183 Rys. 38. Grafiki wielkoformatowe monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys. 39. Grafiki wielkoformatowe w odcieniach szarości: rozdzielczość 300 ppi ppi Rys. 40. Grafiki wielkoformatowe w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 3 4-bitowy kolor Rys. 4. Grafiki wielkoformatowe w odcieniach szarości: wzorce koloru Grey Gamma srgb 3 Rys. 4. Grafiki wielkoformatowe w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 4 JPEG z kompresją 83

184 Rys. 43. Grafiki wielkoformatowe w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 4; 00% Rys. 44. Grafiki wielkoformatowe kolorowe: rozdzielczość 00 ppi 40 ppi 300 ppi ppi Rys. 45. Grafiki wielkoformatowe kolorowe: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor 5 48-bitowy kolor Rys. 46. Grafiki wielkoformatowe kolorowe: wzorce koloru srgb 7 ProPhoto RGB Nie wiem Rys. 47. Grafiki wielkoformatowe kolorowe: pierwotny format zapisu TIFF bez kompresji 5 TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją 84

185 Rys. 48. Grafiki wielkoformatowe kolorowe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 6; 00% Rys. 49. Liczba respondentów digitalizujących mapy Mapy czarno-białe z wyraźnym kontrastem 6 Mapy czarno-białe z niewyraźnym kontrastem 3 Mapy monochromatyczne Mapy w odcieniach szarości 5 Mapy kolorowe 3 Rys. 50. Mapy czarno-białe z wyraźnym kontrastem: rozdzielczość 300 ppi ppi Rys. 5. Mapy czarno-białe z wyraźnym kontrastem: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 3 Rys. 5. Mapy czarno-białe z wyraźnym kontrastem: wzorce koloru Grey Gamma srgb 3 Nie wiem 85

186 Rys. 53. Mapy czarno-białe z wyraźnym kontrastem: pierwotny format zapisu TIFF bez kompresji 5 JPEG z kompresją Rys. 54. Mapy czarno-białe z wyraźnym kontrastem: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% Rys. 55. Mapy czarno-białe z niewyraźnym kontrastem: rozdzielczość 300 ppi 3 Rys. 56. Mapy czarno-białe z niewyraźnym kontrastem: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor Rys. 57. Mapy czarno-białe z niewyraźnym kontrastem: wzorce koloru srgb Nie wiem Rys. 58. Mapy czarno-białe z niewyraźnym kontrastem: pierwotny format zapisu TIFF bez kompresji 3 86

187 Rys. 59. Mapy czarno-białe z niewyraźnym kontrastem: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% Rys. 60. Mapy monochromatyczne: rozdzielczość 300 ppi Rys. 6. Mapy monochromatyczne: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor Rys. 6. Mapy monochromatyczne: wzorce koloru srgb Rys. 63. Mapy monochromatyczne: pierwotny format zapisu TIFF bez kompresji Rys. 64. Mapy monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% 87

188 Rys. 65. Mapy w odcieniach szarości: rozdzielczość 300 ppi ppi 600 ppi Rys. 66. Mapy w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor Rys. 67. Mapy w odcieniach szarości: wzorce koloru Grey Gamma srgb 3 Nie wiem Rys. 68. Mapy w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 4 TIFF z kompresją LZW Rys. 69. Mapy w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% 88

189 Rys. 70. Mapy kolorowe: rozdzielczość 40 ppi 300 ppi ppi 600 ppi 3 Rys. 7. Mapy kolorowe: tryb i głębia koloru 4-bitowy kolor 0 48-bitowy kolor 3 Rys. 7. Mapy kolorowe: wzorce koloru srgb 9 Adobe RGB 998 ProPhoto RGB Nie wiem Rys. 73. Mapy kolorowe: pierwotny format zapisu TIFF bez kompresji 0 TIFF z kompresją LZW JPEG z kompresją RAW Rys. 74. Mapy kolorowe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% 89

190 Rys. 75. Liczba respondentów digitalizujących mapy wielkoformatowe Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem Mapy wielkoformatowe monochromatyczne Mapy wielkoformatowe w odcieniach szarości 3 3 Mapy wielkoformatowe kolorowe 8 Rys. 76. Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem: rozdzielczość 300 ppi Rys. 77. Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor Rys. 78. Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem: wzorce koloru Grey Gamma srgb Rys. 79. Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem: pierwotny format zapisu TIFF bez kompresji 3 Rys. 80. Mapy wielkoformatowe czarno-białe z wyraźnym kontrastem: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% 90

191 Rys. 8. Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem: rozdzielczość 300 ppi Rys. 8. Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor Rys. 83. Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem: wzorce koloru Grey Gamma srgb Rys. 84. Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem: pierwotny format zapisu TIFF bez kompresji Rys. 85. Mapy wielkoformatowe czarno-białe z niewyraźnym kontrastem: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys. 86. Mapy wielkoformatowe monochromatyczne: rozdzielczość 300 ppi Rys. 87. Mapy wielkoformatowe monochromatyczne: tryb i głębia koloru 4-bitowy kolor 9

192 Rys. 88. Mapy wielkoformatowe monochromatyczne: wzorce koloru srgb Rys. 89. Mapy wielkoformatowe monochromatyczne: pierwotny format zapisu TIFF bez kompresji Rys. 90. Mapy wielkoformatowe monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicow e ; 00% Rys. 9. Mapy wielkoformatowe w odcieniach szarości: rozdzielczość 300 ppi 600 ppi Rys. 9. Mapy wielkoformatowe w odcieniach szarości: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor Rys. 93. Mapy wielkoformatowe w odcieniach szarości: wzorce koloru Grey Gamma srgb 9

193 Rys. 94. Mapy wielkoformatowe w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW Rys. 95. Mapy wielkoformatowe w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% Rys. 96. Mapy wielkoformatowe kolorowe: rozdzielczość 300 ppi ppi Rys. 97. Mapy wielkoformatowe kolorowe: tryb i głębia koloru 4-bitowy kolor 5 48-bitowy kolor Rys. 98. Mapy wielkoformatowe kolorowe: wzorce koloru srgb Adobe RGB 998 ProPhoto RGB Nie wiem 5 Rys. 99. Mapy wielkoformatowe kolorowe: pierwotny format zapisu TIFF bez kompresji 7 TIFF z kompresją LZW 93

194 Rys. 00. Mapy wielkoformatowe kolorowe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 8; 00% Rys. 0. Liczba respondentów digitalizujących odbitki fotograficzne Odbitki fotograficzne monochromatyczne 9 Odbitki fotograficzne w odcieniach szarości 5 Odbitki fotograficzne kolorowe 4 Rys. 0. Odbitki fotograficzne monochromatyczne: rozdzielczość 300 ppi ppi 00 ppi Rys. 03. Odbitki fotograficzne monochromatyczne: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 3 4-bitowy kolor 6 Rys. 04. Odbitki fotograficzne monochromatyczne: wzorce koloru srgb 7 Adobe RGB 998 Nie wiem 94

195 Rys. 05. Odbitki fotograficzne monochromatyczne: pierwotny format zapisu TIFF bez kompresji 4 TIFF z kompresją CCITT TIFF z kompresją LZW 3 JPEG bez kompresji JPEG z kompresją RAW Rys. 06. Odbitki fotograficzne monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 6; 00% Rys. 07. Odbitki fotograficzne w odcieniach szarości: rozdzielczość 300 ppi ppi 5 Rys. 08. Odbitki fotograficzne w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 3 6-bitowa skala szarości 5 4-bitowy kolor 7 48-bitowy kolor 95

196 Rys. 09. Odbitki fotograficzne w odcieniach szarości: wzorce koloru Grey Gamma srgb Adobe RGB 998 Nie wiem 4 9 Rys. 0. Odbitki fotograficzne w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją CCITT TIFF z kompresją LZW JPEG bez kompresji JPEG z kompresją RAW Rys.. Odbitki fotograficzne w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys.. Odbitki fotograficzne kolorowe: rozdzielczość 300 ppi ppi 4 Rys. 3. Odbitki fotograficzne kolorowe: tryb i głębia koloru 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor 3 96

197 Rys. 4. Odbitki fotograficzne kolorowe: wzorce koloru srgb 0 Adobe RGB 998 Nie wiem 4 Rys. 5. Odbitki fotograficzne kolorowe: pierwotny format zapisu TIFF bez kompresji 8 TIFF z kompresją CCITT TIFF z kompresją LZW JPEG bez kompresji 3 3 JPEG z kompresją Rys. 6. Odbitki fotograficzne kolorowe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 0; 00% Rys. 7. Liczba respondentów digitalizujących negatywy i przezrocza Negatywy, przezrocza monochromatyczne 4 Negatywy, przezrocza w odcieniach szarości 7 Negatywy, przezrocza kolorowe 3 Rys. 8. Negatywy, przezrocza monochromatyczne: tryb i głębia koloru bit (czerń i biel) 6-bitowa skala szarości 4-bitowy kolor 97

198 Rys. 9. Negatywy, przezrocza monochromatyczne: wzorce koloru srgb Rys. 0. Negatywy, przezrocza monochromatyczne: pierwotny format zapisu TIFF bez kompresji 4 PNG PDF bez wewnętrznej kompresji grafik Rys.. Negatywy, przezrocza monochromatyczne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 4; 00% Rys.. Negatywy, przezrocza w odcieniach szarości: rozdzielczość 600 ppi 4000 Rys. 3. Negatywy, przezrocza w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor 98

199 Rys. 4. Negatywy, przezrocza w odcieniach szarości: wzorce koloru srgb 3 Adobe RGB 998 Nie wiem Rys. 5. Negatywy, przezrocza w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 5 TIFF z kompresją LZW Rys. 6. Negatywy, przezrocza w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% Rys. 7. Negatywy, przezrocza kolorowe: rozdzielczość 4000 Rys. 8. Negatywy, przezrocza kolorowe: tryb i głębia koloru 4-bitowy kolor 3 Rys. 9. Negatywy, przezrocza kolorowe: wzorce koloru srgb 3 99

200 Rys. 30. Negatywy, przezrocza kolorowe: pierwotny format zapisu TIFF bez kompresji TIFF z kompresją LZW JPEG bez kompresji Rys. 3. Negatywy, przezrocza kolorowe: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys. 3. Liczba respondentów digitalizujących mikroformy Mikrofilmy 8 Mikrofisze Rys. 33. Mikrofilmy: rozdzielczość 300 ppi Rys. 34. Mikrofilmy: tryb i głębia koloru bit (czerń i biel) 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor 00

201 Rys. 35. Mikrofilmy: wzorce koloru nie dotyczy (dla koloru -bitowego) srgb Adobe RGB 998 Nie wiem Rys. 36. Mikrofilmy: pierwotny format zapisu TIFF bez kompresji 5 TIFF z kompresją LZW JPEG bez kompresji RAW PDF bez wewnętrznej kompresji grafik Rys. 37. Mikrofilmy: rodzaj generowanych plików TIFF ; 7% jednostronicowe wielostronicowe 5; 83% Rys. 38. Mikrofisze: rozdzielczość 300 ppi Rys. 39. Mikrofisze: tryb i głębia koloru 8-bitowa skala szarości 0

202 Rys. 40. Mikrofisze: wzorce koloru Grey Gamma Rys. 4. Mikrofisze: pierwotny format zapisu TIFF bez kompresji Rys. 4. Mikrofisze: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys. 43. Liczba respondentów digitalizujących prace licencjackie, magisterskie i doktorskie Prace - czarno-biała treść 5 Prace zawierające czarno-białe elementy graficzne 6 Prace zawierające elementy graficzne w odcieniach szarości 5 Prace zawierające kolorowe elementy graficzne 8 Rys. 44. Prace licencjackie, magisterskie, doktorskie czarno-biała treść: rozdzielczość 300 ppi Rys. 45. Prace licencjackie, magisterskie, doktorskie czarno-biała treść: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 0

203 Rys. 46. Prace licencjackie, magisterskie, doktorskie czarno-biała treść: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb Adobe RGB 998 Rys. 47. Prace licencjackie, magisterskie, doktorskie czarno-biała treść: pierwotny format zapisu TIFF bez kompresji 4 TIFF z kompresją LZW PDF z wewnątrzną kompresją bezstratną grafik Rys. 48. Prace licencjackie, magisterskie, doktorskie czarno-biała treść: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 5; 00% Rys. 49. Prace licencjackie, magisterskie, doktorskie zawierające czarno-białe elementy graficzne: rozdzielczość 300 ppi 600 ppi 3 Rys. 50. Prace licencjackie, magisterskie, doktorskie zawierające czarno-białe elementy graficzne: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 3 03

204 Rys. 5. Prace licencjackie, magisterskie, doktorskie zawierające czarno-białe elementy graficzne: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 3 Adobe RGB 998 Nie wiem Rys. 5. Prace licencjackie, magisterskie, doktorskie zawierające czarno-białe elementy graficzne: pierwotny format zapisu TIFF bez kompresji 5 TIFF z kompresją LZW PDF z wewnątrzną kompresją bezstratną grafik Rys. 53. Prace licencjackie, magisterskie, doktorskie zawierające czarno-białe elementy graficzne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 6; 00% Rys. 54. Prace licencjackie, magisterskie, doktorskie zawierające elementy graficzne w odcieniach szarości: rozdzielczość 300 ppi ppi 04

205 Rys. 55. Prace licencjackie, magisterskie, doktorskie zawierające elementy graficzne w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 48-bitowy kolor Rys. 56. Prace licencjackie, magisterskie, doktorskie zawierające elementy graficzne w odcieniach szarości: wzorce koloru Grey Gamma 3 srgb Adobe RGB 998 ProPhoto RGB Nie wiem Rys. 57. Prace licencjackie, magisterskie, doktorskie zawierające elementy graficzne w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 4 TIFF z kompresją LZW PDF z wewnątrzną kompresją bezstratną grafik Rys. 58. Prace licencjackie, magisterskie, doktorskie zawierające elementy graficzne w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 4; 00% 05

206 Rys. 59. Prace licencjackie, magisterskie, doktorskie zawierające kolorowe elementy graficzne: rozdzielczość 300 ppi ppi Rys. 60. Prace licencjackie, magisterskie, doktorskie zawierające kolorowe elementy graficzne: tryb i głębia koloru 4-bitowy kolor 7 48-bitowy kolor Rys. 6. Prace licencjackie, magisterskie, doktorskie zawierające kolorowe elementy graficzne: wzorce koloru Grey Gamma srgb 4 Adobe RGB 998 ProPhoto RGB Nie wiem 3 Rys. 6. Prace licencjackie, magisterskie, doktorskie zawierające kolorowe elementy graficzne: pierwotny format zapisu TIFF bez kompresji 5 TIFF z kompresją LZW JPEG bez kompresji PDF z wewnątrzną kompresją bezstratną grafik 06

207 Rys. 63. Prace licencjackie, magisterskie, doktorskie zawierające kolorowe elementy graficzne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 6; 00% Rys. 64. Liczba respondentów digitalizujących dokumenty urzędowe Dokumenty - czarno-biała treść 0 Dokumenty zawierające czarno-białe elementy graficzne 5 Dokumenty zawierające elementy graficzne w odcieniach szarości 5 Dokumenty zawierające kolorowe elementy graficzne Rys. 65. Dokumenty urzędowe czarno-biała treść: rozdzielczość 00 ppi 300 ppi 4 Rys. 66. Dokumenty urzędowe czarno-biała treść: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 6 07

208 Rys. 67. Dokumenty urzędowe czarno-biała treść: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 5 Adobe RGB 998 Nie wiem Rys. 68. Dokumenty urzędowe czarno-biała treść: pierwotny format zapisu TIFF bez kompresji 6 JPEG bez kompresji JPEG z kompresją PDF bez wewnętrznej kompresji grafik Inny format Rys. 69. Dokumenty urzędowe czarno-biała treść: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 6; 00% Rys. 70. Dokumenty urzędowe zawierające czarno-białe elementy graficzne: rozdzielczość 00 ppi 300 ppi Rys. 7. Dokumenty urzędowe zawierające czarno-białe elementy graficzne: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 08

209 Rys. 7. Dokumenty urzędowe zawierające czarno-białe elementy graficzne: wzorce koloru Grey Gamma srgb 3 Rys. 73. Dokumenty urzędowe zawierające czarno-białe elementy graficzne: pierwotny format zapisu TIFF bez kompresji 4 Inny format Rys. 74. Dokumenty urzędowe zawierające czarno-białe elementy graficzne: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% Rys. 75. Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości: rozdzielczość 300 ppi 4 Rys. 76. Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor Rys. 77. Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości: wzorce koloru Grey Gamma srgb 3 09

210 Rys. 78. Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości: pierwotny format zapisu TIFF bez kompresji 3 JPEG z kompresją Inny format Rys. 79. Dokumenty urzędowe zawierające elementy graficzne w odcieniach szarości: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% Rys. 80. Dokumenty urzędowe zawierające kolorowe elementy graficzne: rozdzielczość 300 ppi 7 Rys. 8. Dokumenty urzędowe zawierające kolorowe elementy graficzne: tryb i głębia koloru 4-bitowy kolor 8 48-bitowy kolor 3 Rys. 8. Dokumenty urzędowe zawierające kolorowe elementy graficzne: wzorce koloru srgb 8 Adobe RGB 998 ProPhoto RGB Nie wiem 0

211 Rys. 83. Dokumenty urzędowe zawierające kolorowe elementy graficzne: pierwotny format zapisu TIFF bez kompresji 8 TIFF z kompresją LZW JPEG z kompresją Inny format Rys. 84. Dokumenty urzędowe zawierające kolorowe elementy graficzne: rodzaj generowanych plików TIFF ; % jednostronicowe wielostronicowe 8; 89% Rys. 85. Liczba respondentów digitalizujących maszynopisy Maszynopisy - wyraźny kontrast 8 Maszynopisy - niewyraźny kontrast 9 Rys. 86. Maszynopisy wyraźny kontrast: rozdzielczość 300 ppi ppi Rys. 87. Maszynopisy wyraźny kontrast: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 5

212 Rys. 88. Maszynopisy wyraźny kontrast: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 5 Adobe RGB 998 Nie wiem Rys. 89. Maszynopisy wyraźny kontrast: pierwotny format zapisu TIFF bez kompresji 8 Inny format Rys. 90. Maszynopisy wyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 8; 00% Rys. 9. Maszynopisy niewyraźny kontrast: rozdzielczość 300 ppi 400 ppi 450 ppi 600 ppi

213 Rys. 9. Maszynopisy niewyraźny kontrast: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor 3 5 Rys. 93. Maszynopisy niewyraźny kontrast: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma srgb 6 Nie wiem Rys. 94. Maszynopisy niewyraźny kontrast: pierwotny format zapisu TIFF bez kompresji 8 JPEG z kompresją Inny format Rys. 95. Maszynopisy niewyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 8; 00% Rys. 96. Liczba respondentów digitalizujących nuty Nuty - wyraźny kontrast 5 Nuty - niewyraźny kontrast 3 3

214 Rys. 97. Nuty wyraźny kontrast: rozdzielczość 300 ppi 3 Rys. 98. Nuty wyraźny kontrast: tryb i głębia koloru 4-bitowy kolor 48-bitowy kolor 3 Rys. 99. Nuty wyraźny kontrast: wzorce koloru srgb ProPhoto RGB Nie wiem Rys Nuty wyraźny kontrast: pierwotny format zapisu TIFF bez kompresji 3 JPEG bez kompresji RAW Rys. 30. Nuty wyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% Rys. 30. Nuty niewyraźny kontrast: rozdzielczość 300 ppi 4

215 Rys Nuty niewyraźny kontrast: tryb i głębia koloru 4-bitowy kolor Rys Nuty niewyraźny kontrast: wzorce koloru srgb Nie wiem Rys Nuty niewyraźny kontrast: pierwotny format zapisu TIFF bez kompresji JPEG bez kompresji RAW Rys Nuty niewyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe ; 00% Rys Liczba respondentów digitalizujących rysunki techniczne Rysunki techniczne - wyraźny kontrast 4 Rysunki techniczne - niewyraźny kontrast 3 Rys Rysunki techniczne wyraźny kontrast: rozdzielczość 300 ppi 600 ppi 5

216 Rys Rysunki techniczne wyraźny kontrast: tryb i głębia koloru bit (czerń i biel) 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor Rys. 30. Rysunki techniczne wyraźny kontrast: wzorce koloru nie dotyczy (dla koloru -bitowego) Grey Gamma 3 srgb Rys. 3. Rysunki techniczne wyraźny kontrast: pierwotny format zapisu TIFF bez kompresji 4 PDF z wewnątrzną kopresją bezstratną grafik Rys. 3. Rysunki techniczne wyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 4; 00% Rys. 33. Rysunki techniczne niewyraźny kontrast: rozdzielczość 300 ppi 400 ppi 600 ppi 6

217 Rys. 34. Rysunki techniczne niewyraźny kontrast: tryb i głębia koloru 8-bitowa skala szarości 6-bitowa skala szarości 4-bitowy kolor Rys. 35. Rysunki techniczne niewyraźny kontrast: wzorce koloru Grey Gamma srgb Rys. 36. Rysunki techniczne niewyraźny kontrast: pierwotny format zapisu TIFF bez kompresji 3 PDF z wewnątrzną kopresją bezstratną grafik Rys. 37. Rysunki techniczne niewyraźny kontrast: rodzaj generowanych plików TIFF 0; 0% jednostronicowe wielostronicowe 3; 00% Rys. 38. Sposób postępowania z plikami uzyskanymi w trakcie skanowania / fotografowania ; 4% ; 4% Pliki archiwalne objęte są polityką długotrwałego przechowywania Pliki archiwalne - po stworzeniu na ich podstawie wersji prezentacyjnych - są kasowane Stosowany jest inny model postępowania 47; 9% 7

218 Rys. 39. Model polityki długotrwałego przechowywania plików ; 4% ; % Outsourcing Samodzielne przechowywanie Model mieszany 46; 94% Rys. 30. Typy nośników, na których docelowo przechowywane są pliki Pojedyncze dyski optyczne 30 Dyski magnetooptyczne obsługiwane przez zmieniarkę Niezorganizowane dyski twarde 9 Macierze dyskowe 6 NAS 6 Nośniki taśmowe 6 Inny typ nośników 3 Rys. 3. Korekta plików archiwalnych ; % Obrazy zapisane w plikach archiwalnych nie są korygowane Obrazy zapisane w plikach archiwalnych są korygowane 0; 0% 30; 59% Korygowane są wyłącznie kopie plików archiwalnych, oryginały przechowywane są w formie niezmienionej 8

219 Rys. 3. Sposób postępowania ze skorygowanymi kopiami ; 9% 3; 7% 7; 64% Podobnie jak oryginały - objęte są polityką długotrwałego przechowywania Są kasowane po dokonaniu docelowej konwersji na formaty prezentacyjne Stosowany jest inny model postępowania Rys. 33. Sposób przeprowadzania korekty ; 5% 8; 38% ; 57% Wsadowo Ręcznie W sposób mieszany Rys. 34. Czynności wykonywane w trakcie korekty Kadrowanie Korekcja kolorów Obrót o kąty będące wielokrotnością 90 st. Zmiana wymiarów obrazów Zmiana rozdzielczości Zmiana głębi bitowej koloru Obrót o dowolny kąt (korekta przekoszenia) Korekcja jasności Korekcja kontrastu Korekcja nasycenia Korekcja ostrości Eliminacja artefaktów i zniekształceń Inne czynności

220 Rys. 35. Oprogramowanie stosowane do korekty skanów Oprogramowanie dostarczone przez producenta skanera / aparatu 9 Adobe Photoshop 0 Adobe Photoshop Elements GIMP 6 Corel Photo-Paint 5 Corel Paint Shop Pro IrfanView 6 Inny program 9 Rys. 36. Rodzaje generowanych plików prezentacyjnych DjVu 40 PDF 6 JPEG 4 JPEG 000 PNG Inny format 3 Rys. 37. Oprogramowanie stosowane do generowania i edycji plików DjVu DocumentExpress Desktop 4 DocumentExpress Professional 5 DocumentExpress Enterprise 9 DjVuLibre 8 PDFDjVu 4 Inny program 3 0

221 Rys. 38. Stosowane profile DjVu Normal 0 Electronic 5 Photo 7 Bitonal Manuscript 4 Drawing Map Własny profil 9 Trudno powiedzieć 7 Rys. 39. Przeciętna rozdzielczość stosowana dla DjVu 50 ppi 00 ppi 300 ppi 600 ppi Rys Generowanie systemu zakładek odzwierciedlających strukturę dokumentu w plikach DjVu ; 6% ; 63% ; 3% Tak - we wszystkich plikach Tak, ale tylko w niektórych plikach Nie

222 Rys. 33. Sposoby zabezpieczania plików DjVu Wygenerowane pliki nie są zabezpieczone 4 Pliki posiadają znak wodny 3 Pliki są zabezpieczone w inny sposób 4 Rys. 33. Realizowanie OCR w plikach DjVu 3; 9% Nie 7; 0% 7; 0% Tak - za pomocą mechanizmu wbudowanego w DocumentExpress Tak - proces OCR jest realizowany przez zewnętrzne oprogramowanie (np. ABBYY FineReader) 8; 5% Tak - przy zastosowaniu modelu mieszanego (mechanizm wbudowany w DocumentExpress oraz oprogramowanie zewnętrzne - w zależności od dokumentu/grupy dokumentów) Rys Istniejące pliki DjVu bez OCR 3; 50% 3; 50% Nie Tak Rys Procent plików DjVu bez OCR w stosunku do wszystkich posiadanych plików DjVu 3; 3% 3; 3% 5; 39% do 0% -5% 6-50% 5-75% ; 5%

223 Rys Poddanie w przyszłości OCRowi nierozpoznanych plików DjVu ; 5% 7; 54% 4; 3% Nie Tak Trudno powiedzieć Rys Oprogramowanie stosowane do generowania i edycji plików PDF Adobe Acrobat Standard 0 Adobe Acrobat Pro 7 ABBYY FineReader Inny program 6 Rys Generowane typy PDF Standardowy PDF 4 PDF/A Trudno powiedzieć Rys Przeciętna rozdzielczość stosowana dla PDF 44 ppi 50 ppi 00 ppi 300 ppi ppi 600 ppi 3

224 Rys Generowanie systemu zakładek odzwierciedlających strukturę dokumentu w plikach PDF 7; 30% Tak - we wszystkich plikach ; 48% Tak, ale tylko w niektórych plikach Nie 5; % Rys Sposoby zabezpieczania plików PDF Wygenerowane pliki nie są zabezpieczone 7 Pliki posiadają znak wodny 3 Pliki są chronione przed modyfikacją 9 Pliki są chronione przed drukowaniem Pliki są chronione przed kopiowaniem 4 4 Pliki są zabezpieczone w inny sposób Rys. 34. Realizowanie OCR w plikach PDF Nie ; 8% Tak - za pomocą mechanizmu wbudowanego w Adobe Acrobat 0; 4% 8; 33% Tak - proces OCR jest realizowany przez zewnętrzne oprogramowanie (np. ABBYY FineReader) 4; 7% Tak - przy zastosowaniu modelu mieszanego (mechanizm wbudowany w Adobe Acrobat oraz oprogramowanie zewnętrzne - w zależności od dokumentu/grupy dokumentów) 4

225 Rys. 34. Istniejące pliki PDF bez OCR 0; 63% 6; 37% Nie Tak Rys Procent plików PDF bez OCR w stosunku do wszystkich posiadanych plików PDF ; 0% ; 0% do 0% -5% powyżej 75% 7; 70% Rys Poddanie w przyszłości OCR-owi nierozpoznanych plików PDF 3; 30% 4; 40% Nie Tak Trudno powiedzieć 3; 30% 5

Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych

Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych Lp. Kryteria Obiekt Biblioteczny 1. Procedury, obejmujące: 1. selekcję wybór materiału, który zostanie poddany digitalizacji; selekcji

Bardziej szczegółowo

Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej. Zawartość cyfrowa

Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej. Zawartość cyfrowa Treść dokumentu: Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej. Opis standardów przekazywania obiektów zdigitalizowanych oraz informacji towarzyszących w zakresie zawartości cyfrowej.

Bardziej szczegółowo

Sposób doręczania dokumentów elektronicznych. do Urzędu Gminy Zawady

Sposób doręczania dokumentów elektronicznych. do Urzędu Gminy Zawady Urząd Gminy Zawady Urząd Gminy Zawady Sposób doręczania dokumentów elektronicznych do Urzędu Gminy Zawady Zgodnie z rozporządzeniem Prezesa Rady Ministrów z dnia 29 września 2005 roku w sprawie warunków

Bardziej szczegółowo

ROZPORZĄDZENIE RADY MINISTRÓW. z dnia 11 października 2005 r. (Dz. U. z dnia 28 października 2005 r.)

ROZPORZĄDZENIE RADY MINISTRÓW. z dnia 11 października 2005 r. (Dz. U. z dnia 28 października 2005 r.) Dz.U.05.212.1766 ROZPORZĄDZENIE RADY MINISTRÓW z dnia 11 października 2005 r. w sprawie minimalnych wymagań dla systemów teleinformatycznych (Dz. U. z dnia 28 października 2005 r.) Na podstawie art. 18

Bardziej szczegółowo

ROZPORZĄDZENIE RADY MINISTRÓW. z dnia 11 października 2005 r. w sprawie minimalnych wymagań dla systemów teleinformatycznych

ROZPORZĄDZENIE RADY MINISTRÓW. z dnia 11 października 2005 r. w sprawie minimalnych wymagań dla systemów teleinformatycznych Dz.U.05.212.1766 ROZPORZĄDZENIE RADY MINISTRÓW z dnia 11 października 2005 r. w sprawie minimalnych wymagań dla systemów teleinformatycznych (Dz. U. z dnia 28 października 2005 r.) Na podstawie art. 18

Bardziej szczegółowo

Opis standardów przekazywania obiektów zdigitalizowanych oraz informacji towarzyszących.

Opis standardów przekazywania obiektów zdigitalizowanych oraz informacji towarzyszących. Treść dokumentu: Warunki przekazywania obiektów cyfrowych do Biblioteki Narodowej. Opis standardów przekazywania obiektów zdigitalizowanych oraz informacji towarzyszących. Nazwa dokumentu: warunki_wplywu_obiektow

Bardziej szczegółowo

Opis standardu. Dokumenty w postaci czystego (niesformatowanego) zbioru znaków zapisanych w standardzie Unicode UTF-8 jako pliki typu.

Opis standardu. Dokumenty w postaci czystego (niesformatowanego) zbioru znaków zapisanych w standardzie Unicode UTF-8 jako pliki typu. Lp. FORMATY DANYCH ORAZ STANDARDY ZAPEWNIAJĄCE DOSTĘP DO ZASOBÓW INFORMACJI UDOSTĘPNIANYCH ZA POMOCĄ SYSTEMÓW TELEINFORMATYCZNYCH UŻYWANYCH DO REALIZACJI ZADAŃ PUBLICZNYCH Opis 8) Ze zmianami wprowadzonymi

Bardziej szczegółowo

Wielkopolska Biblioteka Cyfrowa

Wielkopolska Biblioteka Cyfrowa Wielkopolska Biblioteka Cyfrowa Cezary Mazurek, Jan Andrzej Nikisch PIONIER 2003 Poznań 9-11 kwietnia 2003. Geneza WBC1 Celem strategicznym PFBN realizowanym od lat jest rozbudowa i modernizacja platformy

Bardziej szczegółowo

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ Wydział Elektrotechniki, Elektroniki, Informatyki i Automatyki Politechnika Łódzka Środowisko pracy grafików dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ Formaty

Bardziej szczegółowo

Biblioteki cyfrowe i ich kolekcje

Biblioteki cyfrowe i ich kolekcje Biblioteki cyfrowe i ich kolekcje Elżbieta Szymańska Dolnośląska Biblioteka Pedagogiczna we Wrocławiu Cel lekcji - przedstawienie historii powstania Bibliotek Cyfrowych; definicja - zapoznanie uczniów

Bardziej szczegółowo

Digitalizacja wybranych pozycji księgozbioru w Bibliotece Centralnego Instytutu Ochrony Pracy Państwowego Instytutu Badawczego

Digitalizacja wybranych pozycji księgozbioru w Bibliotece Centralnego Instytutu Ochrony Pracy Państwowego Instytutu Badawczego Digitalizacja wybranych pozycji księgozbioru w Bibliotece Centralnego Instytutu Ochrony Pracy Państwowego Instytutu Badawczego Marek Poźniak mapoz@ciop.pl XII Krajowe Forum Informacji Naukowej i Technicznej

Bardziej szczegółowo

Dziennik Ustaw 10 Poz. 113

Dziennik Ustaw 10 Poz. 113 Dziennik Ustaw 10 Poz. 113 Załączniki do rozporządzenia Rady Ministrów z dnia 12 kwietnia 2012 r. Załącznik nr 1 IDENTYFIKATORY OBIEKTÓW WYSTĘPUJĄCYCH W ARCHITEKTURZE REJESTRÓW PUBLICZNYCH Nazwa obiektu

Bardziej szczegółowo

Rozszerzenia plików graficznych do publkacji internetowych- Kasia Ząbek kl. 2dT

Rozszerzenia plików graficznych do publkacji internetowych- Kasia Ząbek kl. 2dT Rozszerzenia plików graficznych do publkacji internetowych- Kasia Ząbek kl. 2dT Plik graficzny o formacie ".tiff" TIFF (ang. Tagged Image File Format)- komputerowy format plików graficznych służy on do

Bardziej szczegółowo

P.2.1 WSTĘPNA METODA OPISU I

P.2.1 WSTĘPNA METODA OPISU I 1 S t r o n a P.2.1 WSTĘPNA METODA OPISU I ZNAKOWANIA DOKUMENTACJI MEDYCZNEJ W POSTACI ELEKTRONICZNEJ P.2. REKOMENDACJA OPISU I OZNAKOWANIA DOKUMENTACJI MEDYCZNEJ W POSTACI ELEKTRONICZNEJ 2 S t r o n a

Bardziej szczegółowo

OPIS PRZEDMIOTU. Dygitalizacja i biblioteki cyfrowe MSIW 01 1400-IN23D-SP. Wydział Administracji i Nauk Społecznych Instytut/Katedra

OPIS PRZEDMIOTU. Dygitalizacja i biblioteki cyfrowe MSIW 01 1400-IN23D-SP. Wydział Administracji i Nauk Społecznych Instytut/Katedra OPIS PRZEDMIOTU Kod przedmiotu Dygitalizacja i biblioteki cyfrowe MSIW 01 1400-IN23D-SP Wydział Wydział Administracji i Nauk Społecznych Instytut/Katedra Katedra Informacji Naukowej i Bibliologii Kierunek

Bardziej szczegółowo

Raportów o Stanie Kultury

Raportów o Stanie Kultury Raport został opracowany na zlecenie Ministerstwa Kultury i Dziedzictwa Narodowego jako jeden z Raportów o Stanie Kultury, podsumowujących zmiany, jakie dokonały się w sektorze kultury w Polsce w ciągu

Bardziej szczegółowo

Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe

Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe Rozwój polskich bibliotek cyfrowych Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe Plan prezentacji Wprowadzenie Historia rozwoju bibliotek cyfrowych w Polsce Aktualny stan bibliotek cyfrowych

Bardziej szczegółowo

GRAFIKA RASTROWA. WYKŁAD 2 Oprogramowanie i formaty plików. Jacek Wiślicki Katedra Informatyki Stosowanej

GRAFIKA RASTROWA. WYKŁAD 2 Oprogramowanie i formaty plików. Jacek Wiślicki Katedra Informatyki Stosowanej GRAFIKA RASTROWA WYKŁAD 2 Oprogramowanie i formaty plików Jacek Wiślicki Katedra Informatyki Stosowanej Oprogramowanie Na rynku istnieje wiele programów do tworzenia i przetwarzania grafiki rastrowej.

Bardziej szczegółowo

UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz

UEK w Krakowie Janusz Stal & Grażyna Paliwoda-Pękosz Po zrealizowaniu materiału student będzie w stanie rozpoznawać różne formaty opisu dokumentów biurowych edytować dokumenty w różnych formatach generować dokumenty w formacie PDF, XPS 2 1 ODF http://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office

Bardziej szczegółowo

projekt Zachodniopomorskiego Systemu Informacji Region@lnej i N@ukowej

projekt Zachodniopomorskiego Systemu Informacji Region@lnej i N@ukowej Biblioteka w erze cyfrowej informacji projekt Zachodniopomorskiego Systemu Informacji Region@lnej i N@ukowej Lilia Marcinkiewicz Książ ążnica Pomorska Misja: współuczestnictwo w budowie społecze eczeństwa

Bardziej szczegółowo

Tom 6 Opis oprogramowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli obmiaru do celów fakturowania

Tom 6 Opis oprogramowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli obmiaru do celów fakturowania Część 8 Narzędzie do kontroli danych elementarnych, danych wynikowych oraz kontroli Diagnostyka stanu nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 21 maja 2012 Historia dokumentu

Bardziej szczegółowo

Gdzieś w bibliotece jeleniogórskiej, 14 grudnia Wirtualna biblioteka e-pogranicze

Gdzieś w bibliotece jeleniogórskiej, 14 grudnia Wirtualna biblioteka e-pogranicze Gdzieś w bibliotece jeleniogórskiej, 14 grudnia 19... Wirtualna biblioteka e-pogranicze Jelenia Góra, 14.12.2012, Joanna Broniarczyk Związane tradycyjnie z bibliotekami media i procesy powstają już tylko

Bardziej szczegółowo

Kompresja obrazów i formaty plików graficznych

Kompresja obrazów i formaty plików graficznych Kompresja obrazów i formaty plików graficznych Kompresja obrazów Obrazy zapisywane w 24 lub 32-bitowej głębi kolorów o dużej rozdzielczości zajmują dużo miejsca. Utrudnia to przesyłanie ich pocztą elektroniczną,

Bardziej szczegółowo

REGULAMIN ORGANIZACYJNY BIBLIOTEKI GŁÓWNEJ UNIWERSYTETU KARDYNAŁA STEFANA WYSZYŃSKIEGO W WARSZAWIE

REGULAMIN ORGANIZACYJNY BIBLIOTEKI GŁÓWNEJ UNIWERSYTETU KARDYNAŁA STEFANA WYSZYŃSKIEGO W WARSZAWIE REGULAMIN ORGANIZACYJNY BIBLIOTEKI GŁÓWNEJ UNIWERSYTETU KARDYNAŁA STEFANA WYSZYŃSKIEGO W WARSZAWIE Postanowienia ogólne 1 1. Regulamin organizacyjny Biblioteki Głównej określa szczegółową strukturę organizacyjną

Bardziej szczegółowo

CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA

CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA http://www.cdlib.org/ 1. Zawartości serwisu Kalifornijska Biblioteka Cyfrowa = California Digital Library (CDL) jest serwisem, który umożliwia

Bardziej szczegółowo

Organizacja i logistyka digitalizacji

Organizacja i logistyka digitalizacji Wprowadzenie Organizacja i logistyka digitalizacji Tomasz Kalota www.tomasz.kalota.pl VIII Ogólnopolska Konferencja "Automatyzacja bibliotek publicznych" Warszawa, 26-28 listopada 2008 r. http://www.koszykowa.pl/biblioteka/content/view/710/26/

Bardziej szczegółowo

Udostępnianie i przechowywanie obiektów cyfrowych w kontekście biblioteki akademickiej

Udostępnianie i przechowywanie obiektów cyfrowych w kontekście biblioteki akademickiej Udostępnianie i przechowywanie obiektów cyfrowych w kontekście biblioteki akademickiej Tomasz Parkoła (tparkola@man.poznan.pl) Agenda Wprowadzenie Biblioteka cyfrowa Etapy tworzenia cyfrowych zasobów proces

Bardziej szczegółowo

Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie

Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie Wyzwania techniczne związane z prezentacją dziedzictwa kulturowego w Internecie Tomasz Parkoła, Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe II konferencja i3: internet infrastruktutry innowacje

Bardziej szczegółowo

Agnieszka Koszowska, FRSI Remigiusz Lis, ŚBC-BŚ

Agnieszka Koszowska, FRSI Remigiusz Lis, ŚBC-BŚ Cyfrowa biblioteka publiczna od skanera do Europeany Ułatwienie dostępu Ochrona (pośrednia) zbiorów Komunikacyjność Zasób róŝnorodnego zastosowania Dokumentacja Promocja Nowi odbiorcy Dlaczego warto digitalizować?

Bardziej szczegółowo

INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA.

INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych dr inż. Adam Iwaniak Infrastruktura Danych Przestrzennych w Polsce i Europie Seminarium, AR Wrocław

Bardziej szczegółowo

Digitalizacja zbiorów muzycznych analiza od strony użytkownika na podstawie Federacji Bibliotek Cyfrowych (FBC)

Digitalizacja zbiorów muzycznych analiza od strony użytkownika na podstawie Federacji Bibliotek Cyfrowych (FBC) Digitalizacja zbiorów muzycznych analiza od strony użytkownika na podstawie Federacji Bibliotek Cyfrowych (FBC) Martyna Darowska Biblioteka Główna Akademia Muzyczna im. Karola Szymanowskiego w Katowicach

Bardziej szczegółowo

ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI [1]) z dnia... 2006 r.

ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI [1]) z dnia... 2006 r. Źródło: http://bip.mswia.gov.pl/bip/projekty-aktow-prawnyc/2006/584,projekt-rozporzadzenia-ministra-swia-z-dnia-2006-r-w-s prawie-wymagan-technicznyc.html Wygenerowano: Poniedziałek, 4 stycznia 2016, 08:37

Bardziej szczegółowo

Wykaz skrótów... Wykaz literatury... O Autorach... Wstęp... XXIII

Wykaz skrótów... Wykaz literatury... O Autorach... Wstęp... XXIII Wykaz skrótów... Wykaz literatury... O Autorach... Wstęp... XXIII Ustawa o informatyzacji działalności podmiotów realizujących zadania publiczne (t.j. Dz.U. z 2017 r. poz. 570 ze zm.) Rozdział 1. Przepisy

Bardziej szczegółowo

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA Załącznik Nr 1.11 pieczątka jednostki organizacyjnej OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A * (opis modułu (przedmiotu) i programu nauczania)

Bardziej szczegółowo

ROZPORZĄDZENIE PREZESA RADY MINISTRÓW

ROZPORZĄDZENIE PREZESA RADY MINISTRÓW ROZPORZĄDZENIE PREZESA RADY MINISTRÓ z dnia 27 grudnia 2011 r. w sprawie wymagań technicznych dla dokumentów elektronicznych zawierających akty normatywne i inne akty prawne, dzienników urzędowych wydawanych

Bardziej szczegółowo

Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych

Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych Jak Nas widzą, tak Nas piszą Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych Warszawa Maj 2013 Plan prezentacji 1. Stan informacji naukowej w zakresie nauk technicznych w Polsce 2. Koncepcja systemu

Bardziej szczegółowo

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego Jakub Bajer Krzysztof Ober Polskie Biblioteki Cyfrowe Poznań, 18-22 października 2010 r. Plan prezentacji Wstęp

Bardziej szczegółowo

Renata Karpińska Departament Mecenatu Państwa Ministerstwo Kultury i Dziedzictwa Narodowego. Konferencja Dziedzictwo w sieci 30 listopada 2012 r.

Renata Karpińska Departament Mecenatu Państwa Ministerstwo Kultury i Dziedzictwa Narodowego. Konferencja Dziedzictwo w sieci 30 listopada 2012 r. Renata Karpińska Departament Mecenatu Państwa Ministerstwo Kultury i Dziedzictwa Narodowego Konferencja Dziedzictwo w sieci 30 listopada 2012 r. Podstawa prawna: Uchwała Rady Ministrów nr 176/2010 z dn.

Bardziej szczegółowo

mgr inż. Mariusz Jarocki Forum Nauczycieli Bibliotekarzy Szkolnych

mgr inż. Mariusz Jarocki Forum Nauczycieli Bibliotekarzy Szkolnych mgr inż. Mariusz Jarocki Forum Nauczycieli Bibliotekarzy Szkolnych na temat Nowe formy książki Instytut Informacji Naukowej i Bibliologii UMK Olsztyn 2011 Książka jest jednym z najstarszych sposób wyrażania

Bardziej szczegółowo

Dlaczego OpenSouce jest atrakcyjne

Dlaczego OpenSouce jest atrakcyjne Dlaczego OpenSouce jest atrakcyjne w projektach informatycznych w administracji publicznej Paweł Dudzik, Infovide S.A. Projekt informatyczny w administracji Jeden duży przetarg jest łatwiej zorganizować,

Bardziej szczegółowo

Infrastruktura bibliotek cyfrowych

Infrastruktura bibliotek cyfrowych Infrastruktura bibliotek cyfrowych w sieci PIONIER C. Mazurek, M.Stroiński, M.Werla, J.Węglarz Poznańskie Centrum Superkomputerowo-Sieciowe Polskie Biblioteki Cyfrowe, Poznań, 25.11.2008r. Polski Internet

Bardziej szczegółowo

serwisy W*S ERDAS APOLLO 2009

serwisy W*S ERDAS APOLLO 2009 serwisy W*S ERDAS APOLLO 2009 1 OGC (Open Geospatial Consortium, Inc) OGC jest międzynarodowym konsorcjum 382 firm prywatnych, agencji rządowych oraz uniwersytetów, które nawiązały współpracę w celu rozwijania

Bardziej szczegółowo

Wykład 1: Tekstowe dokumenty elektroniczne strona 1. Wykład 1: Tekstowe dokumenty elektroniczne

Wykład 1: Tekstowe dokumenty elektroniczne strona 1. Wykład 1: Tekstowe dokumenty elektroniczne Wykład 1: Tekstowe dokumenty elektroniczne strona 1 Wykład 1: Tekstowe dokumenty elektroniczne 1 Formaty dokumentów Publikując dla uczniów/studentów/słuchaczy materiały w sieci musimy rozważyć najpierw

Bardziej szczegółowo

Baza Wiedzy Politechniki Warszawskiej uregulowania prawne, organizacja. Jolanta Stępniak Biblioteka Główna Politechniki Warszawskiej

Baza Wiedzy Politechniki Warszawskiej uregulowania prawne, organizacja. Jolanta Stępniak Biblioteka Główna Politechniki Warszawskiej Baza Wiedzy Politechniki Warszawskiej Jolanta Stępniak Biblioteka Główna Politechniki Warszawskiej Początki brak jednego źródła informacji Bibliografia publikacji pracowników PW 1944-1986 wersja drukowana

Bardziej szczegółowo

Ewa Piotrowska. Projekty biblioteczne realizowane w Bibliotece Głównej Uniwersytetu Pedagogicznego w Krakowie

Ewa Piotrowska. Projekty biblioteczne realizowane w Bibliotece Głównej Uniwersytetu Pedagogicznego w Krakowie Ewa Piotrowska Projekty biblioteczne realizowane w Bibliotece Głównej Uniwersytetu Pedagogicznego w Krakowie Plan prezentacji Pozabudżetowe źródła finansowania bibliotek akademickich Środki pozabudżetowe

Bardziej szczegółowo

Wyszukiwanie pełnotekstowe w zasobach bibliotek cyfrowych

Wyszukiwanie pełnotekstowe w zasobach bibliotek cyfrowych Arkadiusz Pulikowski Instytut Bibliotekoznawstwa i Informacji Naukowej Uniwersytet Śląski Wyszukiwanie pełnotekstowe w zasobach bibliotek cyfrowych X Krajowe Forum Informacji Naukowej i Technicznej, Zakopane

Bardziej szczegółowo

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu Marcin Werla (mwerla@man.poznan.pl) Poznańskie Centrum Superkomputerowo-Sieciowe, Dział Bibliotek Cyfrowych i Platform Wiedzy Prezentacja

Bardziej szczegółowo

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe

Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe Marcin Werla (mwerla@man.poznan.pl) Poznańskie Centrum Superkomputerowo-Sieciowe Udostępnienie danych w formatach i w sposób umożliwiający użycie ich w Europeanie Podstawowy protokół to OAI-PMH Treść obiektu

Bardziej szczegółowo

DIGITALIZACJA. Maciej Rynarzewski Oddział Zbiorów Specjalnych

DIGITALIZACJA. Maciej Rynarzewski Oddział Zbiorów Specjalnych DIGITALIZACJA CZYM JEST DIGITALIZACJA? to przetwarzanie analogowych nośników o formy cyfrowej w rozumieniu bibliotekarskim to przetworzenie tradycyjnych, drukowanych lub rękopiśmiennych materiałów do postaci

Bardziej szczegółowo

Morze i Pomorze w Bałtyckiej Bibliotece Cyfrowej. Iwona Joć-Adamkowicz Wojewódzka i Miejska Biblioteka Publiczna w Gdańsku Gdańsk, 21 czerwca 2017 r.

Morze i Pomorze w Bałtyckiej Bibliotece Cyfrowej. Iwona Joć-Adamkowicz Wojewódzka i Miejska Biblioteka Publiczna w Gdańsku Gdańsk, 21 czerwca 2017 r. Morze i Pomorze w Bałtyckiej Bibliotece Cyfrowej Iwona Joć-Adamkowicz Wojewódzka i Miejska Biblioteka Publiczna w Gdańsku Gdańsk, 21 czerwca 2017 r. www.bibliotekacyfrowa.eu (01.10.2008- ) Współtwórcy

Bardziej szczegółowo

Biblioteka Cyfrowa czy Biblioteka 2.0 czyli co przechowuje biblioteka

Biblioteka Cyfrowa czy Biblioteka 2.0 czyli co przechowuje biblioteka Biblioteka Cyfrowa czy Biblioteka 2.0 czyli co przechowuje biblioteka dr inż. Marek Szepski Krakowska Akademia mszepski@afm.edu.pl Inspiracje Na półce stoją obok siebie 2 książki. Mają tego samego autora

Bardziej szczegółowo

FORMATY PLIKÓW GRAFICZNYCH

FORMATY PLIKÓW GRAFICZNYCH FORMATY PLIKÓW GRAFICZNYCH Różnice między nimi. Ich wady i zalety. Marta Łukasik Plan prezentacji Formaty plików graficznych Grafika wektorowa Grafika rastrowa GIF PNG JPG SAV FORMATY PLIKÓW GRAFICZNYCH

Bardziej szczegółowo

Dopuszczalność skanu oferty w postępowaniu o zamówienie publiczne

Dopuszczalność skanu oferty w postępowaniu o zamówienie publiczne Dopuszczalność skanu oferty w postępowaniu o zamówienie publiczne Niniejsza opinia uwzględnia stanowiska Ministerstwa Cyfryzacji i Polskiej Izby Informatyki i Telekomunikacji uzyskane przez Prezesa Urzędu

Bardziej szczegółowo

Repozytorium Uniwersytetu Jagiellońskiego

Repozytorium Uniwersytetu Jagiellońskiego Repozytorium Uniwersytetu Jagiellońskiego droga ku otwartości Leszek Szafrański Konferencja, Rozwój umiejętności cyfrowych, Gdańsk 10-11122015 Jagiellońska Biblioteka Cyfrowa repozytorium Uniwersytetu

Bardziej szczegółowo

Uchwała Nr Kolegium Regionalnej Izby Obrachunkowej w Warszawie z dnia 19 lipca 2016 roku

Uchwała Nr Kolegium Regionalnej Izby Obrachunkowej w Warszawie z dnia 19 lipca 2016 roku Uchwała Nr 16.169.2016 Kolegium Regionalnej Izby Obrachunkowej w Warszawie z dnia 19 lipca 2016 roku w sprawie: orzeczenia nieważności Uchwały Nr XX.250.2016 Rady Gminy Nadarzyn z dnia 22 czerwca 2016

Bardziej szczegółowo

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych rk Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych pojęć, prawdopodobnie zastanawiasz się, kiedy zaczniesz

Bardziej szczegółowo

Procesowa specyfikacja systemów IT

Procesowa specyfikacja systemów IT Procesowa specyfikacja systemów IT BOC Group BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management Office

Bardziej szczegółowo

1. Przypisy, indeks i spisy.

1. Przypisy, indeks i spisy. 1. Przypisy, indeks i spisy. (Wstaw Odwołanie Przypis dolny - ) (Wstaw Odwołanie Indeks i spisy - ) Przypisy dolne i końcowe w drukowanych dokumentach umożliwiają umieszczanie w dokumencie objaśnień, komentarzy

Bardziej szczegółowo

Mgr Aniela Piotrowicz Poznań - UM

Mgr Aniela Piotrowicz Poznań - UM Mgr Aniela Piotrowicz Poznań - UM zasoby medyczne w wielkopolskiej bibliotece cyfrowej Rosną krajowe zasoby cyfrowe z zakresu medycyny. W Wielkopolskiej Bibliotece Cyfrowej, oprócz historycznych monografii

Bardziej szczegółowo

FISZKA KONKURSU. Centrum Projektów Polska Cyfrowa POPC IP /16. Program Operacyjny Polska Cyfrowa

FISZKA KONKURSU. Centrum Projektów Polska Cyfrowa POPC IP /16. Program Operacyjny Polska Cyfrowa FISZKA KONKURSU Instytucja ogłaszająca nabór Nr konkursu Centrum Projektów Polska Cyfrowa POPC.02.03.01-IP.01-00-004/16 LINK https://cppc.gov.pl/programy/popc-2/popc/popc_2-3- 1_nauka_2016/ Program Operacyjny

Bardziej szczegółowo

Prawne, organizacyjne i techniczne aspekty budowy IIP w temacie zagospodarowanie przestrzenne

Prawne, organizacyjne i techniczne aspekty budowy IIP w temacie zagospodarowanie przestrzenne Prawne, organizacyjne i techniczne aspekty budowy IIP w temacie zagospodarowanie przestrzenne Magdalena Zagrzejewska Zastępca Dyrektora Departamentu Polityki Przestrzennej w Ministerstwie Infrastruktury

Bardziej szczegółowo

Koordynator projektu: Anna Głowacz Ośrodek Kultury Biblioteka Polskiej Piosenki e-mail: anna.głowacz@bibliotekapiosenki.pl

Koordynator projektu: Anna Głowacz Ośrodek Kultury Biblioteka Polskiej Piosenki e-mail: anna.głowacz@bibliotekapiosenki.pl Założenia programowe, przebieg i rezultaty projektu Polskie pieśni i piosenki w zbiorach Biblioteki Jagiellońskiej jako podstawa do rozwoju Cyfrowej Biblioteki Polskiej Piosenki cz. 2 Koordynator projektu:

Bardziej szczegółowo

Możliwości pozyskiwania pozabudżetowych środków finansowych na digitalizację zasobów

Możliwości pozyskiwania pozabudżetowych środków finansowych na digitalizację zasobów Możliwości pozyskiwania pozabudżetowych środków finansowych na digitalizację zasobów Teresa E. Szymorowska Wojewódzka Biblioteka Publiczna Książnica Kopernikańska w Toruniu e-polska Biblioteki i archiwa

Bardziej szczegółowo

WYKORZYSTANIE FUNDUSZY UNIJNYCH PRZEZ BIBLIOTEKĘ GŁÓWNĄ AKADEMII MORSKIEJ W SZCZECINIE

WYKORZYSTANIE FUNDUSZY UNIJNYCH PRZEZ BIBLIOTEKĘ GŁÓWNĄ AKADEMII MORSKIEJ W SZCZECINIE WYKORZYSTANIE FUNDUSZY UNIJNYCH PRZEZ BIBLIOTEKĘ GŁÓWNĄ AKADEMII MORSKIEJ W SZCZECINIE Elżbieta Edelman IV Wrocławskie Spotkania Bibliotekarzy Organizacja Czytelni Multimedialnej Europejski Fundusz Rozwoju

Bardziej szczegółowo

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl

extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl Plan wykładu Wprowadzenie: historia rozwoju technik znakowania tekstu Motywacje dla prac nad XML-em Podstawowe koncepcje XML-a XML jako metajęzyk

Bardziej szczegółowo

Wszystko na temat wzoru dokumentu elektronicznego

Wszystko na temat wzoru dokumentu elektronicznego Stowarzyszenie PEMI Wszystko na temat wzoru dokumentu elektronicznego Czym jest, kto go tworzy, kto publikuje, kto może z niego skorzystać? Mirosław Januszewski, Tomasz Rakoczy, Andrzej Matejko 2007-07-25

Bardziej szczegółowo

Opis znaczenia kryterium. Lp. Nazwa kryterium Opis kryterium. 1. Wnioskodawca przeprowadził inwentaryzację zasobów nauki objętych projektem.

Opis znaczenia kryterium. Lp. Nazwa kryterium Opis kryterium. 1. Wnioskodawca przeprowadził inwentaryzację zasobów nauki objętych projektem. Kryteria merytoryczne wyboru projektów dla poddziałania 2.3.1 Cyfrowe udostępnianie informacji sektora publicznego (ISP) ze źródeł administracyjnych oraz zasobów nauki Programu Operacyjnego Polska Cyfrowa

Bardziej szczegółowo

Publikacje współczesne w realiach biblioteki cyfrowej technicznej szkoły wyższej wokół pewnego przypadku

Publikacje współczesne w realiach biblioteki cyfrowej technicznej szkoły wyższej wokół pewnego przypadku Publikacje współczesne w realiach biblioteki cyfrowej technicznej szkoły wyższej wokół pewnego przypadku Jarosław Gajda (Biblioteka Politechniki Lubelskiej) Twórcy a biblioteki cyfrowe Problemy z gromadzeniem

Bardziej szczegółowo

KATOLICKIEGO UNIWERSYTETU LUBELSKIEGO JANA PAWŁA II. Poz. 201

KATOLICKIEGO UNIWERSYTETU LUBELSKIEGO JANA PAWŁA II. Poz. 201 M O N I T O R KATOLICKIEGO UNIWERSYTETU LUBELSKIEGO JANA PAWŁA II Poz. 201 ZARZĄDZENIE NR ROP-0101-34/18 REKTORA KATOLICKIEGO UNIWERSYTETU LUBELSKIEGO JANA PAWŁA II z dnia 3 kwietnia 2018 r. w sprawie

Bardziej szczegółowo

od roku akademickiego 2014/2015

od roku akademickiego 2014/2015 wykłady labolat. konwer. semin. Razem Wydział Filologiczny Kierunek Informacja naukowa i bibliotekoznawstwo Studia drugiego stopnia stacjonarne od roku akademickiego 2014/2015 PRZEDMIOTY WSPÓLNE DLA WSZYSTKICH

Bardziej szczegółowo

Tom 6 Opis oprogramowania

Tom 6 Opis oprogramowania Część 4 Narzędzie do wyliczania wielkości oraz wartości parametrów stanu Diagnostyka stanu nawierzchni - DSN Generalna Dyrekcja Dróg Krajowych i Autostrad Warszawa, 30 maja 2012 Historia dokumentu Nazwa

Bardziej szczegółowo

Opis znaczenia kryterium. Lp. Nazwa kryterium Opis kryterium

Opis znaczenia kryterium. Lp. Nazwa kryterium Opis kryterium Kryteria merytoryczne wyboru projektów dla poddziałania 2.3.2 Cyfrowe udostępnienie zasobów kultury Programu Operacyjnego Polska Cyfrowa na lata 2014-2020 Typ projektu Cyfrowe udostępnienie zasobów kultury

Bardziej szczegółowo

WSKAZÓWKI DLA AUTORÓW REFERATÓW

WSKAZÓWKI DLA AUTORÓW REFERATÓW WSKAZÓWKI DLA AUTORÓW REFERATÓW Spis treści: I. Wymogi formalne... 2 II. WZÓR... 3 III. Bibliografia... 4 IV. Streszczenie... 5 V. Cytaty i przypisy... 6 VI. Tabele, rysunki, wzory... 7 1 I. Wymogi formalne

Bardziej szczegółowo

Wymagania edukacyjne na ocenę z informatyki klasa 3

Wymagania edukacyjne na ocenę z informatyki klasa 3 Wymagania edukacyjne na ocenę z informatyki klasa 3 0. Logo [6 godz.] PODSTAWA PROGRAMOWA: Rozwiązywanie problemów i podejmowanie decyzji z wykorzystaniem komputera, stosowanie podejścia algorytmicznego.

Bardziej szczegółowo

Międzyplatformowy interfejs systemu FOLANessus wykonany przy użyciu biblioteki Qt4

Międzyplatformowy interfejs systemu FOLANessus wykonany przy użyciu biblioteki Qt4 Uniwersytet Mikołaja Kopernika w Toruniu Wydział Matematyki i Informatyki Wydział Fizyki, Astronomii i Informatyki Stosowanej Agnieszka Holka Nr albumu: 187396 Praca magisterska na kierunku Informatyka

Bardziej szczegółowo

Ewidencja dorobku naukowego lata wcześniejsze

Ewidencja dorobku naukowego lata wcześniejsze Dokumentowanie i upowszechnianie dorobku naukowego pracowników i studentów uczelni wyższych prace nad tworzeniem repozytorium Politechniki Warszawskiej. Weronika KUBRAK Zakopane 2013 Ewidencja dorobku

Bardziej szczegółowo

POROZUMIENIE o współtworzeniu MAZOWIECKIEJ BIBLIOTEKI CYFROWEJ. Preambuła

POROZUMIENIE o współtworzeniu MAZOWIECKIEJ BIBLIOTEKI CYFROWEJ. Preambuła ul. Koszykowa 26/28 00-950 Warszawa skrytka nr 365 tel. 22 537 41 58 fax 22 621 19 68 biblioteka@koszykowa.pl Warszawa, dnia.. POROZUMIENIE o współtworzeniu MAZOWIECKIEJ BIBLIOTEKI CYFROWEJ Preambuła I.

Bardziej szczegółowo

Seminarium magisterskie* ocena ciągła (praca na. B zajęciach), praca pisemna Społeczeństwo informacji i

Seminarium magisterskie* ocena ciągła (praca na. B zajęciach), praca pisemna Społeczeństwo informacji i Rok studiów: I Semestr 1 Nazwa przedmiotu Program studiów niestacjonarnych (zaocznych) II stopnia dla kierunku informacja naukowa i bibliotekoznawstwo dla studentów rozpoczynających studia w roku akademickim

Bardziej szczegółowo

Cała prawda o plikach grafiki rastrowej

Cała prawda o plikach grafiki rastrowej ~ 1 ~ Cała prawda o plikach grafiki rastrowej Grafika rastrowa to rodzaj grafiki zapisywanej na dysku w postaci bitmapy, czyli zbioru pikseli. W edytorach grafiki rastrowej możliwa jest edycja na poziomie

Bardziej szczegółowo

Innowacyjne narzędzia w procesie digitalizacji

Innowacyjne narzędzia w procesie digitalizacji Innowacyjne narzędzia w procesie digitalizacji Tomasz Parkoła tparkola@man.poznan.pl Konferencja i3, 16.04.2013, Poznań Agenda Wprowadzenie Obszary działania Narzędzia i zasoby Podsumowanie Kontekst projekt

Bardziej szczegółowo

Cyfrowe dokumenty muzyczne w Internecie

Cyfrowe dokumenty muzyczne w Internecie Cyfrowe dokumenty muzyczne w Internecie Biblioteki cyfrowe w pracy biblioteki muzycznej Maciej Dynkowski Biblioteka Główna Akademii Muzycznej Im. G. i K. Bacewiczów w Łodzi Zalety dokumentów cyfrowych

Bardziej szczegółowo

Realizacja założeń polityki otwartości na Politechnice Krakowskiej.

Realizacja założeń polityki otwartości na Politechnice Krakowskiej. Realizacja założeń polityki otwartości na Politechnice Krakowskiej. Dorota Buzdygan Dorota Lipińska Maria Pierukowicz Biblioteka Politechniki Krakowskiej Wdrażanie otwartego dostępu w instytucji naukowej

Bardziej szczegółowo

Korekta OCR problemy i rozwiązania

Korekta OCR problemy i rozwiązania Korekta OCR problemy i rozwiązania Edyta Kotyńska eteka.com.pl Kraków, 24-25.01.2013 r. Tekst, który nie jest cyfrowy - nie istnieje w sieci OCR umożliwia korzystanie z materiałów historycznych w formie

Bardziej szczegółowo

Wyjaśnienia z dnia r. do treści Zapytania Ofertowego nr ZO/3/FO/POPC/2017 w odpowiedzi na pytania dotyczące Zapytania ofertowego.

Wyjaśnienia z dnia r. do treści Zapytania Ofertowego nr ZO/3/FO/POPC/2017 w odpowiedzi na pytania dotyczące Zapytania ofertowego. Wyjaśnienia z dnia 13.09.2017r. do treści Zapytania Ofertowego nr ZO/3/FO/POPC/2017 w odpowiedzi na pytania dotyczące Zapytania ofertowego. 1. Czy Przedmiotem zamówienia jest również dostarczenie materiałów

Bardziej szczegółowo

Szkolenia dla pracowników Politechniki Wrocławskiej

Szkolenia dla pracowników Politechniki Wrocławskiej Szkolenia dla pracowników Politechniki Wrocławskiej Laboratorium Tyfloinformatyczne zaprasza wszystkich pracowników Politechniki Wrocławskiej na darmowe szkolenia z tworzenia i redagowania dostępnych i

Bardziej szczegółowo

Księgarnia internetowa Lubię to!» Nasza społeczność

Księgarnia internetowa Lubię to!» Nasza społeczność Kup książkę Poleć książkę Oceń książkę Księgarnia internetowa Lubię to!» Nasza społeczność Spis treści Rozdział 1. Zastosowanie komputera w życiu codziennym... 5 Rozdział 2. Elementy zestawu komputerowego...13

Bardziej szczegółowo

Ω-Ψ R. Uczelniana Baza Wiedzy. Wdrażanie Bazy Wiedzy. Wersja 1.0

Ω-Ψ R. Uczelniana Baza Wiedzy. Wdrażanie Bazy Wiedzy. Wersja 1.0 Ω-Ψ R Uczelniana Baza Wiedzy Wdrażanie Bazy Wiedzy Wersja 1.0 Wydział Elektroniki i Technik Informacyjnych i Biblioteka Główna Politechnika Warszawska Page 1 Historia dokumentu Numer wersji Data wersji

Bardziej szczegółowo

kierunkową rozwoju informatyzacji Polski do roku 2013 oraz perspektywiczną prognozą transformacji społeczeństwa informacyjnego do roku 2020.

kierunkową rozwoju informatyzacji Polski do roku 2013 oraz perspektywiczną prognozą transformacji społeczeństwa informacyjnego do roku 2020. Z A T W I E R D Z A M P R E Z E S Polskiego Komitetu Normalizacyjnego /-/ dr inż. Tomasz SCHWEITZER Strategia informatyzacji Polskiego Komitetu Normalizacyjnego na lata 2009-2013 1. Wprowadzenie Informatyzacja

Bardziej szczegółowo

Akty prawne regulujące funkcjonowanie stron podmiotowych BIP

Akty prawne regulujące funkcjonowanie stron podmiotowych BIP Akty prawne regulujące funkcjonowanie stron podmiotowych BIP Michał Bukowski Departament Informatyzacji MSWiA Kraków, 15 czerwca 2007 r. Prawo dostępu do informacji publicznej Powszechna Deklaracja Praw

Bardziej szczegółowo

GML w praktyce geodezyjnej

GML w praktyce geodezyjnej GML w praktyce geodezyjnej Adam Iwaniak Kon-Dor s.c. Konferencja GML w praktyce, 12 kwietnia 2013, Warszawa SWING Rok 1995, standard de jure Wymiany danych pomiędzy bazami danych systemów informatycznych

Bardziej szczegółowo

System zarządzający grami programistycznymi Meridius

System zarządzający grami programistycznymi Meridius System zarządzający grami programistycznymi Meridius Instytut Informatyki, Uniwersytet Wrocławski 20 września 2011 Promotor: prof. Krzysztof Loryś Gry komputerowe a programistyczne Gry komputerowe Z punktu

Bardziej szczegółowo

Opis przedmiotu zamówienia

Opis przedmiotu zamówienia Załącznik nr 1 do SIWZ Opis przedmiotu zamówienia Świadczenie usług doradztwa eksperckiego w ramach projektu Elektroniczna Platforma Gromadzenia, Analizy i Udostępniania Zasobów Cyfrowych o Zdarzeniach

Bardziej szczegółowo

Informacje dot. sposobu przygotowywania i przekazywania do ogłoszenia aktów prawnych zgodnie z wymaganiami powszechnie obowiązujących przepisów.

Informacje dot. sposobu przygotowywania i przekazywania do ogłoszenia aktów prawnych zgodnie z wymaganiami powszechnie obowiązujących przepisów. Informacje dot. sposobu przygotowywania i przekazywania do ogłoszenia aktów prawnych zgodnie z wymaganiami powszechnie obowiązujących przepisów. Procedurę ogłaszania aktów normatywnych w Dzienniku Województwa

Bardziej szczegółowo

w tym wykłady konwer. labolat. semin. ćwicz.

w tym wykłady konwer. labolat. semin. ćwicz. wykłady labolat. konwer. semin. Razem Wydział Filologiczny Kierunek Informacja naukowa i bibliotekoznawstwo studia drugiego stopnia stacjonarne od roku akademickiego 2016/2017 PRZEDMIOTY WSPÓLNE DLA WSZYSTKICH

Bardziej szczegółowo

1. Wymagania prawne. Europejskie uwarunkowania prawne:

1. Wymagania prawne. Europejskie uwarunkowania prawne: 1. Wymagania prawne Oferowane przez Wykonawcę rozwiązania muszą być na dzień odbioru zgodne z aktami prawnymi regulującymi pracę urzędów administracji publicznej, dyrektywą INSPIRE, ustawą o Infrastrukturze

Bardziej szczegółowo

Spis lektur Lektura obowiązkowa Lektury uzupełniające A. Publikacje drukowane: 1. 2. 3. 4. 5. 6. 7. 8. 9.

Spis lektur Lektura obowiązkowa Lektury uzupełniające A. Publikacje drukowane: 1. 2. 3. 4. 5. 6. 7. 8. 9. Spis lektur Lektura obowiązkowa S t a n i s ł a w s k a K l o c S., Prawo autorskie a biblioteka cyfrowa - opinia prawna : sporządzona w ramach projektu KPBC finansowanego z Funduszy Strukturalnych UE

Bardziej szczegółowo

Masowe zabezpieczanie i udostępnianie egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej. Leszek Szafrański Biblioteka Jagiellońska

Masowe zabezpieczanie i udostępnianie egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej. Leszek Szafrański Biblioteka Jagiellońska Masowe zabezpieczanie i udostępnianie egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej Leszek Szafrański Biblioteka Jagiellońska Jagiellońska Biblioteka Cyfrowa Po 3 latach istnienia: Czasopisma

Bardziej szczegółowo

Zdalne monitorowanie i zarządzanie urządzeniami sieciowymi

Zdalne monitorowanie i zarządzanie urządzeniami sieciowymi Uniwersytet Mikołaja Kopernika w Toruniu Wydział Matematyki i Informatyki Wydział Fizyki, Astronomii i Infomatyki Stosowanej Piotr Benetkiewicz Nr albumu: 168455 Praca magisterska na kierunku Informatyka

Bardziej szczegółowo

Dokumenty online model opracowania, udostępniania, archiwizacji. egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej

Dokumenty online model opracowania, udostępniania, archiwizacji. egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej Dokumenty online model opracowania, udostępniania, archiwizacji egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej Katarzyna Szczepaniec Oddział Zbiorów Cyfrowych BJ Dokumenty Analogowe i Elektroniczne

Bardziej szczegółowo