Formaty hybrydowe w bibliotekach cyfrowych



Podobne dokumenty
Tworzenie zasobów cyfrowych

Automatyzacja procesu publikowania w bibliotece cyfrowej

Jak przygotować projekt

MBC technologia - instrukcja 3 1

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

Część 2 struktura e-paczki

Sieć komputerowa grupa komputerów lub innych urządzeo połączonych ze sobą w celu wymiany danych lub współdzielenia różnych zasobów, na przykład:

REGULAMIN PRZESYŁANIA I UDOSTĘPNIANIA FAKTUR W FORMIE ELEKTRONICZNEJ E-FAKTURA ROZDZIAŁ 1. I. Postanowienia ogólne

Postanowienia ogólne. Usługodawcy oraz prawa do Witryn internetowych lub Aplikacji internetowych

Oprogramowanie FonTel służy do prezentacji nagranych rozmów oraz zarządzania rejestratorami ( zapoznaj się z rodziną rejestratorów FonTel ).

Instrukcja Obsługi STRONA PODMIOTOWA BIP

OGŁOSZENIE O ZAPROSZENIU DO SKŁADANIA OFERT NA DOSTAWĘ SKANERÓW i WIELOFUNKCYJNYCH URZĄDZEŃ BIUROWAYCH

Gdynia: Księgowość od podstaw Numer ogłoszenia: ; data zamieszczenia: OGŁOSZENIE O ZAMÓWIENIU - usługi

PROGRAM ZAJĘĆ INFORMATYCZNYCH NIE TYLKO GG REALIZOWANYCH W RAMACH PROJEKTU RADOŚĆ UCZENIA SIĘ

(Akty, których publikacja nie jest obowiązkowa) KOMISJA

Sieci komputerowe cel

BEZPIECZEŃSTWO INFORMACYJNE I CYBERNETYCZNE

Kancelaris - Zmiany w wersji 2.50

o zmianie ustawy o księgach wieczystych i hipotece.

Podstawa programowa kształcenia ogólnego informatyki w gimnazjum

Marcin Werla

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007

Opis instalacji systemu Intranet Komunikator

Konferencja Sądu Arbitrażowego przy SIDiR WARUNKI KONTRAKTOWE FIDIC KLAUZULA 13 JAKO ODMIENNY SPOSÓB WYKONANIA ROBÓT A NIE ZMIANA UMOWY

O autorze 11 O recenzentach 13 Przedmowa 15

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ

Projekt z dnia 2 listopada 2015 r. z dnia r.

Usługi publiczne w Internecie

Formularz cenowo przedmiotowy

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Miejskim w Łabiszynie

Chmura obliczeniowa. do przechowywania plików online. Anna Walkowiak CEN Koszalin

DZIENNIK URZĘDOWY MINISTRA CYFRYZACJI

Regulamin korzystania z Systemu invooclip przez Adresata i Odbiorcę

W dobie postępującej digitalizacji zasobów oraz zwiększającej się liczby dostawców i wydawców

POLITYKA PRYWATNOŚCI SKLEPU INTERNETOWEGO

System nagłośnieniowy i dźwiękowy system ostrzegawczy Bosch Praesideo

Opis zmian funkcjonalności platformy E-GIODO wprowadzonych w związku z wprowadzeniem możliwości wysyłania wniosków bez podpisu elektronicznego

Regulamin reklamy produktów leczniczych na terenie Samodzielnego Publicznego Zakładu Opieki Zdrowotnej Ministerstwa Spraw Wewnętrznych w Białymstoku

OGŁOSZENIE O ZAMÓWIENIU- DOSTAWY

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Prawo i praktyka kancelaryjno-archiwalna w podmiotach publicznych

Platforma do obsługi zdalnej edukacji

Warszawa, dnia 1 października 2013 r. Poz. 783 UCHWAŁA ZARZĄDU NARODOWEGO BANKU POLSKIEGO. z dnia 24 września 2013 r.

Realizacja procesu digitalizacji przy pomocy systemu DigitLab

2.1 INFORMACJE OGÓLNE O SERII NX

Tworzenie plików w formacie DjVu z wykorzystaniem oprogramowania DocumentExpress Enterprise Edition

REGULAMIN FINANSOWANIA ZE ŚRODKÓW FUNDUSZU PRACY KOSZTÓW STUDIÓW PODYPLOMOWYCH

Długoterminowa archiwizacja zasobów cyfrowych w świadomości pracowników polskich bibliotek

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Wykorzystanie grafiki wektorowej do tworzenia elementów graficznych stron i prezentacji

newss.pl Ultraszybki internet nowej generacji - UPC Fiber Power

Szczegółowy opis przedmiotu zamówienia

I. 2) RODZAJ ZAMAWIAJĄCEGO:

1. PODMIOTEM ŚWIADCZĄCYM USŁUGI DROGĄ ELEKTRONICZNĄ JEST 1) SALESBEE TECHNOLOGIES SP. Z O.O. Z SIEDZIBĄ W KRAKOWIE, UL.

Procedura działania Punktu Potwierdzającego. Profile Zaufane epuap. w Urzędzie Miejskim w Miłakowie

Regulamin korzystania z serwisu internetowego pn. Serwis Sądowy - Sprawny Sąd

EDYTOR SYSTEMÓW MEDIALNYCH

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Miejskim w Gdańsku

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap Urzędzie Gminy w Ułężu

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Miejskim w Barcinie

Konstrukcja sterownika oparta na 32-bitowym procesorze

Regulamin korzystania z wypożyczalni online Liberetto. z dnia r., zwany dalej Regulaminem

Warunki Oferty PrOmOcyjnej usługi z ulgą

ZARZĄDZENIE NR 82/15 WÓJTA GMINY WOLA KRZYSZTOPORSKA. z dnia 21 lipca 2015 r.

System do kontroli i analizy wydawanych posiłków

ZAPROSZENIE NR 24/SWZ/KJU/2014. z dnia 08 kwietnia 2014 roku

Inspiracje dla branży. Sport i rekreacja

Harmonogramowanie projektów Zarządzanie czasem

Oferta kompleksowego serwisu sprzętu komputerowego dla przedsiębiorstw, instytucji oraz organizacji.

Współczesne nowoczesne budownictwo pozwala na wyrażenie indywidualnego stylu domu..

OSZACOWANIE WARTOŚCI ZAMÓWIENIA z dnia roku Dz. U. z dnia 12 marca 2004 r. Nr 40 poz.356

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Regulamin serwisu internetowego ramowka.fm

Procedura działania Punktu Potwierdzającego. Profile Zaufane epuap. w Urzędzie Gminy Kampinos

Firma Informatyczna JazzBIT

OFERTA Nazwa Wykonawcy (wykonawców występujących wspólnie):... ADRES:... TEL.:... REGON:... NIP:... Adres do

Specyfikacja Techniczna

Regulamin organizacji przetwarzania i ochrony danych osobowych w Powiatowym Centrum Kształcenia Zawodowego im. Komisji Edukacji Narodowej w Jaworze

ROZDZIAŁ 1 Instrukcja obsługi GRAND HAND VIEW III

Formaty plików graficznych

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Gminy Wągrowiec

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. Specyfikacja warunków zamówienia

Procedura nadawania uprawnień do potwierdzania Profili Zaufanych w Urzędzie Gminy w Ryjewie

REGULAMIN. przeprowadzania naboru nowych pracowników do korpusu służby cywilnej w Kuratorium Oświaty w Szczecinie.

Grafika inżynierska. Projekt znaczka inż. M. Janecka

I. 1) NAZWA I ADRES: Filmoteka Narodowa, ul. Puławska 61, Warszawa, woj. mazowieckie, tel , faks

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

NOWE I ISTNIEJĄCE SYSTEMY ADMINISTRACJI PUBLICZNEJ W ŚWIETLE ROZPORZĄDZENIA KRAJOWYCH RAM INTEROPERACYJNOŚCI

Umowa - wzór. Zawarta w dniu roku w Świątkach pomiędzy :

Warszawa, dnia 14 czerwca 2016 r. Poz. 845 ROZPORZĄDZENIE MINISTRA ZDROWIA 1) z dnia 31 maja 2016 r.

Jakim skalpelem przecinać prawno-autorski węzeł gordyjski?

Lublin, dnia 14 kwietnia 2015 r. Poz UCHWAŁA NR IX/53/2015 RADY MIASTA KRAŚNIK. z dnia 8 kwietnia 2015 r.

PRZETWARZANIE DANYCH OSOBOWYCH

Polityka prywatności i wykorzystywania plików cookies w serwisie internetowym mateuszgrzesiak.tv

Elementy typografii. Technologia Informacyjna Lekcja 22

DOTACJE NA INNOWACJE. Zapytanie ofertowe

Tworzenie zasobów cyfrowych

Urząd Zamówień Publicznych Al. Szucha 2/4; Warszawa Faks: (022) Przesyłanie ogłoszeń on-line:

Umowa o powierzanie przetwarzania danych osobowych

Transkrypt:

Formaty hybrydowe w bibliotekach cyfrowych (kontekst i praktyka) Konferencja Praktyczne aspekty tworzenia bibliotek cyfrowych. Wojewódzka Biblioteka Publiczna w Krakowie, 12.09.2008

Plan wyk adu cz. 1 z 3 1. Dokument elektroniczny i jego konteksty Kontekst normatywny Kontekst praktyczny 2. Typologia formatów Formaty w cyklu tworzenia publikacji cyfrowej Formaty archiwalne Formaty prezencyjne 3. Formaty hybrydowe Portable Document Format DJVu, inne

Dokument elektroniczny w sensie normatywnym Definicje prawne Normy Cechy DE Struktura DE Co to jest format?

DE prawo i normy - ISO 15489 (mi dzynarodowe) - Model of Requirements for Records Management (UE) Polska: - PN-ISO 15489-1:2006 i in. - Ustawa o informatyzacji... (Dz.U. 2005 nr 64, poz. 565), - Ustawa o wiadczeniu us ug drog elektroniczn - Ustawa o podpisie elektronicznym - Kodeks Karny (Dz.U. 2002 nr 144, poz. 1204) (Dz.U. 2001 nr 130, poz. 1450)

Definicje DE (1) DE (komputerowy, cyfrowy) - dokument z sygna em utrwalonym na no niku elektronicznym. Mog to by komunikaty ró nych j zyków naturalnych w subkodach akustycznych i graficznych, inne komunikaty graficzne jak obrazy, wykresy, animacje, filmy, komunikaty d wi kowe, np. muzyka (S ownik encyklopedyczny informacji, j zyków i systemów... Warszawa 2002) DE - zbiór danych wprowadzonych lub przechowywanych na dowolnym no niku przez system informatyczny lub podobny uk ad, które mog by odczytane lub wy wietlone przez osob lub przez tego rodzaju system lub uk ad, a tak e wszelkiego rodzaju prezentacja i wszelkiego rodzaju przedstawienie tych danych w formie drukowanej lub innej (Decyzja KE, 2004/563/WE)

Definicje DE (2) DE - dokument istniej cy w postaci elektronicznej, dost pny za po rednictwem techniki komputerowej (PN-ISO 690-2) DE - stanowi cy odr bn ca o znaczeniow zbiór danych uporz dkowanych w okre lonej strukturze wewn trznej i zapisany na informatycznym no niku danych (Ustawa o informatyzacji... 2005) DE - ka dy przedmiot lub zapis na komputerowym no niku informacji, z którym jest wi zane okre lone prawo albo który ze wzgl du na zawart w nim tre stanowi dowód prawa, stosunku prawnego lub okoliczno ci maj cej znaczenie prawne (Kodeks Karny)

Prace nad terminologi Ustawa o zmianie ustaw w celu ujednolicenia terminologii informatycznej (w toku skier. do podpisu Prezydenta - 5.09.2008)

W wietle PN-ISO 690-2 DE [...] dokument istniej cy w postaci elektronicznej, dost pny za po rednictwem techniki komputerowej [...] posta medium PN-ISO 690-2 Informacja i dokumentacja -Zarz dzanie dokumentami

DE - cechy 1. Utrwalone na materialnym no niku; 2. Mo na je odtwarza w formie umo liwiaj cej ich percepcj ; - Nie jest istotny rodzaj no nika i sposób transmisji; - istotne za jest, aby dane mog y by wielokrotnie odtwarzane.

DE - wyró niki 1. Zawarto tekst, obraz, d wi k i in.; 2. Struktura logiczna, która nie musi by to sama ze struktur fizyczn, gdy mo e by zawarta bezpo rednio w dokumencie, w bazie danych lub pliku zewn trznym; 3. Kontekst, czyli metadane techniczne okre laj ce w jakiej postaci dokument b dzie prezentowany.

Struktura DE Struktura logiczna dokumentu elektronicznego - sposób u o enia informacji w dokumencie elektronicznym zdefiniowany poprzez okre lenie elementów informacyjnych oraz powi za mi dzy nimi; Struktura fizyczna dokumentu elektronicznego wynik przetworzenia, w tym kodowania i szyfrowania, informacji zawartych w dokumencie elektronicznym na dane w uk adzie bitowym (czyli format danych); Rozporz dzenie Prezesa Rady Ministrów z dnia 29 wrze nia 2005 r. w sprawie warunków organizacyjnotechnicznych dor czania dokumentów elektronicznych podmiotom publicznym (Dz.U. 2005, nr 200, poz. 1651)

Dokument elektroniczny w sensie praktycznym Rozumienie DE w bibliotece cyfrowej Oczekiwania wobec publikacji w bibliotece cyfrowej Porównanie procesu tworzenia publikacji tradycyjnej i elektronicznej Konsekwencje dla bibliotek

DE w sensie praktycznym Z punktu widzenia bibliotek cyfrowych obecnej generacji w a ciwsze jest operowanie poj ciem publikacji cyfrowej, któr nale y traktowa w sko:... to ksi ka tradycyjna na no niku elektronicznym Podobny lub identyczny: proces tworzenia proces redakcji, recenzowania proces sk adu

Oczekiwania czytelników Format zapisu e-ksi ki winien oferowa takie parametry, aby higiena jej czytania by a nie gorsza ni ksi ki tradycyjnej. 600 DPI 24 BPP djvu 6283x9094 pikseli 280 kb

Warto dodana - ZOOM Wojewódzka Biblioteka Publiczna w Krakowie

Z my l o przysz o ci Ile cali b dzie mia monitor przysz o ci?

Warto dodana - OCR Wojewódzka Biblioteka Publiczna w Krakowie

Ksi ka tradycyjna a e-ksi kae Ksi ka wspó czesna (druk cyfrowy) Autor Recenzent Redakcja DTP PDF Przygotowanie Ksi ka tradycyjna e-ksi ka Maszyny drukarskie Przygotowanie + metadane Biblioteka cyfrowa

Ksi ka tradycyjna a e-ksi kae Ksi ka dawna lub drukowana z u yciem klisz Autor Recenzent? Redakcja? DTP? Przygotowanie Biblioteka cyfrowa Skanowanie TIFF + metadane

Biblioteka cyfr. nowe zadania Funkcje typowe dla drukarni: przetwarzanie sk adu; montowanie publikacji; skanowanie, konwersja; Funkcje typowe dla wydawców: umowy licencyjne; regulacja praw autorskich; dora na redakcja i sk ad DTP; Funkcje typowe dla firm hostingowych: utrzymanie w ruchu infrastruktury serwerów i czy.

Plan wyk adu cz. 2 z 3 1. Dokument elektroniczny i jego konteksty Kontekst normatywny Kontekst praktyczny 2. Typologia formatów Formaty w cyklu tworzenia publikacji cyfrowej Formaty archiwalne Formaty prezencyjne 3. Formaty hybrydowe Portable Document Format DJVu, inne

Formaty dokumentów Formaty w cyklu tworzenia publikacji cyfrowej O etapach cyklu Ogólna typologia formatów

Cykl tworzenia PC a formaty 1. Przygotowanie materia ów do digitalizacji 2. Digitalizacja Formaty po rednie 3. Obróbka plików, porz dkowanie 4. Przechowywanie Format archiwalny 5. Udost pnianie Format prezencyjny * PC - publikacja cyfrowa

1. Przygotowanie materia u Strategie: Digitalizacja; Digitalizacja wraz z konserwacj ; Digitalizacja po czona z mikrofilmowaniem. Konwersja z formatów stosowanych w DTP do PDF

Przygotowanie podzia mat. Typ orygina u: czarno-bia e (druk, rysunek itp.); kolorowe i pó tonowe (fotografie, grafika itp.); Format orygina u Ma e (do A4); rednie (A3-A2); Du e (A1 i wi ksze); Obiekty cenne

2. Digitalizacja Metody: Skanowanie lub filmowanie orygina u; Skanowanie z mikroform; Skanowanie z filmów negatywowych; Konwersja z formatów po rednich paradigitalizacja

3. Obróbka plików Formaty plików (standardy i dobór); Wersjonowanie (f. archiwalny i prezencyjny); Retusz (f. prezencyjny); Konwersja (f. prezencyjny); OCR (f. prezencyjny); czenie i indeksowanie (f. archiwalny i prezencyjny).

4. Utrwalenie, archiwizacja No niki: CD/DVD/BD; Dyski; System oznacze Notacja; Obs uga wersjonowania; Zabezpieczenia: 1 kopia (macierz archiwalna) f. archiwalny; 2 kopia (macierz u ytkowa) f. archiwalny; 3 kopia (egz. u ytkowy) f. prezencyjny.

Formaty po rednie Zagadnienia: Automatyzacja zapisu skanów System notacji (nazwa, _,-, Aa, cyfry) No nik gazeta_polska_1867_nr_078_s_0001 Problemy: Pliki jedno- i wielostronicowe Skanowanie stron nieparzystych Skanowanie mat. w ró nych trybach (bitonal, gray)

5. Przechowywanie i udost pnianie Problem trwa o ci no nika: CD/DVD/BD, HDD, Internet mikroformy Udost pnianie: Offline (f. prezencyjny, f. archiwalny); intranet; no niki CD/DVD/BD; Online (f. prezencyjny); Us ugi: wydruki, wyp. miedzybibliot., us ugi komercyjne

Formaty archiwalne i prezencyjne Cechy formatu archiwalnego (FA): 1. wysoka jako ; 2. wierne odwzorowanie orygina u. Cechy formatu prezencyjnego (FP): 1. ma e rozmiary; 2. akceptowalna jako ; 3. wysoki poziom zorganizowania (indeksowania).

Formaty archiwalne i prezencyjne

Zalecane formaty archiwalne TIF bezstratna kompresja, obs uga przestrzeni barwnej (RGB, CMYK) i wszystkich trybów g bi bitowej; standard mi dzyplatformowy (win/mac/unix) w wersji master - raczej bez kompresji raczej nie stosowa plików wielostronicowych. PDF/A - ISO 19005:2005 zasadniczo chodzi tu o zaimportowanie do PDF dowolnych plików pierwotnych. bezpo rednio nie s u y do odtwarzania danych ma jedynie umo liwi ich bezstratny eksport.

Zalecane parametry dla FA Dokumenty tekstowe: rozdzielczo (600 DPI); g bia bitowa (24 lub 36 BPP) R kopisy: rozdzielczo (600-800 DPI); g bia bitowa (36 lub 48 BPP) Ikonografia: rozdzielczo (300-600 DPI); g bia bitowa (24 lub 36 BPP); Fotografie: rozdzielczo (3200-6400 DPI); g bia bitowa (16, 36, 48 BPP); Mikrofilmy: rozdzielczo (3200 DPI); g bia bitowa (16 BPP); Szerzej - Decyzja NDAP (2005)

Obj to a g bia i rozdzielczo Obj to przyk adowego skanu A4 (TIF, bez kompresji) 800 700 600 500 400 300 200 100 300 dpi 400 dpi 600 dpi 1200 dpi 0 Skala szaro ci 8 bit Skala szaro ci 16 bit Kolor 36 bit Kolor 48 bit

Obj to a g bia i rozdzielczo Obj to przyk adowego skanu A4 (TIF, bez kompresji) Rozdzielczo Gray 8 bit Gray 16 bit Kolor 36 bit Kolor 48 bit 300 dpi 8 16 33 50 400 dpi 16 32 60 100 600 dpi 33 66 133 200 1200 dpi 133 266 533 800

TIF kompresja ród o: A. Trembowiecki, Digitalizacja zbiorów bibliotecznych. Teoria i praktyka, Warszawa 2006

Formaty prezencyjne

Formaty prezencyjne - typologia Tekstowe nieadnotowane (np. TXT) *** adnotowane (np. RTF) Graficzne rastrowe (TIF, BMP, JPG, GIF, PNG) *** wektorowe (np. CorelDraw, AutoCAD) inne natywne (np. Photoshop, CorelPhoto-Paint) Hybrydowe (PDF, djvu) *** Specjalne: audio, wideo, aplikacyjne... *** Formaty stosowane w bibliotekach cyfrowych

Formaty a generacje bibliotek Biblioteki I generacji (1971-1995): - tekstowe (ASCI, HTML, RTF itp.) lub - grafika rastrowa (GIF, JPG, TIF, PNG). Biblioteki II generacji: - formaty hybrydowe: DJVu, PDF; - formaty graficzne: JPG, JPG2000, PNG, GIF + java; - formaty specjalne: mapy, nuty (zoomity, sibelius); - formaty multimedialne: mp3, mpeg, flash; - formaty aplikacyjne: np. java.

Formaty tekstowe - nieadnotowane TXT plik tekstowy pozbawiony elementów typograficznych (formatowania). Zakodowany w standardzie ANSI lub UTF. Przyk ad: Ala ma kota (11 znaków 11 bajtów)

Formaty tekstowe - adnotowane Np. RTF - (Rich Text Format). W odró nieniu od TXT pozwala na zapis formatowania. Od wersji 1.6 obs uguje UTF. Przyk ad: Ala ma kota (11 znaków 189 b)

Formaty tekstowe - zalety i wady Zalety: Ma y rozmiar pliku; Mo liwo wyszukiwania tekstowego; Wady: Niski wspó czynnik bezpiecze stwa; Liczne standardy kodowania (ANSI, ISO, UTF...); Formaty i aplikacje natywne (np. Word); Brak mo liwo ci wiernego odwzorowania oryg.; Mo liwe problemy z czcionkami (typy, kroje); Du y nak ad pracy podczas konwersji (OCR).

Grafika rastrowa - wybór JPEG pe na paleta barw, wysoki wspó czynnik kompresji (tylko stratna), mo liwa progresja, brak kana u przezroczysto ci. Dobre efekty i wierne odwzor dla obrazów z du a liczb szczegó ów. GIF 256 kolorów, kana przezroczysto ci, wysoki wspó czynnik kompresji (tylko stratna). Dobre efekty dla obrazów z du ymi jednorodnymi przestrzeniami. PNG nast pca GIFa, pe na paleta barw, mo liwa kompresja bezstratna. Sprawdza si tylko dla niektórych kategorii obrazów (zrzuty, mapy). TIF jako format prezencyjny sprawdza si tylko dla obrazów bitonalnych, mo liwa kompresja bezstratna.

Obraz kompresja stratna Bez kompresji (196 kb) Kompresja 25% (4 kb) ród o: Wikipedia Kompresja 5% (1,7 kb)

Tekst kompresja tekstu Bez kompresji (5 kb) Kompresja 25% (2 kb) Kompresja 5% (1,2 kb)

G bia a jako 24 BPP 8 BPP 4 BPP 8 BPP 4 BPP 1 BPP

Dla wi kszo ci skanowanych druków Bitonal Kolor 4-8 BPP 1 BPP Gray 4 BPP

Dla wspó czesnych wyd. ilustrowanych RGB Kolor 24 BP

Problem prezentacji rastra Raster - bitonalny obraz sk adaj cy si z drobnych kropek (lub linii), daj cy podczas ogl dania z normalnej odleg o ci wra enie istnienia pó tonów

Raster w gazecie z lat 60.

Z udzenia optyczne (raster, 1BPP) wyg adzony brak wyg adzenia FastStone ImageViewer FastStone MaxView Programowe renderowanie obrazów xnview

Korekty ród o: L. Buczy ski: Skanery i skanowanie. Warszawa 2005

Przetwarzanie wsadowe (win)

Przetwarzanie wsadowe (unix( unix) ImageMagick/DJVulibre/bash (przyk ady): Wszystkie djvu do tiff [1 strona] (ddjvu): find. -name '*.djvu' -exec ddjvu -v -format=tiff - page=1 {} {}.tiff '; Miniatury 200 pix z wszystkich tiff (ImageMagick): find. -name '*.tiff' -exec mogrify -format jpg -quality 82 -thumbnail 200 {} ';

Narz dzia do grafiki rastrowej Edytory: Adobe Photoshop komercyjny (win, mac) GUI; Gimp bezp atny (unix, win, mac) GUI; ImageMagic bezp atny (unix, win, mac) konsola. Przegl darki i konwertery (bezp atne): FastStone Viewer (win); xnview (win); irfanview (win); liczne narz dzia (linux, mac)

Formaty rastrowe - zalety i wady Zalety: Wierne odwzorowanie orygina u; Ma y nak ad pracy podczas tworzenia; Standardy mi dzyplatformowe (jpeg, gif, tif, png); atwo u ytkowania, du a popularno na www. Wady: Du a obj to pliku (w stosunku do jako ci); Brak mo liwo ci osadzania warstwy tekstowej; Zwykle poddane kompresji stratnej (prezencyjne); Niski poziom zorganizowania (obrazy jednostr.).

Dylemat: tekst czy grafika Kazania wi tokrzyskie nieczytelne, autentyczne czytelne, nieautentyczne

Plan wyk adu cz. 3 z 3 1. Dokument elektroniczny i jego konteksty Kontekst normatywny Kontekst praktyczny 2. Typologia formatów Formaty w cyklu tworzenia publikacji cyfrowej Formaty archiwalne Formaty prezencyjne 3. Formaty hybrydowe Portable Document Format DJVu, inne

Format hybrydowy Cechy: Mo e czy cechy formatów tekstowych i graficznych; Oferuje wysoki poziom zorganizowania mo liwa obs uga struktury logicznej dokumentu; Inne nowe mo liwo ci Wybrane specyfikacje: PDF DJVu

Portable Document Format PDF (Portable Document Format) - jest formatem plików s u cym do prezentacji, przenoszenia, drukowania i przechowywania tre ci tekstowo-graficznych. J zykiem opisu PDF jest okrojona wersja j zyka PostScript wzbogacona o elementy hipertekstowe i aplikacyjne. Twórca: Adobe Systems

Portable Document Format PDF w zale no ci od wersji mo e pe ni okre lone funkcje: 1. Zastosowanie do celów poligraficznych PDF/X (ISO 15930; ISO TC130) 2. Kontenera danych PDF/A (ISO 19005; ISO TC171) 3. Zastosowanie do wymiany obiektów graficznych i dokumentacji technicznej PDF/E (ISO TC171)

Portable Document Format W plikach PDF mo e by zawarty tekst, grafika (rastrowa, wektorowa), a tak e elementy aktywne. W styczniu 2007 Adobe ca kowicie otwar a format PDF i przekaza a jego specyfikacj organizacji AIIM. 2 lipca 2008 og oszono norm ISO 32000-1:2008

Czym jest PDF? 1. PDF podstawa nowoczesnej poligrafii (du e pliki wysoka jako np. PDF/X). 2. Mo e pe ni funkcj kontenera (PDF/A; PDF/E). 3. PDF jako format prezencyjny - ale po wyrafinowanych zabiegach adaptacyjnych. 4. PDF w pe ni poprawnie funkcjonuje tylko na oprogramowaniu Adobe. 5. Mog istnie problemy prawne (por. licencje EULA). 6. PDF format bardzo z o ony, czy: tekst, grafik rastrowa i wektorow oraz elementy aplikacyjne.

PDF (w poligrafii i nie tylko)

PDF - narz dzia 1. Adobe Acrobat - edytor (komercyjny)* 2. Brak godnych polecenia edytorów bezp atnych; 3. Liczne przegl darki (na czele z Adobe Reader); 4. Liczne drukarki wirtualne (z regu y bezp atne) lub wbudowane w aplikacje (np. MS Office, AutoCad); 5. Liczne narz dzia do manipulacji na plikach PDF; 6. Poza Adobe Acrobatem wszystkie narz dza oferuj tylko pewien poziom obs ugi formatu PDF (skutkuje to z jako ci, rozmiarem, niepoprawnymi parametrami). * Nadto inne specjalistyczne stosowane w poligrafii

Adobe Acrobat 8.0 Prof. (9.0)

Adobe Acrobat wybrane funkcje - mo liwo manipulacji na danych (uk ad, grafika, tekst, czcionki, parametry obiektów itp.); - mo liwo importu dowolnych danych; - mo liwo dodania warstwy OCR*; - zabezpieczenia; metadane; - narz dza do edycji i optymalizacji; - formularze, komentarze, - liczne opcje eksportu; - narz dzia kontroli i inspekcji. * Niska jako wbudowanego engine OCR

PDF (zaimportowany TIF)

PDF obiekt tekstowo-graficzny

PDF osadzone matadane

PDF osadzony DublinCore

Optymalizacja zawsze potrzebna

PDF wirtualne drukarki Mimo szerokiej oferty programów tylko nieliczne dzia aj w pe ni poprawnie: 1. Narz dzia oparte na silniku Adobe: Acrobat Distiller i kontrolki Adobe (InDesign i in.) Wtyczki do popularnych programów (Word, Corel, AutoCad) 2. Niektóre programy oparte na GPL/AFPL GhostScript: PDF Creator*; Wtyczki do OpenOffice i GoogleDoc. 3. Uniksowe narz dzia do PostScriptu. * Drobne b dy

Adobe Distiller

PDF eksport z InDesign

PDF Creator

PDF Creator b dy

PDF edycja Nieliczne dzia aj ce poprawnie bezp atne programy, które s u ba do czenia, dzielenia, naprawy, nak adania znaków wodnych; ustawiania zabezpiecze ; manipulacji na PDF. - PDF Tools (win) - PDFTK (win, unix)

PDFTools http://www.sheelapps.com/

PDF TK (unix( unix) Wybrane polecenia: rozdziel na pojedyncze strony: pdftk nazwa.pdf burst sklej wszystkie pliki pdf): pdftk cat *.pdf output nowy.pdf napraw plik: pdftk stary.pdf output nowy.pdf zmie wersj PDF (do 1.2): ps2pdf12 stary.pdf nowy.pdf

PDF TK (win)

PDF eksport Funkcj kontrolera eksportu do tif/jpg mo e pe ni : Ghostscript/Ghostview lub jego klony: PDFill PDF Tools lub PDF-XChange Narz dzia te nie oferuj dost pu do opcji zaawansowanych Brak jednak sprawnych bezp atnych programów do optymalizacji PDF i edycji metadanych.

PDFill

AFPL GhostScript+GSview GSview

Nowe horyzonty AdobeDigital

AdobeDigital

AdobeDigital

Spo eczno : Adobe Adobe DC: http://www www.adobe.com/devnet/acrobat/

Spo eczno : PDF PDF Zone: : http://www www.pdfzone.com/

Spo eczno : Planet PDF http://www www.planetpdf.com/ Spo eczno :

Zalety i wady PDF (jako formatu prezencyjnego) Zalety Popularno, atwo u ytkowania; Idealny dla ma ych tekstowych dokumentów; Umo liwia popr. wy wietlanie skomplikowanych znaków (np. mat., chem.) tworzonych LaTeXem. Wady: Du e rozmiary plików dla dokumentów innych ni tekstowe; Problem z sekwencyjnym serwowaniem i wy wietlaniem stron; Potencjalne problemy z osadzonymi fontami.

DjVu DjVu - technologia rozwijana od 1996 r. przez koncern AT&T do kompresji skanowanych dokumentów. Oprogramowanie oparte na tej technologii stworzy a i opatentowa a firma LizardTech Inc. Od 2008 roku technologia rozwijana pod szyldem Celartem Technology Inc. (spó ki matki, która jest w a cicielem LizardTecha).

Czym jest DjVu Format DJVu w przeciwie stwie do PDF ma charakter czysto graficzny. Algorytm DJVu opiera si na metodzie segmentacji obrazu i wydzieleniu warstw (por. Photoshop) Wynikowe pliki - najmniejsze z mo liwych (por. JPG) Mo e mie zakotwiczona warstw tekstow OCR. Jasny status prawny brak ogranicze licencyjnych zarówno do celów nie komercyjnych jak i niekomerc. Istniej zarówno komercyjne (Cartlem/LizardTech), jak i bezp atne aplikacje (DJVuLibre)

DjVu w a ciwo ci dokumentu

Warstwy Trzy warstwy t a Kolor Tre T o

Warstwy djvu ród o: Léon Bottou: Efficient Conversion of Digital Documents to Raster Formats Multilayer (2001)

DjVu ma e rozmiary Ma e rozmiary Morfologia pliku djvu Dokumenty DjVu s nieedytowalne daj wi c gwarancj wiarygodno ci

DjVu kompresja (zestawienie)

DjVu pejza

DJVu dokumenty matematyczne

DJVU - akwarele

Dokumentacja techniczna ród o GB Soft

DJVu portret

DJVu rysunek

DJVu jako poligraficzna

DJVu jako poligraficzna

DJVu zoom 1000% (600 dpi) Jako poligraficzna

DjVu - oprogramowanie Edytory: Document Express edytor, komercyjny (win, unix) DJVU Virtual Printer drukarka, komercyjna (win) DjVu Solo prosty bezp atny edytor (win) DjVuLibre bezp atny pakiet narz dziowy (unix, win) Przegl darki (bezp.): - DjVu Browser (LizardTech) 6.1 - DJView 4.3 (DjVuLibre) - Inne (unix, win i inne) wyra nie s absze

Document Express Editor

Document Express Editor Prof. Funkcje*: - import plików (TIF, BMP, inne) - manipulacje stronami dokumentu; - dodawanie adnotacji, etykiet, linków; - OCR - eksport do formatów graficznych; - wydruk do DjVu z dowolnej aplikacji (drukarka) - obs uga skanowania * W wersji Enterprise znacznie wi cej opcji i funkcji

DjVu Solo (bezp atny)

DjVu Virtual Printer

DjVuLibre (unix) - przyk ady Wszystkie PDF do djvu (bez OCR) [pe ny kolor] find. -name '*.pdf' -exec djvudigital -dpi=600 -exact-color {} ';' Wstaw adnotacj do wszystkich djvu find. -name 'e*.djvu' -exec djvused -f nasz.txt nasz.txt {} -s {}-v -s'; -v '; Osad miniaturki we wszystkich djvu find. -name '*.djvu' -exec djvused {} {} -e 'set-thumbnails' -e 'set-thumbnails' -s -v -s';' -v ';' Zapisz jako rozdzielony:.../djvmcvt...\ -i -input.djvu.. index.djvu

pdf2djvu (unix( unix) - przyk ady Konwersja pdf do djvu (wraz z OCR) root@helios:~/pdfx/$ pdf2djvu --words --dpi=600 pismo.pdf > pismo.djvu: - page #1 -> #1... 0.227 bits/pixel; 1.656:1, 39.62% saved, 1275423 bytes in, 770040 bytes out Niestabilna wersja windows/cygwin

DjVu Browser szybki, sprawny Tre

DJView 4.3 nowe mo liwo ci

Najwi ksze biblioteki (z DJVu) Internet Archive: http://www.archive.org/ Open Library: http://openlibrary.org/ Gutenberg Consortia Center: http://gutenberg.cc/ Nadto liczne o zasi gu narodowym: USA Japonia Rosja Polska Islandia W ochy i in.

Wiele formatów: IA/OL Tre

DJVu z IA Tre

Zalety i wady DJVu Zalety Bardzo ma e rozmiary; Sekwencyjne wy wietlanie (str. fizycznie rozdzielone); Idealny dla d ugich dokumentów; Du y wybór aplikacji komercyjnych i bezp atnych; Jasna sytuacja prawna, wsparcie w Polsce (GB Soft). Wady Nieco trudny w obs udze w fazie tworzenia, konwersji; Ma o skuteczny engine OCR wbudowany w DE.

Kilka wskazówek Jak w djvu poprawi OCR? Jak wykona djvu i OCR przy 72 dpi? Jak zaprojektowa rozwi zanie serwerowe

Poprawa OCR 1. Eksport DJVu do TIFF wielostronicowy (najlepiej 1BPP)

Poprawa OCR 2. OCR w Abbyy Fine Reader i zapis do wi zki

Poprawa OCR osadzanie wi zki

DJVuOCR inne opcje

DJVuLibre djvused [edytor] Fragment strony pomocy: Parametr: -- set-txt txt [djvusedtxtfile] Insert hidden text information into the selected pages. The optional argument djvusedtxtfile names a file containing the hidden text information. This file must contain data similar to what is produced by command printtxt. When the optional argument is omitted, the program reads the hidden text information from the djvused script until reaching an end-of-file or a line containing a single period....

Jak wykona djvu i OCR z 72 dpi?

Jak wykona djvu i OCR z 72 dpi?

DJVu rozwi zanie serwerowe 1. Infrastruktura oparta na Document Express Enterprise wraz z elementami dedykowanymi komercyjne 2. Infrastruktura wykorzystuj ca równolegle Document Express Prof. i komponenty bezp atne na platform linuksa (DJVuLibre, Tesseract, ImageMagick, pdftk). 3. Jak 2. ale zamiast Tesseracta u ywany jest Abbyy FineReader (komercyjny).

DJVu serw. rozwi zanie 2-32 1. Dwie metody tworzenia djvu: na platformie linuksa wówczas jedynie kopiujemy pdf lub tif na serwer (DJVuLibre lub pdf2djvu); wykonane w aplikacjach windows w tym przypadku kopiujemy na serwer pliki djvu do dalszej obróbki; 2. Przed OCR. eksport djvu do TIFF (ddjvu); 3. OCR (Tesseract lub FineReader); 4. Osadzanie tekstu z djvu (djvused) 5. Czynno ci ko cowe: miniatury jpg, thumb, rozdzielnie 6. Kopiowanie gotowych katalogów z serwera na udzia y samby.

DJVu rozwi zanie serwerowe PDF/X maj du obj to FTP 4 Mb/s PDF-djvu konwersja formatu A2 trwa d ugo (30 sek./str.) Obróbka grafiki potrzebuje du ej mocy

Abbyy FineReader skuteczny, inteligentny ród o: AutoID API (rozwi zania dedykowane) wersja pude kowa

Tesseract - bezp atny

Kto tak pracuje?

Google Books - tekst

Any2DjVu Server

Spo eczno ci

Spo eczno ci

Spo eczno ci

Inne formaty: TeX Natywne formaty prezencyjne TeX, Latex popularne w kr gach matematyków, fizyków i in ynierów (*.dvi)

Inne formaty: postscript PostScript - niezale nym od urz dzenia wyj ciowego j zykiem programowania, który opisuje tekst i grafik na stronie. Jego polecenia steruj drukark laserow (lub dowolnym innym urz dzeniem postscriptowym), umieszczaj c w odpowiednim miejscu lini, okr g, tekst czy te map bitow. Do odczytu plików Postscriptowych (*.ps) mo na u y programu GhostScript (GSview)

Zoomify EZ, Google Maps Inteligentna forma prezentacji jpg (ci cie, scalanie)

Zoomify (z Photoshopem) Wojewódzka Biblioteka Publiczna w Krakowie

Sibelius Inteligentna forma czenia obrazu i d wi ku Wtyczka

Sibelius

Technologia czy sztuka?

Technologia

Sztuka

Profesja

Dzi kuj