LABORATORIUM TELEMATYKI TRANSPORTU



Podobne dokumenty
Tworzenie plików w formacie DjVu z wykorzystaniem oprogramowania DocumentExpress Enterprise Edition

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

Cechy systemu X Window: otwartość niezależność od producentów i od sprzętu, dostępny kod źródłowy; architektura klient-serwer;

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows 7

Instalacja Webroot SecureAnywhere przy użyciu GPO w Active Directory

BIBLIOTEKA CYFROWA JAKO KONTENER TREŚCI DLA PORTALI INTERNETOWYCH. DLIBRA & DRUPAL DWA SYSTEMY, JEDNA WITRYNA.

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

TWORZENIE DANYCH DO DRUKU W PROGRAMIE MICROSOFT POWERPOINT 2013

Księgarnia internetowa Lubię to!» Nasza społeczność

dlibra 3.0 Marcin Heliński

Skrócony przewodnik OPROGRAMOWANIE PC. MultiCon Emulator

SIP Studia Podyplomowe Ćwiczenie laboratoryjne Instrukcja

Jak zamówić zdjęcia przez FotoSender?

Internetowa sieć laboratoriów fotograficznych

1. Pobieranie i instalacja FotoSendera

mfaktura Instrukcja instalacji programu Ogólne informacje o programie biuro@matsol.pl

Kancelaria Prawna.WEB - POMOC

I. Informacje ogólne. Jednym z takich systemów jest Mambo.

Instrukcja konfiguracji funkcji skanowania

e-podręcznik dla seniora... i nie tylko.

Laboratorium : Tworzenie partycji w Windows XP Pro

Ćwiczenie Nr 6 Przegląd pozostałych najważniejszych mechanizmów systemu operacyjnego Windows

EDYCJA TEKSTU MS WORDPAD

System generacji raportów

DLIBRA & DRUPAL DWA SYSTEMY, JEDNA WITRYNA

Niniejsza skrócona instrukcja obsługi pomaga w rozpoczęciu korzystania z urządzenia IRIScan TM Mouse Executive 2.

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

Definiowanie drukarek w programie ZAFIR

MasterEdytor. Podprogram pomocniczy do programu mpfotoalbum 1.2 INSTRUKCJA

Pokaz slajdów na stronie internetowej

Jedno zdjęcie z wielu panorama w praktyce

TWÓJ BIZNES. Nasz Obieg Dokumentów

Instrukcje dotyczące systemu Windows w przypadku drukarki podłączonej lokalnie

UNIFON podręcznik użytkownika

Instrukcja obsługi programu ODGiK-NET 1.5

INSTRUKCJA PRZYGOTOWANIA ZDJĘĆ DO

Laboratorium - Monitorowanie i zarządzanie zasobami systemu Windows Vista

Platforma szkoleniowa krok po kroku. Poradnik Kursanta

Jak tworzyć pliki *.pdf z dowolnego programu (np. Word, Exel, PowerPoint itp.).

LampScan. Nr produktu

Podstawy systemu operacyjnego Windows 7 i bezpieczne korzystanie z sieci Internet

Dokumentacja systemu NTP rekrut. Autor: Sławomir Miller

Zadanie1: Odszukaj w Wolnej Encyklopedii Wikipedii informacje na temat NAT (ang. Network Address Translation).

SKRó CONA INSTRUKCJA OBSŁUGI

OpenOfficePL. Zestaw szablonów magazynowych. Instrukcja obsługi

KATEGORIA OBSZAR WIEDZY NR ZADANIA Podstawowe informacje i czynności

Przed skonfigurowaniem tego ustawienia należy skonfigurować adres IP urządzenia.

Jak przeglądać publikacje w formacie DjVu?

Prezentacje multimedialne w Powerpoint

Rozdział 8. Sieci lokalne

etrader Pekao Podręcznik użytkownika Strumieniowanie Excel

5.1. Światłem malowane

Tworzenie prezentacji w MS PowerPoint

Instrukcja przygotowania pliku do deponowania

Kompresja obrazów i formaty plików graficznych

Podstawy technologii cyfrowej i komputerów

APLIKACJA SHAREPOINT

Moduł 1 Pliki i foldery

JAK W SYSTEMIE MS WINDOWS PRZYGOTOWAĆ PRACĘ DYPLOMOWĄ W WERSJI PDF?

Biblioteki cyfrowe i ich kolekcje


SysLoger. Instrukcja obsługi. maj 2018 dla wersji aplikacji (wersja dokumentu 2.5)

1. Logowanie do Systemu BCW

IRISPen Air 7. Skrócona instrukcja obsługi. (Android)

11. Rozwiązywanie problemów

Instalacja i użytkowanie programu Fotolabo 3.0

FlowSoft02. Przeznaczenie programu

Przygotowanie zdjęcia do publikacji w Internecie

FORMATY PLIKÓW GRAFICZNYCH

Aplikacja serwerowa Platformy Prezentacyjnej Opis produktu

PROJEKT POWYKONAWCZY. System zdalnego odczytu, transmisji i archiwizacji danych z wodomierzy i ciepłomierzy instrukcja obsługi.

Obsługa programu Paint. mgr Katarzyna Paliwoda

WINDOWS Instalacja serwera WWW na systemie Windows XP, 7, 8.

2. Dostosuj listę Szybkiego Dostępu

MODELER MODUŁ KOREKCJI DYSTORSJI SOCZEWKI WERSJA ZEWNĘTRZNA UPROSZCZONA INSTRUKCJA OBSŁUGI PROGRAMU

Platforma szkoleniowa krok po kroku

Avtek i dzielenie się notatkami Bezprzewodowe przesyłanie obrazów i plików

WORDPRESS INSTRUKCJA OBSŁUGI

Jak używać funkcji prostego udostępniania plików do udostępniania plików w systemie Windows XP

SERWER AKTUALIZACJI UpServ

Tomasz Grześ. Systemy zarządzania treścią

ZSUT. Laboratoria zdalne ZSUT. Instrukcja Rezerwacja zasobów. Zakład Sieci i Usług Teleinformatycznych

System Broker. Wersja 5.1

8. Sieci lokalne. Konfiguracja połączenia lokalnego

Jeleniogórska Biblioteka Cyfrowa od kuchni

Praca w sieci z serwerem

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Automatyzacja procesu publikowania w bibliotece cyfrowej

Technologie Internetowe Raport z wykonanego projektu Temat: Internetowy sklep elektroniczny

IRISPen Air 7. Skrócona instrukcja obsługi. (ios)

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ

Océ Podręcznik użytkownika

Wyświetlanie publikacji w formacie DjVu. Wyświetlanie publikacji w Bałtyckiej Bibliotece Cyfrowej można realizować na 3 sposoby:

Instalowanie certyfikatów celem obsługi pracy urządzenia SIMOCODE pro V PN z poziomu przeglądarki internetowej w systemie Android

Dodawanie grafiki i obiektów

KONFIGURACJA SIECIOWA SYSTEMU WINDOWS

OPIS PROGRAMU OBSŁUGI STEROWNIKA DISOCONT >> DISOCONT MASTER RAPORTY <<

Transkrypt:

ZESPÓŁ LABORATORIÓW TELEMATYKI TRANSPORTU ZAKŁAD TELEKOMUNIKACJI W TRANSPORCIE WYDZIAŁ TRANSPORTU POLITECHNIKI WARSZAWSKIEJ LABORATORIUM TELEMATYKI TRANSPORTU INSTRUKCJA DO ĆWICZENIA Dokument elektroniczny DO UŻYTKU WEWNĘTRZNEGO WARSZAWA 2008

1. Cel i zakres ćwiczenia Celem ćwiczenia jest prezentacja procesu tworzenia elektronicznego dokumentu, od jego powstania w wersji elektronicznej (wytworzonego poprzez oprogramowanie edycyjne lub digitalizację), przez scalenie, kompresję, opatrzenie elementami nawigacyjnymi aż do ostatecznej formy i kompresji. Zakres ćwiczenia obejmuje dwa najpopularniejsze standardy elektronicznych dokumentów: PDF oraz DjVu, a także ich ocenę pod względem: sprawności kompresji, jakości kompresji, łatwości edycji, skuteczności publikacji w sieci. 2. Wykaz wykorzystanych przyrządów komputer PC z systemem Windows XP, moduł USB digitalizacji obrazu wideo (rys. 2.1), stół do reprodukcji z zestawem oświetleniowym (rys. 2.2), aparat fotograficzny Samsung 815Pro (rys. 2.3), oprogramowanie Adobe Acrobat Professional oraz LizardTech Dokument Express. 1

Rys. 2.1 Moduł USB digitalizacji obrazu wideo Rys. 2.2 Stół do reprodukcji z zestawem oświetleniowym Rys. 2.3 Aparat fotograficzny Samsung 815Pro 2

4. Wprowadzenie teoretyczne 4.1 Założenia Techniki kompresji danych, polegające na zmniejszeniu objętości zbioru źródłowego, należą do najtańszych metod oszczędności miejsca pamięci i nośników systemów teleinformatycznych. Nie bez znaczenia jest także pośredni wpływ na efektywną szybkość samej transmisji danych mniejsza ilość danych, to krótszy czas ich przesłania łączem o danej przepustowości. Tym samym zrozumiałe jest, że rozwój technik kompresji i systemów teleinformatycznych dawno stał się ściśle związany oraz wspólnie uwarunkowany. Duże sukcesy w dziedzinie rozwoju technik kompresji, wspierane wzrostem mocy obliczeniowej systemów komputerowych oraz rozwojem technologii wytwarzania pamięci i nośników danych przy jednoczesnym radykalnym spadku ich ceny, przyczyniły się do rozwoju wielu nowych obszarów ich zastosowań. Jednym z nich jest upowszechnienie i urzeczywistnienie idei elektronicznej wymiany danych EDI (ang. Electronic Data Interchange), gdzie zdecydowana większość (docelowo wszystkie) dokumentów powstaje i jest przetwarzana jedynie w postaci elektronicznej. Korzyści z takiego rozwiązania są oczywiste: - szybkość wytworzenia, - łatwość przechowywania, - prostota wyszukiwania i przeszukiwania, - efektywność przesyłania, - niskie koszty archiwizacji. Poza oferowanymi korzyściami, rozwojowi tej idei sprzyjają nowe uwarunkowania prawne, które stale poszerzają zakres stosowania dokumentów elektronicznych na równi z ich papierowymi odpowiednikami. Dzięki temu wizja biura bez papieru stała się już dla wielu przedsiębiorstw rzeczywistością. Niemniej stale pozostaje wiele firm, głownie małych i średnich, które nie są w stanie wprowadzić tej idei w życie we własnym przedsiębiorstwie. Głównym problemem jest tutaj bariera ekonomiczna, uniemożliwiająca dostosowanie systemu teleinformatycznego do wymagań EDI, zarówno w zakresie sprzętu, jak i specjalizowanego oprogramowania systemowego. Wśród tych firm znajdują się także przedsiębiorstwa transportowe (kurierskie, przewozowe, spedycyjne), które w obliczu różnorodności oraz mnogości kontrahentów stają 3

przed coraz większymi problemami archiwizacji i przetwarzaniu dokumentów w ich papierowej postaci. Wiele z tych problemów mogłoby zostać szybko i sprawnie rozwiązanych, gdyby tylko istniała spójna technika przetwarzania (głównie kompresji i archiwizacji) dokumentów, niewymagająca znaczących nakładów finansowych. 4.2 Efektywna technika przetwarzania dokumentów Poszukiwania odpowiedniego narzędzia, gwarantującego spełnienie stawianych wymagań, należy rozpocząć od ich ścisłego zdefiniowania. Warunek minimalizacji kosztów rozwiązania zawęża poszukiwania do rozwiązań opartych na popularnych systemach operacyjnych (Windows, Linux) i pozwalających w prosty sposób wykorzystać powszechnie dostępne platformy prezentacji dokumentów (np. HTML i pokrewne). Tym samym do głównych wymagań należeć będą: - praca w popularnych systemie operacyjnym (Windows, Linux), - wykorzystanie powszechnych (głównie internetowych) platform i narzędzi prezentacji dokumentów, - prostota przetwarzania dokumentu do formatu docelowego, zarówno z postaci papierowej, jak i elektronicznej, - wysoka wydajność duże współczynniki kompresji, przy jednoczesnej wysokiej zgodności z oryginałem, - prostota tworzenia dokumentów zbiorczych, - łatwość przeglądania i przeszukiwania dokumentów archiwalnych, - wbudowany mechanizm rozpoznawania tekstu dla dokumentów skanowanych, - bezpośredni dostęp do dokumentów (stron) w dokumentach zbiorczych. Przez szereg lat większości z tych wymagań był w stanie sprostać, wprowadzony przez firmę Adobe, format PDF (ang. Portable Document Format). Pojawiający się sporadycznie na rynku konkurenci nie byli w stanie zaoferować zdecydowanie lepszych ani nowych możliwości, co w połączeniu ze sprawną polityką firmy Adobe (np. bezpłatna przeglądarka) prowadziło jedynie do dalszego umocnienia pozycji formatu PDF. Należy jednak pamiętać, że format PDF powstał z myślą o zastosowaniach do wydruków dokumentów, co znacząco ogranicza komfort ich przeglądania, np. bezpośrednio na ekranie monitora. Dodatkowym problemem jest brak możliwości zewnętrznego (spoza pliku) bezpośredniego odwołania do konkretnej strony dokumentu, co dodatkowo ogranicza zastosowania tego formatu w 4

archiwizacji dokumentów i rozbudowanych (sieciowych) aplikacjach baz danych. W ostatnim jednak czasie na rynku elektronicznego przetwarzania dokumentów pojawiło się narzędzie, którego twórcy wprost zapowiadają koniec ery formatu PDF. Jest nim standard DjVu, powstały wręcz z myślą o zastosowaniach w archiwizacji dokumentów i nie tylko pozbawiony dwóch podstawowych wad formatu PDF, lecz dodatkowo oferujący nowe możliwości przy lepszych parametrach kompresji. 4.3 Standard DjVu Od roku 1996 w laboratoriach firmy AT&T trwają prace nad nową, wysoko efektywną techniką przetwarzania dokumentów elektronicznych. Prace te doprowadziły do powstania nowego formatu dokumentów, tzw. DjVu. Pod koniec lat 90tych XX w., na podstawie umów licencyjnych i praw patentowych, amerykańska firma LizardTech Inc. wprowadziła ten format na rynek, implementując jego obsługę w stworzonym oprogramowaniu rodzinie Document Express. W bardzo krótkim czasie okazało się, że możliwości tego formatu stanowią realne zagrożenie dla formatów Postscript i PDF, pretendując go do miana nowego standardu elektronicznego przetwarzania dokumentów. Proces ten trwa już kilka lat i choć początkowo niewidoczny, staje się coraz bardziej dynamiczny i zauważalny. 46 MB 1,3 MB 1,3 MB 56 kb TIFF JPEG PDF DjVu Rys. 4.3a Porównanie wielkości zbiorów danych 5

Przyczyn coraz większego sukcesu standardu DjVu jest wiele, jednak najważniejszą z nich jest bez wątpienia wysoka skuteczność i uzyskiwane duże współczynniki kompresji. Dokumenty zapisane w tym formacie są do 1000 razy mniejsze od plików TIFF i zwykle od 5 do 100 razy mniejsze od plików JPEG i PDF. Porównanie wielkości zbiorów danych w tych formatach, powstałych po zeskanowaniu przykładowej kolorowej strony, zostało przedstawione na rysunku (rys. 4.3a). Tak wysoka skuteczność kompresji formatu DjVu została osiągnięta dzięki nowatorskiej metodzie segmentacji obrazu. Jej podstawowa idea polega na rozdzieleniu przetwarzanych obrazów (bez względu na stopień ich złożoności) na warstwy (rys. 4.3b). Ich główny podział, to podział na warstwę pierwszoplanową i warstwę tła. Następnie warstwy te poddawane są odrębnej optymalizacji i kompresji, stosownie do reprezentowanej przez nich treści i właściwości. Warstwa tła zawiera, zgodnie z nazwą, reprezentowane w niskiej rozdzielczości (zwykle 100dpi) tło dokumentu. Kodowane jest ono techniką typową dla obrazów płynnych przejść tonalnych (ang. Continuous Tone Technique). Warstwa pierwszoplanowa zawiera wysokiej (wyższej) rozdzielczości (zwykle 300dpi) maskę obrazu, definiującą szczegóły i kształty detali obrazu. Informacja o kolorze jest przetwarzana do postaci niskiej rozdzielczości (25dpi) obrazu pierwszoplanowego, którego kolory są wykorzystywane jako szablon dla maski obrazu. Niezależnie tworzone są czarno-białe warstwy tekstu, zarówno (w zależności od rodzaju dokumentu) jako wyodrębniony zestaw szczegółów obrazu, jak i zestaw znaków odczytanych techniką rozpoznawania tekstu OCR (ang. Optical Character Recognition). Ta ostatnia właściwość techniki DjVu ma fundamentalne znaczenie w dalszym przetwarzaniu, głównie przeszukiwaniu i katalogowaniu, dokumentów DjVu. Warstwa czarno-biała Warstwa dokumentu Warstwa pierwszoplanowa Warstwa tła Rys. 4.3b Podstawowa idea podziału dokumentu na warstwy 6

W rezultacie złożonego i wielowarstwowego przetwarzania dokumentu plik formatu DjVu jest nie tylko znacznie mniejszych rozmiarów, niż jego odpowiedniki w innym standardzie, np. PDF. Ma on szereg dodatkowych cech, które czynią go niezwykle interesującym dla systemów elektronicznego przetwarzania dokumentów: - jakość: wysoki współczynnik kompresji nie jest ani kompromisem ani kosztem w odniesieniu do jakości, lecz rezultatem zastosowanej metody. - przenośność: pliki formatu DjVu są plikami rastrowymi, dzięki czemu mogą być swobodnie przenoszone pomiędzy różnymi platformami systemowymi (Windows, Sun/Solaris, Linux, Unix) bez typowych dla innych rozwiązań problemów, związanych z różnorodnością stosowanych czcionek. - efektywność: przeglądarki plików DjVu przetwarzają w danym momencie jedynie aktywny (oglądany) fragment dokumentu, co pozwala na uzyskanie maksymalnej szybkości jego przetwarzania (powiększania, przesuwania). - optymalność: format DjVu został zoptymalizowany pod kątem zastosowań w sieciach rozległych, głównie dla zapewnienia niemal natychmiastowego odczytu danych, co osiągnięto poprzez zapewnienie dostępu do aktualnie interesującego fragmentu pliku, bez konieczności wcześniejszej jego transmisji w całości. - podatność: wysoka jakość dokumentów DjVu pozwala na poddanie ich przetwarzaniu przy wykorzystaniu innych technik, od rozpoznawania tekstu OCR, przez zbiorcze indeksowanie i wyszukiwanie, aż do eksportu do innych formatów, np. TXT lub XML. Jak widać z powyższego zestawienia standard DjVu jest w stanie spełnić wszystkie wymagania, stawiane (i sformułowane wcześniej) efektywnej technice przetwarzania dokumentów. Na szczególne podkreślenie zasługuje cecha formatu, gwarantująca jego optymalne wykorzystanie w sieciach rozległych. To dzięki niej pliki formatu DjVu mogą być bezpośrednio osadzane w dokumentach HTML, zamiast plików obrazu lub jako ich odrębne uzupełnienie. Najważniejszą konsekwencją tej cechy jest fakt, że użytkownik uzyskuje natychmiastowy dostęp do interesującego go fragmentu dokumentu bez konieczności transmisji całego pliku, jak ma to miejsce przy zastosowaniach klasycznych (rys. 4.3c). Dzięki temu wielkość pliku przestała mieć wpływ na szybkość przeglądania dokumentu, co znosi ograniczenia ich rozmiaru w kontekście udostępniania ich w sieci. 7

PDF DjVu Rys. 4.3c Różnica w dostępie do strony dokumentu PDF i DjVu Samo prezentowanie dokumentu nie ogranicza się bynajmniej do jego udostępnienia. Standard oferuje szereg opcji, które pozwalają dynamicznie wpływać na sposób wyświetlania dokumentu za pomocą zestawu argumentów na sposób zbliżony do CGI-Bin. Sam użytkownik ma także możliwość skonfigurowania przeglądarki w taki sposób, by dokumenty prezentowane były w ulubionej przez niego postaci. Na komfort pracy z dokumentami DjVu wpływają także m.in. rozbudowane możliwości tworzenia miniatur stron, spisów treści oraz osadzania hiperłączy, prowadzących do innych stron, dokumentów lub plików. 4.4 Możliwości tworzenia archiwum dokumentów Cechy dokumentów formatu DjVu, co zaprezentowano wcześniej, pozwalają na wyjątkową łatwość ich integracji z rozwiązaniami sieciowymi, głownie internetowymi. Umożliwia to proste i szybkie stworzenie archiwum dokumentów w oparciu o istniejące narzędzia programistyczne. Co istotne, narzędzia te są nie tylko dostępne w bardzo szerokim wyborze, lecz także przy bardzo niskim koszcie zakupu licencji, a często wręcz bezpłatnie. Za ten stan rzeczy odpowiada zmierzch ery statycznego HTML i niezwykła, stale rosnąca, popularność dynamicznych witryn WWW. Mechanizmy bazodanowe i techniki skryptowe działające po stronie serwera przestały być domeną portali i sklepów internetowych, a stały się nieodzownym składnikiem każdej, rozbudowanej strony WWW. Wśród narzędzi programistycznych od dawna wiedzie tu prym zestaw PHP i MySQL, pracujący pod kontrolą Apache. Dzięki temu stworzenie archiwum przedsiębiorstwa można byłoby powierzyć osobie odpowiedzialnej za obsługę serwisu internetowego firmy. Oczywiście od rodzaju tworzonego archiwum i natury przechowywanych dokumentów zależeć będzie, czy będą one udostępniane w sieci jedynie wewnątrz przedsiębiorstwa, czy też publicznie. Dostępne 8

techniki autoryzacji i identyfikacji nie wykluczają powstania rozwiązania mieszanego, opartego na hierarchicznej strukturze dostępu do dokumentów. Oczywiście w pełni funkcjonalne archiwum dokumentów musi oferować funkcję ich przeszukiwania pod kątem potrzeby znalezienia określonej zawartości. Procedura indeksacji dokumentów jest zazwyczaj procesem bardzo czasochłonnym. Jednak i tutaj przychodzi z pomocą standard DjVu, dla którego oferowane jest bezpłatne narzędzie przeszukiwania kolekcji dokumentów DjVu po ich zawartości warstwy tekstowej. Narzędziem tym jest IFilter, który integruje się z systemem operacyjnym, umożliwiając wyszukiwanie wprost z poziomu systemu. Analizując jednak funkcje, jakie musi spełniać elektroniczne archiwum dokumentów trudno nie oprzeć się wrażeniu, że funkcjonalnie w niczym nie odbiega ono od tzw. cyfrowej biblioteki. Musi przecież: - zostać stworzone i nadzorowane przez kompetentną osobę Administratora, - gromadzić dokumenty w bazie danych i tworzyć archiwum publikacji, - przyjmować dodatkowe dokumenty i pozwalać na modyfikację istniejących uprawnionym użytkownikom (pracownikom przedsiębiorstwa) Redaktor, - udostępniać dokumenty w sieci przedsiębiorstwa i/lub Internet, - pozwalać na dostęp uprawnionych użytkowników (pracowników) poprzez sieć Czytelnicy. Pierwszym, nadal rozwijanym, polskim projektem biblioteki cyfrowej jest środowisko dlibra. Pierwsze badania, prowadzące do jego powstania, realizowane były przez PCSS (Poznańskie Centrum Superkomputerowo-Sieciowe) już w 1996 roku. Obecnie system dlibra jest najpopularniejszym tego typu oprogramowaniem w Polsce, którego grono użytkowników stale się poszerza. Są to głównie biblioteki akademickie i publiczne, za czym przemawia fakt niskiego kosztu wdrożenia dla placówek państwowych. Nic nie stoi jednak na przeszkodzie, by z projektu tego nie mogły skorzystać przedsiębiorstwa czysto komercyjne. Oparte o dlibrę systemy oferują użytkownikom nie tylko wszystkie przedstawione wyżej funkcje, ale oferują znacznie szersze możliwości. Integrują w jednym środowisku nie tylko dokumenty wszystkich głównych formatów (HTML, DOC, PDF, DjVu, itd.), ale także pliki audio i wideo. Sama wymiana danych odbywa się w oparciu o powszechnie znane i docenione protokoły oraz standardy, do których należą RSS, RDF, MARC, DublinCore czy OAI-PMH. 9

Sam system jest systemem wielowarstwowym (rys. 4.4a), w którym dają się wyróżnić, typowe dla sieciowych rozwiązań bazodanowych, główne moduły: Serwera i jego Administratora oraz Redaktora i Czytelnika. Ich funkcje dokładnie odpowiadają sprecyzowanym wcześniej funkcjom elektronicznego archiwum dokumentów. Wymagania dotyczące sprzętu nie są wysokie, a samo oprogramowanie potrzebne do jego uruchomienia (oprócz głównej licencji dlibra) jest wręcz darmowe: - system operacyjny - Linux, - baza danych PostgreSQL, - serwer aplikacji - Apache Tomcat, - wirtualna maszyna Javy - JRE Sun Microsystems Inc. Archiwum publikacji Serwer systemu Baza danych Czytelnik Czytelnik Serwer WWW Redaktor Redaktor Administrator Czytelnik Rys. 4.4a Architektura systemu dlibra Tym samym uzyskujemy przykładowe dwa sposoby stworzenia elektronicznego archiwum dokumentów przedsiębiorstwa przy minimalnych nakładach finansowych. W obydwu przypadkach wymagany będzie zakup oprogramowania do konwersji dokumentów DjVu. Jednak jego koszt w wersji podstawowej Document Express Professional jest na tyle niski, że nie stanowi praktycznie żadnej bariery finansowej. Drugie rozwiązanie wymagać będzie dodatkowo zakupu licencji środowiska dlibra. Nie jest to jeszcze produkt czysto komercyjny, dlatego nie istnieje jego konkretny cennik. Jednak ze wstępnych ustaleń i 10

zapewnień PCSS jego koszt powinien być zbliżony do ceny dobrej klasy i mocy komputera PC, co także nie tworzy żadnej bariery finansowej. 5. Wykaz użytych skrótów i oznaczeń Dla zwiększenia przejrzystości instrukcji wprowadzono poniższe skróty, które zostały wykorzystane w tekście oraz schematach blokowych. Dotyczą one wykorzystywanych przyrządów oraz ustawień dokonywanych w sprzęcie pomiarowym i modułach laboratoryjnych. Dla ich lepszego wyróżnienia skróty w tekście pisane są czcionką pogrubioną. - zapisz przebieg na dysku, - pytanie, na które odpowiedź musi znaleźć się w sprawozdaniu, 6. Uwagi praktyczne Przed przystąpieniem do realizacji ćwiczenia zalecane jest zapoznanie się z instrukcjami: obsługi aparatu Samsung 815Pro, oprogramowania Document Express Editor oraz Acrobat Professional, które stanowi istotne uzupełnienie instrukcji do ćwiczenia. W celu likwidacji drgań aparatu należy wykonywać zdjęcia przy wykorzystaniu pilota. Jeżeli pilot nie jest dostępny, należy skorzystać z funkcji samowyzwalacza aparatu wykonanie zdjęcia z opóźnieniem 2 lub 10 sekund szczegóły w instrukcji aparatu. Pod żadnym pozorem nie należy upraszczać ćwiczenia i próbować wykonywać poleceń jednocześnie z kilku punktów instrukcji. Jest to najszybsza droga do pomyłki, co skutkuje odrzuceniem sprawozdania. W nawiasach klamrowych {} podane są ustawienia podstawowych parametrów aparatu, w przypadku potrzeby ręcznej korekty ustawień. 11

7. Przebieg ćwiczenia 7.1 Zapoznaj się z budową stanowiska laboratoryjnego. Zidentyfikuj wszystkie przyrządy i elementy stanowiska. Digitalizacja dokumentu 7.2 Umieść digitalizowany dokument na stole do reprodukcji. Możesz wykorzystać dostępną ramkę do zaznaczenia stałej pozycji dokumentu na stole. 7.3 Ustaw aparat na prawie maksymalnej wysokości kolumny stołu do reprodukcji. Ustaw ogniskową aparatu w taki sposób, by obiektyw obejmował cały dokument, jedynie z minimalnym marginesem. Pamiętaj, że wykonywanie zdjęć na najkrótszych ogniskowych grozi zniekształceniami w geometrii obrazu. 7.4 Skoryguj ustawienia oświetlenia w taki sposób, by zlikwidować odblaski światła od dokumentu. Pamiętaj, że obiektyw aparatu jest wyposażony w filtr polaryzacyjny, który także jest w tym pomocny. 7.5 Wykonaj zdjęcia poszczególnych stron dokumentu wg ustawień aparatu zadanych przez prowadzącego. Pamiętaj, że w celu likwidacji drgań aparatu należy wykonywać zdjęcia przy wykorzystaniu pilota. Jeżeli pilot nie jest dostępny, należy skorzystać z funkcji samowyzwalacza aparatu wykonanie zdjęcia z opóźnieniem 2 lub 10 sekund szczegóły w instrukcji aparatu. Wykonaj najpierw zdjęcia stron nieparzystych, a później parzystych. Wstępna obróbka zdjęć 7.6 Poproś prowadzącego o podłączenie aparatu do komputera PC. Przenieś zdjęcia dokumentu do komputera PC. 7.7 Wykorzystaj program do wsadowego przetwarzania grafiki BIMP Lite do korekcji położenia wykonanych zdjęć dokumentu. Pamiętaj, że strony parzyste i nieparzyste mogą się różnić położeniem o 180 stopni. Nie zmieniaj rozdzielczości zdjęć. Zmień nazwę plików: wybierz opcję to lower-case, ustaw Prefix na zgodny z oznaczeniem dokumentu (np. nazwa i numer wydania), Zaznacz opcję Sequential Number: z parametrem Start With: 1 i Zero Fill: 3. Wybierz opcję Output in different folder i wybierz katalog docelowy. Naciśnij Start. 7.8 Uruchom program IrfanView. Wykonaj przycięcie każdego z obrazów do pożądanego rozmiaru. W tym celu użyj funkcji z menu Edit -> Create custom selection... (Shift+C). Rozmiar docelowy i początkowe położenie lewego, górnego rogu zaznaczenia. W razie potrzeby skoryguj położenie okna przesuwając je myszą z wciśniętym prawym klawiszem myszy. Użyj funkcji z menu Edit -> Crop Selection (Ctrl+Y) do przycięcia 12

obrazu. Zapisz obraz, pamiętając o formacie i parametrach kompresji kompresja minimalna lub jej całkowity brak. Wytworzenie dokumentu - Acrobat Professional 7.9 Uruchom program Acrobat Professional. Korzystając z funkcji w menu Plik -> Utwórz PDF -> Z wielu plików... (rys. 7.7a) wprowadź do programu wykonane i przetworzone zdjęcia dokumentu. Pamiętaj o kolejności stron (najpierw wykonywano strony nieparzyste a potem parzyste). W razie potrzeby dokonaj odpowiedniego posortowania stron. Zapisz dokument w formacie PDF. Jaki problem występuje podczas dodawania stron do dokumentu? Rys. 7.7a Dodanie stron do dokumentu PDF Wytworzenie dokumentu - Document Express Editor 7.10 Uruchom program Document Express Editor. Korzystając z funkcji w menu File -> Open wprowadź do programu PIERWSZE wykonane i przetworzone zdjęcie dokumentu. 7.11 Korzystając z funkcji w menu Edit -> Insert Page(s)After... (rys. 7.7b) wprowadź pozostałe strony dokumentu. Pamiętaj o kolejności stron (najpierw wykonywano strony nieparzyste a potem parzyste). W razie potrzeby dokonaj odpowiedniego posortowania stron. Zapisz dokument w formacie DjVu dobierając odpowiedni profil. Sprawdź kilka podstawowych profili, za każdym razem zapisując plik pod inną nazwą, z uzupełnieniem o nazwę profilu. Jak wybór profilu wpływa na wielkość i jakość dokumentu? 13

7.12 Wybierz plik wytworzony profilem, gwarantującym kompromis między wielkością a jakością dokumentu. Dodaj do dokumentu tekst rozpoznany funkcją OCR: Menu Tools -> OCR -> OCR Entire Document. Zapisz plik pod nową nazwą. Jak dodanie tekstu wpływa na wielkość dokumentu? Rys. 7.7b Dodanie stron do dokumentu DjVu 7.13 Korzystając z funkcji Tools -> Annotations -> Rectangular HL uzupełnij spis treści dokumentu o odnośniki (skoki) do jego poszczególnych stron. 7.14 Uzupełnij dokument o dodatkowe odnośniki, np. o powrót do spisu treści, skok na koniec, itp. Zapisz plik pod nową nazwą. Jak dodanie odnośników wpływa na wielkość dokumentu? 7.15 Korzystając z funkcji Tools -> Thumbnails dodaj do dokumentu miniaturki stron. Zapisz plik pod nową nazwą. Jak dodanie miniaturek wpływa na wielkość dokumentu? Jaki jest cel ich osadzania w dokumencie? Co one umożliwiają? 7.16 Otwórz dokument PDF w przeglądarce Acrobat Reader oraz DjVu w DjVu Viewer. Który format gwarantuje lepszą jakość dokumentu? W którym formacie dokument zajmuje więcej miejsca na dysku? Który dokument jest łatwiejszy do nawigacji? Która przeglądarka jest bardziej przyjazna użytkownikowi? Biblioteki cyfrowe 7.17 Uruchom stronę Biblioteki Cyfrowej PW http://bcpw.bg.pw.edu.pl/dlibra. Zapoznaj się z przykładową publikacją. 7.18 Biblioteka zawiera dokumenty zarówno w formacie PDF, jak i DjVu. Wybierz dwa dokumenty w tych dwóch formatach. Otwórz obydwa i zapoznaj się z ich zawartością 14

w sensie realizacji nawigacji po tekście. Który z formatów jest wygodniejszy do przeglądania? Dlaczego? 7.19 Zapoznaj się z listą innych bibliotek cyfrowych projektu dlibra pole: Dodatki -> Zdalne biblioteki cyfrowe. 8. Literatura Materiały reklamowe i szkoleniowe firmy LizardTech, http://www.djvu.com.pl/ Materiały informacyjne środowiska dlibra, http://dlibra.psnc.pl 15