MOŻLIWOŚĆ WYBRANYCH METOD KOMPRESJI OBRAZÓW W DIGITALIZACJI ZBIORÓW BIBLIOTECZNYCH

Podobne dokumenty
teoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015

ZESPÓŁ LABORATORIÓW TELEMATYKI TRANSPORTU ZAKŁAD TELEKOMUNIKACJI W TRANSPORCIE WYDZIAŁ TRANSPORTU POLITECHNIKI WARSZAWSKIEJ

Podstawowe pojęcia. Teoria informacji

Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych

Techniki multimedialne

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

Wprowadzenie do informatyki i użytkowania komputerów. Kodowanie informacji System komputerowy

Temat: Algorytm kompresji plików metodą Huffmana

Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9,

Grafika rastrowa i wektorowa

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

Podsumowanie wyników ankiety

Fundamentals of Data Compression

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

Wybrane metody kompresji obrazów

Przykładowe zagadnienia na sprawdzian z wiedzy ogólnej. Linux to nazwa: A. Programu biurowego. B. Systemu operacyjnego. C. Przeglądarki internetowej.

teoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015

Kodowanie informacji. Przygotował: Ryszard Kijanka

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

Modulacja i kodowanie. Labolatorium. Kodowanie źródłowe Kod Huffman a

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Plan nauczania informatyki Opracował: mgr Daniel Starego

Kodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

WYMAGANIA EDUKACYJNE. Informatyka Szkoła Podstawowa Klasa 4 NA ŚRÓDROCZNĄ I ROCZNĄ OCENĘ KLASYFIKACYJNĄ

Informatyka kl. 1. Semestr I

Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

TECHNOLOGIE INFORMACYJNE

ZWIĄZEK MIĘDZY INFORMATYKĄ I TECHNOLOGIĄ INFORMACYJNĄ

wiadomość komunikat - informacja Caius Julius Cesar Człowiek zasztyletowany przez senatorów na forum Romanum w Idy Marcowe roku DCCIX ab urbe condita

Sygnał a informacja. Nośnikiem informacji mogą być: liczby, słowa, dźwięki, obrazy, zapachy, prąd itp. czyli różnorakie sygnały.

Spis treści. Od autorów / 9

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

DLA SEKTORA INFORMATYCZNEGO W POLSCE

POROZUMIENIE o współtworzeniu MAZOWIECKIEJ BIBLIOTEKI CYFROWEJ. Preambuła

Teoria informacji i kodowania Ćwiczenia

Wybrane wymagania dla informatyki w gimnazjum i liceum z podstawy programowej

Spis treści. Wstęp Część I Internet rozwiązania techniczne... 13

Moduł 2 Użytkowanie komputerów i zarządzanie plikami wymaga od kandydata znajomości obsługi komputera osobistego.

Akwizycja i przetwarzanie sygnałów cyfrowych

PRZEWODNIK PO PRZEDMIOCIE

Teoria przetwarzania A/C i C/A.

Wymagania edukacyjne na ocenę z informatyki klasa 3

Metody numeryczne Technika obliczeniowa i symulacyjna Sem. 2, EiT, 2014/2015

KARTA PRZEDMIOTU. Techniki przetwarzania sygnałów, D1_3

INFORMATYKA, TECHNOLOGIA INFORMACYJNA ORAZ INFORMATYKA W LOGISTYCE

Program modułu multimedialnego mgr Urszula Galant. PROGRAM MODUŁU MULTIMEDIALNEGO DLA UCZNIÓW KLAS IV VI SP im. Szarych Szeregów w Płochocinie

PRZEWODNIK PO PRZEDMIOCIE

Wygra Polska czy Brazylia, czyli o tym jak zwięźle zapisywać informacje

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

zna podstawową terminologię w języku obcym umożliwiającą komunikację w środowisku zawodowym

Dostawa oprogramowania. Nr sprawy: ZP /15

Tom 6 Opis oprogramowania

System komputerowy. Sprzęt. System komputerowy. Oprogramowanie

WYOBRAŹ SOBIE, ŻE MÓGŁBYŚ WIZUALIZOWAĆ DANE W NIECAŁĄ SEKUNDĘ Z KAŻDEGO MIEJSCA NA ZIEMI.

WYMAGANIA EDUKACYJNE Z INFORMATYKI NA POSZCZEGÓLNE STOPNIE W KLASIE 7 opracowane na podstawie podręcznika:

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Rok akademicki: 2014/2015 Kod: CCB s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Teoria Informacji i Metody Kompresji Danych

ActiveXperts SMS Messaging Server

Publiczne Technikum Informatyczne Computer College w Koszalinie

Adaptive wavelet synthesis for improving digital image processing

Urządzenie wielofunkcyjne czarno białe 1 szt.

Obróbka grafiki cyfrowej

Projekt przejściowy 2015/2016 BARTOSZ JABŁOŃSKI, TOMASZ JANICZEK

Zastosowanie kompresji w kryptografii Piotr Piotrowski

PRZEWODNIK PO PRZEDMIOCIE

Liczba godzin w semestrze Ogółem Semestr 1 Semestr 2 Semestr 3 E Z Sh W C L S P W C L S P ECTS W C L S P ECTS W C L S P ECTS W C L S P ECTS

Roman Mocek Zabrze Opracowanie zbiorcze ze źródeł Scholaris i CKE

Programowanie Strukturalne i Obiektowe Słownik podstawowych pojęć 1 z 5 Opracował Jan T. Biernat

Projekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI

Wymagania edukacyjne z informatyki w klasie IIIa gimnazjum

Wymagania - informatyka

12. Wprowadzenie Sygnały techniki cyfrowej Systemy liczbowe. Matematyka: Elektronika:

PRZEWODNIK PO PRZEDMIOCIE

Komputer i urządzenia z nim współpracujące.

Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty)

TECHNOLOGIA INFORMACYJNA

Kryteria oceniania z Technologii Informacyjnej

Rozkład materiału do zajęć z informatyki. realizowanych według podręcznika

Programowanie komputerów

Teoria informacji i kodowania Ćwiczenia

biegle i poprawnie posługuje się terminologią informatyczną,

Języki i metodyka programowania. Reprezentacja danych w systemach komputerowych

Plan studiów dla kierunku:

KATEGORIA OBSZAR WIEDZY NR ZADANIA Podstawowe informacje i czynności

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

3.1. Na dobry początek

Systemy liczenia. 333= 3*100+3*10+3*1

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Rozkład materiału informatyki w gimnazjum w Kielnie dla klasy I i II z podziałem na jednostki lekcyjne.

Informacje i zalecenia dla zdających egzamin maturalny z informatyki 1. Część pierwsza egzaminu z informatyki polega na rozwiązaniu zadań

Transkrypt:

Marcin BRODKA Politechnika Śląska Biblioteka Główna MOŻLIWOŚĆ WYBRANYCH METOD KOMPRESJI OBRAZÓW W DIGITALIZACJI ZBIORÓW BIBLIOTECZNYCH Charakterystycznym znakiem czasu jest nadmiar informacji. Dostarczana informacja, która dotyczy niemal każdej najdrobniejszej dziedziny naszego życia, jest różnej jakości. Dostępność informacji, jaką się cieszymy, czy też na jaką cierpimy, jeszcze w zeszłym pokoleniu była nie do pomyślenia. Coraz bardziej wymagane są narzędzia nie tyle zwiększające dostęp, ile raczej ułatwiające selekcję informacji. Szybki dostęp do istotnych informacji, a także efektywne przetwarzanie informacji i wyszukiwanie wiarygodnych źródeł wiedzy staje się składnikiem decydującym o sukcesie wszelkiej działalności biznesowo-gospodarczej, organizacyjnej i społecznej. Poszanowanie czasu odbiorcy powinno być obowiązkiem nadawcy informacji, będącej typowym gorącym tematem na sprzedaż. W artykule zostanie pokazany wpływ kompresji danych, a w szczególności obrazów, na skuteczność digitalizacji zbiorów bibliotecznych. Wstęp Początek XXI w. to przede wszystkim era informacji, którą charakteryzuje intensywny rozwój społeczeństwa informacyjnego, przekształcającego się stopniowo w społeczeństwo powszechnie dostępnej wiedzy (przetwarzanie i tworzenie wiedzy staje się podstawą jego rozwoju). Wobec dużej i stale rosnącej roli Internetu można obecnie mówić również o zjawisku społeczeństwa sieciowego 1. Komputery są łatwo dostępne i wyposażone standardowo w interfejsy sieciowe umożliwiające podłączenie do wspomnianej już sieci komputerowej. Również świat techniki ulega bardzo gwałtownym zmianom. Popularnym sposobem na życie współczesnego człowieka, funkcjonującego w ciągłym pośpiechu, staje się oszczędzanie każdej chwili, mające znaczenie zwłaszcza ekonomiczne oraz eksploatacyjne (użytkowe). Poszanowanie czasu przekłada się na zwiększenie ilości informacji dostępnej (przekazywanej) w jednostce czasu w warunkach, jakimi dysponuje konkretny odbiorca (określone ramy czasowe, sprzętowe, finansowe). Oszczędność czasu odbiorcy informacji można uzyskać przede 1 A. Przelaskowski: Kompresja danych. Wydawnictwo BTC, Warszawa 2005.

96 wszystkim przez dbałość o jakość informacji, tj. selekcję jedynie tych danych, które są istotne dla użytkownika, oraz przez zapewnienie minimalnej długości reprezentacji przekazywanych danych 2. Również dzięki zastosowaniu nowoczesnej technologii cyfrowej istnieje możliwość ochrony cennego dziedzictwa kulturowego, jakim są zbiory biblioteczne. Digitalizacja pozwala na przenoszenie na format cyfrowy starych druków, rękopisów, inkunabułów czy czasopism z XIX w. Umożliwia nie tylko zabezpieczenie cennych dzieł, lecz także dostęp do wielu kategorii zbiorów. Zabezpieczenie i ułatwianie przesyłania tych zbiorów stały się koniecznością w budowaniu nowoczesnych zasobów akademickich bibliotek. Pojęcie kompresji danych Możliwość kompresji zbiorów, a w szczególności obrazów, różnego typu danych, jest ostatnio jednym z najbardziej interesujących tematów z pogranicza wielu dziedzin nauki i techniki, takich jak teoria informacji, teoria stopnia zniekształceń źródeł informacji, teoria przekształceń (unitarnych, nieliniowych, z bazą nadmiarową itd.), czasowa i sprzętowa optymalizacja algorytmów itp. Jednocześnie wiele zagadnień istotnych z punktu widzenia kompresji danych ma bardziej złożony charakter. Prace nad uściśleniem pojęcia informacji i ilościowym jej opisem, sprecyzowaniem dostępnej wiedzy na temat analizowanych zbiorów danych i optymalną (możliwie prostą, a jednocześnie zupełną) ich charakterystyką (modelowaniem), obiektywizacją wrażeń wzrokowej percepcji i ujęciem ich w ramy efektywnego modelu stanowią także kluczowe zagadnienia z obszaru optymalizacji technik analizy, przetwarzania i rozpoznawania danych. Duża liczba opracowań dotyczących metod kompresji stratnej i bezstratnej, formatów oraz konkretnych implementacji, a także znacznie rozwinięty proces standaryzacji metod wyznaczania efektywnych reprezentacji danych są spowodowane zainteresowaniem technologii informatycznych i telekomunikacyjnych oraz zwiększeniem liczby i rozmiarów zbiorów danych różnego rodzaju, pojawiających się niemal w każdej dziedzinie życia, do której dotarły komputery, oraz związanymi z tym trudnościami ich gromadzenia, przeglądania i wymiany (transmisji). Postęp technologiczny w dziedzinie rejestracji obrazu, dźwięku, różnego typu danych, postępująca komputeryzacja niemal wszystkich dziedzin życia, gwałtowny rozwój połączeń sieciowych (Internet, intranet) powodują powstawanie ogromnych 2 Ibidem.

97 ilości informacji w postaci cyfrowej. Liczne zbiory danych, które są zapisywane, przetwarzane, przechowywane, wymieniane, przesyłane, stanowią w bardzo wielu przypadkach główny przedmiot analizy różnego typu systemów, a zdolność szybkiej manipulacji zbiorami danych (wygodne i sprawne przeglądanie, wyszukiwanie, sortowanie, klasyfikacja itd.) decyduje o efektywności i użyteczności tych systemów. Zarys historii technik kompresji Pierwszym kluczowym wydarzeniem było położenie fundamentów teorii informacji przez C. Shannona, jednego z największych naukowców XX w. 3 Chodzi tu o prace Shannona z końca lat 40. XX w. (szczególnie z 1948 r.). Sformułowane tam pojęcia entropii jako miary informacji, nadmiarowości, modeli źródeł informacji, itp., stanowią zręby współczesnych technik kompresji danych. Shannon przyczynił się do powstania skutecznego algorytmu kodowania opartego na statystycznej analizie zbioru kompresowanych danych, zwanego algorytmem Shannona-Fano. Innym bardzo istotnym wydarzeniem było opublikowanie w 1952 r. przez D.A. Huffmana pracy A Method for the Construction of Minimum Redundancy Codes. Przedstawia ona algorytm tworzenia optymalnej reprezentacji kodowej dla zbioru danych, przy założeniu przyporządkowania każdemu symbolowi alfabetu źródła, modelującego ten zbiór danych, oddzielnego słowa kodowego o długości (w bitach) w przybliżeniu odwrotnie proporcjonalnej do prawdopodobieństwa wystąpienia tego symbolu w strumieniu danych wejściowych. Te i inne prace były podwalinami w tworzeniu minimalnych, optymalnych kodów skompresowanych zbiorów obrazowych. Nie ma technik kompresji, które są optymalne w każdym zastosowaniu. Różnorodność analizowanych obrazów, w tym zbiory PDF, zarówno co do ogólnej czy lokalnej charakterystyki zbioru wartości, jak i sposobu ich wykorzystania powoduje, że dla różnych typów danych należy stosować dopasowane do ich własności algorytmy w celu uzyskania maksymalnej skuteczności kompresji. Ogólna charakterystyka obrazów bibliotecznych Najczęściej spotykane zbiory tekstowe, w szczególności w bibliotekach, zawierają bajtowe informacje o kolejnych znakach (np. zapisanych w kodzie ASCII), tworzących: słowa, zdania tekstu uzupełnione znakami formatującymi i narzucającymi 3 C.E. Shannon: A Mathematical Theory of Communication. The Bell System Technical Journal, Vol. 27, 1948, p. 379-423, 623-656.

98 interpretację, rozkazy danego języka programowania, wektory danych arkuszy kalkulacyjnych itp. Ważne są tutaj częstości wystąpień pojedynczych znaków w tekstach danego języka, formatu, dokumentu, jak też różnych kombinacji tych znaków w określonym kontekście, wynikające często z koncepcji składniowej i semantycznego określonego zbioru danych 4. Dane będące bardzo istotnym elementem współczesnych systemów informacji można podzielić na dwie zasadnicze grupy: analogowe i cyfrowe. Obrazy analogowe są opisywane funkcją jasności obrazu, reprezentującą przestrzenny rozkład energii promieniowania widzialnego, którą można opisać matematycznie. Do nich zaliczymy: obrazy medyczne, sekwencje obrazów (wideo), dane mieszane oraz dane multimedialne 5. Te wszystkie rodzaje obrazów bądź danych obrazowych należy odpowiednio przygotować do zadań digitalizacji. Digitalizacja ta umożliwia wprowadzenie zbiorów książek, opracowań i skryptów w postaci cyfrowych rekordów zapamiętywanych na dyskach głównych serwerów bibliotek. Aby wielkość tych rekordów została właściwie zminimalizowana, można zastosować kompresję danych, czyli dane te należy kodować 6. Kompresją danych bądź kodowaniem jest nazywany proces przekształcenia pierwotnej reprezentacji zbioru danych w inną reprezentację o mniejszej liczbie bitów, a odwrotny proces rekonstrukcji oryginalnego zbioru danych na podstawie reprezentacji skompresowanej jest nazywany dekompresją. Cele kompresji w zależności od charakteru danych i zastosowań mogą być różnorodne. Zazwyczaj przy projektowaniu metody kompresji chodzi jednak o uzyskanie największej efektywności, przy czym efektywność ta może być rozumiana rozmaicie. Można wyróżnić dwie zasadnicze kategorie metod kompresji danych: bezstratne i stratne. W kompresji bezstratnej (inaczej odwracalnej) zrekonstruowany po kompresji zbiór danych jest numerycznie identyczny ze zbiorem oryginalnym z dokładnością do pojedynczego bitu. Ten rodzaj kompresji jest oczywiście pożądany w zastosowaniach bezwzględnie wymagających wiernej rekonstrukcji zbioru oryginalnego. W kompresji stratnej (nieodwracalnej) zazwyczaj transformuje się zbiór danych w zupełnie nową przestrzeń pośrednią, w której nadmiarowość reprezentacji 4 W systemach analizy języka naturalnego (np. tłumaczenia automatycznego) stosuje się programy komputerowe do rozwiązywania problemów związanych z językami używanymi przez ludzi. Automatyzacja tłumaczenia czy analizy składniowej jest zagadnieniem trudnym ze względu na charakter języków naturalnych ich reguły często są skomplikowane, zawierają liczne wyjątki, a znaczenie poszczególnych fraz w wielu wypadkach zależy od kontekstu. 5 A. Przelaskowski: op.cit. 6 Funkcja kompresji obrazu często jest nazywana w skrócie kodowaniem. Zob.: M. Brodka: Kompresja falkowa na potrzeby transmisji sygnału. Studia Informatica, Vol. 23, No. 3 (50), s. 337-347.

99 oryginalnej jest znacznie zredukowana. Faza modelowania kończy się kwantyzacją zbioru uzyskanych wartości, który redukuje alfabet binarnie kodowanego strumienia, dając znaczne oszczędności w długości kodu wyjściowego. Kwantyzacja jest procesem nieodwracalnym, a więc niemożliwa jest pełna rekonstrukcja oryginalnego zbioru danych w procesie dekompresji. Odtwarzany zbiór danych jest jedynie przybliżeniem oryginału możliwe są nawet znaczne różnice w poszczególnych wartościach z zachowaniem jednak ogólnego charakteru danych, w wyniku czego można osiągać znacznie wyższe stopnie kompresji niż w technikach odwracalnych. Większa kompresja osiągana jest zwykle kosztem mniejszej zgodności ze zbiorem danych oryginalnych 7. Efektywność kompresji może być rozumiana w różnoraki sposób w zależności od rodzaju kompresowanych danych, zastosowania, sprzętowych możliwości implementacji itp. Pierwszym, najbardziej powszechnym rozumieniem tego pojęcia jest zdolność do maksymalnego zmniejszenia rozmiaru nowej reprezentacji kompresowanych danych w stosunku do rozmiaru zbioru pierwotnego. Do liczbowych miar tak rozumianej efektywności należą przede wszystkim: stopień kompresji CR (ang. compression ratio 8 ), procent kompresji CP (ang. compression percentage 9 ) oraz średnia bitowa BR (ang. bite rate 10 ). Średnia bitowa to parametr stosowany w celu określenia zdolności przepływu danych przez sieć komputerową. Wielkość ta określa, ile bitów na sekundę potrafimy przesłać przez dany kanał transmisyjny. Efektywność czy skuteczność metod kompresji to najczęściej zdolność do osiągnięcia w procesie kompresji możliwie dużych wartości CR lub CP, czy też możliwie małej średniej bitowej BR. W pewnych zastosowaniach, np. w urządzeniach do rejestracji danych w czasie rzeczywistym, efektywność kompresji może być pojmowana jako zdolność do minimalizacji czasu kompresji (lub też kompresji/dekompresji). Istnieje jeszcze wiele innych współczynników charakteryzujących obrazy oraz ich możliwa kompresja które można odnaleźć w literaturze branżowej 11. 7 K. Sayood: Introduction to Data Compression. Morgan Kaufmann, San Francisco 2002; J. Chojcan, J. Łęski: Zbiory rozmyte i ich zastosowania. Wydawnictwo Politechniki Śląskiej, Gliwice 2001. 8 Compression ratio współczynnik kompresji określany jako stosunek wielkości obrazu przed kompresją i po niej. 9 Compression percentage współczynnik kompresji wyrażany w mierze procentowej. 10 Bite rate przepływność; w telekomunikacji i informatyce: prędkość, z jaką sygnał cyfrowy przepływa przez kanał łączności, np. Internet. 11 K. Sayood: op.cit.; M. Vetterli: Wavelets, Approximation and Compression. IEEE Signal Processing Magazine, No. 3, 2001, p. 59-371; A. Przelaskowski: op.cit.

100 Przykład zastosowania metody zmniejszania objętości zbiorów Oprogramowanie dostępne i korzystne dla zmniejszenia objętości skanowanych zbiorów bibliotecznych, wykonywane na ogół w plikach w formacie PDF, to: Kpdftool aplikacja uruchamiana na platformie Linuxowej, Irfanview dostępny w systemie Windows (domena publiczna). Obydwa programy zmniejszają ilość informacji bitowej (często są zawarte na stronach naszych plików typu PDF) z wielkości 300 dpi na 200 dpi. Wielkość dpi 12 mówi o liczbie punktów graficznych na jednostkę. Przykład badania zamieszczony na rysunkach poniżej nie wykazuje szczególnych różnic prezentowanych obrazów, wykonanych z dokładnością 300 dpi (rys. 1), a następnie poddanych kompresji do wartości 200 dpi (rys. 2). Rys. 1. Kościół Bazylianów pod wezwaniem Piotra i Pawła w Wilnie; rozdzielczość 300 dpi 12 dpi (ang, dots per inch) wielkość charakterystyczna spotykana przy zakupie np. drukarek.

101 Rys. 2. Kościół Bazylianów pod wezwaniem Piotra i Pawła w Wilnie; konwersja z 300 dpi na 200 dpi Podsumowanie i wnioski Przedstawiony zarys dotyczący skanowanych obrazów bibliotecznych wskazuje na ich wielkości, które mogą być problematyczne przy kopiowaniu, przesyłaniu i drukowaniu. Podkreśla się natomiast korzyści wynikające ze zmniejszenia tych zbiorów, co jak pokazuje zamieszczony przykład (rys. 1 i rys. 2) nie zakłóca fotografii w subiektywnym odbiorze wzrokowym. Dlatego daleko idącym wnioskiem jest mądre zmniejszanie obrazów, np. przez redukowanie skali dpi. Redukcja ta spowoduje zmniejszenie nakładów obliczeniowych przy przesyłaniu tych obrazów siecią internetową. Ponadto zbiory poddane kompresji będą miały mniejszą wielkość bitową i zajmą mniejszą ilość pamięci dysków twardych, a w przypadku odczytu szybciej będą się wyświetlać na ekranie monitora. Obrazy użyte w badaniu ulegają znacznej redukcji, jeśli chodzi o zajmowane miejsce na przestrzeni dyskowej, czyli dla naszych obrazów testowych jest to: rys. 1 2,3 MB, rys. 2 1,3 MB. Taki zabieg znacznie poprawia obszar wykorzystywanej przestrzeni pamięci komputerowej. Także ulegną osiągi w przekazywaniu takich obrazów binarnych, co przyspiesza i zmniejsza, a tym samym polepsza wskaźnik BR. Takie przygotowanie skanowanych dokumentów powinno być standardem w procesach digitalizacji (archiwizacji) zbiorów w bibliotekach.

102 Bibliografia 1. Białasiewicz J.: Falki i aproksymacje. Wydawnictwo Naukowo-Techniczne, Warszawa 2000. 2. Brodka M.: Kompresja falkowa na potrzeby transmisji sygnału. Studia Informatica, Vol. 23, No. 3 (50), s. 337-347. 3. Chojcan J., Łęski J.: Zbiory rozmyte i ich zastosowania. Wydawnictwo Politechniki Śląskiej, Gliwice 2001. 4. Huffman D.A.: A Method for the Construction of Minimum Redundancy Codes. Proceedings of the Institute of Radio Engineers, No. 40 (9), 1952, p. 1098-1101. 5. Przelaskowski A.: Kompresja danych. Wydawnictwo BTC, Warszawa 2005. 6. Sayood K.: Introduction to Data Compression. Morgan Kaufmann, San Francisco 2002. 7. Shannon C.E.: A Mathematical Theory of Communication. The Bell System Technical Journal, Vol. 27, 1948, p. 379-423, 623-656. 8. Vetterli M.: Wavelets, Approximation and Compression. IEEE Signal Processing Magazine, No. 3, 2001, p. 59-371.