Realizacja procesu digitalizacji przy pomocy systemu DigitLab Adam Dudczak, Piotr Smoczyk {maneo, smoq}@man.poznan.pl Konferencja Biblioteka cyfrowa dziś a wyzwania jutra
Czym jest DigitLab? System operacyjny stworzony na bazie Linux Ubuntu 12.04 LTS Gotowy do użycia zbiór darmowych narzędzi, które mogą być wykorzystane do realizacji procesu cyfryzacji Środowisko testowe dla przyszłych twórców bibliotek cyfrowych Narzędzie edukacyjne Dostępny za darmo dla każdego 2
Historia DigitLab Stworzony w ramach realizacji projektu ACCESS IT plus (http://accessitplus.eu) Pierwsza wersja była wykorzystywana w marcu 2012 do realizacji szkoleń Lipiec 2012 - pierwsza publicznie dostępna wersja Wrzesień 2012 - wersja 1.0 Statystyki ściągnięć: 275 (od 09.2012) 3
Modele wykorzystania Uruchomienie systemu z pendrive'a Nie ingeruje w oprogramowanie już zainstalowane na komputerze użytkownika Po zakończeniu pracy można wrócić do używanego na co dzień systemu operacyjnego Tradycyjna instalacja Zamiast lub obok dotychczasowego systemu operacyjnego 5
Istniejące narzędzia Zarówno dla systemów z rodziny Linux jak i Windows dostępne są darmowe narzędzia, które można wykorzystywać Niektóre z nich mają jednak poważne błędy, które je tak naprawdę wykluczają W DigitLabie zainstalowano następujące oprogramowanie narzędziowe: Audacity Calibre DjView DjVuLibre dlibra Demo DSpace ffmpeg GIMP GraphicsMagick GreenStone gscan2pdf GSView hocr2pdf ImageMagick LibreOffice OpenShot Video Editor Pdf2djvu Pdftk Phatch PitiVi Scan Tailor SimpleScan Tesseract VLC 6
Realizacja procesu cyfryzacji Digitalizacja i przygotowanie materiałów: Ikonograficznych Wielkoformatowych Tekstowych Przygotowanie materiałów A-V do publikacji 7
Materiały ikonograficzne Obsługa skanera Simple Scan i gscan2pdf Obróbka graficzna GIMP (do PNG, JPG, TIFF) Przygotowanie plików DjVu DjVuLibre (cjb2) wywołanie programu z konsoli 8
Materiały wielkoformatowe Obsługa skanera Simple Scan, gscan2pdf Składanie cząstkowych wyników skanowania Hugin Obróbka w programie graficznym GIMP Przygotowanie postaci prezentacyjnej Zoomify/Google Map Tiles Magicktiler narzędzie wywoływane z konsoli 9
Materiały tekstowe Obsługa skanera Simple Scan, gscan2pdf Normalizacja skanów na potrzeby przetwarzania OCR ScanTailor (wynik: pliki TIFF, 1BPP) Automatyczne rozpoznawanie znaków (OCR) Bezpośrednio Tesseract (wywołanie z konsoli) Poprzez interfejs gscan2pdf Zapis w formacie PDF/DjVu/txt gscan2pdf Optymalizacja rozmiaru plików PDF Skrypt o nazwie MultiValent wywołanie konsolowe 10
Obróbka materiałów audio Przycinanie/odszumianie/korekta głośności Audacity (wspiera FLAC) Kodowanie plików audio do formatów stratnych Koder Lame wywołanie z konsoli Audacity (wspiera zapisanie kopii projektu w MP3) 12
Obróbka materiałów wideo Obróbka OpenShot Video Editor (szeroki zakres formatów wyjściowych) Kodowanie plików wideo ffmpeg wywołanie z konsoli 13
Materiały instruktażowe Na stronie http://digitlab.psnc.pl będziemy sukcesywnie udostępniać materiały instruktażowe Opisy pokazujące jak krok po kroku zrealizować każdą z omówionych ścieżek cyfryzacji 14
Biblioteka cyfrowa W DigitLab zainstalowane są trzy przykładowe biblioteki cyfrowe oparte o: DSpace, Greenstone dlibrę (ograniczenie do 3 publikacji) Doskonałe środowisko testowe dla przyszłych twórców repozytoriów Proces publikacji został opisany w kursach e-learningowych działających przy FBC http://fbc.pionier.net.pl/elearning/ 15
Znane problemy Wersja 32 bitowa maks. 4GB pamięci RAM Kilka programów ma tylko interfejs konsolowy 16
Dalszy rozwój Wersja 64bit praktycznie brak limitu pamięci RAM Dodanie nowych programów: Omeka, Sigil (EPUB), Raw Therapee, pdfsizeopt Rozwój strony projektu http://digitlab.psnc.pl Ścisła integracja z treściami e-learningowymi przy FBC 17
Potrzebna pomoc Tworzenie materiałów instruktażowych Sugestie dotyczące przydatnych programów 18
Dziękuje za uwagę! http://digitlab.psnc.pl