Od edukacji do realizacji otwarta digitalizacja z DigitLabem Adam Dudczak Poznaoskie Centrum Superkomputerowo-Sieciowe maneo@man.poznan.pl
Zespół bibliotek cyfrowych PCSS Pomagamy budowad polskie biblioteki cyfrowe dlibra, dmuseion, dlab, darceo Prowadzimy portal Federacji Bibliotek Cyfrowych (http://fbc.pionier.net.pl) Począwszy od 2004 organizujemy warsztaty Biblioteki cyfrowe Od 2008 roku również konferencję Polskie Biblioteki Cyfrowe Przygotowaliśmy i przeprowadziliśmy wiele szkoleo zarówno w Polsce jak i za granicą
Biblioteki cyfrowe w sieci PIONIER 2 2 Ponad 90 bibliotek cyfrowych, tworzonych przez kilkaset instytucji Ponad.3 miliona cyfrowych dokumentów Dostępne przez portal Federacji Bibliotek Cyfrowych (http://fbc.pionier.net.pl) 3 3 2 3 9 9 3
Od edukacji Projekt Access IT plus (http://accessitplus.eu) Wsparcie procesu digitalizacji dziedzictwa kulturowego w Europie południowo-wschodniej Tworzenie otwartych zasobów edukacyjnych Udostępnianie narzędzi pozwalających na realizację cyfryzacji dziedzictwa kulturowego Promocja dobrych praktyk i otwartych standardów Promocja polskich osiągnięd w zakresie budowy infrastruktury bibliotek cyfrowych 4
Od edukacji (2) Rozwój kursów e-learningowych Repozytoria cyfrowe dla małych instytucji kultury Współpraca z Europeaną Oryginalnie kursy rozwijane po angielsku http://dl.psnc.pl/moodle Treśd dostępna na licencji Creative Commons BY-NC-SA (Uznanie autorstwa-użycie niekomercyjne-na tych samych warunkach) Pierwsze wydanie kursu październik 200, drugie - lipiec 202 5
Od edukacji (3) Oba kursy to ponad 42 moduły i kilkaset pytao Liczne praktyczne instrukcje pokazujące jak krok po kroku realizowad konkretne zadania np. wyprostowanie obrazu w GIMP czy przygotowanie PDF a z przeszukiwalnym tekstem 6
Od edukacji (4) Kurs został przetłumaczony i wdrożony w: Bośni i Hercegowinie, Chorwacji, Serbii, Grecji, Turcji i Polsce Co najmniej 300 osób ukooczyło kurs w różnych wersjach językowych Oprócz e-learningu realizowane są również normalne szkolenia i warsztaty Jak realizowad dwiczenia praktyczne? 7
Powstanie DigitLabu Konieczne zapewnienie jednorodnego środowiska nauki na potrzeby różnego rodzaju szkoleo Identyfikacja darmowych, otwartych narzędzi pozwalających na realizację procesu cyfryzacji 8
Czym jest DigitLab? System operacyjny stworzony na bazie Linux Ubuntu 2.04 LTS Gotowy do użycia zbiór darmowych narzędzi, które mogą byd wykorzystane do realizacji procesu cyfryzacji Środowisko testowe dla przyszłych twórców bibliotek cyfrowych Narzędzie edukacyjne Dostępny za darmo dla każdego 9
Historia DigitLabu Pierwsza wersja była wykorzystywana w marcu 202 do realizacji szkoleo W lipcu 202 pierwsza publicznie dostępna wersja Wersja.0 gotowa w połowie września 202 Statystyki ściągnięd: 275 (od 09.202 do 02.203) Strona projektu: http://digitlab.psnc.pl 0
Warsztaty i konferencje DigitLab w akcji na festiwalu Kultura 2.0
Modele wykorzystania Uruchomienie systemu z pendrive'a Nie ingeruje w oprogramowanie już zainstalowane na komputerze użytkownika Po zakooczeniu pracy można wrócid do używanego na co dzieo systemu operacyjnego Tradycyjna instalacja Zamiast lub obok dotychczasowego systemu operacyjnego 2
Istniejące narzędzia Zarówno dla systemów z rodziny Linux jak i Windows dostępne są darmowe narzędzia, które można wykorzystywad Niektóre z nich mają jednak poważne błędy, które je tak naprawdę wykluczają W DigitLabie zainstalowano następujące oprogramowanie narzędziowe: Audacity, Calibre, DjView, DjVuLibre, dlibra Demo, DSpace, ffmpeg, GIMP, GraphicsMagick, GreenStone, gscan2pdf, GSView, hocr2pdf, Hugin, ImageMagick, LibreOffice, OpenShot Video Editor, pdf2djvu, pdftk, Phatch, PitiVi, Scan Tailor, SimpleScan, Tesseract, VLC 3
do realizacji Narzędzie edukacyjne zaczęto wykorzystywad w codziennej pracy Promocja narzędzi FLOSS Obniżanie kosztów digitalizacji poprzez promowanie otwartych rozwiązao również w zakresie sprzętu 4
do realizacji http://diybookscanner.org 5
do realizacji http://bookscanner.pbworks.com 6
do realizacji Fot. http://www.scandock.com 7
do realizacji Fot. http://www.thescanbox.com/ 8
Realizacja procesu cyfryzacji Digitalizacja i przygotowanie materiałów: Ikonograficznych Wielkoformatowych Tekstowych Przygotowanie materiałów A-V do publikacji 9
Materiały ikonograficzne Obsługa skanera Simple Scan i gscan2pdf Obróbka graficzna GIMP (do PNG, JPG, TIFF) Przygotowanie plików DjVu DjVuLibre (cjb2) wywołanie programu z konsoli 20
Materiały wielkoformatowe Obsługa skanera Simple Scan, gscan2pdf Składanie cząstkowych wyników skanowania Hugin Obróbka w programie graficznym GIMP Przygotowanie postaci prezentacyjnej Zoomify/Google Map Tiles Magicktiler narzędzie wywoływane z konsoli 2
Materiały tekstowe Obsługa skanera Simple Scan, gscan2pdf Normalizacja skanów na potrzeby przetwarzania OCR ScanTailor (wynik: pliki TIFF, BPP) Automatyczne rozpoznawanie znaków (OCR) Bezpośrednio Tesseract (wywołanie z konsoli) Poprzez interfejs gscan2pdf Zapis w formacie PDF/DjVu/txt gscan2pdf Optymalizacja rozmiaru plików PDF Skrypt o nazwie MultiValent wywołanie konsolowe 22
5 MP, zdjęcie zrobione telefonem komórkowym 23
ScanTailor (http://scantailor.sourceforge.net/) 24
Obróbka materiałów audio Przycinanie/odszumianie/korekta głośności Audacity (wspiera FLAC) Kodowanie plików audio do formatów stratnych Koder Lame wywołanie z konsoli Audacity (wspiera zapisanie kopii projektu w MP3) 25
Obróbka materiałów wideo Obróbka OpenShot Video Editor (szeroki zakres formatów wyjściowych) Kodowanie plików wideo ffmpeg wywołanie z konsoli 26
Materiały instruktażowe Na stronie http://digitlab.psnc.pl sukcesywnie udostępniamy materiały instruktażowe Opisy pokazujące jak krok po kroku zrealizowad każdą z omówionych ścieżek cyfryzacji 27
Biblioteka cyfrowa W DigitLab zainstalowane są trzy przykładowe biblioteki cyfrowe oparte o: DSpace, Greenstone dlibrę (ograniczenie do 3 publikacji) Doskonałe środowisko testowe dla przyszłych twórców repozytoriów Proces publikacji został opisany w kursach e-learningowych działających przy FBC http://fbc.pionier.net.pl/elearning/ 28
Znane problemy Wersja 32 bitowa maks. 4GB pamięci RAM Kilka programów ma tylko interfejs konsolowy Bootowanie systemu z pendrive a 29
Dalszy rozwój Wersja 64bit praktycznie brak limitu pamięci RAM Dodanie nowych programów: Omeka, Sigil (EPUB), Raw Therapee, pdfsizeopt Rozwój strony projektu http://digitlab.psnc.pl Ścisła integracja z treściami e-learningowymi przy FBC 30
Potrzebna pomoc Tworzenie materiałów instruktażowych Sugestie dotyczące przydatnych programów http://digitlab.psnc.pl 3
Dziękuje za uwagę! http://digitlab.psnc.pl