Realizacja procesu digitalizacji przy pomocy systemu DigitLab



Podobne dokumenty
Od edukacji do realizacji otwarta digitalizacja z DigitLabem Adam Dudczak Poznaoskie Centrum Superkomputerowo-Sieciowe maneo@man.poznan.

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

DIGITALIZACJA. Maciej Rynarzewski Oddział Zbiorów Specjalnych

Udostępnianie i przechowywanie obiektów cyfrowych w kontekście biblioteki akademickiej

Krok w stronę cyfrowej humanistyki infrastruktura IT dla badań humanistycznych

Biblioteki cyfrowe i ich kolekcje

Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe

Katalog dobrych praktyk digitalizacyjnych dla obiektów bibliotecznych

Nic nie zastąpi ciężkiej pracy*

Digitalizacja wybranych pozycji księgozbioru w Bibliotece Centralnego Instytutu Ochrony Pracy Państwowego Instytutu Badawczego

Cyfrowe dokumenty muzyczne w Internecie

Instrukcja przygotowania pliku do deponowania

Tworzenie metadanych, proces digitalizacji i publikowanie dokumentów w projekcie Merkuriusz. Katarzyna Araszkiewicz

UNIWERSYTETU WARSZAWSKIEGO

Wpisany przez Łukasz Nawrotek Niedziela, 08 Czerwiec :43 - Zmieniony Niedziela, 08 Czerwiec :44

Instrukcja przygotowania pliku do deponowania

TECHNOLOGIA INFORMACYJNA

Jako, że jesteśmy Linuksowcami będziemy używać OCR dla Linuksa. Właśnie zainstalowałeś silnik OCR ze słownikiem (by nie robił błędów)

Jak przeglądać publikacje w formacie DjVu?

Od planowania do publikowania co można zautomatyzować?

Tworzenie plików w formacie DjVu z wykorzystaniem oprogramowania DocumentExpress Enterprise Edition


4. Oprogramowanie OCR do rozpoznawania znaków 39

Open Source w Open e-learningu. Przykłady zastosowania

Niniejsza skrócona instrukcja obsługi pomaga w rozpoczęciu korzystania z urządzenia IRIScan TM Mouse Executive 2.

Agnieszka Koszowska, FRSI Remigiusz Lis, ŚBC-BŚ

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Korekta OCR problemy i rozwiązania

Wpisany przez Łukasz Nawrotek Poniedziałek, 20 Październik :57 - Zmieniony Poniedziałek, 20 Październik :02

Specyfikacja PL (Ploter A1 24 ) (szt. 1) Wymagane parametry minimalne. 72 wydruki A1/godz. (+/- 1 m²/godz) 72 wydruki A1/godz.

SYSTEM OPERACYJNY. Monika Słomian

Jeleniogórska Biblioteka Cyfrowa od kuchni

Masowe zabezpieczanie i udostępnianie egzemplarza obowiązkowego w Jagiellońskiej Bibliotece Cyfrowej. Leszek Szafrański Biblioteka Jagiellońska

Organizacja i logistyka digitalizacji

Czytelnik w bibliotece cyfrowej

Automatyzacja procesu publikowania w bibliotece cyfrowej

Międzyplatformowy interfejs systemu FOLANessus wykonany przy użyciu biblioteki Qt4

Federacja Bibliotek Cyfrowych w sieci PIONIER

Data wykonania Część praktyczna

(nazwa (firma) oraz dokładny adres Wykonawcy/Wykonawców; w przypadku składania oferty przez podmioty występujące wspólnie podać nazwy (firmy)

KULTURA W SIECI KURS REALIZOWANY W RAMACH GRANTU PRZYZNANEGO ZE ŚRODKÓW UE PROGRAM OPERACYJNY POLSKA CYFROWA DZIAŁANIE 3.1

CyberGuru Wirtualizacja na platformie Hyper-V w pigułce. Prezentuje: Kamil Frankowicz

Innowacyjne narzędzia w procesie digitalizacji

Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT

OPIS PRZEDMIOTU. Dygitalizacja i biblioteki cyfrowe MSIW IN23D-SP. Wydział Administracji i Nauk Społecznych Instytut/Katedra

Wymagania edukacyjne na ocenę z informatyki klasa 3

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2017 CZĘŚĆ PRAKTYCZNA

Expo Composer Garncarska Szczecin tel.: info@doittechnology.pl. Dokumentacja użytkownika

Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu

Zintegrowana platforma drukowania, skanowania, archiwizowania i obiegu

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego. Opis oferowanego przedmiotu zamówienia

Czytelnik w bibliotece cyfrowej

Technologia znaku wodnego dla plików dźwiękowych: Legimi Audio Watermark

Rozwój Wielkopolskiej Biblioteki Cyfrowej a zmiany funkcjonalności systemu dlibra

Nowe usługi w infrastrukturze sieci MAN i PIONIER. Aleksandra Nowak Marcin Werla

Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF

LampScan. Nr produktu

Tom 6 Opis oprogramowania

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2019 CZĘŚĆ PRAKTYCZNA

* Big Index - Indeks dołączony do ProfiCD w formacie 25x24 cm. Usługa dotyczy negatywów i diapozytywów typu 135. Index zawiera 36 klatek.

Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF

Szczegółowy opis przedmiotu zamówienia. CZĘŚĆ I Dostawa sprzętu komputerowego do biura Zamawiającego w Nowym Targu (Polska) Opis minimalnych wymagań

. Sposób zapisu plików pojedynczej publikacji w formacie DjVu

Format DjVu. Jakub Wilk. Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego. 27 lutego 2007 r.

Zainstalowany AutoCAD w pełnej wersji najlepiej Civil lub MAP 2007 lub wyższej.

w Politechnice Łódzkiej

Diagnostyka obrazowa

Nazwa, typ, model, producent oferowanego urządzenia...

Internet Archive (IA) ogólne informacje. ebooks and Texts prezentacja polskojęzycznych dokumentów

Opis przedmiotu zamówienia

Automatyczna instalacja oprogramowania.

CENTRALNA KOMISJA EGZAMINACYJNA

kk-cms System Zarządzania Treścią - prezentacja intensys - agencja interaktywna tel

Rozszerzenia plików graficznych do publkacji internetowych- Kasia Ząbek kl. 2dT

Szczegółowy wykaz minimalnych parametrów technicznych urządzeń wielofunkcyjnych kolorowych/monochromatycznych

Techniki multimedialne

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2017 CZĘŚĆ PRAKTYCZNA

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2018 CZĘŚĆ PRAKTYCZNA

Szczegółowy Opis Przedmiotu Zamówienia

Pla$orma edukacyjna czy to wystarczy? Przygotował: Artur Dyro, Prezes Learnetic S.A.

Audyt oprogramowania. Artur Sierszeń

Szczegółowy wykaz minimalnych parametrów technicznych urządzeń wielofunkcyjnych monochromatycznych szt. 6 WYMAGANE MINIMALNE PARAMETRY TECHNICZNE

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

SZCZEGÓŁOWY OPIS PRZEDMIOTU ZAMÓWIENIA CZĘŚĆ III DRUKARKI

Infrastruktura bibliotek cyfrowych

Wyszukiwanie pełnotekstowe w zasobach bibliotek cyfrowych

Instalacja Ubuntu 12.12

Gdzieś w bibliotece jeleniogórskiej, 14 grudnia Wirtualna biblioteka e-pogranicze

Zakup sprzętu komputerowego i oprogramowania

Biblioteka w cyfrowej rzeczywistości wyzwania i praktyka Henryk Hollender Uczelnia Łazarskiego. Organizator

Zarządzanie partycjami

Repozytorium Uniwersytetu Jagiellońskiego

Zintegrowany System Wiedzy oraz Wielofunkcyjne Repozytorium Danych Źródłowych podstawy technologiczne. Marcin Werla, PCSS

Załacznik nr 4 do SIWZ - OPIS PRZEDMIOTU ZAMÓWIENIA- załącznik do Formularza Oferty

ActiveXperts SMS Messaging Server

CYRENA czyli Cyfrowe Repozytorium Nauki Politechniki Łódzkiej

Baza danych Oracle 11g Express Edition

Diagnostyka komputera

Instrukcja użytkownika Platforma transakcyjna mforex Trader dla systemu MacOS

E-Podręcznik w edukacji. Marlena Plebańska

Transkrypt:

Realizacja procesu digitalizacji przy pomocy systemu DigitLab Adam Dudczak, Piotr Smoczyk {maneo, smoq}@man.poznan.pl Konferencja Biblioteka cyfrowa dziś a wyzwania jutra

Czym jest DigitLab? System operacyjny stworzony na bazie Linux Ubuntu 12.04 LTS Gotowy do użycia zbiór darmowych narzędzi, które mogą być wykorzystane do realizacji procesu cyfryzacji Środowisko testowe dla przyszłych twórców bibliotek cyfrowych Narzędzie edukacyjne Dostępny za darmo dla każdego 2

Historia DigitLab Stworzony w ramach realizacji projektu ACCESS IT plus (http://accessitplus.eu) Pierwsza wersja była wykorzystywana w marcu 2012 do realizacji szkoleń Lipiec 2012 - pierwsza publicznie dostępna wersja Wrzesień 2012 - wersja 1.0 Statystyki ściągnięć: 275 (od 09.2012) 3

Modele wykorzystania Uruchomienie systemu z pendrive'a Nie ingeruje w oprogramowanie już zainstalowane na komputerze użytkownika Po zakończeniu pracy można wrócić do używanego na co dzień systemu operacyjnego Tradycyjna instalacja Zamiast lub obok dotychczasowego systemu operacyjnego 5

Istniejące narzędzia Zarówno dla systemów z rodziny Linux jak i Windows dostępne są darmowe narzędzia, które można wykorzystywać Niektóre z nich mają jednak poważne błędy, które je tak naprawdę wykluczają W DigitLabie zainstalowano następujące oprogramowanie narzędziowe: Audacity Calibre DjView DjVuLibre dlibra Demo DSpace ffmpeg GIMP GraphicsMagick GreenStone gscan2pdf GSView hocr2pdf ImageMagick LibreOffice OpenShot Video Editor Pdf2djvu Pdftk Phatch PitiVi Scan Tailor SimpleScan Tesseract VLC 6

Realizacja procesu cyfryzacji Digitalizacja i przygotowanie materiałów: Ikonograficznych Wielkoformatowych Tekstowych Przygotowanie materiałów A-V do publikacji 7

Materiały ikonograficzne Obsługa skanera Simple Scan i gscan2pdf Obróbka graficzna GIMP (do PNG, JPG, TIFF) Przygotowanie plików DjVu DjVuLibre (cjb2) wywołanie programu z konsoli 8

Materiały wielkoformatowe Obsługa skanera Simple Scan, gscan2pdf Składanie cząstkowych wyników skanowania Hugin Obróbka w programie graficznym GIMP Przygotowanie postaci prezentacyjnej Zoomify/Google Map Tiles Magicktiler narzędzie wywoływane z konsoli 9

Materiały tekstowe Obsługa skanera Simple Scan, gscan2pdf Normalizacja skanów na potrzeby przetwarzania OCR ScanTailor (wynik: pliki TIFF, 1BPP) Automatyczne rozpoznawanie znaków (OCR) Bezpośrednio Tesseract (wywołanie z konsoli) Poprzez interfejs gscan2pdf Zapis w formacie PDF/DjVu/txt gscan2pdf Optymalizacja rozmiaru plików PDF Skrypt o nazwie MultiValent wywołanie konsolowe 10

Obróbka materiałów audio Przycinanie/odszumianie/korekta głośności Audacity (wspiera FLAC) Kodowanie plików audio do formatów stratnych Koder Lame wywołanie z konsoli Audacity (wspiera zapisanie kopii projektu w MP3) 12

Obróbka materiałów wideo Obróbka OpenShot Video Editor (szeroki zakres formatów wyjściowych) Kodowanie plików wideo ffmpeg wywołanie z konsoli 13

Materiały instruktażowe Na stronie http://digitlab.psnc.pl będziemy sukcesywnie udostępniać materiały instruktażowe Opisy pokazujące jak krok po kroku zrealizować każdą z omówionych ścieżek cyfryzacji 14

Biblioteka cyfrowa W DigitLab zainstalowane są trzy przykładowe biblioteki cyfrowe oparte o: DSpace, Greenstone dlibrę (ograniczenie do 3 publikacji) Doskonałe środowisko testowe dla przyszłych twórców repozytoriów Proces publikacji został opisany w kursach e-learningowych działających przy FBC http://fbc.pionier.net.pl/elearning/ 15

Znane problemy Wersja 32 bitowa maks. 4GB pamięci RAM Kilka programów ma tylko interfejs konsolowy 16

Dalszy rozwój Wersja 64bit praktycznie brak limitu pamięci RAM Dodanie nowych programów: Omeka, Sigil (EPUB), Raw Therapee, pdfsizeopt Rozwój strony projektu http://digitlab.psnc.pl Ścisła integracja z treściami e-learningowymi przy FBC 17

Potrzebna pomoc Tworzenie materiałów instruktażowych Sugestie dotyczące przydatnych programów 18

Dziękuje za uwagę! http://digitlab.psnc.pl