Automatyzacja procesu publikowania w bibliotece cyfrowej



Podobne dokumenty
Tworzenie plików w formacie DjVu z wykorzystaniem oprogramowania DocumentExpress Enterprise Edition

Od planowania do publikowania co można zautomatyzować?

Microsoft Management Console

Spis treści. Rozdział 1 ewyniki. mmedica - INSTR UKC JA UŻYTKO W NIKA

Utrzymanie aplikacji biznesowych SI PSZ

Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x

Instrukcja Obsługi STRONA PODMIOTOWA BIP

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Miejskim w Gdańsku

epuap Ogólna instrukcja organizacyjna kroków dla realizacji integracji

Oprogramowanie FonTel służy do prezentacji nagranych rozmów oraz zarządzania rejestratorami ( zapoznaj się z rodziną rejestratorów FonTel ).

System kontroli wersji SVN

Systemy mikroprocesorowe - projekt

PERSON Kraków

Dokumentacja usługi SMS (Aplikacja def3000/sms)

Procedura nadawania uprawnień do potwierdzania Profili Zaufanych w Urzędzie Gminy w Ryjewie

INFORMATOR TECHNICZNY WONDERWARE

Poniżej instrukcja użytkowania platformy

Kopia zapasowa i odzyskiwanie Podręcznik użytkownika

Program Płatnik Instrukcja instalacji

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Miejskim w Barcinie

Audyt SEO. Elementy oraz proces przygotowania audytu. strona

API transakcyjne BitMarket.pl

dlibra 3.0 Marcin Heliński

Waldemar Pietrzak s5207. Projekt Wypożyczalnia Samochodów

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Miejskim w Łabiszynie

Część 2 struktura e-paczki

Procedura nadawania uprawnień do potwierdzania, przedłuŝania waŝności i uniewaŝniania profili zaufanych epuap. Załącznik nr 1

elektroniczna Platforma Usług Administracji Publicznej

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap Urzędzie Gminy w Ułężu

Procedura działania Punktu Potwierdzającego. Profile Zaufane epuap. w Urzędzie Miejskim w Miłakowie

Oświęcim, dnia 26 listopada 2013r. Państwowe Muzeum Auschwitz-Birkenau w Oświęcimiu ul. Więźniów Oświęcimia Oświęcim

Lublin, Zapytanie ofertowe

DOTACJE NA INNOWACJE. Zapytanie ofertowe

Zad.1 Pokazać pierwszeństwo trybu odmów przed zezwalaj.

W dobie postępującej digitalizacji zasobów oraz zwiększającej się liczby dostawców i wydawców

Aplikacje internetowe oparte na kluczowych technologiach Java Enterprise(Servlet,JSP,JDBC, )

InsERT GT Własne COM 1.0

Instrukcja programu PControl Powiadowmienia.

Podręcznik użytkownika środowiska dlibra. Poznańskie Centrum Superkomputerowo - Sieciowe Redakcja: Tomasz Parkoła


SpedCust 5 instrukcja instalacji

Opis instalacji systemu Intranet Komunikator

Integracja systemów, integracja procesów

enova Workflow Obieg faktury kosztowej

DOTACJE NA INNOWACJE ZAPYTANIE OFERTOWE

Opis zmian funkcjonalności platformy E-GIODO wprowadzonych w związku z wprowadzeniem możliwości wysyłania wniosków bez podpisu elektronicznego

Opis obsługi systemu Ognivo2 w aplikacji Komornik SQL-VAT

MySource Matrix CMS - PROSTY INTERFEJS UŻYTKOWNIKA. INSTRUKCJA ver 1.2

INFORMATOR TECHNICZNY WONDERWARE. Konfiguracja komputera klienckiego do łączenia się z serwerem IndustrialSQL

Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego

Miejski System Zarządzania - Katowicka Infrastruktura Informacji Przestrzennej

Konfiguracja historii plików

Cennik reklamowy 2009: billoboard, banerów, linków, artykułów promocyjnych i ingu reklamowego w ramach Serwisu Proekologia.

Formularz rzeczowo-cenowy PAKIET 2

emszmal 3: Automatyczne księgowanie przelewów w sklepie internetowym Magento (plugin dostępny w wersji ecommerce)

System do kontroli i analizy wydawanych posiłków

Praca na wielu bazach danych część 2. (Wersja 8.1)

Chmura obliczeniowa. do przechowywania plików online. Anna Walkowiak CEN Koszalin

Przekształcenie danych przestrzennych w interaktywne mapy dostępne na stronach www (WARSZTATY, poziom podstawowy)

Rozliczenia z NFZ. Ogólne założenia. Spis treści

Instrukcja dotycząca generowania klucza dostępowego do Sidoma v8

Procedura działania Punktu Potwierdzającego Profile Zaufane epuap w Urzędzie Gminy Wągrowiec

PROCEDURA ADMINISTROWANIA ORAZ USUWANIA

Zaznaczając checkbox zapamiętaj program zapamięta twoje dane logowania. Wybierz cmentarz z dostępnych na rozwijalnej liście.

VinCent Office. Moduł Drukarki Fiskalnej

Zarządzanie Zasobami by CTI. Instrukcja

Platforma do obsługi zdalnej edukacji

Tytuł pracy. Praca dyplomowa inżynierska. Filip Piechocki. Tytuł Imię i Nazwisko

KONKURS NA NAJLEPSZE LOGO

Instrukcja obsługi. Oprogramowanie SAS 31

emszmal 3: Automatyczne księgowanie przelewów w menedżerze sprzedaży BaseLinker (plugin dostępny w wersji ecommerce)

Pierwsze kroki. Krok 1. Uzupełnienie danych własnej firmy

PROGRAM ZAPEWNIENIA I POPRAWY JAKOŚCI AUDYTU WEWNĘTRZNEGO

Regulamin serwisu internetowego ramowka.fm

Bazy danych II. Andrzej Grzybowski. Instytut Fizyki, Uniwersytet Śląski

Zapytanie ofertowe M.M. Druk Serwis Sp. z o.o.

System Informatyczny CELAB. Przygotowanie programu do pracy - Ewidencja Czasu Pracy

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

Instrukcja obsługi Norton Commander (NC) wersja 4.0. Autor: mgr inż. Tomasz Staniszewski

Ogólnozakładowy system monitoringu i rozliczeń mediów

Wyślij sterownik. Podręcznik administratora

Stan prac w zakresie wdrożenia systemów operacyjnych: NCTS2, AIS/INTRASTAT, AES, AIS/ICS i AIS/IMPORT. Departament Ceł, Ministerstwo Finansów

Testowanie i wdrażanie oprogramowania Emulator systemu bankowego

Procedura działania Punktu Potwierdzającego. Profile Zaufane epuap. w Urzędzie Gminy Kampinos

REGULAMIN KONTROLI ZARZĄDCZEJ W MIEJSKO-GMINNYM OŚRODKU POMOCY SPOŁECZNEJ W TOLKMICKU. Postanowienia ogólne

CZYTNIK ZBLIŻENIOWY RFID-UR80D

Strona główna góra

Regulamin Usługi Certyfikat SSL. 1 Postanowienia ogólne

1. DYNAMICSAX nie pobiera żadnych opłat za korzystanie z serwisu internetowego DYNAMICSAX.PL.

Ostatnia cena sprzeda y klienta 1.0 dodatek do Symfonia Faktura dla 1 firmy

IZBA CELNA WE WROCŁAWIU Wrocław, dnia 30 kwietnia 2012 r. Ul. Hercena Wrocław

Tworzenie wielopoziomowych konfiguracji sieci stanowisk asix z separacją segmentów sieci - funkcja POMOST. Pomoc techniczna

Numer obszaru: 13. Jak pracować z uczniem uzdolnionym informatycznie? Od grafiki i multimediów do poważnych algorytmów w środowisku Logomocja-Imagine

Załącznik nr 1 do projektu wzoru umowy - szczegółowe zasady realizacji i odbioru usług

Charakterystyka systemów plików

Doxis4 SmartOffice Plus

PROGRAM PŁATNIK WERSJA rozszerzenie wymiany danych z ZUS

Kancelaris - Zmiany w wersji 2.50

Transkrypt:

Automatyzacja procesu publikowania w bibliotece cyfrowej Jakub Bajer Biblioteka Politechniki Poznańskiej Krzysztof Ober Poznańska Fundacja Bibliotek Naukowych

Plan prezentacji 1. Cel prezentacji 2. Proces tworzenia publikacji 3. Narzędzia: - Document Express Enterprise 5.1 - ABBYY Recognition Server 2.0 - narzędzie do dodawania plików do publikacji planowanej (dostępne w systemie dlibra od wersji 4.0.10) 4. Automatyzacja procesu publikowania

Cel prezentacji Celem prezentacji jest zapoznanie uczestników warsztatów z głównymi funkcjami oprogramowania wykorzystywanego do przygotowania publikacji dla potrzeb biblioteki cyfrowej (m. in. Document Express Enterprise 5.1, Recognition Server 2.0) oraz zaprezentowanie możliwości automatyzacji procesu publikowania na przykładzie rozwiązań wdrożonych w Wielkopolskiej Bibliotece Cyfrowej.

Proces tworzenia publikacji Tworzenie publikacji dla potrzeb biblioteki cyfrowej jest procesem wieloetapowym: opracowywanie planów wprowadzania publikacji, tworzenie opisów publikacji planowanych, przygotowywanie cyfrowych wersji publikacji, konwersja plików do formatu DjVu + OCR, umieszczanie publikacji w bibliotece cyfrowej, publikowanie.

Narzędzia Pewne etapy pracy redaktora można zautomatyzować. Z pomocą przychodzą narzędzia programistyczne: - zewnętrzne: - Document Express Enterprise 5.1 - ABBYY Recognition Server 2.0 - wbudowane w system dlibra narzędzie do dodawania treści do opisów publikacji planowanych (dostępne od wersji 4.0.10)

Document Express Enterprise 5.1 DocumentExpress to rodzina aplikacji do tworzenia i manipulowania dokumentami skanowanymi i generowanymi elektronicznie o bardzo dużym stopniu kompresji zapisanych w formacie DjVu. Enterprise Edition to wersja Document Expressa przeznaczona dla instytucji, które przetwarzają większe ilości dokumentów możliwość automatycznego przetwarzania wsadowego.

Komponenty DocumentExpress EE 1) Graficzne (tylko Windows): Configuration Manager interfejs graficzny do zarządzania profilami (zestawami parametrów przetwarzania) - umożliwia modyfikację istniejących, tworzenie nowych oraz testowanie działania profili; Workflow Manager oparty na platformie.net program pozwalający zorganizować konwersję wsadową. Obsługuje WatchFolders (aktywne foldery), profile konwersji, konwersję PDF-ów (z profilami), OCR, Watermarks (znaki wodne), generowanie plików XML i TXT, seryjną zmianę nazw, obsługę błędów, log operacji;

Komponenty DocumentExpress EE 2) Programy uruchamiane z linii poleceń (wszystkie platformy): documenttodjvu konwersja obrazów rastrowych do formatu djvu z obsługą warstw; photododjvu konwersja obrazów rastrowych do formatu djvu bez obsługi warstw; djvutotext ekstrahowanie warstwy tekstowej do pliku tekstowego; djvudecode konwersja plików djvu do obrazów rastrowych; djvutoxml ekstrahowanie adnotacji, metadanych oraz warstwy tekstowej do pliku XML;

Komponenty DocumentExpress EE djvubundle konwersja pliku DjVu do formatu bundled (opcjonalnie tworzenie warstwy OCR oraz osadzanie miniatur); djvujoin - konwersja pliku DjVu do formatu indirect (opcjonalnie tworzenie warstwy OCR oraz osadzanie miniatur); djvuparsexml przetwarzanie informacji tekstowych zawartych w pliku XML, import do pliku djvu; watermarkdjvu osadzanie znaku wodnego w dokumencie DjVu.

ABBYY Recognition Server 2.0 ABBYY Recognition Server jest zaawansowanym rozwiązaniem serwerowym, które automatyzuje proces rozpoznawania tekstu i konwersji dokumentów PDF. Może on wykonywać wiele zadań równocześnie w obrębie instytucji, natomiast ich monitorowanie odbywa się z jednego centralnego punktu administracji.

Komponenty Recognition Server 2.0 Server Manager Processing Station Verification Station Remote Administration Console COM-based API Web Service

Narzędzie do dodawania plików do publikcji planowanej Narzędzie znajduje się w dystrybucji dlibry począwszy od wersji 4.0.10 i służy do dodawania plików do publikacji planowanej. Pliki jakie mają zostać dodane, użytkownika w imieniu którego pliki będą dodawane oraz publikację do której pliki zostaną dodane wskazywane są w parametrach konfiguracyjnych tego narzędzia. Narzędzie to uruchamiane jest z linii poleceń i jest dedykowane do wykorzystania w mechanizmach automatyzacji pracy redaktorów biblioteki cyfrowej.

Narzędzie do dodawania plików do publikacji planowanej lib - katalog zawierający potrzebne biblioteki do uruchomienia narzędzia config.xml - plik zawierający informacje o serwerze do którego narzędzie dodawania plików ma się podłączyć users.xml - informacje o użytkownikach w imieniu których narzędzie będzie dodawało pliki do publikacji planowanej. run.bat - skrypt uruchamiający narzędzie w środowisku systemów z rodziny Windows run.sh - skrypt uruchamiający narzędzie w środowisku systemów z rodziny Linux

Narzędzie do dodawania plików do publikacji planowanej Uruchamianie narzędzia: run <PREFIX>\<USER_ID>\out\<PUB_ID>\<FILE> false true np. run C:\pliki\jkowalski\out\22345\directory.djvu true <PREFIX> to pierwsza część ścieżki nieistotna z punktu widzenia narzędzia <USER_ID> jest katalogiem którego nazwa jest loginem użytkownika w imieniu którego narzędzie ma dodać pliki publikacji out jest katalogiem zawierającym publikacje danego użytkownika <PUB_ID> jest katalogiem którego nazwa jest identyfikatorem publikacji planowanej do której mają zostać dodane pliki publikacji; zawiera wszystkie pliki publikacji <FILE> jest nazwą pliku głównego publikacji

Publikacje planowane Elementem niezbędnym do prawidłowego działania systemu automatycznego wprowadzania publikacji jest identyfikator publikacji planowanej. Publikacja planowana posiada tylko opis, nie posiada treści. Tworzenie opisów publikacji ręczne wprowadzanie metadanych lub wykorzystanie mechanizmu importu zaimplementowanego w systemie dlibra: - import metadanych z formatu MARC, - import metadanych z formatu XML, - import metadanych z formatu BibTeX, - pobieranie metadanych poprzez rozszerzenie Z39.50, - wymiana metadanych za pomocą formatu RDF.

Umieszczanie plików na serwerze konwersji Dla poszczególnych rodzajów publikacji można skonfigurować odpowiednie profile przetwarzania w Document Express'ie. Każdemu profilowi przetwarzania Document Expressa zostaje przyporządkowany określony katalog w systemie plików na serwerze. Taka sama struktura katalogów zostaje odwzorowana na dysku lokalnym komputera redaktora. Pliki publikacji (TIFF, JPG) muszą zostać umieszczone w katalogach o nazwach odpowiadających identyfikatorom publikacji planowanych w systemie dlibra. Redaktor decyduje o parametrach konwersji umieszczając publikację w określonym katalogu na dysku lokalnym. Przesyłanie plików na serwer odbywa się za pomocą FTP. Na dysku lokalnym komputera redaktora archiwizowane są oryginalne pliki TIFF, na dysku serwera archiwizowane są pliki djvu w trybie bundle oraz opcjonalnie pliki TIFF.

Konwersja plików do formatu DjVu + OCR System automatycznego wprowadzania publikacji wykona - w zależności od katalogu, w którym zostaną umieszczone pliki - następujące zadania: skonwertuje pliki do formatu djvu stosując odpowiednie parametry konwersji, wykona OCR, wygeneruje pliki djvu w trybie indirect (dla potrzeb www),

Umieszczanie publikacji w bibliotece cyfrowej, publikowanie umieści pliki publikacji na serwerze Wielkopolskiej Biblioteki Cyfrowej wykorzystując identyfikator publikacji planowanej, jeśli redaktor sobie tego życzy: opublikuje nową publikację.

Logi operacji Wyniki działania programów realizujących kolejne etapy procesu publikowania są zapisywane do plików log. Analiza logów pozwala zdiagnozować przyczynę problemu jeśli taki wystąpi. Trwają prace nad opracowaniem narzędzia do raportowania błędów bieżąca analiza wpisów w logach i wysyłanie komunikatu na adres(y) e-mail w przypadku wystąpienia problemu.