Rola bibliotek cyfrowych w budowaniu gospodarki opartej o wiedzę Cezary Mazurek
Biblioteki cyfrowe w sieci PIONIER Ekosystem zasobów i narzędzi Użytkownicy indywidualni i instytucjonalni Wyszukiwarki internetowe, portale tematyczne, serwisy agregujące dane, bazy wiedzy, metawyszukiwarki Biblioteki, archiwa, muzea cyfrowe Systemy katalogowe, inwentaryzacji zabytków, inne systemy informacji naukowej Systemy składowania danych (np. Usługa Powszechnej Archiwizacji)
Federacja Bibliotek Cyfrowych Usługa agregująca metadane z polskich bibliotek cyfrowych od 2007r. Utrzymywana i rozwijana w ramach sieci PIONIER Jest pojedynczym punktem dostępu do zbiorów bibliotek cyfrowych Jest źródłem danych o polskich zbiorach cyfrowych dla Europeany, DART-Europe, WorldCat, ViFaOst, Poza możliwością przeszukiwania i przeglądania metadanych, daje dostęp do informacji o polskich bibliotekach cyfrowych http://fbc.pionier.net.pl/
FBC Najnowsze inicjatywy Biblioteka Cyfrowa Instytutu Odlewnictwa (http://www.bc.iod.krakow.pl/dlibra) Kędzierzyńsko-Kozielska Biblioteka Cyfrowa (http://dlibra.mbpkk.pl/dlibra) Polonijna Biblioteka Cyfrowa (http://www.pbc.uw.edu.pl/) Inowrocławska Biblioteka Cyfrowa (http://dlibra.bmino.pl/dlibra) Płocka Biblioteka Cyfrowa (http://www.tnp.org.pl/biblioteka/dlibra) Biblioteka Cyfrowa Kolekcji Prywatnych (http://www.michael-culture.pl:8080/dlibra)
Biblioteki Cyfrowe - funkcje Udostępnianie cyfrowych kopii zasobów Kolekcje instytucjonalne, tematyczne, formalne Wirtualne repozytoria instytucjonalne i self-archiving Szkolenia i wsparcie w organizacji procesu cyfryzacji Agregacja i wzbogacanie metadanych Masowa digitalizacja w trybie workflow Przechowywanie długoterminowe Przetwarzanie obrazu w postać tekstową (automatyczny OCR) Rozwój zaawansowanych narzędzi i aplikacji dla ehumanistyki
MNW
ELearning
Masowa digitalizacja dlab - system do zarządzania procesem digitalizacji ułatwia organizację prac związanych z digitalizacją wspomaga użytkowników w wykonywaniu przydzielonych czynności umożliwia monitorowanie przebiegu prac z wykorzystaniem raportowania dlab może komunikować się z zewnętrznymi narzędziami w celu wykonywania specyficznych czynności np.: OCR konwersja danych wprowadzanie wersji prezentacyjnej do systemu biblioteki cyfrowej archiwizacja w systemie długoterminowego przechowywania danych
Przechowywanie długoterminowe darceo długoterminowe przechowywanie danych źródłowych (m.in. PDF/A, TIFF, JPEG2000, MPEG-4) Automatyczna ekstrakcja metadanych Usługi migracji danych Rozwiązanie komplementarne do systemów dlibra, dmuseion i dlab Konwersja i zaawansowane dostarczanie danych Współdzielenie mechanizmów migracji, konwersji i zaawansowanego dostarczania danych
SYNAT - System Nauki i Techniki KOORDYNATOR: ICM UW Prace związane z FBC: PCSS Etap A9. Badania w zakresie federacyjnych modeli usług informacji naukowej i naukowo-technicznej Główny wynik: system agregacji i wzbogacania danych Clepsydra Etap A10. Prototyp usług Zintegrowanego Systemu Główny wynik: prototyp Zintegrowanego Systemu Wiedzy Etap A11. Prototyp usług długoterminowego archiwizowania dużych wolumenów danych Główny wynik: prototyp Wielofunkcyjnego Repozytorium Danych Źródłowych A12. Badania związane z usługami dotyczącymi danych źródłowych Główny wynik: Wirtualne Laboratorium Transkrypcji
SYNAT: Zintegrowany System Wiedzy (A10) Dwa główne obszary działania: 1. Konstruowanie bazy wiedzy na podstawie podstawowych źródeł danych agregowany przez zbiór agentów opracowywanych w ramach etapu A9 2. Stworzenie narzędzi pozwalających na efektywne korzystanie z bazy wiedzy przez wirtualne zespoły badawcze Intensywne wykorzystanie technologii sieci semantycznych (ang. semantic web)
SYNAT: Wielofunkcyjne Repozytorium Danych Źródłowych (A12) Zestaw usług umiejscowiony pomiędzy istniejącymi systemami zarządzającymi danymi o charakterze źródłowym (np. plikami MASTER), a systemami składowania danych (lokalnymi lub zdalnymi) Pośredniczy w zapisie i odczycie danych oraz oferuje dodatkowe usługi ułatwiające dostęp do danych, zarządzanie nimi oraz ich długoterminowe przechowywanie Zaprojektowany do współpracy ze Zintegrowanym Systemem Wiedzy
SYNAT: Baza Wiedzy - wyzwania Gromadzenie i przetwarzanie danych W 2012, po około roku funkcjonowania podsystemów agregacji i przetwarzania danych baza reprezentacji obiektów zawierała 8.5 miliona rekordów 75 różnych źródeł danych 77 różnych schematów danych około 1.5 mln rekordów jest wynikiem przetwarzania danych z polskich bibliotek cyfrowych do schematów PLMET i ESE na potrzeby konkretnych aplikacji około 5 tys. obiektów oznaczonych jako usunięte
SYNAT: Baza Wiedzy - wyzwania Udostępnianie danych Testy w oparciu o dwie aplikacje: SYNAT A10 udostępnianie metadanych na potrzeby okresowego rekonstruowania bazy wiedzy 1 mln rekordów z NUKAT 1.6 mln rekordów z polskich bibliotek cyfrowych (w dwóch różnych schematach) Indeks pełnotekstowy Zbudowanie indeksu pełnotekstowego w oparciu o rekordy metadanych w schemacie PLMET i operacyjne utrzymywanie spójności indeksu
SYNAT: Baza Wiedzy - wizualizacja
SYNAT: WRDZ - wyzwania Zapis i odczyt danych źródłowych Mechanizmy wstępnej weryfikacji danych Przygotowanie archiwalnego pakietu informacji Składowanie treści i metadanych z wersjonowaniem Kontener METS Strumieniowanie danych (rozwijane w ramach etapu A12) w szczególności dużych skanów Migracja i konwersja danych ( wsadowa oraz na żądanie ) Weryfikacja i monitorowanie spójności danych
SYNAT: Produkty końcowe Wielofunkcyjne Repozytorium Danych Źródłowych System agregacji i wzbogacania danych Clepsydra - umożliwia gromadzenie danych z rozproszonych, heterogenicznych źródeł systemów informacji naukowej, bibliotek, archiwów i muzeów cyfrowych, bibliotecznych systemów katalogowych, itp. oraz normalizację, transformację i wzbogacanie tych danych, a także przetwarzanie ich do postaci bazy wiedzy. Wirtualne Laboratorium Transkrypcji z usługą OCR - celem systemu jest umożliwienie prowadzenia zespołowych transkrypcji dokumentów (opcjonalnie wspieranych również przez internautów-wolontariuszy). System ten wspiera import obiektów z Federacji Bibliotek Cyfrowych oraz oferuje zaawansowaną usługę OCR wytrenowaną pod kątem polskich dokumentów historycznych.
SYNAT: Produkty Każdy z produktów będzie połączony z platformą SYNAT, tworząc wspólny system usług, których użytkownikami będą m.in. użytkownicy portalu INFONA. Wdrożenie powyższych produktów będzie realizowane w powiązaniu z ekosystemem zasobowo-usługowym sieci PIONIER (m.in. biblioteki cyfrowe, Krajowy Magazyn Danych, Usługi PLATON). Wdrożenie na szeroką skalę usług przetwarzania zasobów wymaga zastosowania podejścia globalnego do wykorzystanych technologii i narzędzi
Współpraca europejska
Archiwizacja danych i procesów badawczych długoterminowe przechowywanie cyfrowych obiektów i procesów badawczych, ze szczególnym uwzględnieniem proweniencji, integralności i powtarzalności rozbudowa biblioteki cyfrowej o usługę bazy wiedzy opisującej składowane obiektów cyfrowych, stworzenie biblioteki cyfrowej obiektów i procesów badawczych
Masowa digitalizacja i przetwarzanie tekstu Europejskie centrum kompetencji w zakresie digitalizacji IMPACT http://www.digitisation.eu/ Jeden z efektów końcowych projektu IMPACT Nastawione na ekspertyzę w zakresie masowej digitalizacji dokumentów tekstowych Skierowane zarówno do bibliotek jak i do naukowców humanistów Kontynuacja w ramach projektu SUCCEED
Usługi w chmurze (1) Przykłady usług w modelu IaaS I SaaS Geolokalizacja Crowdsourcing Wzbogacanie metadanych Mapowanie i transformacja metadanych Słowniki i korpusy słowne Projekt LoCloud
Usługi w chmurze (2) Infrastruktura chmurowa dla przechowywania i współdzielenia metadanych i treści Ekonomia skali Modele biznesowe Modele licencjonowania Otwarte laboratorium Usługi repozytoryjne Budowanie wiedzy Model Danych Europeany (EDM) Projekt ecloud
Nowe (?) możliwości Zasoby i usługi bibliotek cyfrowych to ogromny potencjał dla branży kreatywnych przedsiębiorstw i twórców Nowe zastosowania, produkty, usługi Rosnący rynek cyfrowy Potrzeby sektorów kultury i edukacji Europejska Agenda Cyfrowa: Otwarcie dostępu do treści Konsumenci słusznie oczekują, że dostęp do treści w internecie będzie równie łatwy, jak w świecie rzeczywistym. Europie brakuje jednolitego rynku sektora treści.
Wyzwanie: Jak znaleźć liderów działań w biznesie (stakeholders)? Współpraca w zakresie pilotowego wykorzystywania treści cyfrowych w obszarach misyjnych (zdrowie, edukacja, turystyka) i w sieciach społecznościowych Zdynamizowanie działań w odniesieniu do: ZASOBÓW (np. Reużycie treści, kreatywni twórcy) TECHNOLOGII (np. Semantyczny Web, Crowdsourcing, Nowe media, wizualizacja) BUDOWANIA WIEDZY (np. Wirtualne społeczności badaczy) PROMOCJI I SZKOLEŃ (np. Hackatony, Publiczne zbiórki materiałów) Wprowadzanie sprawdzonych modeli w budowaniu nowych produktów w kolejnych dziedzinach życia i gospodarki (ERP, epodręczniki, Prywatne Archiwa)
Małopolska Biblioteka Cyfrowa (za blogiem Charliego Bibliotekarza)