wyciąg Studium Wykonalności dla projektu: Europejskie dziedzictwo techniczne upowszechnianie historycznych Strona 1
1. Słownik stosowanych pojęć ACK Cyfronet Akademickie Centrum Komputerowe AGH; AGH Akademia Górniczo-Hutnicza w Krakowie; API ang. Application Programming Interface należy rozumieć jako interfejs programowania aplikacji; B+R działalność badawczo-rozwojowa; BG AGH Biblioteka Główna Akademii Górniczo-Hutniczej; Bookkeeper III tu: instalacja służąca do odkwaszania druków i rękopisów; BPK Biblioteka Politechniki Krakowskiej; DC ang. Dublin Core - międzynarodowy standard metadanych do opisu dokumentów cyfrowych. Przyjęty jako standard ISO 15836-2003; Europeana cyfrowa biblioteka udostępniająca w Internecie europejskie dziedzictwo kulturowe i naukowe; ICT ang. information and communication technologies - technologie informacyjno-komunikacyjne; MNiSW Ministerstwo Nauki i Szkolnictwa Wyższego; OCR ang. Optical Character Recognition zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie (np. papierowym formularzu lub stronie książki); PESTLE - ang. Political, Economic, Social, Technological, Legal, Environmental; PK Politechnika Krakowska im. Tadeusza Kościuszki; Platforma SUW otwarty system komunikacji naukowej w środowisku cyfrowym, który powstał w wyniku realizacji projektu Zintegrowany System Wymiany Wiedzy i Udostępniania Akademickich Publikacji z Zakresu Nauk Technicznych ; POPC - Program Operacyjny Polska Cyfrowa na lata 2014-2020; WIEiT - Wydział Informatyki, Elektroniki i Telekomunikacji (AGH); Strona 5
3. Charakterystyka projektu i logika interwencji 3.1 Tytuł projektu Europejskie dziedzictwo techniczne upowszechnianie historycznych i współczesnych publikacji z zakresu nauk technicznych w innowacyjnym środowisku informatycznym 3.2 Geneza i istota projektu Potrzeba realizacji projektu została zdefiniowana na podstawie informacji dostarczanych systematycznie przez pracowników Biblioteki Politechniki Krakowskiej oraz pracowników naukowych uczelni. W ramach realizacji projektu partnerzy zamierzają udostępnić w sposób otwarty, a więc nieodpłatnie i przy jak najmniejszych barierach dla ich ponownego wykorzystania zasoby danych z zakresu nauk technicznych przy pomocy innowacyjnego środowiska informatycznego. Udostepnienie cyfrowych zasobów zostanie poprzedzone digitalizacją zbiorów oraz pracami z zakresu konserwacji zachowawczej najcenniejszych kolekcji zbiorów bibliotecznych należących do europejskiego dziedzictwa naukowego, zgromadzonych przez Bibliotekę Politechniki Krakowskiej oraz Bibliotekę Główna Akademii Górniczo-Hutniczej. Część zasobów bibliotecznych przeznaczonych do digitalizacji zostanie do niej odpowiednio przygotowana zabezpieczona i zakonserwowana. Wnioskodawca przeprowadzi fumigację zbiorów, odkwaszenie najprawdopodobniej w instalacji Bookkeeper III oraz konserwację zachowawczą. Charakterystyka zniszczeń najcenniejszych kolekcji obejmuje przede wszystkim poważne zanieczyszczenia powierzchniowe, plamy i przebarwienia, uszkodzenia mechaniczne, uszkodzenia spowodowane przez mikroorganizmy, zakwaszenie papieru, bibulastość, wżery atramentowe i miedziowe, niszczenia wynikające z niewłaściwych reperacji oraz będących rezultatem przewożenia i ukrywania zbiorów podczas okresów powojennych. Obecny stan niektórych cennych (często unikatowych) obiektów grozi ich bezpowrotną utratą. Można, zatem wskazać, że przygotowanie koncepcji projektu jest wynikiem z jednej strony bezpośredniej oceny stanu zachowania obiektów bibliotecznych o ogromnym znaczeniu dla dziedzictwa kultury, z drugiej natomiast jest podyktowane chęcią znacznego zwiększenia dostępu do tych zbiorów dla użytkowników. Realizacja przedmiotowej inwestycji na terenie Krakowa podyktowana jest względami zarówno społecznymi, jak i gospodarczymi. Miasto ze względu na ogromny potencjał naukowy i status miasta akademickiego jest idealnym miejscem do realizacji przedmiotowego projektu. Jego realizacja wpłynie na poprawę jakości istniejącego już kapitału społecznego a to w kontekście dużego potencjału Strona 8
gospodarczego, którym dysponuje Kraków, jest gwarantem poprawy konkurencyjności regionu nie tylko w skali kraju ale i w skali międzynarodowej. Analiza zasobów i potrzeb Wnioskodawcy ukazała, iż Biblioteka Politechniki Krakowskiej posiada dobrze rozbudowaną infrastrukturę techniczną, bogate zasoby informacyjne w postaci cyfrowej oraz rozwiniętą infrastrukturę ICT, jednak istnieje potrzeba jej modernizacji. W ramach projektu zostanie utworzony 1 interfejs API, który umożliwi udostępnienie planowanych zbiorów (zostaną zdigitalizowane i udostępnione zbiory obejmujące ponad 6 000 publikacji). Analiza popytu wskazała, iż w kontekście otwartego charakteru systemu wzrośnie liczba korzystających ze zbiorów biblioteki z uwagi na cyfrowe udostępnienie wskazanych zbiorów. Taka forma umożliwia użytkowanie dokumentów w dowolnym momencie, poza godzinami pracy bibliotek uczelni wyższych. Biorąc pod uwagę swobodny dostęp do zamieszczonych w systemie publikacji i materiałów dydaktycznych a tym samym globalny charakter projektu oraz nieodpłatny charakter korzystania z tych zasobów, stwierdzono, że popyt na produkty projektu jest duży, a w kolejnych latach ulegnie jeszcze zwiększeniu. Użytkownikami nowego systemu informatycznego będą w głównej mierze pracownicy naukowi i dydaktyczni uczelni wyższych akademiccy oraz studenci, badacze i specjaliści (inżynierowie architekci, budowniczy, badacze historii, techniki, górnictwa i hutnictwa, bibliofile, bibliotekoznawcy, historycy i kulturoznawcy) oraz uczniowie chcący prowadzić badania oraz poszerzyć swoją wiedzę. Dodatkowo zniknie ryzyko uszkodzenia starych księgozbiorów rzez użytkowników, gdyż udostępniane będą ich elektroniczne wersje, natomiast oryginały będą odpowiednio zabezpieczone i przechowywane. Strona 9
3.5 Cele projektu Cel ogólny przedsięwzięcia został zdefiniowany, jako cyfrowe udostepnienie historycznych i współczesnych publikacji z zakresu nauk technicznych w innowacyjnym środowisku. Cel ten zostanie osiągnięty dzięki realizacji szeregu celów szczegółowych, wśród których wskazać należy: Wdrożenie nowego systemu informatycznego zapewniającego zwiększenie użyteczności udostępnianych zbiorów bibliotecznych oraz włączenie ich w europejski obieg naukowy z punktu widzenia udostępniającego zbiory, jak również użytkowników końcowych, konieczne jest zapewnienie odpowiedniego systemu do zarządzania, przetwarzania, przeszukiwania i udostępniania cyfrowych zasobów nauki. W konsekwencji pozwala to na sprawne włączanie zbiorów do zasobów europejskich i światowych. Wyposażenie partnerów projektu w narzędzia informatyczne oraz sprzęt do digitalizacji, które umożliwią poszerzanie zakresu udostępnianych zasobów cyfrowych zakres zbiorów posiadanych przez partnerów projektu wykracza poza zasoby objęte projektem. Planowane przedsięwzięcie stworzy podstawy do dalszego rozwoju cyfrowych zasobów nauki oraz ich udostępniania., Strona 18
Cele szczegółowe to: udostępnienie unikatowej kolekcji książek i czasopism w różnych językach, przybliżenie i upowszechnienie osiągnięć europejskiej techniki i nauki, udostępnienie twórczości naukowej uczelni wyższych, promocja otwartej nauki, udostępnienie wszystkim zainteresowanym powstałej w ramach projektu otwartej aplikacji internetowej z innowacyjnymi usługami, budowanie świadomości istnienia wartościowych kolekcji wśród odbiorców, którzy nie mieli okazji się z nimi zapoznać lub nie wiedzieli o ich istnieniu, wzrost kompetencji cyfrowych pracowników wnioskodawców oraz użytkowników zasobów i nowoczesnego systemu, wzrost konkurencyjności nauki polskiej i zwiększenie jej roli w rozwoju gospodarczym. Cele projektu mogą być również zdefiniowane na poziomie jego oddziaływań, przez które rozumie się długofalowy wpływ projektu na polską naukę. Podstawowym oddziaływaniem będzie wzrost konkurencyjności nauki polskiej zwiększenie dostępu do bibliotek naukowych poprzez zastosowanie nowoczesnych technologii cyfrowych, w szczególności poza dużymi ośrodkami uniwersyteckimi, co przyczyni się do dyfuzji wiedzy poza te ośrodki również do mniejszych miast, ośrodków wiejskich. Dodatkowo przedsięwzięcie wpłynie na zwiększenie roli nauki w rozwoju gospodarczym w Polsce poprawa warunków pracy naukowców z ośrodków w całym kraju, która zostanie uzyskana poprzez ułatwienie dostępu do cyfrowych zasobów nauki, przełoży się bezpośrednio na efekty osiąganych prac, a co za tym idzie również na wzrost znaczenia nauki w rozwoju gospodarczym. Efektem realizowanego projektu będzie wzbogacenie nauki i upowszechnianie wiedzy z zakresu rozwoju nauk technicznych, przyrodniczych, architektury, sztuki, historii, kulturoznawstwa. Warto nadmienić, że z całości kolekcji przeznaczonej do udostepnienia on-line około 80% druków posiada znaki własnościowe: ekslibrisy, pieczątki i odręczne podpisy, notatki, dedykacje autorskie i od wydawców. Ponadto pieczątki nieistniejących już antykwariatów, księgarń, zakładów introligatorskich, bibliotek i instytucji kulturalnych, ceny książek i opraw. Cennym uzupełnieniem książek z kolekcji, głównie tych z zakresu hydrotechniki i architektury są bogate materiały ilustracyjne, w formie map, planów, projektów, rycin, fotografii. Wartość kolekcji podnoszą zachowane oryginalne, niekiedy bogato zdobione oprawy. Z uwagi na historyczny charakter kolekcji, jej unikatowość i znaczenie ważne jest, aby druki zachować w jak najlepszym stanie. Strona 19
Przedmiotowy projekt należy rozpatrywać również w kontekście tych zaleceń. Dzięki projektowi zostaną zdigitalizowane zostaną zasoby nauki i zasoby będące w posiadaniu administracji publicznej, celem ich powszechnego udostępnienia i ponownego wykorzystania. Zgodnie z Zaleceniem Komisji Europejskiej z dnia 17 lipca 2012 w sprawie dostępu do informacji naukowej i jej ochrony dążenie do zapewnienia otwartego dostępu do wyników badań finansowanych ze środków publicznych powinno również dotyczyć danych badawczych i naukowych. Z punktu widzenia udostępniającego zbiory, jak również użytkowników końcowych, konieczne jest zapewnienie odpowiedniego systemu do zarządzania, przetwarzania, przeszukiwania i udostępniania cyfrowych zasobów naukico w konsekwencji pozwoli na sprawne włączanie zbiorów do zasobów europejskich i światowych. Zakres zbiorów posiadanych przez partnerów projektu wykracza poza objęte projektem. Planowane przedsięwzięcie stworzy podstawy do dalszego rozwoju cyfrowych zasobów nauki oraz ich udostępniania: udostępnienie unikatowej kolekcji książek i czasopism; przybliżenie i upowszechnienie osiągnięć europejskiej techniki i nauki; udostępnienie twórczości naukowej uczelni wyższych; promocja otwartej nauki; udostępnienie wszystkim zainteresowanym powstałej w ramach projektu otwartej aplikacji internetowej z innowacyjnymi usługami; budowanie świadomości istnienia wartościowych kolekcji wśród odbiorców, którzy nie mieli okazji się z nimi zapoznać lub nie wiedzieli o ich istnieniu; wzrost kompetencji cyfrowych pracowników wnioskodawców oraz użytkowników zasobów i nowoczesnego systemu; wzrost konkurencyjności nauki polskiej i zwiększenie jej roli w rozwoju gospodarczym. W kontekście otwartego dostępu do informacji naukowej a także digitalizacji danych projekt realizuje misję: zapewnienie zunifikowanego dostępu do danych i usług oraz opieka nad krajowymi zbiorami bibliotecznymi; udostępnianie danych, produktów oraz usług poprzez Internet i inne media. Strona 58
4.2 Odbiorcy projektu Liderem projektu i jego głównym Beneficjentem jest uczelnia wyższa Politechnika Krakowska, reprezentowana przez Bibliotekę Politechniki Krakowskiej oraz Partner Akademia Górniczo-Hutnicza w Krakowie, reprezentowana przez Wydział Informatyki, Elektroniki i Telekomunikacji Akademii Górniczo-Hutniczej oraz Bibliotekę Główną AGH.Partnerzy zamierzają udostępnić w sposób otwarty, a więc nieodpłatnie i przy jak najmniejszych barierach dla ich ponownego wykorzystania zasoby danych z zakresu nauk technicznych przy pomocy innowacyjnego środowiska informatycznego. Udostepnienie cyfrowych zasobów zostanie poprzedzone digitalizacją zbiorów oraz pracami z zakresu konserwacji zachowawczej najcenniejszych kolekcji zbiorów bibliotecznych należących do europejskiego dziedzictwa naukowego, zgromadzonych przez Bibliotekę Politechniki Krakowskiej oraz Bibliotekę Główna Akademii Górniczo-Hutniczej.. W ramach struktury organizacyjnej PK jednostką organizacyjną, która będzie bezpośrednio implementować prezentowany projekt oraz odpowiadać za osiągnięcie jego produktów, rezultatów i oddziaływań będzie Biblioteka PK. Jednostka ta bezpośrednio skorzysta również z wyników projektu, głównie w kontekście poprawy stanu zachowania i możliwości zaspokajania potrzeb użytkowników w zakresie dostępu do zbiorów bibliotecznych oraz informacji naukowej. Zadanie to wynika ze statutu PK w zakresie załącznika nr 13 pn. Regulamin systemu biblioteczno-informacyjnego Politechniki Krakowskiej. Również Biblioteka Główna AGH uzyska możliwość rozpowszechnienia kolekcji unikatowych zbiorów drukowanych (czasopism), co wpisuje się w statutowe zadania AGH wynikające z Załącznika nr 5 do Statutu uczelni: Organizacja i funkcjonowanie systemu biblioteczno-informacyjnego Akademii Górniczo-Hutniczej. Przedmiotowy projekt zakłada szerokie oddziaływania w odniesieniu do rozwoju nauk technicznych, gospodarki i kapitału ludzkiego. W ramach projektu zidentyfikowano potencjalną grupę jego odbiorców na podstawie obecnej struktury wypożyczających i korzystających ze zbiorów na miejscu oraz online, a także doświadczeń płynących z obserwacji efektów zaangażowania poszczególnych użytkowników w wyniku aktualnie realizowanych tego typu projektów w Polsce i na świecie. Można wskazać następujących jego interesariuszy: Międzynarodowa społeczność akademicka (pracownicy naukowi i dydaktyczni, studenci) Strona 60
Społeczność instytutów naukowo-badawczych polskich i zagranicznych Badacze, specjaliści (inżynierowie architekci, budowniczy, badacze historii techniki, górnictwa i hutnictwa, bibliofile, bibliotekoznawcy, historycy i kulturoznawcy) Uczniowie (techników i liceów) Globalna społeczność wirtualna (zbiorowość użytkowników internetu zainteresowana dostępem do literatury naukowej). Aktualnie Biblioteka Politechniki Krakowskiej posiada 17 615 zarejestrowanych użytkowników (stan na 31.12.2015), z czego 7 128 użytkowników posiada status aktywnie wypożyczających i korzystających ze zbiorów zgromadzonych przez bibliotekę. W 2015 roku odnotowano 2 593 517 pobrań dokumentów udostępnionych w ramach zbioru pozycji elektronicznych. Liczba ta systematycznie wzrasta z uwagi na coraz większą liczbę zdigitalizowanych dokumentów dostępnych w wersji cyfrowej. Należy zaznaczyć, że realizacja projektu Europejskie dziedzictwo techniczne upowszechnianie historycznych i współczesnych publikacji z zakresu nauk technicznych w innowacyjnym środowisku informatycznym będzie miała dodatkowo znaczenie dla budowy w Polsce społeczeństwa informacyjnego, w którym wszelkiego rodzaju technologie gromadzenia i transmisji informacji oraz danych są powszechnie dostępne, oraz kapitału społecznego (rozumianego, jako wiedza osadzona w relacjach i stosunkach społecznych, gdzie jego wartość opiera się na wzajemnych relacjach społecznych i zaufaniu jednostek, które dzięki niemu mogą osiągać więcej korzyści z ekonomicznego i społecznego punktu widzenia). Możliwość dostępu do najcenniejszych zasobów dziedzictwa nauki jest jednym z warunków harmonijnego rozwoju społeczno-gospodarczego, w tym szczególności z uwagi na potrzeby gospodarki w zakresie kształcenia przyszłych inżynierów. Dzięki realizacji projektu różnorodna działalność w zakresie nauk technicznych i przyrodniczych, architektury, historii sztuki, budownictwa, inżynierii lądowej i wodnej czy mechaniki zyska nowe przestrzenie aktywności w oparciu o szeroką dostępność informacji sektora publicznego. w tym kontekście należy też przyjąć pośrednie pozytywne oddziaływanie projektu na odbiorców prac twórców działających tych obszarach. Strona 61
Wariant inwestycyjny wybrany do realizacji W ramach wybranego wariantu upowszechnione on-line zostaną zasoby zgromadzone w Bibliotece Politechniki Krakowskiej i Akademii Górniczo-Hutniczej mające duże znaczenie dla obszaru nauki oraz gospodarki, które obecnie nie są udostępniane w formie cyfrowej. Przeprowadzona inwentaryzacja wykazała, że objęte projektem powinny zostać następujące zasoby (kolekcje): Z Biblioteki Politechniki Krakowskiej (łącznie 5 549 woluminów): Strona 65
Do udostępnienia w ramach projektu wybrano najstarsze wydania wyodrębnione ze zbiorów historycznych BPK. Ich zasięg chronologiczny obejmuje okres od XVII-XX wieku. Wraz z założeniem w 1945 roku Politechniki Krakowskiej zaistniała potrzeba szybkiego uruchomienia biblioteki, a co za tym idzie zgromadzenia odpowiedniego księgozbioru. Jego zalążkiem były druki pochodzące z: tzw. zbiorów zabezpieczonych (porzucone zbiory poniemieckie instytucji publicznych, szkół, kolekcji prywatnych); zbiorów likwidowanych polskich instytucji; darów osób prywatnych; aukcji antykwarycznych. Zakres tematyczny zbiorów związany jest więc z ówczesnymi potrzebami wydziałów i kierunkami studiów w Politechnice Krakowskiej (architektura, historia sztuki, inżynieria lądowa i wodna, mechanika). Z najstarszego księgozbioru wyodrębniono 5 kolekcji, które znajdują się w osobnym magazynie. Dwie z tych kolekcji stanowią przedmiot projektu. Z kolekcji zbiorów drukowanych Biblioteki Politechniki Krakowskiej w ramach projektu digitalizacji zostaną poddane: Kolekcja Lwowiana (656 tytułów) Kolekcja Lwowiana stanowi zbiór o niewątpliwych wartościach merytorycznych. O wyborze kolekcji Lwowiana do objęcia projektem zadecydowała unikatowość poszczególnych egzemplarzy wchodzących w jej skład. Na kartach druków znaleźć można wiele cennych informacji będących odbiciem dziejów uczelni i osób z nią związanych (ekslibrisy, pieczątki i odręczne podpisy, notatki, dedykacje autorskie). Księgozbiór jest niedocenianym źródłem wiedzy o dziedzictwie historycznym i kulturowym społeczeństwa polskiego końca XIX i pierwszej połowy XX wieku. Kolekcję tworzą publikacje wydane przed 1945 rokiem we Lwowie oraz dotyczące Lwowa. Najstarszy dokument w tej kolekcji pochodzi z roku 1747, a zasięg chronologiczny pozostałych dokumentów obejmuje lata 1864-1939. Kolekcja stanowi bogaty zbiór książek, głównie podręczników z dziedzin technicznych. Większość autorów to wykładowcy Politechniki Lwowskiej, np. Maksymilian Thullie, Stefan Władysław Bryła, Zygmunt Weyberg, Maksymilian Matakiewicz. Odrębną grupę tematyczną stanowi literatura piękna polska i obca, przewodniki turystyczne, dzieła dotyczące historii Polski i świata oraz historii sztuki. Wszystkie tytuły są opracowane w katalogu kartkowym BPK, zeskanowanym i udostępnianym w wersji elektronicznej z witryny internetowej Biblioteki PK (http://hps.biblos.pk.edu.pl/cik/). W obecnej wersji udostępnionego katalogu kartkowego nie jest możliwe, aby użytkownik przy wpisaniu hasła autorskiego lub tytułowego otrzymał listę rezultatów. Po wpisaniu hasła w oknie wyszukiwawczym system pokaże zakres, w którym powinna być zaszeregowana karta. Dopiero sporządzenie rekordu Strona 66
bibliograficznego w formacie MARC21 w systemie bibliotecznym Koha umożliwi sprawne i efektywne wyszukiwanie konkretnego rekordu. Powstałe rekordy bibliograficzne będą widoczne i wzbogacą bazę centralnego katalogu zbiorów polskich bibliotek naukowych Narodowego Uniwersalnego Katalogu Centralnego (NUKAT). Ponadto przystosowanie zbiorów do rzeczywistości cyfrowej i sieciowej spowoduje pokonanie bariery czasu i przestrzeni. Z całej kolekcji Lwowiana 656 tytułów w systemie Koha opracowanych jest 427 rekordy bibliograficzne, tylko 8 tytułów dostępnych jest w wersji cyfrowej w Repozytorium BPK (http://suw.biblos.pk.edu.pl/). Zbiory z tej kolekcji nie są wypożyczane na zewnątrz biblioteki. Kolekcja druków wydanych w XVIII XX w. (4 893 tytuły) Kolekcja druków wydanych w XVIII XX w. obejmuje druki polskie i obce wydane do 1918 r. Pochodzi w większej części z księgozbioru zabezpieczonego (w jej obrębie znajdują się książki ze znakami własnościowymi nieistniejących już instytucji, szkół ziem obszaru kultury niemieckiej). W kolekcji znajdują się również pozycje wydane po 1918 r. Zaliczono je do omawianej kolekcji, aby zachować ciągłość w przypadku serii wydawniczych, których pierwsze numery ukazały się przed 1918 r. Tematyka zbiorów to architektura, historia sztuki, nauki techniczne i przyrodnicze, budownictwo lądowe oraz najliczniej reprezentowane nauki dotyczące budownictwa wodnego (żegluga śródlądowa i morska, hydrologia, hydrografia, geologia, porty, groble, kanały, śluzy, latarnie morskie, budowa statków). Znaczna ilość pozycji z dziedziny hydrotechniki pochodzi z biblioteki CK Pruskiego Ministerstwa Robót Publicznych (KK Preussische Ministerium für öffentliche Arbeiten). Ministerstwo działające w latach 1897-1918 miało ożywione kontakty z podobnymi instytucjami całego świata, stąd też w zbiorach biblioteki PK oprócz wydań europejskich (włoskie, francuskie, angielskie, szwajcarskie, węgierskie, krajów skandynawskich, rosyjskie) są również te wydawane w Azji i Ameryce (Washington, Chicago, Buenos Aires). Ten obszerny księgozbiór wydaje się być związany z ożywieniem powstałego we Lwowie w 1759 roku projektu połączenia drogą morską morza Bałtyckiego z morzem Czarnym, a w następnym stuleciu planami rozbudowy dróg wodnych w całej Europie. Wśród kolekcji cenny zasób stanowią zbiory ikonograficzne. Są to albumy, ryciny luźne i w woluminach, fotografie w albumach sztucznych, ekslibrisy. Wzbogaceniem kolekcji są obszerne wydawnictwa informacyjne: encyklopedie i leksykony oraz materiały z konferencji czy kongresów. Cenną częścią kolekcji są liczne wydawnictwa albumowe, mające przede wszystkim wartość dokumentalną, zwłaszcza te przedstawiające widoki nieistniejących już zabytków architektury ziem zachodnich (ogólne widoki miast, plany, poszczególne budowle, wyposażenie budynków). Strona 67
W skład kolekcji wchodzi około 7 000 tytułów, do projektu wybrano natomiast 4 893 tytuły, gdyż przy wyborze poszczególnych druków kierowano się ich unikatowością, tzn. brakiem ich cyfrowej wersji w otwartym dostępie (wyjątek stanowią druki wydane w ramach serii wydawniczych lub wydawnictwa wielotomowego aby utworzyć jak najbardziej kompletny zbiór nie zastosowano powyższego kryterium). Wszystkie tytuły są opracowane w katalogu kartkowym BPK, zeskanowanym i udostępnianym w wersji elektronicznej z witryny internetowej Biblioteki PK (http://hps.biblos.pk.edu.pl/cik/). W obecnej wersji udostępnionego katalogu kartkowego nie jest możliwe, aby użytkownik przy wpisaniu hasła autorskiego lub tytułowego otrzymał listę rezultatów. Po wpisaniu hasła w oknie wyszukiwawczym system pokaże zakres, w którym powinna być zaszeregowana karta. Sporządzenie rekordu bibliograficznego w formacie MARC21 w systemie bibliotecznym Koha umożliwi sprawne i efektywne wyszukiwanie konkretnego rekordu. Powstałe rekordy bibliograficzne będą widoczne i wzbogacą bazę centralnego katalogu zbiorów polskich bibliotek naukowych Narodowego Uniwersalnego Katalogu Centralnego (NUKAT). Ponadto przystosowanie zbiorów do rzeczywistości cyfrowej i sieciowej spowoduje pokonanie bariery czasu i przestrzeni. Niewielka ilość druków kolekcji jest opracowana w systemie Koha i dostępna w wersji cyfrowej w Repozytorium BPK (http://suw.biblos.pk.edu.pl/). Zbiory z kolekcji nie są wypożyczane na zewnątrz biblioteki. Udział procentowy kolekcji Biblioteki Politechniki Krakowskiej (Lwowiana i druków wydanych w XVIII XX w., tj. łącznie 5 549 woluminów) w stosunku do całości zbiorów bibliotecznych BPK (215 890 woluminów) stanowi 2,57% kolekcji. Z Biblioteki Głównej Akademii Górniczo-Hutniczej: Kolekcja czasopism XIX i XX w. (498 numerów) Do udostępnienia w ramach projektu wybrano czasopisma historyczne, które stanowią część kolekcji historycznej Biblioteki Głównej AGH w Krakowie. Z uwagi na uwarunkowania historyczne i związane z nimi zniszczenia wielu cennych zabytków piśmiennictwa polskiego utrwalenie powyższej kolekcji jest niezmiernie istotne. Także tematyka techniczna dominująca w artykułach zawartych w czasopismach może stanowić dla badacza historii techniki cenne źródło informacji. Poniższe zbiory, w zakresie podanych roczników, nie zostały do tej pory zdigitalizowane. Objęte projektem będą: Oleum: tygodniowe pismo statystyczno-informacyjne dla spraw przemysłu oleju skalnego w Polsce. Drohobycz: Marcin Witkower, 1935-39. Dźwignia: organ Towarzystwa Ukończonych Techników we Lwowie. Lwów: [s.n.], 1877-1882. Strona 68
Czasopismo Górniczo-Hutnicze: poświęcone sprawom rodzimego przemysłu górniczohutniczego wychodzi co miesiąc w Krakowie. Kraków: Wydaw. Związku Górników i Hutników Polskich w Austryi, 1916-1920. Przegląd Górniczo-Hutniczy: czasopismo poświęcone sprawom przemysłu górniczego i hutniczego, wychodzi 1-go i 15-go każdego miesiąca. Dąbrowa: Stanisław Ciechanowski, 1907. W wariancie wybranym do realizacji część zasobów bibliotecznych przeznaczonych do digitalizacji zostanie do niej odpowiednio przygotowana zabezpieczona i zakonserwowana. Wnioskodawca przeprowadzi fumigację zasobów, odkwaszenie w instalacji w instalacji Bookkeeper III i konserwację zachowawczą. Technika Bookkeeper może być stosowana do książek w całości i pojedynczych kart, bez selekcji ze względu na użyty w nich rodzaj klejów, farb czy tuszy. Nie nadaje się tylko do odkwaszania papieru o niskiej porowatości. w rezultacie odkwaszania, czas życia książki czy dokumentu znacznie się przedłuży, a papier zostanie oczyszczony i wzmocniony, co nie zostałoby osiągnięte w przypadku zlecenia na zewnątrz usługi digitalizacji. Strona 69
8 Analiza techniczna projektu 8.1 Opis techniczny projektu W ramach przedsięwzięcia bezpłatnie upowszechnione w Internecie zostaną zasoby zgromadzone w Bibliotece Politechniki Krakowskiej i Bibliotece Głównej Akademii Górniczo-Hutniczej mające duże znaczenie dla obszaru nauki oraz gospodarki, które obecnie nie są udostępniane w formie cyfrowej. Przeprowadzona inwentaryzacja wykazała, że objęte projektem powinny zostać następujące zasoby (kolekcje) BPK: Kolekcja Lwowiana (656 tytułów), Kolekcja druków wydanych w XVIII XX w. (4 893 tytuły), oraz BG AGH: Kolekcja czasopism XIX i XX w. (498 numerów). Zasoby te stanowią unikalne zbiory obu bibliotek, a fakt ten nakłada na nie szczególny obowiązek w zakresie digitalizacji posiadanego zasobu i udostępnienia w sposób nieograniczony jego cyfrowych kopii studentom, badaczom oraz wszystkim osobom zainteresowanym naukowym dziedzictwem technicznym, które obecnie są udostępniane w ograniczony sposób, na miejscu w czytelniach obu bibliotek. Przeznaczony do digitalizacji zbiorów druków i czasopism poddany zostanie w ramach niniejszego projektu opracowaniu, zgodnemu z obowiązującymi normami, które pozwolą na stworzenie wszechstronnego instrumentarium wyszukiwawczego udostępnionego bezpłatnie w nowym systemie informatycznym, umożliwiającego szczegółowe rozpoznanie jego struktury i zawartości, tak pod względem treściowym, jak i formalnym. Udostępnianie treści cyfrowych będzie się odbywało zgodnie z właściwymi przepisami prawa (w szczególności z poszanowaniem praw własności intelektualnej). Wnioskodawca i Partner projektu udostępni on-line posiadane zasoby publicznie, z możliwością ich dowolnego - w granicach prawa wykorzystania (pobierania, kopiowania, dalszego udostępniania itd.). Zachowane zostaną reguły udostępniania wyznaczone przez obowiązującą Ustawę o prawie autorskim. Lider i Partner projektu nie będą pobierali opłat za udostępnianie zbiorów on-line. Wszystkie opisy i cyfrowe kopie będą dostępne bezpłatnie i bez ograniczeń, na zasadach właściwych dla domeny publicznej. Realizowany projekt jest zgodny ze standardami dostępności treści internetowych (WCAG 2.0), m.in. poprzez fakt, iż proces digitalizacji odczytanie zawartości tekstowej obejmował będzie zastosowanie technologii OCR (Optical Character Recognition). Projekt wykracza ponad minimalne standardy cyfrowego udostępniania Informacji Sektora Publicznego poprzez zapewnienie dostępności na poziomie wyższym niż minimum określone Strona 108
w wytycznych WCAG 2.0 wskazane w Rozporządzeniu Rady Ministrów z dn. 12 kwietnia 2012r. w sprawie Krajowych Ram Interoperacyjności. Wnioskodawca zrealizuje cele projektu przy pomocy działań polegających głównie na digitalizacji, opracowaniu zbiorów, utworzeniu innowacyjnego systemu, w którym zasoby nauki będą udostępniane i szeregu prac inwestycyjnych, umożliwiających realizację tych zadań przez Lidera i Partnera projektu. Prace inwestycyjne poprzedzone zostaną opracowaniem koncepcji systemu i modelu działań związanych z udostępnianiem zasobów naukowych, który zostanie poddany testom wśród ekspertów i grupy interesariuszy projektowanego rozwiązania technicznego. W wyniku przeprowadzonych analiz określono wstępny zakres i kształt projektowanych rozwiązań technicznych. W ramach prac nad koncepcją udostępniania zasobów opracowana i wdrożona zostanie polityka tzw. otwartego mandatu na Politechnice Krakowskiej prawnego zobowiązania do zapewnienia otwartego dostępu do utworów oraz przedmiotów praw pokrewnych. W tym celu konieczne będzie skorzystanie ze specjalistycznego merytorycznego doradztwa prawnego (m.in. w zakresie prawa autorskiego). Etap ten obejmował będzie również tłumaczenie interfejsu systemu na język angielski i niemiecki, co znacznie przyczyni się do poszerzenia dostępności zasobów. Partner projektu przeprowadzi następnie prace informatyczne, w wyniku których utworzony zostanie innowacyjny system umożliwiający zarządzanie, przetwarzanie, przeszukiwanie i udostępnianie cyfrowych zasobów nauki. Opracowana zostanie architektura i rdzeń aplikacji, treści zasobu, graficzny interfejs użytkownika, zaindeksowane treści i metadane oraz wyszukiwanie zasobów, wykonane interfejsy API, Dla prawidłowej eksploatacji systemu i zarządzania danymi przewiduje się rozbudowę i późniejsze utrzymanie infrastruktury Politechniki Krakowskiej do eksploatacji systemu i zarządzania danymi, w tym dostawę, konfigurację i uruchomienie infrastruktury sprzętowej dla BPK (Serwer NAS z osprzętem rack 19" wraz z 28 dyskami oraz pamięć taśmowa napęd taśmowy LTO-6; loader 8/1 rack 19" z osprzętem i 48 nośnikami danych), stworzenie i utrzymanie strony internetowej projektu, blogu i utrzymywanie infrastruktury sieciowej. Realizowany w ramach projektu system zostanie uruchomiony na dedykowanym do tego celu serwerze, zakupionym w ramach projektu, który zostanie umieszczony w siedzibie Wnioskodawcy. Serwer zostanie włączony w strukturę sieci lokalnej Wnioskodawcy i będzie udostępniony w sieci Internet pod stałym, publicznym adresem IP oraz stałym adresem DNS. Przed właściwą digitalizacją zbiorów przeznaczonych do ucyfrowienia ważnym elementem będzie odpowiednie przygotowanie zasobów do digitalizacji. Przeprowadzone zostanie ich zabezpieczenie i konserwacja, obejmujące fumigację zasobów bibliotecznych będących przedmiotem projektu Strona 109
z magazynu A, ich odkwaszenie w instalacji Bookkeeper III (ok. 500 kg książek) i konserwację zachowawczą wybranych zbiorów drukowanych (objętych nią zostanie ok. 1/3 1850 woluminów przeznaczonych do digitalizacji). Wnioskodawca, ze względów wskazanych w analizie rozwiązań alternatywnych, będzie sam przeprowadzał digitalizację posiadanych zbiorów. W tym celu utworzona zostanie Pracownia Digitalizacji Biblioteki Politechniki Krakowskiej. Prace z tym związane obejmą adaptację i dostosowanie pomieszczenia czytelni Biblioteki Wydziału Mechanicznego na Pracownię Digitalizacji BPK, tj.: roboty instalacyjne elektryczne, instalowanie urządzeń klimatyzacyjno-wentylacyjnych, roboty malarskie, wymianę wykładziny, rozbudowę instalacji elektrycznej i sieci komputerowej, montaż systemu zabezpieczenia i kontroli dostępu, wyposażenie Pracowni Digitalizacji w sprzęt specjalistyczny, które obejmowało będzie dostawę, konfigurację i uruchomienie infrastruktury sprzętowo-programowej. Składała się ona będzie z: Profesjonalnych skanerów do digitalizacji: Skaner profesjonalny do formatu A-1 z dodatkowymi opcjami (komputer, monitor, oprogramowanie, wydłużona gwarancja), Skaner profesjonalny do formatu A-2 z dodatkowymi opcjami (komputer, monitor, oprogramowanie wydłużona gwarancja), Stanowiska do digitalizacji: 2 zestawy, każdy składający się z: Komputera z monitorem, Skanera płaskiego A4, Skanera płaskiego A3. Właściwy proces digitalizacji (skanowanie zbiorów) wiązał się będzie dodatkowo z zakupem i dostawą specjalistycznego oprogramowania do opracowania zasobów i szkoleń dla użytkowników (oprogramowanie do przeprowadzenia OCR plików przekształcające zeskanowane dokumenty, cyfrowe zdjęcia dokumentów i pliki PDF na postać edytowalną, oprogramowanie do obróbki obrazów, tworzenia e-kursów, prezentacji i demonstracji, grafiki) oraz przeszkoleniem osób wykonujących to zadanie (operatorów skanerów). Zdigitalizowane zasoby zostaną następnie opracowane w pracowni metadanych. Będą one opracowane pod względem formalnym i rzeczowym w systemie bibliotecznym Strona 110
zastosowany zostanie format katalogowania danych bibliograficznych w formie elektronicznej MARC. Dla zdigitalizowanych zasobów opracowane zostaną metadane (zbiory informacji szczegółowo opisujące każdy plik), a następnie zasoby cyfrowe zostaną zaadaptowane do udostępniania w stworzonym systemie (wykonany zostanie ich OCR, obróbka graficzna). Realizacja projektu wiązała się będzie także z szeroką promocją zasobów BPK udostępnianych za pośrednictwem stworzonego systemu przeprowadzona zostanie kampania informacyjnopromocyjna i szkolenia użytkowników. Udostępnianie zasobów nauki odbywało się będzie z uwzględnieniem i zachowaniem praw autorskich, zgodnie z Ustawą z dnia 4 lutego 1994 r. o prawie autorskim i prawach pokrewnych (Dz.U. 1994 nr 24 poz. 83 z późn. zm.). W opracowanym, przez Partnera projektu, systemie umieszczone będą: materiały wolne od ograniczeń praw autorskich, z tzw. domeny publicznej; materiały do których majątkowe prawa autorskie są oczywiste i należą do uczelni lub do autorów. Metadane zasobów zamieszczonych w systemie będą udostępniane bez ograniczeń przez Internet, podobnie jak i pełne teksty dokumentów zarchiwizowanych w systemie, które będą z założenia dostępne w sposób otwarty dla wszystkich zainteresowanych. Projekt obejmował będzie tzw. domenę publiczną zasoby, które nie są objęte majątkowym prawem autorskim nie objęte restrykcjami prawa autorskiego lub co, do których prawa te wygasły. Utwory te są własnością publiczną, co oznacza, że dostępne są dla każdego, do wykorzystania w dowolnym celu. Zdigitalizowane zostaną najstarsze zbiory, których zachowanie jest sprawą najpilniejszą, a ich udostępnianie nie jest ograniczone tym prawem. Zgodnie ze współczesnym polskim i europejskim prawem autorskim oryginalne prace literackie, dzieła sztuki, utwory muzyczne itp. są chronione prawem od momentu ich stworzenia aż do 70 lat od śmierci autora/współtwórców, daty pierwszej publikacji lub powstania utworu. Po tym czasie wygasa prawo autorskie, a utwór wchodzi do domeny publicznej. Materiały, które trafiają do domeny publicznej, i które zostaną zdigitalizowane i udostępnione w ramach projektu, są własnością wspólną dostępną dla każdego do wykorzystania w swobodny sposób i w dowolnym celu, z poszanowaniem praw autorskich osobistych. Będzie można je swobodnie publikować i rozpowszechniać, gdyż z materiałów w domenie publicznej można korzystać w szerokim zakresie, bez konieczności uzyskiwania zgody na kopiowanie, modyfikowanie czy rozpowszechnianie, zarówno do celów komercyjnych, jak i niekomercyjnych. Strona 111
Zasady udostępniania zasobów przewidują, że będą one udostępniane użytkownikom bez ograniczeń czasowych i terytorialnych. Zdigitalizowane zasoby będą udostępniane całkowicie nieodpłatnie, bez względu na typ użytkowników. Wszystkie zasoby zamieszczone w systemie będzie można zgodnie z prawem przeglądać, zapisywać na swój komputer i cytować. Realizowany w ramach projektu system informatyczny będzie miał za zadanie udostępnić zgromadzone zasoby wraz z opisującymi je metadanymi. Będzie pozwalał na przeglądanie zasobów, ich wyszukiwanie oraz pobieranie ich treści. System będzie podzielony na dwie, ściśle współpracujące ze sobą części: 1) Podsystem udostępniania zasobów. 2) Podsystem opracowania zasobów. Oba podsystemy będą operowały na wspólnej bazie danych, w której gromadzone będą informacje o zasobach (metadane) oraz treść zasobów w różnych formatach. 1) Podsystem udostępniania zasobów Podsystem udostępniania zasobów będzie aplikacją webową, udostępniająca graficzny interfejs użytkownikom sieci Internet za pośrednictwem standardowej przeglądarki stron internetowych. Będzie on dostępny bez ograniczeń, w formie publicznej, dynamicznej strony internetowej, dla każdego użytkownika mającego połączenie z globalną siecią komputerową. Interfejs będzie automatycznie dostosowywany do rodzaju urządzenia, z którego korzysta końcowy użytkownik (komputer, telefon, tablet), by zapewnić maksymalny komfort i ergonomię użytkowania. Interfejs podsystemu będzie projektowany zgodnie z wytycznymi normy ISO 9241-210:2010 Ergonomics of human-system interaction -- Part 210: Human-centred design for interactive systems. W związku z tym docelowi użytkownicy zostaną zaangażowani w całość procesu projektowania i realizacji interfejsu: projektowanie poprzedzone zostanie analizą kontekstu wykorzystania systemu; w fazie projektowania powstanie analiza potrzeb użytkownika oraz specyfikacja jego wymagań; prototyp interfejsu powstanie w formie specyfikacja interakcji oraz specyfikacja interfejsu; zrealizowany interfejs będzie poddany ocenie przez grupę docelowych użytkowników. Interfejs nie powstanie w pojedynczym etapie, ale będzie realizowany przyrostowo, bo możliwe było dopracowanie kolejnych dodawanych aspektów. w proces projektowania i realizacji interfejsu zaangażowani zostaną profesjonalni graficy oraz specjaliści do spraw ergonomii tego typu rozwiązań. Dodatkowo zakłada się, że stworzony podsystem będzie zapewniał zgodność interfejsu ze standardem WCAG na poziomie AA we wszystkich aspektach dotyczących opracowywanego systemu. Strona 112
Wprowadzone zostaną także rozwiązanie spełniające wytyczne poziomu AAA, kluczowe dla prezentacji rozważanych zasobów, takie jak: 1.4.6: kontrast elementów interfejsu na poziomie 7:1 lub większym, 1.4.8: odpowiednie formatowanie tekstu i zachowanie odstępów między wierszami i akapitami, 2.2.5: powrót do poprzedniego miejsca po wygaśnięciu sesji, 2.4.8: ciągła dostępność informacji o miejscu, w którym znajduje się użytkownik (breadcrumb). Pełna zgodność ze standardem WCAG2.0 na poziomie AA oraz częściowa zgodność na poziomie AAA zostaną zweryfikowane przez niezależny zespół ekspertów z Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie. Szczegółowa analiza zgodności ze standardem Web Content Accessibility Guidelines 2.0 zostanie przedstawiona w niżej w podrozdziale Wymagania w zakresie interoperacyjności. Interfejs użytkownika będzie dostępny w wielu językach. W ramach projektu planuje się tłumaczenie wszystkich elementów interfejsu na język polski, angielski i niemiecki, w przyszłości możliwe będzie łatwe dodanie kolejnych wersji językowych. Udostępniane w ramach projektu zasoby i metadane je opisujące będą dostępne bez ograniczeń. Użytkownik nie będzie musiał zakładać kont i wpisywać haseł by korzystać z systemu i pobierać treść zasobów. System udostępni techniczną możliwość ograniczania dostępu do niektórych zasobów czy kolekcji, która może okazać się przydatna w przyszłości. Dla wygody użytkowników możliwe będzie zintegrowanie systemu z istniejącymi mechanizmami uwierzytelniania, takimi jak LDAP. Użytkownik systemu będzie mógł przeglądać zgromadzone zasoby wykorzystując różne techniki wyszukiwania interesującej go treści: przeglądanie kolekcji zasobów określonego typu, wyszukiwanie według słów kluczowych i konkretnych wartości metadanych, wyszukiwanie fasetowe (faceted search), wyszukiwanie w pełnej treści zasobów. System będzie udostępniał pełną treść zasobów w różnych formatach, wykorzystując otwarte standardy: Portable Document Format - PDF, interaktywna przeglądanie kolejnych stron zasobów w formie obrazów JPEG, przeglądanie oryginałów zdigitalizowanej treści w formacie TIFF w wysokiej rozdzielczości, możliwość pobrania treści w otwartym formacie e-booków: epub lub MOBI. Dla zwiększenia użyteczności i dostępności zasobów wspierane będzie także generowanie danych bibliograficznych w popularnych formatach (BibTeX, EndNote) oraz integracja z portalami Strona 113
społecznościowymi. Udostępnione zostaną także kanały RSS dla kolekcji zasobów w systemie. Dodatkowo opracowane zostaną mechanizmy interakcji użytkowników z redaktorami i administratorami systemu. Mechanizm zgłaszania uwag będzie generował zadania dla redaktorów w sytuacji, gdy użytkownik będzie chciał zadać pytanie lub gdy system wykryje niepoprawne lub niekompletne dane (np. błędne odnośniki). Integracja systemu z innymi systemami do gromadzenia, udostępniania czy wyszukiwania zasobów będzie realizowana za pomocą uznanego i szeroko stosowanego w dziedzinie wymiany metadanych protokołu OAI-PMH w wersji 2.0. Protokół pozwoli zewnętrznym systemom na pobieranie metadanych o zgromadzonych zasobach w otwartym formacie XML. Dane będą strukturalizowane zgodnie ze standardem ISO 15836-2003 (Dublin Core) z rozszerzeniami. Dodatkowo udostępniona zostanie usługa typu SOAP Web Service, która będzie oferowała analogiczną do OAI-PMH funkcjonalność. Podsystem udostępniania zasobów dostarczy otwarty dostęp do treści zasobów i metadanych je opisujących na poziomie 5 gwiazdek w skali 5 Star Open Data : Wszystkie dane dotyczące zgromadzonych zasobów będą dostępne w otwartych formatach i przystosowane do maszynowego przetwarzania (format Dublin Core); Każdy zasób będzie dostępny pod unikatowym adresem URI. Również wyniki wyszukiwania będą posiadały unikatowy URI pozwalający na stworzenie odnośników; Zasoby będą posiadały odnośniki do powiązanych zasobów w sieci (inne wersje, podobna tematyka). System będzie automatycznie weryfikował poprawność odnośników. Podczas działania system będzie nieustannie analizował, zliczał i logował zachodzące zdarzenia. Będzie monitorował czas wykonania poszczególnych operacji i alarmował administratorów w przypadku przekroczenia krytycznych wartości czasu reakcji czy ilości wykorzystanej pamięci. Zgromadzone dane o normalnych i wyjątkowych zdarzeniach w systemie posłużą do zapewnienia wysokiej jakości usługi poprzez usunięcie ewentualnych błędów w oprogramowaniu oraz zabezpieczanie systemu przed nieodpowiednim wykorzystaniem. Pozwolą także na generowanie statystyk wykorzystania systemu zawierających wartość następujących wskaźników: pobrań poszczególnych zasobów; wyszukań określonych zasobów; unikatowych użytkowników systemu; wyświetleń stron; nowo utworzonych zasobów; ranking najczęściej pobieranych zasobów. 2) Podsystem opracowania zasobów. Strona 114
Realizowany system będzie oparty o nowatorski, elastyczny model metadanych, w którym każda metadana będzie mogła być dodatkowo charakteryzowana kolejnymi metadanymi, tworząc hierarchiczną strukturę metadanych. System pozwoli na swobodne definiowanie typów metadanych niezbędnych do charakteryzowania udostępnianych zasobów. Przewiduje się udostępnienie możliwości definiowania typów metadanych w oparciu o następujące podstawowe typy danych: tekst; liczba całkowita lub rzeczywista; data; odnośnik (link); element słownika (indeksu); odnośnik do zasobu; odnośnik do elementu zewnętrznego systemu (zasobu, osoby, konta). Typy metadanych będą definiowane przez nazwę (np. title ) oraz typ danej (np. text ). Każdy typ metadanych będzie dodatkowo definiował wartości prezentowanej nazwy w różnych językach (np. Tytuł, Title, ) oraz listę typów meta-metadanych, które ten typ metadanych mogą dodatkowo charakteryzować (np. language definiujący język tytułu). Typy metadanych będą jednoznacznie mapowane na wartości zgodne ze standardem ISO 15836-2003 (Dublin-Core). System będzie pozwalał redaktorom na tworzenie nowych zasobów, edytowanie ich metadanych, dodawanie treści w odpowiednich formatach, przeprowadzanie procesu recenzji i publikowanie zasobów. Proces opracowywania zasobów będzie zintegrowany z mechanizmami przetwarzania zeskanowanych materiałów, takimi jak OCR, generowanie plików PDF, JPG, generowanie e-booków czy spisów treści. Drugą rolą w systemie będzie administrator baz zasobów, który będzie konfigurował strukturę zasobów. Będzie on tworzył rodzaje zasobów, kolekcje zasobów, słowniki (indeksy), oraz konfigurował sposób prezentacji poszczególnych kolekcji i rodzajów. Będzie także edytował statyczne strony informacyjne za pomocą zintegrowanego systemu CMS. Konta administratorów, redaktorów (i ewentualnie użytkowników) systemu będą zawierały zwykłe dane osobowe (imiona, nazwiska, adresy e-mail). System nie będzie przechowywał wrażliwych danych osobowych ani informacji niejawnych. Dostęp do danych osobowych realizowany będzie wyłącznie za pośrednictwem protokołu https, zabezpieczonego podpisanym certyfikatem. Po ukończeniu wdrożenia systemu przeprowadzone zastaną testy penetracyjne (black box oraz crystal box) przez niezależny zespół specjalistów z Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie. Strona 115
Techniczne aspekty realizowanego systemu Technologie programowe Podstawową technologią, na której oparta będzie implementacja systemu udostępniania zasobów, będzie PHP. Jest to bardzo popularna, szybko rozwijająca się i przenośna podstawa, która pozwala na tworzenie zaawansowanych systemów webowych. Systemy w PHP mogą działać pod praktycznie dowolnym systemem operacyjnym, są łatwe w utrzymaniu czy rozwijaniu i dostatecznie wydajne. Do realizacji systemu wykorzystane zostaną frameworki i biblioteki wspierające realizację typowych zadań. Rozważane jest wykorzystanie Symfony 2 oraz AngularJS 2. Poszczególne funkcjonalności systemu będą wymagały zastosowania dodatkowych bibliotek i narzędzi zapewniających zgodność ze standardami czy odpowiednią wydajność. Będą to na pewno: interfejs OAI-PMH, edytor stron statycznych WYSiWYG, generator plików PDF, generator e-booków, interfejs RSS. Dane gromadzone przez system będą przechowywane w dwóch systemach zarządzania bazami danych, z których jeden będzie przechowywał ustrukturalizowane dane na potrzeby edycji i prezentacji, a drugi będzie gromadził i aktualizował indeksy na potrzeby szybkiego wyszukiwania. Planowane jest wykorzystanie silnika dokumentowego MongoDB do przetwarzania metadanych oraz silnika indeksującego Elasticsearch do realizacji wyszukiwania pełnotekstowego. System zostanie zintegrowany z następującymi zewnętrznymi systemami i usługami: Rozpoznawanie tekstu w obrazie - ABBYY Cloud OCR SDK; Automatyczne tłumaczenie - Google Translate API; Autentykacja użytkowników LDAP. Wymagania w zakresie interoperacyjności Zgodnie z Rozporządzeniem Rady Ministrów z dnia 12 kwietnia 2012 r. w sprawie Krajowych Ram Interoperacyjności, zwanego dalej Rozporządzeniem, interoperacyjność tworzonego systemu zostanie osiągnięta przez ujednolicenie, rozumiane jako zastosowanie kompatybilnych norm, standardów i procedur. Zastosowane zostaną rozwiązania z zakresu interoperacyjności na poziomie organizacyjnym, semantycznym i technologicznym. Interoperacyjność na poziomie organizacyjnym zostanie osiągnięta przez opublikowanie na publicznej stronie projektu kompletnej informacji na temat sposobu udostępniania zasobów w systemie, w tym szczegółowej informacji technicznej na temat sposobów wykorzystania interfejsów programowych Strona 116
(API). Informacje o zasobach projektu oraz sposobie ich udostępniania (wraz z odnośnikami do szczegółów technicznych) będą publikowane i uaktualniane w Biuletynie Informacji Publicznej jednostek realizujących projekt. Interoperacyjność na poziomie semantycznym zostanie osiągnięta poprzez stosowanie struktur danych i znaczenia danych zawartych w tych strukturach określonych Rozporządzeniu. Interoperacyjność na poziomie technologicznym zostanie osiągnięta poprzez stosowanie minimalnych wymagań dla systemów teleinformatycznych, określonych w Rozporządzeniu. W szczególności cały proces projektowania, implementacji, wdrażania, eksploatowania, monitorowania, utrzymania i udoskonalania realizowanego systemu informatycznego i udostępnianych przez niego usług będzie realizowany przy zastosowaniu norm oraz uznanych w obrocie profesjonalnym standardów i metodyk. Proces będzie się odbywał z uwzględnieniem Polskich Norm PN-ISO/IEC 20000-1 i PN-ISO/IEC 20000-2 oraz uznanych na świecie standardów RFC i REC. Wszystkie dane tekstowe przetwarzane i przechowywane przez system oraz udostępniane na zewnątrz będą wykorzystywały kodowanie znaków według standardu Unicode UTF-8 określonego przez normę ISO/IEC 10646. Podstawowym interfejsem dostępowym do usług systemu będzie interfejs WWW, czy strona dostępna publicznie w ogólnoświatowej sieci Internet. Interfejs ten pozwoli urzytkownikom na nieskrępowany i nieograniczony miejscem lub wykorzystywaną technologią dostęp do zgromadzonych w systemie metadanych, plików zasobów i danych źródłowych. Zgodnie z wymaganiami określonymi w Rozporządzeniu strony WWW systemu będą udostępniane w formacie html oraz css. Zgodnie z Rozporządzeniem podstawowym formatem pełnych tekstów zasobów będzie pdf, który jest jednym z zalecanych formatów wymiany danych zawierających dokumenty tekstowe, tekstowograficzne lub multimedialne. Podstawowym formatem wymiany materiałów oryginalnych będzie tiff, który jest jednym z zalecanych formatów wymiany danych zawierających informację graficzną. Udostępniane zbiory materiałów będą kompresowane zgodnie z formatem zip, który jest jednym z zalecanych Rozporządzeniem formatów do kompresji (zmniejszenia objętości) dokumentów elektronicznych. Zgodnie z Rozporządzeniem, realizowany interfejs WWW będzie spełniał następujące wymagania standardu Web Content Accessibility Guidelines (WCAG 2.0): Wymaganie 1.1: Treści nietekstowe przedstawione użytkownikowi posiadają swoją tekstową alternatywę. System dostarczy tekstową wersję obrazków wykorzystywanych w interfejsie. System dostarczy tekstową wersję dokumentów udostępnianych przez system. Zostanie ona uzyskana poprzez zastosowanie techniki OCR. Strona 117