DSpace Instrukcja użytkownika Podstawowe informacje: Co to jest DSpace? Dostęp do danych Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości dostępu do archiwum Instrukcja obsługi Wygląd strony głównej Rozwijany panel boczny Informacje ogólne - podręczne instrukcje, FAQ, kontakt Przeglądanie repozytorium Pole wyszukiwania Szukanie zaawansowane - filtry Rejestracja użytkownika i logowanie Logowanie federacyjne Przesyłanie danych Funkcje przycisków Basic Info Who s involved Describe Upload Additional CMDI License Review Complete Pobieranie i eksportowanie zasobów Licencja Cytowanie Materiały szkoleniowe
Podstawowe informacje: Co to jest DSpace? Miejsce dostępu : https://clarin-pl.eu/dspace Repozytorium DSpace umożliwia użytkownikom tworzenie bezpiecznych archiwów, w których możliwe jest długoterminowe przechowywanie danych (dokumentów tekstowych i zasobów multimedialnych). Pliki są deponowane i archiwizowane w repozytorium bezpośrednio przez przeglądarkę internetową, nie wymaga to instalacji żadnego dodatkowego oprogramowania. Konieczne jest jedynie utworzenie konta użytkownika w systemie DSpace. Dostęp do danych Dane zdeponowane w repozytorium przechowywane są na serwerze i współdzielone między użytkownikami. Oznacza to, że każdy może mieć do nich wgląd (choć dopuszczalne jest ograniczenie dostępu: dowiedz się więcej ), a także pobrać je z repozytorium i wykorzystać. Zasoby zdeponowane w repozytorium dostają unikalny i trwały identyfikator. Umożliwia on wykorzystanie danych przez innych użytkowników, z zachowaniem obowiązku wskazania ich autora. Bez zalogowania możemy przeszukiwać repozytorium i pobierać zasoby. Bardziej zaawansowane opcje (np. eksport korpusu danych do systemu Inforex i dalsze przetwarzanie) wymagają zalogowania w systemie.
Sposoby wykorzystania: Po co umieszczać dane w repozytorium? DSpace jest bezpiecznym i darmowym systemem, stworzonym do udostępniania danych i administrowania nimi na potrzeby badań korpusowych. Repozytorium pozwala nie tylko współdzielić dane, wymieniać się nimi i współtworzyć rozbudowane korpusy. Publikowanie oparte jest w większości na zasadach Creative Commons (narzędzia zaś na open source), pozwala więc na uczestnictwo w globalnej sieci baz danych. System umożliwia gromadzenie danych w dowolnych formatach. Można zatem tworzyć archiwa, w których użytkownicy przechowywać będą zarówno pliki w formatach tekstowych, graficznych czy multimedialnych. Należy jednak pamiętać, że za pomocą repozytorium DSpace można przetwarzać wyłącznie różne formaty plików tekstowych (więcej w dalszej części instrukcji: Pobieranie zasobów ). Ponadto repozytorium pozwala na zaawansowane przeszukiwanie korpusów oraz pobieranie narzędzi do ich opracowywania. Umożliwia dostęp do danych z wielu miejsc, za pomocą rozmaitych narzędzi i systemów ( Google Scholar, VLO, DataCite, OLAC, Data Citation Index, arxive). Pobieranie i eksportowanie danych Repozytorium umożliwia użytkownikom deponowanie i pobieranie wybranych zasobów w różnych formatach (więcej w sekcji Pobieranie zasobów ). Po zalogowaniu uzyskujemy opcję eksportowania danych do innych, bardziej zaawansowanych narzędzi, np. Inforexa. Z poziomu DSpace a możemy także opisać zasoby metadanymi według standardu CMDI (Component Metadata Infrastructure), rozwijanego w ramach infrastruktury CLARIN. Jakie są możliwości dostępu do archiwum Dane opublikowane w repozytorium oparte są na licencjach umożliwiających darmowy i wolny dostęp dla wszystkich użytkowników. Po zalogowaniu dostępne stają się opcje przeglądania oraz udostępniania zasobów. Tworzenie i udostępnianie korpusu wymaga wyboru licencji ( lista wspieranych licencji ). Ze względu na różnorodne dane, jakie zawierają poszczególne korpusy (np. informacje wrażliwe,
wymagające anonimizacji), system przewiduje możliwość ograniczenia do nich dostępu (np. wgląd tylko dla użytkowników z afiliacjami akademickimi, itd.), które można zdefiniować w trakcie tworzenia korpusu lub (na specjalną potrzebę) po porozumieniu z administratorami. Instrukcja obsługi Wygląd strony głównej Rozwijany panel boczny. Podstawowe pole wyszukiwania w repozytorium. Podręczna lista popularnych tagów (autor, temat, język). Menu użytkownika ( dodawanie archiwów, obsługa korpusów, cytowanie, logowanie federacyjne ). Lista ostatnio dodanych do repozytorium archiwów ( What s new ).
Rozwijany panel boczny Z lewej strony repozytorium znajduje się panel, za którego pomocą możemy w uproszczony sposób uzyskać dostęp do podstawowych opcji: przejść do strony głównej projektu CLARIN-PL; wrócić na stronę główną repozytorium DSpace; skontaktować się z administratorami systemu; zarejestrować się lub zalogować; uzyskać dostęp do podstawowych narzędzi, aplikacji i zasobów udostępnionych w ramach infrastruktury CLARIN-PL. Informacje ogólne - podręczne instrukcje, FAQ, kontakt Z panelu menu użytkownika możemy dotrzeć do przydatnych informacji (w języku angielskim), które znajdują się w części General information : Deposit - instrukcja wyjaśniająca krok po kroku, jak zdeponować dane w repozytorium; Cite - informacje dotyczące trwałego identyfikatora, przypisywanego zdeponowanym zasobom; FAQ - lista najczęściej zadawanych pytań i odpowiedzi; Help Desk - bezpośredni odnośnik do okna kontaktowego z administratorami repozytorium DSpace. Przeglądanie repozytorium Pole wyszukiwania Zawartość repozytorium można przeszukiwać na różne sposoby. Jednym z nich jest wpisanie szukanej frazy w oknie wyszukiwania na stronie głównej:
Szukanie zaawansowane - filtry Użytkownik może skorzystać z opcji Advanced Search w celu wprowadzenia bardziej precyzyjnych kryteriów przeglądania zawartości repozytorium. Opcja ta znajduje się poniżej pola wyszukiwania. Po jej wybraniu możemy określić filtr wyszukiwania (np. tytuł korpusu tekstowego, nazwisko autora czy datę dodania danych do repozytorium): Zaawansowane wyszukiwanie umożliwia wybór kryteriów z rozwijanej listy po lewej stronie sekcji. W zależności od wprowadzonego kryterium wyszukiwania, wyświetlone zostaną wyłącznie wyniki, które je spełniają (np. tylko korpusy tekstowe, wyłącznie w języku angielskim):
Podobne opcje wyszukiwania uzyskamy po rozwinięciu listy w sekcji Browse, która znajduje się na głównej stronie repozytorium, w panelu użytkownika po prawej stronie: Rejestracja użytkownika i logowanie Aby korzystać z pełnej funkcjonalności systemu DSpace należy się zalogować. W tym celu najpierw konieczne jest utworzenie konta użytkownika. Rejestracja dostępna jest na stronie głównej repozytorium. W panelu po prawej stronie wybieramy zakładkę Register. Możemy również wybrać opcję rejestracji konta z rozwijanego panelu bocznego repozytorium. Widoczny jest w nim link Zaloguj, który przenosi użytkownika na stronę logowania do usług CLARIN-PL, na której możliwa jest także rejestracja konta:
Następnie wymagane jest podanie adresu e-mail, który od tej pory służyć nam będzie do logowania na stronie repozytorium (login ten będzie automatycznie przypisany również do konta w Inforexie). Na podany adres wysłany zostanie link aktywacyjny, który odsyła użytkownika do kolejnych kroków rejestracji. Wprowadzenie adresu e-mail: Link aktywacyjny w wiadomości e-mail:
Nowy użytkownik w kolejnym kroku może uzupełnić dane osobowe: imię, nazwisko i telefon kontaktowy - informacje te nie są jednak niezbędne do rejestracji. Wymagane jest podanie hasła, którego używać będziemy wraz z adresem e-mail podczas logowania do repozytorium. Konto utworzone w systemie DSpace umożliwia zalogowanie do Inforexa przy pomocy tego samego loginu i hasła. Po wybraniu opcji Complete Registration (u dołu strony) rejestracja zostanie zakończona. Od tej pory możliwe jest korzystanie z opcji dostępnych dla zalogowanych użytkowników. Logowanie federacyjne Logowanie federacyjne za pośrednictwem instytucji umożliwia zalogowanie na konto utworzone na mocy umów zawartych między Centrum Technologii Językowych CLARIN-PL a innymi podmiotami zbiorowymi. Możliwe jest logowanie za pośrednictwem instytucji krajowych, jak i zagranicznych ośrodków, które należą do federacji. Po wyborze konkretnej jednostki (np. uniwersytetu, laboratorium badawczego, konsorcjum) z listy propozycji, strona przenosi użytkownika do osobnego okna logowania, gdzie należy podać wcześniej uzyskany login i hasło.
Przesyłanie danych W pierwszej kolejności należy zalogować się w systemie. Tylko zalogowani użytkownicy mogą dodawać i udostępniać dane. Aby rozpocząć proces deponowania danych w repozytorium, w menu bocznym w sekcji My Account wybieramy opcję zgłoszenia - Submissions. Przechodzimy do głównego panelu zarządzania archiwami, w którym możemy zdecydować, czy będziemy uzupełniać niekompletne zgłoszenie, dodawać nowe lub usuwać stare. W tym miejscu możliwe jest również dodanie zaktualizowanej wersji zdeponowanego wcześniej archiwum - Add new version. W celu dodania nowego zgłoszenia wybieramy opcję Start another submission. Okno zarządzania zgłoszeniami Prezentowany poniżej panel przeprowadzi użytkownika przez kolejne osiem kroków, które należy wykonać, żeby archiwum zostało poprawnie udostępnione w repozytorium DSpace.
Funkcje przycisków W każdym kolejnym kroku dodawania danych u dołu panelu znajdują się trzy przyciski: Save & Exit - wybór tej opcji pozwala zapisać zgłoszenie i wyprowadza użytkownika z panelu deponowania archiwum. Zanim to się stanie mamy jednak możliwość wybrania jednej z trzech dostępnych opcji: powrotu do zgłoszenia (jeśli wyjście było przypadkowe), zapisania informacji i wyjścia lub usunięcia archiwum: Save & Share - opcja ta pozwala nie tylko zapisać postępy w pracy, ale umożliwia też podzielenie się nimi z innymi użytkownikami repozytorium. Jest to funkcja przydatna zwłaszcza w pracy zespołowej, gdy chcemy poinformować pozostałych współpracowników, jakie informacje zostały przypisane dodawanym zasobom, a także umożliwić im edytowanie zgłoszenia. Po wybraniu tej opcji wygenerowany zostaje odnośnik do panelu przesyłania danych: Zalogowany użytkownik, który otrzyma odnośnik, będzie mógł edytować informacje o zasobach, a także przekazać je kolejnym osobom. Next > - przycisk ten przenosi nas do kolejnych kroków uzupełniania informacji. Dodatkowo pozwala sprawdzić, które z pól wymagają uzupełnienia. Po kliknięciu Next > wszystkie nieuzupełnione pola obowiązkowe zostaną wyróżnione kolorem czerwonym i oznaczone gwiazdką. Przejście do kolejnych etapów deponowania archiwum wymaga uzupełnienia pól obligatoryjnych:
Basic Info W pierwszej kolejności należy wybrać rodzaj materiału, który chcemy zdeponować w repozytorium: Corpus - materiały tekstowe, wypowiedzi i źródła, będące podstawą przyszłego korpusu; Lexical Conceptual Resource - zasoby leksykalne, słowniki, listy słów; L anguage description - modele językowe i gramatyki konkretnych języków; Technology / Tool / Service - narzędzia, aplikacje etc.. W pierwszym kroku podajemy nazwę tworzonego archiwum oraz datę jego opublikowania. Who s involved W drugim kroku należy uzupełnić zgłoszenie o informacje o autorze (uwaga: podajemy dane twórcy zasobu (np. korpusu), nie autora przesyłanego tekstu), współpracownikach, danych kontaktowych, organizacjach lub instytucjach odpowiedzialnych oraz źródłach finansowania. Describe Następnie uzupełniamy opis korpusu, wybieramy język, słowa kluczowe, podajemy szacowany rozmiar oraz rodzaj przesyłanych danych (teksty, pliki audio, video). Upload W kolejnym kroku użytkownik może wgrać wybrane pliki do bazy danych. Jeśli na tym etapie nie mamy gotowych plików, możemy pominąć krok i przejść dalej. Pliki można dodawać z
poziomu wyszukiwarki z opcji Wybierz pliki lub poprzez przeciąganie ich na odpowiednie pole (drag&drop). Wybranie pliku otworzy okno dialogowe, umożliwiające osobny opis każdego z dodawanych elementów. Aby przesłać zasoby, należy kliknąć opcję Start Upload ( uwaga : jeśli dodajemy więcej plików, przycisk ten będzie znajdował się u dołu okna, którego zawartość trzeba przewinąć, aby przycisk się wyświetlił). Zakończenie operacji potwierdzamy wybierając OK.
Po wgraniu kolejnych plików możemy jeszcze dodać do nich opis, zmienić ich układ, a także skasować wybrane z nich: Additional CMDI W tym kroku możemy dodać do zasobu lub wybranego elementu plik z przygotowanym wcześniej opisem CMDI. Jest to opcja dla zaawansowanych użytkowników i możemy ją pominąć (Next). Szczegółowe informacje dotyczące opisów CMDI znajdują się pod tym adresem: https://clarin-pl.eu/pl/metadane, a instrukcja ich zastosowania w repozytorium DSpace umieszczona została w materiałach do pobrania na końcu instrukcji. License Jeśli został dodany chociaż jeden plik, należy wybrać licencję, na podstawie której będzie udostępniany korpus (dane pozbawione tej informacji staną się bezużyteczne dla innych użytkowników, którzy nie będą wiedzieli, w jakim zakresie mogą je wykorzystać). Po uważnym zapoznaniu się z Distribution agreement (warunkami udostępnienia) klikamy czerwony przycisk (zmieni kolor na zielony).
Następnie należy wybrać z listy rodzaj licencji udostępniania. W razie problemów ze zdefiniowaniem zakresu praw do korpusu możemy skorzystać z opcji OPEN License Selector, która przeniesie nas do specjalnego narzędzia (szczegółowe omówienie w sekcji: Licencja ). Review Kolejny krok umożliwia poprawienie wszystkich, wypełnionych wcześniej pól zgłoszenia oraz ich weryfikację. Jeśli coś zostało błędnie lub nie w pełni uzupełnione, wystarczy wybrać opcję Correct i poprawić fragment formularza. Complete Gdy wszystkie elementy zostaną przez użytkownika zweryfikowane, możemy wybrać Complete Submission i dokończyć publikowanie korpusu lub kliknąć Save & Exit, zapisując zmiany i pozostawiając bazę do późniejszej pracy. Po wybraniu opcji Complete Submission korpus zostanie przesłany do wglądu administratorom. Gdy zgłoszenie zostanie zaakceptowane (w razie jakichkolwiek problemów bądź wątpliwości związanych z danymi, administratorzy skontaktują się z użytkownikiem poprzez podany adres e-mail), znajdzie się w repozytorium DSpace. Od tego momentu użytkownik nie będzie mógł samodzielnie usunąć opublikowanych danych - w tym celu konieczne będzie skontaktowanie się z administratorami serwisu.
Pobieranie i eksportowanie zasobów Aby pobrać zasoby z repozytorium, należy wybrać archiwum, w którym zostały one zdeponowane, a następnie wybrać opcję Download all files in item w celu pobrania całej zawartości archiwum, albo Download file, aby pobrać wybrany plik z archiwum. Operacje na korpusie tekstowym: Zalogowani użytkownicy mogą eksportować dane zawarte w wybranym korpusie do systemu Inforex lub MeWex i przeprowadzić dalsze operacje. Nie ma to wpływu na zawartość korpusu zdeponowanego w repozytorium przez inną osobę. Aby móc eksportować zdeponowane dane, należy je najpierw przetworzyć do formatu CCL : Process files to CCL. Dopiero po tym możliwe są inne operacje, np. eksport do systemu Inforex lub MeWex, czy wygenerowanie listy frekwencyjnej ( Make sense frequency list ), która zawiera formy podstawowe i częstość występowania znaczeń słów ze Słowosieci w danym korpusie tekstowym. Po wygenerowaniu, listę frekwencyjną można zapisać na dysku w formacie CSV. Licencja Podczas udostępniania danych w repozytorium użytkownik zostanie poproszony o wybranie odpowiedniej licencji, która określać będzie zakres udostępniania i przetwarzania zdeponowanych zasobów przez innych użytkowników. Lista dostępnych licencji znajduje się pod tym adresem. Jeśli użytkownik nie jest pewien, którą licencję powinien wybrać, może skorzystać z pomocnego narzędzia ( OPEN License Selector ), które dostępne jest na etapie publikowania danych w archiwum. Pozwala ono dopasować nasze oczekiwania, dotyczące dostępu do
danych, do jednej z gotowych licencji. Gdyby użytkownik był jednak zainteresowany licencją spoza listy, powinien skontaktować się z administratorami. Narzędzie OPEN License Selector przeprowadza użytkownika przez kilka pytań, które pomagają ustalić preferowany rodzaj licencji, np.: rodzaj zdeponowanych materiałów: oprogramowanie czy dane? czy dane objęte są prawami autorskimi? czy posiadasz prawa autorskie do zbioru danych? czy pozwalasz innym na tworzenie dzieł pochodnych na podstawie zdeponowanych danych? czy pozwalasz innym na komercyjne wykorzystanie danych?
Dodatkowo OPEN License Selector zawiera szczegółowy opis każdej z możliwych opcji wyboru, wraz ze wskazówkami ułatwiającymi decyzję, które wyświetlają się po najechaniu kursorem na podkreślony obszar pytania: Cytowanie System Handle umożliwia automatyczne tworzenie unikalnych i trwałych identyfikatorów do zdigitalizowanych obiektów. Pozwala na wygenerowanie stałego identyfikatora (PID) i adresu URL, który będzie połączony z konkretnym plikiem, bez względu na przyszłą lokalizację danych. W razie zmian lub edycji korpusu (z wyłączeniem błędów technicznych i drobnych korekt), danym przypisany zostaje nowy identyfikator. Można zatem bezpiecznie używać systemu jako źródła odwołań, np. na potrzeby przyszłych publikacji naukowych.
Opis metadanymi można wyeksportować do formatu CMDI lub BibTex, który ukaże się w osobnym oknie: Materiały szkoleniowe prezentacja dotycząca systemu DSpace: http://clarin-pl.eu/wp-content/uploads/2017/06/dspace-publikacja-w-repozytorium.pdf instrukcja wykorzystywania opisów CMDI w DSpace: http://clarin-pl.eu/wp-content/uploads/2015/03/cmdi_dspace.pdf