Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.19
DSpace/NextCloud/Inforex
DSpace/NextCloud/Inforex powiązania Dane 1. 1. 4. 1. Deponowanie danych w DSpace/NextCloud 2. Eksport danych z NextCloud do DSpace/Inforex 3. Eksport danych z DSpace do Inforex 4. Upublicznienie danych w NextCloud/Inforex 2. 2. 3. 4.
DSpace/NextCloud/Inforex powiązania Przestrzeń prywatna Dane 1. 1. 4. 1. Deponowanie danych w DSpace/NextCloud 2. Eksport danych z NextCloud do DSpace/Inforex 3. Eksport danych z DSpace do Inforex 4. Upublicznienie danych w NextCloud/Inforex 2. 2. 3. 4.
DSpace/NextCloud/Inforex powiązania Dane 1. 1. 4. 1. Deponowanie danych w DSpace/NextCloud 2. Eksport danych z NextCloud do DSpace/Inforex 3. Eksport danych z DSpace do Inforex 4. Upublicznienie danych w NextCloud/Inforex 2. 2. 3. 4. Przestrzeń publiczna
DSpace/NextCloud/Inforex powiązania Przestrzeń prywatna Dane 1. 1. 4. 1. Deponowanie danych w DSpace/NextCloud 2. Eksport danych z NextCloud do DSpace/Inforex 3. Eksport danych z DSpace do Inforex 4. Upublicznienie danych w NextCloud/Inforex 2. 2. 3. 4. Przestrzeń publiczna
DSpace Lokalizacja clarin-pl.eu/dspace clarin-pl.eu» Repository
DSpace Zastosowanie repozytorium do długoterminowego przechowywania zasobów elementy zasobu: metadane ustrukturalizowany sposób opisu danych (standard CMDI rozwijany przez CLARIN) dane (opcjonalne) dowolne formaty plików: tekstowe, graficzne, wideo, binarne, archiwa, itd. zasoby zdeponowane w repozytorium dostają unikalny i trwały identyfikator, (Handle.net), autoryzowany dostęp, a w przyszłości logowanie federacyjne przy użyciu prywatnych kont z instytucji, które dołączą do federacji, wyszukiwanie fasetowe filtrowanie po metadanych, jest częścią infrastruktury CLARIN integracja metadanych z różnych repozytoriów z możliwością wyszukiwania przez http://vlo.clarin.eu
Przetwarzanie dokumentów w DSpace i NextCloud Konwersja ekstrakcja treści tekstowych z dokumentów doc, docx, odt, rtf txt Adam Mickiewicz urodził się 24 grudnia 1798. W latach 1807 1815 uczęszczał do dominikańskiej szkoły powiatowej w Nowogródku. Tokenizacja podział tekstu na zdania i tokeny (słowa) [1] [Adam] [Mickiewicz] [urodził] [się] [24] [grudnia] [1798] [w] [Zaosiu][.] [2] [W] [latach] [1807][ ][1815] [uczęszczał] [do] [dominikańskiej] [szkoły] [powiatowej] [w] [Nowogródku][.] Analiza morfologiczna określenie formy bazowej i analizy morfologicznej dla każdego tokenu [1] [Adam] [Mickiewicz] [urodzić] [się] [24] [grudzień] [1798] [w] [Zaosiu][.] [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w] [Nowogródek][.] praet:sg:m1:imperf subst:sg:gen:f
Przetwarzanie dokumentów w DSpace i NextCloud Rozpoznanie nazw własnych i wyrażeń temporalnych [1] [Adam] [Mickiewicz] [urodzić] [się] [24] [grudzień] [1798] [w] [Zaosiu][.] [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w] [Nowogródek][.] Nazwy własne: https://clarin-pl.eu/dspace/handle/11321/294 Named Entities (nam) granice nazw własnych, Named Entities (top9) dziewięć głównych kategorii nazw własnych, Named Entities (n82) 82 szczegółowe kategorie nazw własnych. Wyrażenia temporalne: https://clarin-pl.eu/dspace/handle/11321/284 Temporal Expressions (1class) granice wyrażeń temporalnych, Temporal Expressions (4classes) cztery kategorie: DATE, TIME, DURATION i SET. Ustalenie znaczeń słów (w odniesieniu do Słowosieci) [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w]... rok 1 okres obiegu planety dookoła słońca, prawdopodobnie w innych ukł. planetarnych - wokół centralnej gwiazdy (np. rok marsjański) rok 2 jednostka rachuby czasu zależna najczęściej od cyklu przemian związanych z obiegiem Ziemi wokół Słońca rok 3 grupa ludzi, którzy studiują razem kolejne lata na uczelni szkoła 1 budynek, siedziba szkoły jako instytucaji szkoła 2 instytucja zajmująca się kształceniem dzieci i młodzieży szkoła 3 uczniowie i pracownicy instytucji szkoła 10 wykształcenie, wiadomości i umiejętności zdobyte w szkole lub na szkoleniu u mistrza
Próbki danych http://clarin-pl.eu/korpus_warsztaty.zip
Rejestracja clarin-pl.eu/dspace
Rejestracja Register
Rejestracja Register
Rejestracja Register
Rejestracja Register
Rejestracja Register
Logowanie Login
Logowanie Login
Logowanie Login
Logowanie Login
Logowanie Login
Logowanie Login
Deponowanie zasobów clarin-pl.eu/dspace
Zgłoszenia Submissions
Nowe zgłoszenie Start a new submission
Krok 1: Podstawowe informacje Basic info
Krok 1: Podstawowe informacje Basic info
Krok 2: Osoby zaangażowane Who s involved Pole z możliwością wprowadzenia wielu wartości. Każda wartość musi być potwierdzone przez kliknięcie Add.
Krok 2: Osoby zaangażowane Who s involved
Krok 2: Osoby zaangażowane Who s involved Pole z możliwością wprowadzenia wielu wartości. Każda wartość musi być potwierdzone przez kliknięcie Add.
Krok 2: Osoby zaangażowane Who s involved
Krok 3: Opis zasobu Describe
Krok 3: Opis zasobu Describe
Krok 4: Wgrywanie danych Upload
Krok 4: Wgrywanie danych Upload
Krok 4: Wgrywanie danych Upload
Krok 4: Wgrywanie danych Upload
Krok 5: Dodatkowe metadane Additional CMDI
Krok 6: Licencja License
Krok 7: Przegląd Review
Krok 8: Zakończenie zgłoszenia Complete submission
Zakończenie zgłoszenia Complete submission
Archiwalne zgłoszenia Archived Submissions
Przegląd zgłoszenia View Item Process files to CCL
Przegląd zgłoszenia View Item Export to Inforex
Wyskakujące okienka Pop-ups
Przegląd zgłoszenia Inforex Tasks
inforex.clarin-pl.eu
Instrukcja Pełna instrukcja systemu znajduje się na stronie internetowej projektu CLARIN-PL: http://clarin-pl.eu
Deponowanie zasobów nextcloud.clarin-pl.eu
Logowanie Login
NextCloud Lokalizacja nextcloud.clarin-pl.eu
NextCloud udostępnianie
NextCloud udostępnianie
NextCloud eksport do DSpace (01)
NextCloud eksport do DSpace (02)
NextCloud eksport do DSpace (03)
NextCloud eksport do DSpace (04)
NextCloud przetwarzanie (01)
NextCloud przetwarzanie (02)
NextCloud przetwarzanie (03)
NextCloud eksport do Inforexa (01)
NextCloud eksport do Inforexa (02)
NextCloud eksport do Inforexa (03)
NextCloud eksport do Inforexa (04)
koniec części 1