Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Podobne dokumenty
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Publikacja w repozytorium i przetwarzanie w systemie DSpace

DSpace. Podstawowe informacje: Co to jest DSpace? Dostęp do danych

DSpace. Co to jest DSpace? Dostęp do danych. 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych

Inforex - zarządzanie korpusami i ich anotacja

Narzędzia do automatycznej analizy odniesień w tekstach

Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi

Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego

Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Narzędzia do automatycznej analizy odniesień w tekstach

Mapa Literacka analiza odniesień geograficznych w tekstach literackich

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Wykorzystanie narzędzi do automatycznego przetwarzania języka w badaniach onomastycznych

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)

Instrukcja obsługi dla studenta

Narzędzia do automatycznego wydobywania kolokacji

CLARIN infrastruktura naukowa technologii językowych

Narzędzia do automatycznego wydobywania kolokacji

Instrukcja obsługi dla studenta

Instrukcja użytkownika

Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Instrukcja. opracował Marcin Oleksy

Instrukcja obsługi dla studenta

CitiManager. Przewodnik dla Pracowników / Posiadaczy kart. Bank Handlowy w Warszawie S.A.

Program warsztatów CLARIN-PL

Logowanie do systemu. Rys. 1 Strona logowania

Ogólnopolskie Repozytorium Prac Dyplomowych

Centralne Repozytorium Prac Dyplomowych

Jak zarejestrować się w ResearcherID i otrzymać swój unikalny numer

Konfiguracja Trimble Access Sync

Instrukcja Użytkownika (Studenta) Akademickiego Systemu Archiwizacji Prac

Instrukcja obsługi dla studenta

Rejestracja w serwisie GTC Siemens Instrukcja instalacji NX dla studentów i pracowników Politechniki Lubelskiej

1. Przy pierwszym wejściu na stronę proszę wybrać: Logowanie/rejestrowanie

Instrukcja podstawowego uruchomienia sterownika PLC LSIS serii XGB XBC-DR20SU

Instrukcja obsługi dla studenta

CitiManager. Przewodnik dla Pracowników / Posiadaczy kart. Bank Handlowy w Warszawie S.A.

Informatyka I : Tworzenie projektu

Instrukcja obsługi dla studenta

Integracja ORPPD z uczelnianymi systemami antyplagiatowymi

INSTRUKCJA DLA STUDENTA

Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Emilia Karwasińska, Małgorzata Rychlik. Biblioteka Uniwersytecka w Poznaniu

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

Instrukcja obsługi dla studenta

Biblioteka Politechniki Krakowskiej

INSTRUKCJA DLA STUDENTA

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Przewodnik po systemie Antyplagiat dla Użytkownika Indywidualnego

Migracja z programu Symfonia Kadry i Płace wer 3.x do Kadr i Płac Forte

INSTRUKCJA DLA OPERATORA

WPROWADZENIE do Otwartego Systemu Antyplagiatowego

Integracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych i Otwartym Systemem Antyplagiatowym

WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów

CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego

Standard udostępniania danych na portalu danepubliczne.gov.pl

Archiwizacja Rozpraw Doktorskich

Instrukcja migracji PREMIUM. Mendeley_Migration_Guide_Polish.indd 1

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Czytelnik w bibliotece cyfrowej

Issuu publikowanie dokumentów w sieci

Projekt z Technologii Internetowych Internetowe repozytorium plików z autoryzacją użytkownika

INSTRUKCJA INSTALACJI MODUŁU

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Instrukcja Użytkownika

Materiały opracowane przez Ośrodek Edukacji Informatycznej i Zastosowań Komputerów w Warszawie

Platforma wymiany informacji e- science.pl, jako skuteczne narzędzie współpracy. Mateusz Tykierko

Nowy interfejs katalogu Biblioteki Głównej UP - podręcznik użytkownika

Przewodnik instalacji i rejestracji ASN RadioOS

Manage Qulto database

Zasady rejestracji i instrukcja zarządzania kontem użytkownika portalu

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

Rysunek 1 Strona główna systemu Wibo

INSTRUKCJA UŻYTKOWNIKA Internetowego Systemu Antyplagiatowego Plagiat.pl w Uniwersytecie Papieskim Jana Pawła II w Krakowie

OŚWIADCZENIE. Ja, niżej podpisany/a (imię i nazwisko autora pracy dyplomowej) Numer albumu: Kierunek studiów:

INSTRUKCJA REJESTRACJI ELEKTRONICZNEJ KANDYDATA DO PROJEKTU Humanista - Stażysta - Menadżer! Zarządzanie dziedzictwem kulturowym

Ogólnopolskie Repozytorium Prac Dyplomowych

MAREK NIEZGÓDKA ICM, UNIWERSYTET WARSZAWSKI

Najważniejsze informacje dla klienta na temat Portalu Serwisowego D-Link Spis treści

BEZPIECZNE UDOSTĘPNIANIE PLIKÓW

pl/administrator

STANDARDY INTEROPERACYJNOŚCI I STANDARDY OTWARTOŚCI DANYCH

Aquarius Podręcznik uz ytkownika

Microsoft Class Server. Waldemar Pierścionek, DC EDUKACJA

Koncepcja węzła IIP na przykładzie planów zagospodarowania przestrzennego

Data wydania: Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Społecznego

Xpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie

SSI Web 8. (badania.kozminski.edu.pl) Instrukcja logowania i uruchamiania ankiety

INSTRUKCJA Systemu Antyplagiatowego dla Szkół Antyściąga.pl dla Nauczyciela

System EwOs. Ewidencja Osiągnięć. nauczycieli akademickich Uniwersytetu im. Adama Mickiewicza w Poznaniu. Pierwsze kroki

Wyższa Szkoła Bankowa we Wrocławiu

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Online Workbook. Przewodnik dla nauczycieli. Dostęp do konta nauczyciela Online Workbook. Macmillan Education

S P I S T R E Ś C I. Instrukcja obsługi

Instrukcja obsługi systemu erekrutacja Płock, dn r.

Transkrypt:

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.19

DSpace/NextCloud/Inforex powiązania Przestrzeń prywatna Dane 1. 1. 4. 1. Deponowanie danych w DSpace/NextCloud 2. Eksport danych z NextCloud do DSpace/Inforex 3. Eksport danych z DSpace do Inforex 4. Upublicznienie danych w NextCloud/Inforex 2. 2. 3. 4. Przestrzeń publiczna

DSpace Lokalizacja clarin-pl.eu/dspace clarin-pl.eu» Repository

DSpace Zastosowanie repozytorium do długoterminowego przechowywania zasobów elementy zasobu: metadane ustrukturalizowany sposób opisu danych (standard CMDI rozwijany przez CLARIN) dane (opcjonalne) dowolne formaty plików: tekstowe, graficzne, wideo, binarne, archiwa, itd. zasoby zdeponowane w repozytorium dostają unikalny i trwały identyfikator, (Handle.net), autoryzowany dostęp, a w przyszłości logowanie federacyjne przy użyciu prywatnych kont z instytucji, które dołączą do federacji, wyszukiwanie fasetowe filtrowanie po metadanych, jest częścią infrastruktury CLARIN integracja metadanych z różnych repozytoriów z możliwością wyszukiwania przez http://vlo.clarin.eu

Przetwarzanie dokumentów w DSpace i NextCloud Konwersja ekstrakcja treści tekstowych z dokumentów doc, docx, odt, rtf txt Adam Mickiewicz urodził się 24 grudnia 1798. W latach 1807 1815 uczęszczał do dominikańskiej szkoły powiatowej w Nowogródku. Tokenizacja podział tekstu na zdania i tokeny (słowa) [1] [Adam] [Mickiewicz] [urodził] [się] [24] [grudnia] [1798] [w] [Zaosiu][.] [2] [W] [latach] [1807][ ][1815] [uczęszczał] [do] [dominikańskiej] [szkoły] [powiatowej] [w] [Nowogródku][.] Analiza morfologiczna określenie formy bazowej i analizy morfologicznej dla każdego tokenu [1] [Adam] [Mickiewicz] [urodzić] [się] [24] [grudzień] [1798] [w] [Zaosiu][.] [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w] [Nowogródek][.] praet:sg:m1:imperf subst:sg:gen:f

Przetwarzanie dokumentów w DSpace i NextCloud Rozpoznanie nazw własnych i wyrażeń temporalnych [1] [Adam] [Mickiewicz] [urodzić] [się] [24] [grudzień] [1798] [w] [Zaosiu][.] [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w] [Nowogródek][.] Nazwy własne: https://clarin-pl.eu/dspace/handle/11321/294 Named Entities (nam) granice nazw własnych, Named Entities (top9) dziewięć głównych kategorii nazw własnych, Named Entities (n82) 82 szczegółowe kategorie nazw własnych. Wyrażenia temporalne: https://clarin-pl.eu/dspace/handle/11321/284 Temporal Expressions (1class) granice wyrażeń temporalnych, Temporal Expressions (4classes) cztery kategorie: DATE, TIME, DURATION i SET. Ustalenie znaczeń słów (w odniesieniu do Słowosieci) [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w]... rok 1 okres obiegu planety dookoła słońca, prawdopodobnie w innych ukł. planetarnych - wokół centralnej gwiazdy (np. rok marsjański) rok 2 jednostka rachuby czasu zależna najczęściej od cyklu przemian związanych z obiegiem Ziemi wokół Słońca rok 3 grupa ludzi, którzy studiują razem kolejne lata na uczelni szkoła 1 budynek, siedziba szkoły jako instytucaji szkoła 2 instytucja zajmująca się kształceniem dzieci i młodzieży szkoła 3 uczniowie i pracownicy instytucji szkoła 10 wykształcenie, wiadomości i umiejętności zdobyte w szkole lub na szkoleniu u mistrza

Próbki danych http://clarin-pl.eu/warsztaty.zip po rozpakowaniu zawartość w katalogu warsztaty_dspace:

Rejestracja clarin-pl.eu/dspace

Rejestracja Register

Rejestracja Register

Rejestracja Register

Rejestracja Register

Rejestracja Register

Logowanie Login

Logowanie Login

Logowanie Login

Logowanie Login

Logowanie Login

Logowanie Login

Deponowanie zasobów clarin-pl.eu/dspace

Zgłoszenia Submissions

Nowe zgłoszenie Start a new submission

Krok 1: Podstawowe informacje Basic info

Krok 1: Podstawowe informacje Basic info

Krok 2: Osoby zaangażowane Who s involved Pole z możliwością wprowadzenia wielu wartości. Każda wartość musi być potwierdzone przez kliknięcie Add.

Krok 2: Osoby zaangażowane Who s involved

Krok 2: Osoby zaangażowane Who s involved Pole z możliwością wprowadzenia wielu wartości. Każda wartość musi być potwierdzone przez kliknięcie Add.

Krok 2: Osoby zaangażowane Who s involved

Krok 3: Opis zasobu Describe

Krok 3: Opis zasobu Describe

Krok 4: Wgrywanie danych Upload

Krok 4: Wgrywanie danych Upload

Krok 4: Wgrywanie danych Upload

Krok 4: Wgrywanie danych Upload

Krok 5: Dodatkowe metadane Additional CMDI

Krok 6: Licencja License

Krok 7: Przegląd Review

Krok 8: Zakończenie zgłoszenia Complete submission

Zakończenie zgłoszenia Complete submission

Archiwalne zgłoszenia Archived Submissions

Przegląd zgłoszenia View Item Process files to CCL

Przegląd zgłoszenia View Item Export to Inforex

Wyskakujące okienka Pop-ups

Przegląd zgłoszenia Inforex Tasks

inforex.clarin-pl.eu

Instrukcja Pełna instrukcja systemu znajduje się na stronie internetowej projektu CLARIN-PL: http://clarin-pl.eu

Deponowanie zasobów nextcloud.clarin-pl.eu

Logowanie Login

NextCloud Lokalizacja nextcloud.clarin-pl.eu

NextCloud udostępnianie

NextCloud udostępnianie

NextCloud eksport do DSpace (01)

NextCloud eksport do DSpace (02)

NextCloud eksport do DSpace (03)

NextCloud eksport do DSpace (04)

NextCloud przetwarzanie (01)

NextCloud przetwarzanie (02)

NextCloud przetwarzanie (03)

NextCloud eksport do Inforexa (01)

NextCloud eksport do Inforexa (02)

NextCloud eksport do Inforexa (03)

NextCloud eksport do Inforexa (04)

koniec części 1