Publikacja w repozytorium i przetwarzanie w systemie DSpace

Podobne dokumenty
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud

DSpace. Podstawowe informacje: Co to jest DSpace? Dostęp do danych

DSpace. Co to jest DSpace? Dostęp do danych. 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych

Narzędzia do automatycznej analizy odniesień w tekstach

Inforex - zarządzanie korpusami i ich anotacja

Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi

Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych

Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Narzędzia do automatycznej analizy odniesień w tekstach

Mapa Literacka analiza odniesień geograficznych w tekstach literackich

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania kolokacji

Logowanie do systemu. Rys. 1 Strona logowania

CLARIN infrastruktura naukowa technologii językowych

Instrukcja obsługi dla studenta

Rejestracja w serwisie GTC Siemens Instrukcja instalacji NX dla studentów i pracowników Politechniki Lubelskiej

Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Instrukcja. opracował Marcin Oleksy

Instrukcja obsługi dla studenta

Instrukcja obsługi dla studenta

Instrukcja użytkownika

Wykorzystanie narzędzi do automatycznego przetwarzania języka w badaniach onomastycznych

Ogólnopolskie Repozytorium Prac Dyplomowych

Instrukcja obsługi dla studenta

Informatyka I : Tworzenie projektu

Instrukcja Użytkownika (Studenta) Akademickiego Systemu Archiwizacji Prac

Instrukcja obsługi dla studenta

Centralne Repozytorium Prac Dyplomowych

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

Przewodnik po systemie Antyplagiat dla Użytkownika Indywidualnego

Jak zarejestrować się w ResearcherID i otrzymać swój unikalny numer

Konfiguracja Trimble Access Sync

Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Instrukcja obsługi dla studenta

Materiały opracowane przez Ośrodek Edukacji Informatycznej i Zastosowań Komputerów w Warszawie

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Zakładanie i przeprowadzanie badań w JSA

Instrukcja obsługi dla studenta

Emilia Karwasińska, Małgorzata Rychlik. Biblioteka Uniwersytecka w Poznaniu

INSTRUKCJA DLA STUDENTA

OMNITRACKER Wersja testowa. Szybki przewodnik instalacji

WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów

Projekt z Technologii Internetowych Internetowe repozytorium plików z autoryzacją użytkownika

Rysunek 1 Strona główna systemu Wibo

Instrukcja podstawowego uruchomienia sterownika PLC LSIS serii XGB XBC-DR20SU

Program warsztatów CLARIN-PL

OŚWIADCZENIE. Ja, niżej podpisany/a (imię i nazwisko autora pracy dyplomowej) Numer albumu: Kierunek studiów:

Migracja z programu Symfonia Kadry i Płace wer 3.x do Kadr i Płac Forte

Zasady rejestracji i instrukcja zarządzania kontem użytkownika portalu

CitiManager. Przewodnik dla Pracowników / Posiadaczy kart. Bank Handlowy w Warszawie S.A.

1. Przy pierwszym wejściu na stronę proszę wybrać: Logowanie/rejestrowanie

Issuu publikowanie dokumentów w sieci

Wyższa Szkoła Bankowa we Wrocławiu

Archiwum Prac Dyplomowych

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Archiwum Prac Dyplomowych

CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego

1. Przejście przez proces rekrutacji wymaga założenia konta na stronie:

OSA OTWARTY SYSTEM ANTYPLAGIATOWY

Zgłoś projekt do Budżetu Obywatelskiego online!

INSTRUKCJA INSTALACJI MODUŁU

CLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych

Open Access w technologii językowej dla języka polskiego

Instrukcja Użytkownika

INSTRUKCJA DLA STUDENTA

Nowy interfejs katalogu Biblioteki Głównej UP - podręcznik użytkownika

Wprowadzenie do CHAMO

WPROWADZENIE do Otwartego Systemu Antyplagiatowego

Przewodnik instalacji i rejestracji ASN RadioOS

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

CitiManager. Przewodnik dla Pracowników / Posiadaczy kart. Bank Handlowy w Warszawie S.A.

elektroniczna Platforma Usług Administracji publicznej Instrukcja użytkowania oraz złożenia wniosku o Profil zaufany

pl/administrator

INSTRUKCJA REJESTRACJI ELEKTRONICZNEJ KANDYDATA DO PROJEKTU Humanista - Stażysta - Menadżer! Zarządzanie dziedzictwem kulturowym

Uznawalność wykształcenia

Rejestracja wstępna - procedura

Standard udostępniania danych na portalu danepubliczne.gov.pl

Nabór ofert w ramach projektu pozakonkursowego o charakterze koncepcyjnym pt. "Najlepsi z najlepszych!"

System EwOs. Ewidencja Osiągnięć. nauczycieli akademickich Uniwersytetu im. Adama Mickiewicza w Poznaniu. Pierwsze kroki

APD. Archiwum Prac Dyplomowych w USOS. Mariusz.Czerniak@umk.pl

timetrack Przewodnik Użytkownika timetrack Najważniejsze Funkcje

Instrukcja instalacji serwera i konfiguracji licencji AppWave Concurrent.

ZAMAWIANIE KSIĄŻEK I CZASOPISM ON-LINE

"Studia dla wybitnych"

Data wydania: Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Społecznego

INSTALACJA SYSTEMU CMS JOOMLA!

Narzędzia do automatycznej analizy odniesień w tekstach

INSTRUKCJA Systemu Antyplagiatowego dla Szkół Antyściąga.pl dla Nauczyciela

Publikowanie wzoru dokumentu elektronicznego w centralnym repozytorium

Integracja ORPPD z uczelnianymi systemami antyplagiatowymi

Online Workbook. Przewodnik dla nauczycieli. Dostęp do konta nauczyciela Online Workbook. Macmillan Education

Archiwizacja Rozpraw Doktorskich

Transkrypt:

Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.19

DSpace Lokalizacja clarin-pl.eu/dspace clarin-pl.eu» Repository

DSpace Zastosowanie repozytorium do długoterminowego przechowywania zasobów elementy zasobu: metadane ustrukturalizowany sposób opisu danych (standard CMDI rozwijany przez CLARIN) dane (opcjonalne) dowolne formaty plików: tekstowe, binarne, archiwa, itd. zasoby zdeponowane w repozytorium dostają unikalny i trwały identyfikator, (Handle.net), autoryzowany dostęp, a w przyszłości logowanie federacyjne przy użyciu prywatnych kont z instytucji, które dołączą do federacji, wyszukiwanie fasetowe filtrowanie po metadanych, jest częścią sieci CLARIN integrującej metadane z różnych repozytorium dostęp do centralnego repozytorium przez http://vlo.clarin.eu

Przetwarzanie dokumentów 1. Konwersja ekstrakcja treści tekstowych z dokumentów doc, docx, odt, rtf txt Adam Mickiewicz urodził się 24 grudnia 1798. W latach 1807 1815 uczęszczał do dominikańskiej szkoły powiatowej w Nowogródku. 2. Tokenizacja podział tekstu na zdania i tokeny (słowa) [1] [Adam] [Mickiewicz] [urodził] [się] [24] [grudnia] [1798] [w] [Zaosiu][.] [2] [W] [latach] [1807][ ][1815] [uczęszczał] [do] [dominikańskiej] [szkoły] [powiatowej] [w] [Nowogródku][.] 3. Analiza morfologiczna określenie formy bazowej i analizy morfologicznej dla każdego tokenu [1] [Adam] [Mickiewicz] [urodzić] [się] [24] [grudzień] [1798] [w] [Zaosiu][.] [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w] [Nowogródek][.] praet:sg:m1:imperf subst:sg:gen:f

Przetwarzanie dokumentów (Process to CCL) 4. Rozpoznanie nazw własnych i wyrażeń temporalnych [1] [Adam] [Mickiewicz] [urodzić] [się] [24] [grudzień] [1798] [w] [Zaosiu][.] [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w] [Nowogródek][.] Nazwy własne: dspace link Named Entities (nam) granice nazw własnych, Named Entities (top9) dziewięć głównych kategorii nazw własnych, Named Entities (n82) 82 szczegółowe kategorie nazw własnych. Wyrażenia temporalne: 5. dspace link Temporal Expressions (1class) granice wyrażeń temporalnych, Temporal Expressions (4classes) cztery kategorie: DATE, TIME, DURATION i SET. Ustalenie znaczeń słów (w odniesieniu do Słowosieci) [2] [W] [rok] [1807][ ][1815] [uczęszczać] [do] [dominikański] [szkoła] [powiatowy] [w]... rok 1 okres obiegu planety dookoła słońca, prawdopodobnie w innych ukł. planetarnych - wokół centralnej gwiazdy (np. rok marsjański) rok 2 jednostka rachuby czasu zależna najczęściej od cyklu przemian związanych z obiegiem Ziemi wokół Słońca rok 3 grupa ludzi, którzy studiują razem kolejne lata na uczelni szkoła 1 budynek, siedziba szkoły jako instytucaji szkoła 2 instytucja zajmująca się kształceniem dzieci i młodzieży szkoła 3 uczniowie i pracownicy instytucji szkoła 10 wykształcenie, wiadomości i umiejętności zdobyte w szkole lub na szkoleniu u mistrza

Próbki danych http://clarin-pl.eu/warsztaty.zip po rozpakowaniu zawartość w katalogu warsztaty_dspace

Rejestracja Register

Logowanie Login

Zgłoszenia Submissions

Nowe zgłoszenie Start a new submission

Krok 1: Podstawowe informacje Basic info

Krok 1: Podstawowe informacje Basic info

Krok 2: Osoby zaangażowane Who s involved Pole z możliwością wprowadzenia wielu wartości. Każda wartość musi być potwierdzone przez kliknięcie Add.

Krok 2: Osoby zaangażowane Who s involved

Krok 3: Opis zasobu Describe

Krok 4: Wgrywanie danych Upload

Krok 4: Wgrywanie danych Upload

Krok 4: Wgrywanie danych Upload

Krok 4: Wgrywanie danych Upload

Krok 5: Dodatkowe metadane Additional CMDI

Krok 6: Licencja License

Krok 7: Przegląd Review

Krok 8: Zakończenie zgłoszenia Complete submission

Zakończenie zgłoszenia Complete submission

Archiwalne zgłoszenia Archived Submissions

Przegląd zgłoszenia View Item -> Process files to CCL

Przegląd zgłoszenia View Item -> Export to Inforex

Przegląd zgłoszenia Inforex -> Tasks

inforex.clarin-pl.eu

Dziękujemy za uwagę!