Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych
|
|
- Tadeusz Nowakowski
- 6 lat temu
- Przeglądów:
Transkrypt
1 CLARIN-PL Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych Marcin Pol, Tomasz Walkowiak, Marcin Oleksy Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Katedra Informatyki Technicznej
2 Funkcje CTJ CLARIN-PL Rozproszona identyfikacja i autoryzacja użytkowników oparta na federacjach narodowych zasada jednego konta i jednego logowania Odpowiedni system składowania (repozytoryjny) - dspace trwałość danych (system archiwizacji) jednoznaczny opis danych za pomocą trwałych identyfikatorów (Persistent Identifiers) metadane o złożonej strukturze (CMDI) zarządzanie metadanymi zgodnie z przyjętymi standardami, np. CCR (CLARIN Concept Registry) Integracja zasobów i usług w oparciu o usługi sieciowe (Web Services, REST) dostęp poprzez aplikacje webowe brak konieczności ściągania i instalowania 2
3 Infrastruktura Chmura prywatna Cisco UCS B-Series Blade Servers IBM Storwize V7000 Xen Server 3
4 Repozytorium DSpace Otwarty system dspace zapisuje, przechowuje, opisuje, indeksuje i udostępnia materiały cyfrowe Platforma udostępnia otwarte zasoby naukowe oraz integruje narzędzia Clarin-PL z Clarin ERIC Wsparcie dla systemu CNRI Handle System [handle.net] pozwala na swobodną zmianę adresów/serwerów Zasoby są widoczne Virtual Language Observatory, który łączy repozytoria z różnych centrów w Europie CMDI 4
5 Repozytorium DSpace Clarin-PL DSpace posiada liczne rozszerzenia udostępnianie zasobów instytucjom będącym w konfederacji tożsamości - edugain Federacyjne zarządzanie tożsamością logowanie za pomocą jednego loginu i hasła autoryzuje jednostka macierzysta 5
6 Polska federacja uwierzytelniania 6
7 Federacja uwierzytelniania Federacja PIONIER.Id - adresowana do polskiego środowiska naukowo-akademickiego Pokrewne usłudze: eduroam dostawca usługi, dostawca tożsamości Warunki rejestracji technicznie: serwer SAML2 organizacyjne: podpisanie Deklaracji Członkowskiej i przesłanie jej do Operatora Federacji Konfederacja EduGAIN konfederacją o ogólnoświatowym zasięgu, zrzeszającą akademickie i naukowe federacje zarządzania tożsamością, 35 krajowych federacji w 2016, w tym InCommon (ponad 500 uczelni i organizacji komercyjnych) 7
8 Usługi sieciowe Narzędzia językowe aplikacje zbudowane w różnorodnych technologiach złożony proces instalacji różnorodne interfejsy trudność w tworzeniu potoków przetwarzania Wszystko jest usługą sieciową Komponent oprogramowanie o ustandaryzowanym interfejsie, dostępny poprzez protokół internetowy UI przeglądarka internetowa Aplikacje dostępowe oparte o przeglądarki internetowe Łączenie usług w potoki Wizualizacja 8
9 Problemy techniczne Narzędzia NLP/ML dostępne są w różnych językach programowania C++, Java, Python, R (Linux, Windows) Perl, Haskell, Julia, pliki wykonywalne Różnorodność formatów txt, doc, docx, ccl (xml), csv, gęste/rzadkie macierze Rozmiar danych 10 B 10 MB 1-1,000,000 tekstów w korpusie Korpusy po przetworzeniu osiągają duże rozmiary (3 GB dla 100 książek) Złożone tory przetwarzania Any2txt WCRFT2 Liner2 Fextorbis Any2txt WCRFT2 Liner2 Fextorbis WCRFT2 Liner2 Fextorbis Document (doc) Document (docx)... Any2txt Document (pdf) FeatFilt Cluto
10 Usługi sieciowe - architektura Samba REST NLPREST2 RabbitMQ Data base Wydajność Worker 1 (Any2txt) Worker 3 (WCRFT2) Worker 2 (fextor) Worker n (featfilt) LPMN engine urlzip( any2txt wcrft2 fextor({"features":"base"}) dir featfilt({"similarity":"jaccard ) cluto({"no_clusters":3}) przetwarzanie równoległe chmura prywatne, skalowanie Identyfikatory plików na wej./wyj. narzędzi 10
11 Usługi sieciowe: ws.clarin-pl.eu Zaimplementowane usługi (NLP): Konwersja: any2txt, konwersja formatów: ccl, tei, conll, gz, conll2svg Narzędzia NLP dla języka polskiego maca, wcrft2, chunker, serel, liner2, WSD, Spejd,spatial, dependpar, spejd Narzędzia NLP dla języka angielskiego i niemieckiego spacy, nltk Wydobywanie informacji z tekstu summarizer, tfidf, inkluz, termopl 11
12 Usługi sieciowe: ws.clarin-pl.eu Zaimplementowane usługi (ML): wyznaczanie, zliczanie cech: fextor, converter filtrowanie, ważenie, wyznaczanie podobieństwa featfilt (SuperMatrix, R - stylo) grupowanie/klasyfikacja/istotność: cluto, class, featsel (sklearn, weka) skalowanie wielowymiarowe mds (sklearn) topic modeling : gensim, mallet komunikacja (zip, URL, podział), integracja z dspace Wykorzystanie Ilustracja działania narzędzi NLP Element aplikacji badawczych: Mapa literacka, Chronopress, Inforex, MeWeX WebSty, LEM, Topic modeling Inne usługi : SłowoSieć, geokodowanie 12
13 Aplikacje badawcze 13
14 Aplikacje badawcze Narzędzia wysokiego poziomu nie wymagające wiedzy z dziedziny inżynierii języka lub technologii językowych Techniki załadowania własnych danych Bezpośrednie załadowanie plików w interfejsie webowym Lokalny plik, URL, DSpace, prywatna chmura (trwają prace) Różnorodność formatów txt różnorodne kodowanie znaków doc, docx (pptx, xlslx), odt, rtf, html, pdf zip Uprzednie załadowanie plików do repozytorium Identyfikacja poprzez trwały identyfikator Wstępnie przetworzone 14
15 Możliwości wykorzystania Utworzone aplikacje webowe są do państwa dyspozycji służymy pomocą w ich obsłudze w zrozumieniu zasad ich działania/użytych metod nie tylko w ramach warsztatów: webserwisy@clarin-pl.eu Jeżeli nie spełniają one państwa potrzeb, to możemy: rozbudować usługi o potrzebne narzędzia NLP dokument/katalog ->dokument/katalog R, Python, Java, C++, Haskell kod, model, dokumentacja efektywność/niezawodność zbudować potrzebną aplikacje badawczą na bazie istniejących usług przetworzyć korpus za pomocą usług CTJ Clarin-PL 15
16 Możliwości wykorzystania Możecie państwo samodzielnie wykorzystać usługi API REST-owe: przykłady w Javie, Python, R (niedługo) język opisu choreografii (LPMN) efektywność przetwarzania Najbliższe plany: chmura prywatna Leksykograficzne API REST-owe (integratror) Przetwarzanie b. dużych korpusów Zasoby obliczeniowe są zawsze ograniczone Warsztaty to bardzo zły model przetwarzania 16
17 Zintegrowane środowisko D-SPACE any2txt WCRFT2 NFS LINER2 WSD Potok przetwarzania Dane tymczasowe Zasoby / dane Dane przygotowane 17
18 Component MetaData Infrastructure (CMDI)
19 Zalety CMDI elastyczność spójność i jednoznaczność > rejestr kategorii metadanych CLARIN Concept Registry (CCR) współdzielenie schematów > Component Registry wyszukiwanie spośród wielu źródeł Virtual Language Observatory Meertens Institute CMDI search engine
20 Prof il metadanych dla korpusu w DSpace ogólne Specyficzne dla zasobu danego typu Kategorie DCMI Informacje o zasobie
21 Prof il metadanych dla korpusu w DSpace Autor Data umieszczenia w repozytorium Opis Identyfikator Data pierwszej publikacji Język Osoba/instytucja publikująca Licencja Słowa kluczowe Tytuł Kategorie DCMI Informacje o zasobie
22 Prof il metadanych dla korpusu w DSpace Informacje o zasobie Dane identyfikacyjne Informacje o dystrybucji Osoba kontaktowa Data utworzenia instancji CMDI Dane zasobu Typ Zawartość Język Rozmiar Kategorie DCMI Informacje o zasobie
23 Jaki typ licencji wybrać? Warunki dostępu Warunki użycia Warunki dystrybucji
24 CLARIN License Category Calculator
25 Kategorie licencji Public domain CLARIN PUB CLARIN PUB CLARIN PUB CLARIN PUB CC-ZERO Public Domain Princeton Wordnet CLARIN PUB Oprogramowanie CLARIN PUB+BY CLARIN PUB+BY CLARIN PUB+BY CLARIN PUB+BY) CLARIN PUB+BY CLARIN PUB+BY+SA ApacheLicense 2.0 BSD 2 or BSD 3 MIT license Microsoft Public License (MS-PL) LGPL AGPL
26 Problem formatu Teksty przechowywane w wersji elektronicznej w wielu formatach: Przetwarzalne: txt, doc, docx, rtf... Nieprzetwarzalne: jpg, bmp, gif... Problem kodowania Rozwi zanie w CLARIN-PL: Apache Tika Wydobywanie tekstu z wielu formatów danych Wsparcie dla: ppt, xls, pdf, doc, rtf... Warsztaty CLARIN-PL Warszawa IV 2015 CLARIN-PL
27 Etapy przetwarzania Zdeponowanie korpusu w systemie DSpace Uruchomienie wyzwalacza Konwersja dowolnego formatu do postaci tekstowej Analiza morfosyntaktyczna Rozpoznawanie jednostek identyfikacyjnych Rozpoznawanie wyrażeń temporalnych Generowanie lematów dla anotacji Zapis rezultatu w postaci plików CCL Kompresja rezultatu i udostępnienie dla innych narzędzi
28 Publikacja w repozytorium
29 Publikacja w repozytorium
30 Publikacja w repozytorium
31 Publikacja w repozytorium
32 Publikacja w repozytorium
33 Publikacja w repozytorium
34 Publikacja w repozytorium
35 Dziękujemy bardzo za uwagę
Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi
CLARIN-PL Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi Marcin Pol, Tomasz Walkowiak Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19
Bardziej szczegółowoCentrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Maciej Piasecki, Tomasz Walkowiak Politechnika ska Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoWebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Bardziej szczegółowoPublikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Bardziej szczegółowoPublikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoPublikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl
Bardziej szczegółowoCLARIN infrastruktura naukowa technologii językowych
CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:
Bardziej szczegółowoCLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Bardziej szczegółowoWebSty - otwarty sieciowy system do analizy stylometrycznej tekstu
WebSty - otwarty sieciowy system do analizy stylometrycznej tekstu Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Maciej.Piasecki@pwr.edu.pl
Bardziej szczegółowoWebSty - otwarty sieciowy system do analizy stylometrycznej tekstu
WebSty - otwarty sieciowy system do analizy stylometrycznej tekstu Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Maciej.Piasecki@pwr.edu.pl
Bardziej szczegółowoWebSty - otwarty sieciowy system do analizy stylometrycznej tekstu
WebSty - otwarty sieciowy system do analizy stylometrycznej tekstu Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Maciej.Piasecki@pwr.edu.pl
Bardziej szczegółowoWebSty - otwarty sieciowy system do analizy stylometrycznej tekstu
WebSty - otwarty sieciowy system do analizy stylometrycznej tekstu Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Maciej.Piasecki@pwr.edu.pl
Bardziej szczegółowoDSpace. Co to jest DSpace? Dostęp do danych. 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych
DSpace 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych 2. Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości dostępu do archiwum
Bardziej szczegółowoWebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów
IJP PAN / UP Kraków maciejeder@gmail.com WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów ws.clarin-pl.eu/websty.shtml Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika
Bardziej szczegółowoCLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych
wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii Językowej
Bardziej szczegółowoInforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Bardziej szczegółowoZarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoInforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
Bardziej szczegółowoSprzętowo wspomagane metody klasyfikacji danych
Sprzętowo wspomagane metody klasyfikacji danych Jakub Botwicz Politechnika Warszawska, Instytut Telekomunikacji Plan prezentacji 1. Motywacje oraz cele 2. Problemy klasyfikacji danych 3. Weryfikacja integralności
Bardziej szczegółowoCLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Bardziej szczegółowoMapa Literacka analiza odniesień geograficznych w tekstach literackich
CLARIN-PL Mapa Literacka analiza odniesień geograficznych w tekstach literackich Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Bardziej szczegółowoCzęść 1. Ekstrakcja informacji oraz stylometria na usługach psychologii CLARIN-PL. Tomasz Walkowiak
CLARIN-PL Ekstrakcja informacji oraz stylometria na usługach psychologii Część 1 Tomasz Walkowiak Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki i Zarządzania
Bardziej szczegółowoOMNITRACKER Wersja testowa. Szybki przewodnik instalacji
OMNITRACKER Wersja testowa Szybki przewodnik instalacji 1 Krok 1:Rejestracja pobrania (jeżeli nie wykonana dotychczas) Proszę dokonać rejestracji na stronieomninet (www.omnitracker.com) pod Contact. Po
Bardziej szczegółowoWydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk Część 1
Wydobywanie informacji oraz cech tekstów: tworzenie prostych statystyk Część 1 Jan Kocoń, Tomasz Walkowiak Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki
Bardziej szczegółowoEkstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoSystem generacji raportów
Zalety systemu Czym jest ProReports? prostota instalacji, wieloplatformowość (AIX, Linux, Windows, Solaris), obsługa popularnych formatów (PDF, XLS, RTF, HTML,TXT,XML,CSV), obsługa wielu baz danych, raporty
Bardziej szczegółowoDSpace. Podstawowe informacje: Co to jest DSpace? Dostęp do danych
DSpace Instrukcja użytkownika Podstawowe informacje: Co to jest DSpace? Dostęp do danych Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości
Bardziej szczegółowoCLARIN-PL wielka infrastruktura badawcza technologii j zykowych dla nauk humanistycznych i spo ecznych
wielka infrastruktura badawcza technologii j zykowych dla nauk humanistycznych i spo ecznych Maciej Piasecki Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii J
Bardziej szczegółowoEmilia Karwasińska, Małgorzata Rychlik. Biblioteka Uniwersytecka w Poznaniu
Emilia Karwasińska, Małgorzata Rychlik Biblioteka Uniwersytecka w Poznaniu 2010 Cel projektu Celem utworzenia repozytorium instytucjonalnego Uniwersytetu im. Adama Mickiewicza jest podwyższenie prestiżu
Bardziej szczegółowoOgólnopolskie Repozytorium Prac Dyplomowych
Ogólnopolskie Repozytorium Prac Dyplomowych System Informacji o Szkolnictwie Wyższym POL-on Źródła danych i sposób zasilania, formaty i aspekty organizacyjne Strona 1 z 8 Spis treści Spis treści 1.Źródła
Bardziej szczegółowoCLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego Maciej Piasecki Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 maciej.piasecki@pwr.wroc.pl
Bardziej szczegółowoSerwery. Autorzy: Karol Czosnowski Mateusz Kaźmierczak
Serwery Autorzy: Karol Czosnowski Mateusz Kaźmierczak Czym jest XMPP? XMPP (Extensible Messaging and Presence Protocol), zbiór otwartych technologii do komunikacji, czatu wieloosobowego, rozmów wideo i
Bardziej szczegółowoDoxis4 Rendition Server
Konwersja formatów na serwerze Doxis4 Rendition Server Kluczowe informacje Pakiet Doxis4 iecm (zintegrowany system zarządzania treścią w przedsiębiorstwie) oferuje możliwość konwersji dokumentów wejściowych
Bardziej szczegółowoObiektowy model dokumentu. Katedra Mikroelektroniki i Technik Informatycznych
Katedra Mikroelektroniki i Technik Informatycznych Łódź, 14 października 2005 roku Wstęp DOM Document Object Model zapewnia: Zbiór obiektów reprezentujących dokumenty XML i HTML. Model łączenia obiektów.
Bardziej szczegółowoProgram warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Bardziej szczegółowoFederacja zarządzania tożsamością PIONIER.Id
Federacja zarządzania tożsamością PIONIER.Id Tomasz Wolniewicz Maja Górecka-Wolniewicz Uniwersytet Mikołaja Kopernika w Toruniu Federacje zarządzania tożsamością Pomysł pochodzący i rozwijany przez środowiska
Bardziej szczegółowoKONTO UCZNIA Rok szkolny 2016/2017
KONTO UCZNIA Rok szkolny 2016/2017 ProjectSend SPIS TREŚCI Czym jest Magazyn plików? s 03 Tworzenie nowego konta s 04 Logowanie s 05 Dodawanie plików s 07 Zarządzanie plikami s 11 Pobieranie plików s 13
Bardziej szczegółowoCLARINPL. wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych CLARIN-PL. Jan Wieczorek Maciej Piasecki
CLARINPL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Jan Wieczorek Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa
Bardziej szczegółowoSkładowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014
Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014 Podstawowy proces gromadzenia Trudności: Weryfikacja dokumentu
Bardziej szczegółowoIntegracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych
Integracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych... Janina Mincer-Daszkiewicz, Łukasz Karniewski Uniwersytet Warszawski, MUCI jmd@mimuw.edu.pl Warszawa, 2015-11-16 Wymiana danych z ORPD 1.
Bardziej szczegółowoOPIS i SPECYFIKACJA TECHNICZNA
OPIS i SPECYFIKACJA TECHNICZNA Dotyczy Konkursu ofert numer 1/POIG 8.2/2013 WdroŜenie internetowego systemu klasy B2B do automatyzacji procesów biznesowych oraz koordynacji działań z partnerami w firmie
Bardziej szczegółowoOPROGRAMOWANIE KEMAS zbudowane jest na platformie KEMAS NET
Security Systems Risk Management OPROGRAMOWANIE KEMAS zbudowane jest na platformie KEMAS NET Oprogramowanie firmy KEMAS jest zbudowane na bazie pakietu programowego- KEMAS NET- dedykowanego do zarządzania
Bardziej szczegółowoZadanie nr 4.5: Oprogramowanie bazodanowe. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia
Zadanie nr 4.5: Oprogramowanie bazodanowe Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia Zakres przedmiotu zamówienia obejmuje dostarczenie, wdrożenie oraz konfigurację
Bardziej szczegółowoKPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki
Bardziej szczegółowoNarzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Bardziej szczegółowoProgramowanie Komponentowe WebAPI
Programowanie Komponentowe WebAPI dr inż. Ireneusz Szcześniak jesień 2016 roku WebAPI - interfejs webowy WebAPI to interfejs aplikacji (usługi, komponentu, serwisu) dostępnej najczęściej przez Internet,
Bardziej szczegółowoOMNITRACKER Wersja testowa. Szybki przewodnik instalacji
OMNITRACKER Wersja testowa Szybki przewodnik instalacji 1 Krok 1:Rejestracja pobrania (jeżeli nie wykonana dotychczas) Proszę dokonać rejestracji na stronieomninet (www.omnitracker.com) pod Contact. Po
Bardziej szczegółowoRegulamin korzystania z Usługi INVO24 przez Odbiorcę i Użytkownika Odbiorcy
Archivio sp. z o.o. Regulamin korzystania z Usługi INVO24 przez Odbiorcę i Użytkownika Odbiorcy Wersja 1.0 Archivio sp. z o.o. Strona 1 z 6 1. Postanowienia ogólne i definicje 1. Niniejszy Regulamin określa
Bardziej szczegółowoPytanie nr 2. Dodatkowy moduł Kreator Bannerów Czy moduł Kreator Bannerów ma być modułem zintegrowanym z portalem i pozwalającym na
DAZ-ZP.272.57.2012 Gdańsk, dnia 23.07.2012 r. Dotyczy postępowania o udzielenie zamówienia publicznego prowadzonego w trybie przetargu nieograniczonego na zasadach określonych w ustawie Prawo zamówień
Bardziej szczegółowoKonferencja POL-on. Moduły ORPD, PBN, POL-Index. Małgorzata Stefańczuk OPI PIB mstefanczuk@opi.org.pl 18 maja 2015 r.
Konferencja POL-on Moduły ORPD, PBN, POL-Index Małgorzata Stefańczuk OPI PIB mstefanczuk@opi.org.pl 18 maja 2015 r. ORPD Ogólnopolskie Repozytorium Prac Dyplomowych - podstawy prawne USTAWA z dnia 27 lipca
Bardziej szczegółowoAPD. Archiwum Prac Dyplomowych w USOS. Mariusz.Czerniak@umk.pl
APD Archiwum Prac Dyplomowych w USOS Mariusz.Czerniak@umk.pl Plan prezentacji Wprowadzenie do aplikacji Zastosowania i scenariusze działań Plany na najbliższą przyszłość Geneza i przeznaczenie APD należy
Bardziej szczegółowoTypy przetwarzania. Przetwarzanie zcentralizowane. Przetwarzanie rozproszone
Typy przetwarzania Przetwarzanie zcentralizowane Systemy typu mainfame Przetwarzanie rozproszone Architektura klient serwer Architektura jednowarstwowa Architektura dwuwarstwowa Architektura trójwarstwowa
Bardziej szczegółowoWydobywanie informacji oraz cech tekstów: analiza frekwencyjna
Wydobywanie informacji oraz cech tekstów: analiza frekwencyjna Maciej Piasecki, Tomasz Walkowiak Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki i Zarządzania
Bardziej szczegółowoOpis przedmiotu zamówienia
Numer sprawy: DGA/05/12 Załącznik nr A do SIWZ Przedmiot zamówienia: dostawa oprogramowaniasystemowego i narzędziowego dla Instytutu Łączności Państwowego Instytutu Badawczego w ramach Projektu Platforma
Bardziej szczegółowoArchitektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT
Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT A. Dudczak, C. Mazurek, T. Parkoła, J. Pukacki, M. Stroiński, M. Werla, J. Węglarz Poznańskie Centrum Superkomputerowo-Sieciowe
Bardziej szczegółowoegroupware czy phpgroupware jest też mniej stabilny.
Opengroupware to projekt udostępniający kompletny serwer aplikacji oparty na systemie Linux. Dostępny na licencji GNU GPL, strona domowa: http://www.opengroupware.org/ Jego cechy to wysoka stabilność,
Bardziej szczegółowoNarzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Bardziej szczegółowoFederacja Bibliotek Cyfrowych w sieci PIONIER
Federacja Bibliotek Cyfrowych w sieci PIONIER Dostęp p do otwartych bibliotek cyfrowych i repozytoriów Agnieszka Lewandowska, Cezary Mazurek, Marcin Werla {jagna,mazurek,mwerla}@man.poznan.pl Historia
Bardziej szczegółowoTomasz Grześ. Systemy zarządzania treścią
Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,
Bardziej szczegółowoCzęść I Rozpoczęcie pracy z usługami Reporting Services
Spis treści Podziękowania... xi Wprowadzenie... xiii Część I Rozpoczęcie pracy z usługami Reporting Services 1 Wprowadzenie do usług Reporting Services... 3 Platforma raportowania... 3 Cykl życia raportu...
Bardziej szczegółowoInstrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Bardziej szczegółowoGrafika i Systemy Multimedialne (IGM)
Nowa Specjalność na Kierunku Informatyka Informatyka Techniczna (ITN) Grafika i Systemy Multimedialne (IGM) dr inż. Jacek Mazurkiewicz (K-9) Motywacja 2 narastająca potrzeba aktualizacji, modernizacji
Bardziej szczegółowoAplikacja serwerowa Platformy Prezentacyjnej Opis produktu
Aplikacja serwerowa Platformy Prezentacyjnej Opis produktu Polska Organizacja Turystyczna ul. Chałubińskiego 8 00-613 Warszawa Spis treści 1 Założenia wstępne... 1 1.1 Informacje wstępne... 1 1.2 Cel projektu...
Bardziej szczegółowoCześć I Oprogramowanie do zautomatyzowanej masowej obróbki plików graficznych.
Strona 1 z 10 Opis przedmiotu zamówienia Załącznik nr 1 Cześć I Oprogramowanie do zautomatyzowanej masowej obróbki plików graficznych. I. Oprogramowanie do stacji przetwarzania typ I 4 szt. licencji Lp.
Bardziej szczegółowoDariusz Brzeziński. Politechnika Poznańska, Instytut Informatyki
Dariusz Brzeziński Politechnika Poznańska, Instytut Informatyki Język programowania prosty bezpieczny zorientowany obiektowo wielowątkowy rozproszony przenaszalny interpretowany dynamiczny wydajny Platforma
Bardziej szczegółowoNowe usługi w infrastrukturze sieci MAN i PIONIER. Aleksandra Nowak Marcin Werla
Nowe usługi w infrastrukturze sieci MAN i PIONIER Aleksandra Nowak (anowak@man.poznan.pl) Marcin Werla (mwerla@man.poznan.pl) Biblioteki cyfrowe w sieci PIONIER - Ponad 100 serwisów internetowych - Kilkaset
Bardziej szczegółowoKorpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Bardziej szczegółowoMateriał dystrybuowany na licencji CC-BY-SA
Materiał dystrybuowany na licencji CC-BY-SA II Seminarium Technologiczne Warszawa, ORE, 30.08.2013 Autorzy: Krzysztof Kurowski, Piotr Dziubecki Agenda 10.40 12.30 Interfejsy programistyczne i narzędzia
Bardziej szczegółowodlibra 3.0 Marcin Heliński
dlibra 3.0 Marcin Heliński Plan prezentacji Wstęp Aplikacja Redaktora / Administratora Serwer Aplikacja Czytelnika Aktualizator Udostępnienie API NajwaŜniejsze w nowej wersji Ulepszenie interfejsu uŝytkownika
Bardziej szczegółowoII cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Bardziej szczegółowoInstrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Bardziej szczegółowoInstrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Bardziej szczegółowoThe Binder Consulting
The Binder Consulting Contents Indywidualne szkolenia specjalistyczne...3 Konsultacje dla tworzenia rozwiazan mobilnych... 3 Dedykowane rozwiazania informatyczne... 3 Konsultacje i wdrożenie mechanizmów
Bardziej szczegółowoZintegrowany system usług dla nauki etap II (ZSUN II)
Zintegrowany system usług dla nauki etap II (ZSUN II) Ośrodek Przetwarzania Informacji Państwowy Instytut Badawczy Jarosław Protasiewicz jaroslaw.protasiewicz@opi.org.pl Warszawa, 5 czerwca 2017 r. Geneza
Bardziej szczegółowoKoncepcja rozwoju oprogramowania ORPPD
Koncepcja rozwoju oprogramowania ORPPD Słownik pojęd: Informacja indeksowana przetworzona Informacja nieindeksowana (pełna autentyczna treśd pracy dyplomowej znajdująca się w ORPPD) przez Program indeksujący
Bardziej szczegółowoBudowanie repozytorium dziedzinowego
Budowanie repozytorium dziedzinowego doświadczenia Biblioteki Naukowej Instytutu Medycyny Pracy w Łodzi i Biblioteki Politechniki Łódzkiej Jolanta Przyłuska Anna Radomska Biblioteka Naukowa Instytut Medycyny
Bardziej szczegółowoXpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie
Xpress Sp. z o.o. jako wieloletni Premium Partner firmy Xerox ma w swojej ofercie rozwiązanie XPRESS SCAN, które pozwala użytkownikom bezpośrednio z urządzenia Xerox przez panel dotykowy zrealizować odpowiedni
Bardziej szczegółowoZarządzenie Nr R-86/2016 Rektora Politechniki Lubelskiej z dnia 7 grudnia 2016 r. w sprawie Biuletynu Informacji Publicznej Politechniki Lubelskiej
Zarządzenie Nr R-86/2016 Rektora Politechniki Lubelskiej z dnia 7 grudnia 2016 r. w sprawie Biuletynu Informacji Publicznej Politechniki Lubelskiej Na podstawie 32 Statutu Politechniki Lubelskiej, art.
Bardziej szczegółowo` Oxeris Anti-Theft Service Powered by Intel Anti-Theft Technology Usługa antykradzieżowa urządzeń
Oxeris to e-usługa, która ma na celu ochronę i zarządzanie zasobami informacyjnymi urządzeń mobilnych, zdalne zarządzanie tymi urządzeniami, oraz aktywne zapobieganie skutkom kradzieży urządzeń mobilnych
Bardziej szczegółowoCzym jest system antyplagiatowy? Andrzej Sobecki
Czym jest system antyplagiatowy Andrzej Sobecki Politechnika Gdanska 8 kwietnia 2016 r. Agenda 1. Przyczyna i skutek 2. Cele jednostek wdrażających system antyplagiatowy 3. System a program antyplagiatowy
Bardziej szczegółowoKomunikacja i wymiana danych
Budowa i oprogramowanie komputerowych systemów sterowania Wykład 10 Komunikacja i wymiana danych Metody wymiany danych Lokalne Pliki txt, csv, xls, xml Biblioteki LIB / DLL DDE, FastDDE OLE, COM, ActiveX
Bardziej szczegółowoInstrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC
Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC Strona 1 z 14 Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem
Bardziej szczegółowoInstalacja SQL Server Express. Logowanie na stronie Microsoftu
Instalacja SQL Server Express Logowanie na stronie Microsoftu Wybór wersji do pobrania Pobieranie startuje, przechodzimy do strony z poradami. Wypakowujemy pobrany plik. Otwiera się okno instalacji. Wybieramy
Bardziej szczegółowoEXSO-CORE - specyfikacja
EXSO-CORE - specyfikacja System bazowy dla aplikacji EXSO. Elementy tego systemu występują we wszystkich programach EXSO. Może on ponadto stanowić podstawę do opracowania nowych, dedykowanych systemów.
Bardziej szczegółowoRola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu
Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu Marcin Werla (mwerla@man.poznan.pl) Poznańskie Centrum Superkomputerowo-Sieciowe, Dział Bibliotek Cyfrowych i Platform Wiedzy Prezentacja
Bardziej szczegółowoCzęść 1. Wydobywanie informacji z tekstu i stylometria CLARIN-PL. Tomasz Walkowiak, Maciej Piasecki
Wydobywanie informacji z tekstu i stylometria Część 1 Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej Wydział Informatyki i Zarządzania
Bardziej szczegółowoInstrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Bardziej szczegółowoInstrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Bardziej szczegółowoSystem informacji prawnej w wersji internetowej
Załącznik Nr 1 do SIWZ Nr spr. 27/ZP/CBA/2007 OKREŚLENIE PRZEDMIOTU ZAMÓWIENIA OBJĘTEGO UMOWĄ RAMOWĄ System informacji prawnej w wersji internetowej Przedmiotem zamówienia jest dostawa systemu informacji
Bardziej szczegółowoLaboratorium Chmur obliczeniowych. Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz
Laboratorium Chmur obliczeniowych Paweł Świątek, Łukasz Falas, Patryk Schauer, Radosław Adamkiewicz Agenda SANTOS Lab laboratorium badawcze Zagadnienia badawcze Infrastruktura SANTOS Lab Zasoby laboratorium
Bardziej szczegółowoZARZĄDZANIE DOKUMENTACJĄ. Tomasz Jarmuszczak PCC Polska
ZARZĄDZANIE DOKUMENTACJĄ Tomasz Jarmuszczak PCC Polska Problemy z zarządzaniem dokumentacją Jak znaleźć potrzebny dokument? Gdzie znaleźć wcześniejszą wersję? Która wersja jest właściwa? Czy projekt został
Bardziej szczegółowoPlatforma Usług dla Obywateli - Microsoft Citizen Service Platform
Platforma Usług dla Obywateli - Microsoft Citizen Service Platform Paweł Walczak pawel.walczak@microsoft.com CSP w kilku słowach Citizen Services Platform Ogólnoświatowy projekt Microsoft na bazie Doświadczeń
Bardziej szczegółowoSeeon Enterprise Search Engine. Rozwiązanie obsługiwane przez eo Networks S.A.
Seeon Enterprise Search Engine Rozwiązanie obsługiwane przez eo Networks S.A. Seeon Enterprise Search Engine SeeOn Search Engine to kompleksowy, w pełni gotowy do wdrożenia silnik wyszukiwania dedykowany
Bardziej szczegółowoInstrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Bardziej szczegółowoedziennik Ustaw Opis architektury
edziennik Ustaw Opis architektury Spis treści 1 Wstęp...3 2 Architektura systemu...3 2.1 Schemat poglądowy rozwiązania...3 2.2 Architektura logiczna...4 2.3 Opis elementów systemu...5 2.3.1 Moduł Udostępniający...5
Bardziej szczegółowoProgramowanie obiektowe
Programowanie obiektowe Wykład 13 Marcin Młotkowski 27 maja 2015 Plan wykładu Trwałość obiektów 1 Trwałość obiektów 2 Marcin Młotkowski Programowanie obiektowe 2 / 29 Trwałość (persistence) Definicja Cecha
Bardziej szczegółowoPodstawy programowania. Wprowadzenie
Podstawy programowania Wprowadzenie Proces tworzenia programu Sformułowanie problemu funkcje programu zakres i postać danych postać i dokładność wyników Wybór / opracowanie metody rozwiązania znaleźć matematyczne
Bardziej szczegółowoIntegracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych i Otwartym Systemem Antyplagiatowym
Integracja APD z Ogólnopolskim Repozytorium Prac Dyplomowych i Otwartym Systemem Antyplagiatowym... Łukasz Karniewski Uniwersytet Warszawski, MUCI l.karniewski@usos.edu.pl Warszawa, 2015-03-25 Plan prezentacji
Bardziej szczegółowoOPIS PRZEDMIOTU ZAMÓWIENIA
Lubelskie Centrum Transferu Technologii Politechniki Lubelskiej ul. Nadbystrzycka 36, 20-618 Lublin Tel. 81 538 42 70, fax. 81 538 42 67; e-mail: lctt@pollub.pl OPIS PRZEDMIOTU ZAMÓWIENIA Do realizacji
Bardziej szczegółowoProdukt Treść pochodzi ze strony AB (https://www.ab.pl)
Strona 1 z 5 Strona 2 z 5 FineReader Professional 12 EDU KOD PRODUCENT GWARANCJA OBABB12PEED ABBYY gwarancja normalna Ważne Uwaga! Osoby uprawnione do korzystania z licencji EDUKACYJNEJ to: prawna, która
Bardziej szczegółowo