CLARIN rozproszony system technologii językowych dla różnych języków europejskich
|
|
- Agata Kwiecień
- 9 lat temu
- Przeglądów:
Transkrypt
1 CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group
2 Projekt CLARIN CLARIN = Common Language Resources and Technology Infrastructure Wspólne zasoby językowe i infrastruktura technologiczna Część europejskiej mapy drogowej infrastruktury naukowej (European Roadmap for Research Infrastructures) ESFRI (European Strategy Forum on Research Infrastructures) Polskiej Mapy Drogowej Infrastruktury Badawczej Cel zasobów i narzędzi językowych dla wszystkich języków europejskich w ramach jednej wspólnej sieciowej infrastruktury naukowej Obszar działania: nauki humanistyczne i społeczne
3 Projekt CLARIN CLARIN ERIC konsorcjum naukowe typu ERIC (European Research Infrastructure Consortium) członkowie Austria Bułgaria Czechy Dania Estonia Holandia Niemcy Dutch Language Union (organizacja międzypaństwowa) obserwatorzy Norwegia
4 Podstawowe pojęcia Zasoby językowe opisy języka naturalnego, które są sformalizowane w różnym stopniu zbiory danych i bazy danych opisujące język naturalny oraz jego użycie Narzędzia językowe programy komputerowe do przetwarzania tekstu i mowy na różnych poziomach analizy języka naturalnego automatyczna analiza struktur językowych, np. analiza składniowa zastosowania użytkowe, np. rozpoznawanie i klasyfikacja nazw własnych Technologia językowa = zasoby + narzędzia + infrastruktura Infrastruktura językowa wspólna baza technologiczna zapewniająca połączenie zróżnicowanych narzędzi i zasobów językowych
5 Zasoby językowe Korpusy (duże zbiory) dokumentów tekstowych i nagrań mowy: przykłady użycia (fragmenty, wypowiedzi lub całe dokumenty) anotowane - opisane pod względem lingwistycznym w sformalizowany sposób (np. pod względem gramatycznym, czy też znaczenia) Słowniki morfologiczne, własności gramatycznych słów, nazw własnych, leksykony semantyczne, leksykalne sieci semantyczne, wielojęzyczne słowniki itd. Gramatyki Inne zasoby np. schematy anotacji oraz metadanych, funkcje podobieństwa semantycznego słów, listy częstościowe, modele językowe itd.
6 Narzędzia językowe Analizatory morfologiczne rozpoznające znane słowa i przypisujące im opis własności gramatycznych Programy do ujednoznaczniania znaczeń słów w tekście Parsery dokonujące analizy składniowej oraz semantycznej tekstu Programy do rozpoznawania mowy i pisma ręcznego Programy do analizy znaczenia i struktury znaczeniowej tekstu rozpoznawanie i klasyfikacja nazw własnych rozpoznawanie powiązań anaforycznych rozpoznawanie sytuacji itd.
7 Narzędzia językowe - przykład Autorzy filmu stawiają tezę, że pierwszym człowiekiem, który postawił nogę na wierzchołku Ziemi był George Mallory. Autor film stawiać teza, że pierwszy człowiek, który postawić noga na wierzchołek Ziemia być George Mallory. Autor[subst.nom.pl.m1] film[subst.gen.sg.m3] stawiać[fin.pl.m1] teza[subst.gen.sg.f], że[conj] pierwszy[adj.dat.sg.m1] człowiek[subst.dat.sg.m1] Autorzy filmu stawiają tezę, że pierwszym człowiekiem, który postawił nogę na wierzchołku Ziemi[Astro_Object] był George Mallory[Person]. Autorzy filmu[np] stawiają tezę, że [pierwszym człowiekiem, który postawił nogę na wierzchołku Ziemi] był George Mallory.
8 Bariery w dostępie Fizyczna narzędzia i zasoby nie są dostępne w sieci Informacyjna brak opisu narzędzi i zasobów brak katalogów i możliwości łatwego odnalezienia Technologiczna brak standardów, możliwości łączenia elementów technologii brak wspólnej platformy różnorodność rozwiązań technologicznych brak sprzętu o określonych parametrach Wiedzy wymagane umiejętności programistyczne wymagana wiedza z zakresu inżynierii języka naturalnego Prawna licencje ograniczające dostęp i wykorzystanie szczególnie w odniesieniu do korpusów
9 Infrastruktura językowa
10 Funkcje infrastruktury Odpowiedni system składowania (repozytoryjny) trwałość danych (system archiwizacji) jednoznaczny opis danych za pomocą trwałych identyfikatorów (Persistent Identifiers) metadane o złożonej strukturze (CMDI) zarządzanie metadanymi zgodnie z przyjętymi standardami (np. ISOcat, RELcat) wirtualne kolekcje oparte na metadanych Rozproszona identyfikacja i autoryzacja użytkowników oparta na federacjach narodowych zasada jednego konta i jednego logowania Integracja zasobów i usług w oparciu o usługi sieciowe (Web Services) dostęp poprzez aplikacje sieciowe brak konieczności ściągania i instalowania
11 Centra CLARIN Typ A centrum infrastrukturalne dostawca podstaw technologicznych i usług potrzebnych do podstawowego funkcjonowania sieci CLARIN np. gromadzenia i agregacji metadanych, dostarczanie unikalnych identyfikatorów zasobów i narzędzi, itp., Typ B centrum technologii językowych podstawowy składnik sieci usługi, narzędzia, zasoby i aplikacje związane z przetwarzaniem języka naturalnego Typ C centrum metadanych umożliwiają automatczny dostęp do opisów zasobów (ale nie same zasoby) Typ K centrum wiedzy dostęp do wiedzy i ekspertów wsparcie użytkowników CLARIN
12 Aplikacje przykłady Ułatwienie dostępu połączony katalog metadanych federacyjne wyszukiwanie w korpusach tekstu i mowy Gromadzenie i zarządzanie danymi tworzenie własnych kolekcji rozszerzanie istniejących wykorzystanie istniejących archiwów Rozszerzenie wyszukiwania w zasobach automatyczna generacja metadanych w oparciu o narzędzia językowe Wydobywanie informacji i wiedzy automatyczna generacja zestawień analiza statystyczna oparta na faktach wydobytych z korpusu
13 Konsorcjum : polska część infrastruktury CLARIN Centrum Technologii Językowych zlokalizowane na Politechnice Wrocławskiej budowane w ramach Grupy Naukowej G4.19 zapewniające funkcje sieciowe infrastruktury CLARIN udostępniające Korpusy repozytorium zestaw wybranych aplikacji zbudowanych we współpracy z użytkownikami wsparcie dla użytkowników naukowców Uzupełnienie brakujących elementów podstawowej technologii językowej dla języka polskiego Wybrane zasoby dwujęzyczne
14 Typowy schemat przetwarzania wypowiedzi 1. Rozpoznanie struktury dokumentu i wydobycie tekstu 2. Segmentacja: na tokeny, zdania oraz jednostki bardziej złożone 3. Analiza morfologiczna 4. Ujednoznacznianie morfo-syntaktyczne (tagowanie) 5. Ujednoznacznianie sensu słów (znaczeń leksykalnych) 6. Płytka analiza składniowa (płytki parsing) (opcjonalnie) 7. Rozpoznawanie wyrażeń wielowyrazowych, w tym jednostek identyfikujących, np. nazw własnych. 8. Rozpoznawanie związków w tekście, np. anafory, koreferencji, relacji semantycznych, sytuacji. 9. Głęboka analiza składniowa (głęboki parsing) 10. Głęboka analiza semantyczna (częściowo) 11. Analiza pragmatyczna (w tym struktury dyskursu)
15 : wybrane zadania System długoterminowego przechowywania danych cyfrowych Korpusy: mowy, transkrypcji mowy, historyczny i dwujęzyczne Narzędzia do zaawansowanego przeszukiwania korpusów mowy i tekstu oraz wydobywania wiedzy lingwistycznej z korpusów Leksykalne zasoby semantyczne: bardzo duży dwujęzyczny wordnet, wyrażenia wielowyrazowe, nazwy własne oraz ramy walencyjne (struktury argumentowe) Płytkie i głębokie parsery semantyczne dla języka polskiego Wydobywanie informacji: rozpoznawanie nazw własnych, odniesień do czasu, anafory, relacji oraz sytuacji Narzędzia do automatycznego streszczania Narzędzia do wydobywania wiedzy z tekstu (Text Mining) ukierunkowane na zastosowania w naukach humanistycznych i społecznych współpraca z użytkownikami
16 : projekt Okres: Partnerzy: Politechnika Wrocławska, Instytut Informatyki (lider) Instytut Podstaw Informatyki Polskiej Akademii Nauk Instytut Slawistyki Polskiej Akademii Nauk Polsko-Japońska Wyższa Szkoła Technik Komputerowych Uniwersytet Łódzki Uniwersytet Wrocławski
17 Dziękuję bardzo za uwagę
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego Maciej Piasecki Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 maciej.piasecki@pwr.wroc.pl
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Maciej Piasecki, Tomasz Walkowiak Politechnika ska Katedra Inteligencji Obliczeniowej
CLARIN infrastruktura naukowa technologii językowych
CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:
CLARINPL. wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych CLARIN-PL. Jan Wieczorek Maciej Piasecki
CLARINPL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Jan Wieczorek Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa
CLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych
wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii Językowej
CLARIN-PL wielka infrastruktura badawcza technologii j zykowych dla nauk humanistycznych i spo ecznych
wielka infrastruktura badawcza technologii j zykowych dla nauk humanistycznych i spo ecznych Maciej Piasecki Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii J
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:
WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji
Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi
CLARIN-PL Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi Marcin Pol, Tomasz Walkowiak Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19
II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Open Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
MAREK NIEZGÓDKA ICM, UNIWERSYTET WARSZAWSKI
SYNAT: UNIWERSALNA, OTWARTA, REPOZYTORYJNA PLATFORMA HOSTINGOWA I KOMUNIKACYJNA SIECIOWYCH ZASOBÓW WIEDZY DLA NAUKI, EDUKACJI I OTWARTEGO SPOŁECZEŃSTWA WIEDZY MAREK NIEZGÓDKA ICM, UNIWERSYTET WARSZAWSKI
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu
Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu Marcin Werla (mwerla@man.poznan.pl) Poznańskie Centrum Superkomputerowo-Sieciowe, Dział Bibliotek Cyfrowych i Platform Wiedzy Prezentacja
Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT
Architektury i protokoły dla budowania systemów wiedzy - zadania PCSS w projekcie SYNAT A. Dudczak, C. Mazurek, T. Parkoła, J. Pukacki, M. Stroiński, M. Werla, J. Węglarz Poznańskie Centrum Superkomputerowo-Sieciowe
Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe
Rozwój polskich bibliotek cyfrowych Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe Plan prezentacji Wprowadzenie Historia rozwoju bibliotek cyfrowych w Polsce Aktualny stan bibliotek cyfrowych
Zapytanie ofertowe nr 1/2016
to Zapytanie ofertowe nr 1/2016 z dnia 11052016 Espeo Software Sp z oo 2 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zapytanie ofertowe nr 1/2016 z dnia 11052016 Zamawiający: Espeo Software Sp z oo Adres:
Publikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
DARIAH-PL Gdzie jesteśmy, dokąd idziemy?
DARIAH-PL Gdzie jesteśmy, dokąd idziemy? prof. Aleksander Bursche Uniwersytet Warszawski Przewodniczący Rady DARIAH-PL Jakub Szprot Uniwersytet Warszawski National Coordinator w DARIAH-ERIC DARIAH = DigitAl
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Inforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Rola bibliotek cyfrowych w budowaniu gospodarki opartej o wiedzę. Cezary Mazurek
Rola bibliotek cyfrowych w budowaniu gospodarki opartej o wiedzę Cezary Mazurek Biblioteki cyfrowe w sieci PIONIER Ekosystem zasobów i narzędzi Użytkownicy indywidualni i instytucjonalni Wyszukiwarki internetowe,
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl
Semantyczna analiza języka naturalnego
Semantyczna analiza języka naturalnego Rozwiązanie Applica oparte o IBM SPSS Modeler Piotr Surma Applica 2 Agenda O Applica Analiza tekstu w języku polskim - wyzwania Rozwiązanie Applica Analiza Tekstu
Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst
Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst Mariusz Owsianny, PCSS Dr inż. Ewa Kuśmierek, Kierownik Projektu, PCSS Partnerzy konsorcjum Zaawansowany system automatycznego
Krok w stronę cyfrowej humanistyki infrastruktura IT dla badań humanistycznych
Krok w stronę cyfrowej humanistyki infrastruktura IT dla badań humanistycznych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe maneo@man.poznan.pl Humanistyka cyfrowa The digital humanities is
Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego
Wykorzystanie regionalnej biblioteki cyfrowej do tworzenia repozytorium instytucjonalnego Jakub Bajer Krzysztof Ober Polskie Biblioteki Cyfrowe Poznań, 18-22 października 2010 r. Plan prezentacji Wstęp
Możliwości i wyzwania dla polskiej infrastruktury bibliotek cyfrowych
Możliwości i wyzwania dla polskiej infrastruktury bibliotek cyfrowych C. Mazurek, M.Stroiński, M.Werla, J.Węglarz Poznańskie Centrum Superkomputerowo-Sieciowe Europejska infrastruktura informatyczna nauki
Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)
Polszczyzna i inżynieria lingwistyczna Autor: Marcin Miłkowski (IFiS PAN) 1 Polszczyzna i jej cechy szczególne Polszczyzną posługuje się od 40 do 48 milionów osób: najczęściej używany język zachodniosłowiański
Europeana Cloud: Wykorzystanie technologii chmurowych do współdzielenia on-line baz danych dziedzictwa kulturowego
Europeana Cloud: Wykorzystanie technologii chmurowych do współdzielenia on-line baz danych dziedzictwa kulturowego Cezary Mazurek, Aleksandra Nowak, Maciej Stroiński, Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki
Federacja Bibliotek Cyfrowych: wsparcie instytucji kultury w udostępnianiu zbiorów on-line, agregacja metadanych na potrzeby Europeany
Federacja Bibliotek Cyfrowych: wsparcie instytucji kultury w udostępnianiu zbiorów on-line, agregacja metadanych na potrzeby Europeany Justyna Walkowska, Marcin Werla Zespół Bibliotek Cyfrowych, Dział
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Grafika i Systemy Multimedialne (IGM)
Nowa Specjalność na Kierunku Informatyka Informatyka Techniczna (ITN) Grafika i Systemy Multimedialne (IGM) dr inż. Jacek Mazurkiewicz (K-9) Motywacja 2 narastająca potrzeba aktualizacji, modernizacji
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Grafika i Systemy Multimedialne (IGM)
Nowa Specjalność na Kierunku Informatyka Informatyka Techniczna (ITN) Grafika i Systemy Multimedialne (IGM) dr inż. Jacek Mazurkiewicz (K-9) Motywacja 2 narastająca potrzeba aktualizacji, modernizacji
WebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych
Wykorzystanie standardów serii ISO 19100 oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych dr inż. Adam Iwaniak Infrastruktura Danych Przestrzennych w Polsce i Europie Seminarium, AR Wrocław
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych
Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki
KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe
Marcin Werla (mwerla@man.poznan.pl) Poznańskie Centrum Superkomputerowo-Sieciowe Udostępnienie danych w formatach i w sposób umożliwiający użycie ich w Europeanie Podstawowy protokół to OAI-PMH Treść obiektu
WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów
IJP PAN / UP Kraków maciejeder@gmail.com WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów ws.clarin-pl.eu/websty.shtml Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika
Gdzie jesteśmy, dokąd idziemy? prof. Aleksander Bursche Uniwersytet Warszawski Przewodniczący Rady DARIAH-PL
Gdzie jesteśmy, dokąd idziemy? prof. Aleksander Bursche Uniwersytet Warszawski Przewodniczący Rady DARIAH-PL DARIAH = DigitAl Research Infrastracture for Art and Humanities wiosna 2014 początki prac nad
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego
Morfeusz 2 analizator i generator fleksyjny dla języka polskiego Marcin Woliński i Anna Andrzejczuk Zespół Inżynierii Lingwistycznej Instytut Podstaw Informatyki Polskiej Akademii Nauk Warsztaty CLARIN-PL,
Zintegrowany system usług dla nauki etap II (ZSUN II)
Zintegrowany system usług dla nauki etap II (ZSUN II) Ośrodek Przetwarzania Informacji Państwowy Instytut Badawczy Jarosław Protasiewicz jaroslaw.protasiewicz@opi.org.pl Warszawa, 5 czerwca 2017 r. Geneza
Zarządzanie wiedzą w instytucji naukowej cz. I
Zarządzanie wiedzą w instytucji naukowej cz. I Jolanta Przyłuska Dział Zarządzania Wiedzą IMP Łódź Projekt współfinansowany przez Unię Europejską ze środków Europejskiego Funduszu Rozwoju Regionalnego
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O
Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla
Biblioteka cyfrowa jako otwarte, internetowe repozytorium publikacji Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla Poznańskie Centrum Superkomputerowo-Sieciowe Biblioteka cyfrowa Podstawowe
Infrastruktura bibliotek cyfrowych
Infrastruktura bibliotek cyfrowych w sieci PIONIER C. Mazurek, M.Stroiński, M.Werla, J.Węglarz Poznańskie Centrum Superkomputerowo-Sieciowe Polskie Biblioteki Cyfrowe, Poznań, 25.11.2008r. Polski Internet
Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014
Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014 Podstawowy proces gromadzenia Trudności: Weryfikacja dokumentu
Federacja Bibliotek Cyfrowych w sieci PIONIER
Federacja Bibliotek Cyfrowych w sieci PIONIER Dostęp p do otwartych bibliotek cyfrowych i repozytoriów Agnieszka Lewandowska, Cezary Mazurek, Marcin Werla {jagna,mazurek,mwerla}@man.poznan.pl Historia
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Funkcjonalność oprogramowania Bazy Wiedzy i Repozytorium Politechniki Warszawskiej
Funkcjonalność oprogramowania Bazy Wiedzy i Repozytorium Politechniki Warszawskiej Prof. dr hab. inż. Henryk Rybiński, dr inż. Jakub Koperwas, dr inż. Łukasz Skonieczny, mgr inż. Wacław Struk Instytut
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Czy (centralne) katalogi biblioteczne są jeszcze potrzebne? OPAC w infotopii. Dr hab. Marek Nahotko, ISI UJ
Czy (centralne) katalogi biblioteczne są jeszcze potrzebne? OPAC w infotopii Dr hab. Marek Nahotko, ISI UJ 1 Współpraca bibliotek Cała niezbędna metainformacja funkcjonuje obecnie w formie elektronicznej
Efekt kształcenia. Wiedza
Efekty dla studiów drugiego stopnia profil ogólnoakademicki na kierunku Informatyka na specjalności Przetwarzanie i analiza danych, na Wydziale Matematyki i Nauk Informacyjnych, gdzie: * Odniesienie oznacza
Innowacyjne narzędzia w procesie digitalizacji
Innowacyjne narzędzia w procesie digitalizacji Tomasz Parkoła tparkola@man.poznan.pl Konferencja i3, 16.04.2013, Poznań Agenda Wprowadzenie Obszary działania Narzędzia i zasoby Podsumowanie Kontekst projekt
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji
Porozumienie w sprawie utworzenia konsorcjum Polskie Biblioteki Cyfrowe Agreement on the creation of a Consortium Polish Digital Libraries
Porozumienie w sprawie utworzenia konsorcjum - Polskie Biblioteki Cyfrowe Porozumienie w sprawie utworzenia konsorcjum Polskie Biblioteki Cyfrowe Agreement on the creation of a Consortium Polish Digital
INŻYNIERIA OPROGRAMOWANIA
INSTYTUT INFORMATYKI STOSOWANEJ 2013 INŻYNIERIA OPROGRAMOWANIA Inżynieria Oprogramowania Proces ukierunkowany na wytworzenie oprogramowania Jak? Kto? Kiedy? Co? W jaki sposób? Metodyka Zespół Narzędzia
Oprogramowanie dostosowane do potrzeb użytkownika. Skrócenie czasu wejścia na rynek
Platforma ASG jak wykorzystać potencjał usług sieciowych Beta Prelegent: Tomasz Kaczmarek Zespoł: Witold Abramowicz, Agata Filipowska, Monika Kaczmarek, Marek Kowalkiewicz, Tomasz Kaczmarek, Wojciech Rutkowski,
Obiekty Badawcze długoterminowe przechowywanie eksperymentów naukowych. Piotr Hołubowicz, Raúl Palma Poznańskie Centrum Superkomputerowo-Sieciowe
Obiekty Badawcze długoterminowe przechowywanie eksperymentów naukowych Piotr Hołubowicz, Raúl Palma Poznańskie Centrum Superkomputerowo-Sieciowe Plan prezentacji» Przechowywanie eksperymentów naukowych»
Sposoby wyszukiwania multimedialnych zasobów w Internecie
Sposoby wyszukiwania multimedialnych zasobów w Internecie Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy e-mail: lidka@utp.edu.pl III seminarium z cyklu INFOBROKER:
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego Dorota Adamiec Instytut Języka Polskiego PAN Elektroniczny
Informatyka Studia II stopnia
Wydział Elektrotechniki, Elektroniki, Informatyki i Automatyki Politechnika Łódzka Informatyka Studia II stopnia Katedra Informatyki Stosowanej Program kierunku Informatyka Specjalności Administrowanie
Centrum Otwartej Nauki
Centrum Otwartej Nauki Polskie repozytoria instytucjonalne w europejskiej sieci repozytoriów: Agregator CeON Roman Bogacewicz Centrum Otwartej Nauki ICM Uniwersytet Warszawski Repozytoria Co to jest repozytorium
Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi
Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie
Normy serii ISO 19100 w geodezji i geoinformatyce
Akademia Rolnicza we Wrocławiu Normy serii ISO 19100 w geodezji i geoinformatyce Adam Iwaniak Alina Kmiecik Nowoczesne ODGIK - utopia czy rzeczywistość, Wisła 13-15 października 2006 Lata 80te Spectrum,
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Wystąpienie przygotowane w ramach projektu Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772)
Repozytoria uczelniane i ich rola w projekcie SYNAT
Jak Cię widzą, tak Cię piszą Repozytoria uczelniane i ich rola w projekcie SYNAT Warszawa Maj 2013 Plan prezentacji 1. Jak Cię widzą 2. Usytuowanie repozytoriów uczelnianych w systemie Synat 3. Czy tylko
Wykład I. Wprowadzenie do baz danych
Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles
Mapa Literacka analiza odniesień geograficznych w tekstach literackich
CLARIN-PL Mapa Literacka analiza odniesień geograficznych w tekstach literackich Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Infrastruktura bibliotek cyfrowych w sieci PIONIER
POLSKIE BIBLIOTEKI CYFROWE 2008 str. 9-13 Infrastruktura bibliotek cyfrowych w sieci PIONIER CEZARY MAZUREK, MACIEJ STROIŃSKI, MARCIN WERLA, JAN WĘGLARZ Poznańskie Centrum Superkomputerowo-Sieciowe {mazurek
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN, Instytut Podstaw Informatyki PAN Podstawowe informacje o projekcie
Zastosowanie technologii Semantic Web w regionalnej sieci telemedycznej
Zastosowanie technologii Semantic Web w regionalnej sieci telemedycznej Michał Kosiedowski (michal.kosiedowski@man.poznan.pl) Cezary Mazurek (mazurek@man.poznan.pl) Raul Palma (rpalma@man.poznan.pl) Plan
WYKAZ PRZEDMIOTÓW I PLAN REALIZACJI
WYKAZ PRZEDMIOTÓW I PLAN REALIZACJI Lp Nazwa przedmiotu Obowiązuje po semestrze ROZKŁAD GODZIN ZAJĘĆ Godziny zajęć w tym: I rok II rok III rok Egz. Zal. Razem 7 sem. sem. sem. 3 sem. sem. sem. sem. S L
Projekt e-repozytorium prac naukowych Uniwersytetu Warszawskiego. dr Aneta Pieniądz, KBSI Ewa Kobierska-Maciuszko, BUW
Projekt e-repozytorium prac naukowych Uniwersytetu Warszawskiego dr Aneta Pieniądz, KBSI Ewa Kobierska-Maciuszko, BUW E-repozytorium instytucji definicja Gromadzi systematycznie, zachowuje długoterminowo
Pojęcie bazy danych. Funkcje i możliwości.
Pojęcie bazy danych. Funkcje i możliwości. Pojęcie bazy danych Baza danych to: zbiór informacji zapisanych według ściśle określonych reguł, w strukturach odpowiadających założonemu modelowi danych, zbiór
DSpace. Co to jest DSpace? Dostęp do danych. 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych
DSpace 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych 2. Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości dostępu do archiwum
extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl
extensible Markup Language, cz. 1 Marcin Gryszkalis, mg@fork.pl Plan wykładu Wprowadzenie: historia rozwoju technik znakowania tekstu Motywacje dla prac nad XML-em Podstawowe koncepcje XML-a XML jako metajęzyk
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN Podstawowe informacje o projekcie Projekt realizowany przez IJP
Agregacja metadanych zbiorów polskich instytucji kultury działania Poznańskiego Centrum Superkomputerowo-Sieciowego
Agregacja metadanych zbiorów polskich instytucji kultury działania Poznańskiego Centrum Superkomputerowo-Sieciowego Tomasz Parkoła, Marcin Werla Zespół Bibliotek Cyfrowych, Dział Usług Sieciowych PCSS
Szkolenie w zakresie funkcjonalności platformy ekatalogi. - Zamawiający -
Szkolenie w zakresie funkcjonalności platformy ekatalogi - Zamawiający - Warszawa, 08/12/2014 Ewelina Kutyła www.eurodyn.com Agenda 1. European Dynamics wykonawca systemu ekatalogi 2. Platforma ekatalogi
Tomasz Grześ. Systemy zarządzania treścią
Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,
Uniwersytet Jagielloński Collegium Medicum. Anna Uryga, Jolanta Cieśla, Lucjan Stalmach
Wyniki działań realizowanych w Bibliotece Medycznej UJ CM w latach 2011-2013 w ramach projektu SYNAT/PASSIM w zakresie stworzenia platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla
Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych
Jak Nas widzą, tak Nas piszą Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych Warszawa Maj 2013 Plan prezentacji 1. Stan informacji naukowej w zakresie nauk technicznych w Polsce 2. Koncepcja systemu
4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
INNOWACYJNA METODA PROMOCJI TECHNOLOGII GIS I ZASOBU GEODEZYJNEGO I KARTOGRAFICZNEGO SKIEROWANA DO UŻYTKOWNIKÓW Z BRANŻ POKREWNYCH
INNOWACYJNA METODA PROMOCJI TECHNOLOGII GIS I ZASOBU GEODEZYJNEGO I KARTOGRAFICZNEGO SKIEROWANA DO UŻYTKOWNIKÓW Z BRANŻ POKREWNYCH Tomasz Berezowski, XII Podlaskie Forum GIS, 18.06.2015 PRZEDSTAWIENIE
Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie
Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty
Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych
CLARIN-PL Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych Marcin Pol, Tomasz Walkowiak, Marcin Oleksy Politechnika
Ontologie, czyli o inteligentnych danych
1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania
Platforma Informatyczna Wdrażania Oprogramowania Dedykowanego w PL-Grid
1 Platforma Informatyczna Wdrażania Oprogramowania Dedykowanego w PL-Grid Grzegorz Banach Wrocławskie Centrum Sieciowo-Superkomputerowe, Politechnika Wrocławska, Instytut Niskich Temperatur i Badań Strukturalnych
System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą
System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą Lena Szymanek 1, Jacek Seń 1, Krzysztof Skibicki 2, Sławomir Szydłowski 2, Andrzej Kunicki 1 1 Morski
Integracja ORPPD z uczelnianymi systemami antyplagiatowymi
Integracja ORPPD z uczelnianymi systemami antyplagiatowymi Jarosław Protasiewicz Ośrodek Przetwarzania Informacji - Państwowy Instytut Badawczy Europejskie Forum Antyplagiatowe - EFA 2015 Warszawa, 19