Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
|
|
- Rafał Markiewicz
- 8 lat temu
- Przeglądów:
Transkrypt
1 Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.19
2 Historia Historia: Webowy system do budowania, anotowania, przeszukiwania i analizowania korpusów tekstowych rozwijany na Politechnice Wrocławskiej od 2009, wykorzystany: w projektach naukowych: NEKST, SyNaT, CLARIN-PL w habilitacjach: M. Zaśko-Zielińska (językoznawstwo - listy pożegnalne samobójców), Ł. Damurski (urbanistyka - dokumenty dotyczące polityki terytorialnej UE) w rozprawach doktorskich: B. Broda (WSD), M. Marcińczuk (NER, relacje semantyczne), A. Radziszewski (frazy składniowe), J. Kocoń (wyrażenia temporalne, wyznaczniki sytuacji) w innych pracach naukowych: E. Kaczmarz (konwersacje z Facebooka), Bernaś (teksty w j. hebrajskim). dostęp do korpusów: KPWr - Korpus Politechniki Wrocławskiej CEN - korpus wiadomości ekonomicznych z Wikinews PCSN - Polski korpus listów pożegnalnych samobójców
3 Główne cechy Inforex służy przede wszystkim do tworzenia jakościowych danych językowych dostęp przez przeglądarkę internetową nie wymaga instalacji u użytkownika, a jedynie dostępu do Internetu (dostęp dla użytkowników posiadających konto w DSpace) integracja z DSpace import korpusu z DSpace do Inforexa, współdzielenie danych między użytkownikami dane przechowywane są na serwerze, autoryzowany dostęp na poziomie korpusu oraz warstw danych i operacji, praca na dokumentach otagowanych (podział na tokeny i zdania) i nieotagowanych wizualizacja struktury dokumentów podczas anotacji, wsparcie dla anotacji typu 2+1.
4 Poziomy opisu/edycji dokumentów 1. Metadane (tytuł, autor, gatunek, data publikacji, podkorpus) 2. Edycja treści, np. na potrzeby oczyszczania lub anonimizacji dokumentów 3. Opis struktury 4. Anotacje (kategoria, atrybuty, lemat) 5. Relacje między anotacjami (kategoria, kierunek) 6. Znaczenia sensów słów (jako szczególny przypadek anotacji)
5 Dotychczasowe wykorzystanie 1. Korpus Politechniki Wrocławskiej (KPWr) [PWr, współpraca IPI PAN] frazy składniowe i ich lematyzacja (płytki parsing), jednostki identyfikacyjne (nazwy własne), wyrażenia temporalne (wyznaczniki i normalizacja), relacje semantyczne między jednostkami identyfikacyjnymi), sytuacje, wyrażenia przestrzenne, ujednoznacznianie sensów słów, role semantyczne wewnątrz fraz rzeczownikowych, słowa kluczowe. 2. Korpus Listów Pożegnalnych (PCSN) [UWr, M. Zaśko-Zielińska] transkrypcja skanów, opis struktury listów, anonimizacja, 3. Korpus dokumentów dot. polityki terytorialnej UE [PWr, Ł. Damurski] listy frekwencyjne, znakowanie kategoriami związanymi z polityką terytorialną, 4. Korpus tekstów hebrajskich [UWr, T. Bernaś] znakowanie pojęciami i ich tłumaczenie 5. Korpus konwersacji z Facebooka [UWr, E. Kaczmarz] statystyki błędów językowych i korelacje między nimi
6 Struktura korpusu
7 Lista korpusów
8 Strona startowa korpusu
9 Strona startowa korpusu
10 Lista dokumentów
11 Widok treści dokumentu
12 Wizualizacja struktury dokumentu (1/2) KPWr Rozmowy z Facebooka (E. Kaczmarz)
13 Wizualizacja struktury dokumentu (2/2) PCSN (M. Zaśko-Zielińska) Teksty w j. hebrajskim (T. Bernaś)
14 Ćwiczenie Import korpusu ćwiczeniowego z DSpace do Inforex Korpus wiadomości z pl.wikinews.org (Polska) lata
15 Zarządzanie korpusem
16 Dodawanie użytkowników
17 Role użytkowników
18 Perspektywy
19 Statystyki korpusu
20 Podstawowe statystyki
21 Frekwencja słów
22 Lista anotacji
23 Przeglądanie anotacji - kategorie
24 Przeglądanie anotacji - lematy
25 Frekwencja anotacji - kategorie
26 Frekwencja anotacji - frazy
27 Lista relacji
28 Ćwiczenia 1. Określ liczbę wyrazów w zaimportowanym korpusie i jego podkorpusach 2. Wygeneruj i zapisz listę frekwencyjną dla rzeczowników 3. Wygeneruj i zapisz listę frekwencyjną dla wybranej kategorii anotacji
29 Opisywanie dokumentów
30 Metadane
31 Kategorie anotacji
32 Lematy
33 Anafora
34 Sensy słów (WSD)
35 Anotacja fragmentów tekstu
36 Bootstrapping
37 Ćwiczenie 1. Zweryfikuj automatycznie rozpoznane anotacje nazw własnych dla wybranego dokumentu 2. Oznacz i zlematyzuj słowa kluczowe w wybranym dokumencie 3. przeglądanie anotacji nowych i zweryfikowanych
38 Anotacja 2+1 badanie zgodności
39 Wybór trybu znakowania
40 Badanie zgodności Dziękujemy za uwagę
41 Usuwanie niejednoznaczności
42 Porównanie zgodności na przykładzie kategoryzacji wyznaczników obiektów
43 Transkrypcja skanów
44 Transkrypcja skanów
45 Dziękujemy za uwagę!
Inforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl
Publikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Instrukcja. opracował Marcin Oleksy
Instrukcja opracował Marcin Oleksy Wstęp Zarządzanie korpusem Flagi Flagowanie korpusu Usuwanie i edytowanie flag Użytkownicy Przypisywanie użytkowników Role użytkowników Cofnięcie dostępu Podkorpusy Tworzenie
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Instrukcja użytkownika
Instrukcja użytkownika Podstawowe informacje Miejsce dostępu Do czego służy Inforex? Podstawowe funkcje Dla kogo przeznaczone jest narzędzie Przykłady zastosowań Instrukcja obsługi Rejestracja w repozytorium
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
CLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Open Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Wykorzystanie narzędzi do automatycznego przetwarzania języka w badaniach onomastycznych
Wykorzystanie narzędzi do automatycznego przetwarzania języka w badaniach onomastycznych Marcin Oleksy marcin.oleksy@pwr.edu.pl Jan Wieczorek jan.wieczorek@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
CLARIN infrastruktura naukowa technologii językowych
CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:
CLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych
wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Technologii Językowej
Narzędzia do ekstrakcji informacji z tekstu
CLARIN-PL Narzędzia do ekstrakcji informacji z tekstu Politechnika Wrocławska, 2016-04-26 Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Spis treści Wstęp 1. Językoznawstwo sądowe
Spis treści Podziękowania... 11 Wstęp... 13 1. Językoznawstwo sądowe... 17 1.1. Język a prawo... 17 1.2. Językoznawstwo sądowe metody badań... 20 1.2.1. Metody ilościowe... 20 1.2.1.1. Stylometria i metody
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Maciej Piasecki, Tomasz Walkowiak Politechnika ska Katedra Inteligencji Obliczeniowej
DSpace. Co to jest DSpace? Dostęp do danych. 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych
DSpace 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych 2. Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości dostępu do archiwum
Mapa Literacka analiza odniesień geograficznych w tekstach literackich
CLARIN-PL Mapa Literacka analiza odniesień geograficznych w tekstach literackich Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego
CLARIN infrastruktura naukowa technologii językowych i jej potencjał jako narzędzia badawczego Maciej Piasecki Politechnika Wrocławska Instytut Informatyki Grupa Naukowa G4.19 maciej.piasecki@pwr.wroc.pl
Jednolity System Antyplagiatowy. Jak interpretować wynik?
Jednolity System Antyplagiatowy Jak interpretować wynik? 2018 Czym jest JSA? JSA Praca Raport PROMOTOR decyzja TAK/NIE Praca STUDENT Podstawy prawne Prawo o Szkolnictwie Wyższym i Nauce z dnia 20 lipca
Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi
CLARIN-PL Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi Marcin Pol, Tomasz Walkowiak Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN
Włodzimierz Gruszczyński * Maciej Ogrodniczuk ** Marcin Woliński ** *IJP PAN **IPI PAN Wystąpienie przygotowane w ramach projektu Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772)
Jednolity System Antyplagiatowy. Jak interpretować wynik?
Jednolity System Antyplagiatowy Jak interpretować wynik? 2018 Czym jest JSA? JSA Praca Raport PROMOTOR decyzja TAK/NIE Praca STUDENT Podstawy prawne Prawo o Szkolnictwie Wyższym i Nauce z dnia 20 lipca
Instrukcja obsługi Zaplecza epk w zakresie zarządzania tłumaczeniami opisów procedur, publikacji oraz poradników przedsiębiorcy
Instrukcja obsługi Zaplecza epk w zakresie zarządzania tłumaczeniami opisów procedur, publikacji oraz poradników przedsiębiorcy Spis treści: 1 WSTĘP... 3 2 DOSTĘP DO SYSTEMU... 3 3 OPIS OGÓLNY SEKCJI TŁUMACZENIA...
Kategorialny Parser Składniowo-Semantyczny dla języka polskiego
Kategorialny Parser Składniowo-Semantyczny dla języka polskiego Wojciech Jaworski Instytut Informatyki Uniwersytetu Warszawskiego Instytut Podstaw Informatyki Polskiej Akademii Nauk 26 kwietnia 2016 Wojciech
ISDP w systemach geoinformatycznych dla Parków Narodowych
Instytut Systemów Przestrzennych i Katastralnych ISDP w systemach geoinformatycznych dla Parków Narodowych Leszek Litwin III Warsztaty: GIS w PARKACH NARODOWYCH I OBSZARACH CHRONIONYCH, Zakopane, 2007
DSpace. Podstawowe informacje: Co to jest DSpace? Dostęp do danych
DSpace Instrukcja użytkownika Podstawowe informacje: Co to jest DSpace? Dostęp do danych Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości
Jednolity System Antyplagiatowy
Jednolity System Antyplagiatowy Jak interpretować wynik? 2018 Czym jest JSA? 1 JSA Praca Raport PROMOTOR decyzja TAK/NIE Praca STUDENT Podstawy prawne Prawo o Szkolnictwie Wyższym i Nauce z dnia 20 lipca
Zarządzanie korespondencją
Zarządzanie korespondencją Aby korzystać z systemu należy: mieć dostęp do internetu uruchomić przeglądarkę internetową (Firefox) Informację od konsultanta EAT adres internetowy login hasło startowe adres
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Zautomatyzowane tworzenie korpusów błędów dla języka polskiego
Zautomatyzowane tworzenie korpusów błędów dla języka polskiego Marcin Miłkowski Instytut Filozofii i Socjologii PAN Zakład Logiki i Kognitywistyki Adres projektu: morfologik.blogspot.com Korpusy błędów
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska
Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie
KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Odkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013.
Odkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013 Spis treści Wprowadzenie 11 1. Audacity - program do edycji i obróbki
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN
KORBA Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.) Pracownia Historii Języka Polskiego XVII i XVIII wieku IJP PAN Podstawowe informacje o projekcie Projekt realizowany przez IJP
System Wniosków DWZ AGH
System Wniosków DWZ AGH Maurycy Ornat, Aes Grave 25 marca 2012 Plan 1 Wprowadzenie Po co jest system Bezpieczeństwo 2 Panel klienta Rejestracja i logowanie Widok panelu klienta Składanie wniosków 3 Panel
Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.
STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
Praca z ebay. Dokumentacja Użytkownika Systemu. od wersji
Dokumentacja Użytkownika Systemu od wersji Spis treści 1 Integracja... 3 2 Czego potrzebuję... 4 3 Konfiguracja serwisu ebay w Panelu Administracyjnym... 5 3.1 Konto ebay... 5 3.1.1 Dodawanie konta...
Czytelnik w bibliotece cyfrowej
Czytelnik w bibliotece cyfrowej Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe IV Warsztaty Biblioteki Cyfrowe Poznań, 2007 Do czego służy Aplikacja Czytelnika? Udostępnianie zasobów cyfrowych
Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych
CLARIN-PL Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych Marcin Pol, Tomasz Walkowiak, Marcin Oleksy Politechnika
KONKURS Ostatnia Imię i nazwisko Zakres wprowadzanych zmian aktualizacja
Platforma Logintrade KONKURS Instrukcja obsługi dla uczestnika konkursu wersja 1.0 Ostatnia aktualizacja Imię i nazwisko Zakres wprowadzanych zmian 17.09.2019 LT DB Przygotowanie instrukcji 23.09.2019
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
WebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Korpusy językowe podstawowa terminologia i metody tworzenia. Natalia Kotsyba IBI AL Uniwersytet Warszawski 12 i 26 stycznia 2011 r.
Korpusy językowe podstawowa terminologia i metody tworzenia Natalia Kotsyba IBI AL Uniwersytet Warszawski 12 i 26 stycznia 2011 r. Czym jest korpus? Zbiór tekstów albo zapisanych wypowiedzi, wykorzystywany
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji
Telesprzedaż by CTI Instrukcja
Telesprzedaż by CTI Instrukcja 1 Spis treści 1. Opis programu...4 2. Konfiguracja...5 2.1. Połączenie z serwerem MS SQL...6 2.2. Połączenie z serwerem MS SQL systemu Call Center...7 2.3. Nawiązanie połączenia
Wytyczne KPWr. Wyrażenia temporalne. Marcin Oleksy (od 2013 do teraz) Michał Marcińczuk (od 2013 do teraz), Tomasz Bernaś (od 2013 do teraz)
Wytyczne KPWr Wyrażenia temporalne Osoba odpowiedzialna Udział Jan Kocoń Marcin Oleksy (od 2013 do teraz) Michał Marcińczuk (od 2013 do teraz), Tomasz Bernaś (od 2013 do teraz) 1.1. - wyrażenia
ul. Pogodna 6 10-647 Olsztyn +48 504 647 030 codeit@codeit.pl http://codeit.pl
Aplikacja 'mcrm' codeit ul. Pogodna 6 10-647 Olsztyn +48 504 647 030 codeit@codeit.pl 1. Idea Aplikacja 'mcrm' to prosty system klasy CRM (Customer Relationship Management) stworzony z myślą o małych i
WPROWADZANIE ZLECEŃ POPRZEZ STRONĘ WWW.KACZMARSKI.PL INSTRUKCJA UŻYTKOWNIKA
WPROWADZANIE ZLECEŃ POPRZEZ STRONĘ WWW.KACZMARSKI.PL INSTRUKCJA UŻYTKOWNIKA WSTĘP... 2 1 UWARUNKOWANIA TECHNICZNE... 2 2 UWARUNKOWANIA FORMALNE... 2 3 LOGOWANIE DO SERWISU... 2 4 WIDOK STRONY GŁÓWNEJ...
LEM wydobywanie statystyk z korpusów
LEM wydobywanie statystyk z korpusów Maciej Piasecki, Tomasz Walkowiak Politechnika Wroc awska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Maciej Maryl Instytut Bada Literackich Polska Akademia
System SINUS otwarte narzędzie do budowy bibliograficznych baz danych
System SINUS otwarte narzędzie do budowy bibliograficznych baz danych Marzena Błaszczyńska, Michał Kozak, Cezary Mazurek, Marcin Szymczak, Marcin Werla Wyzwania dla Instytucji Naukowej Parametryzacja i
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O
EAP XML Legislator Opis zmian w wersji Service Pack 41 ABC PRO Sp. z o.o.
Opis zmian w wersji 2.2.0.0 Service Pack 41 ABC PRO Sp. z o.o. Dokument zawiera szczegółowy opis zmian wprowadzonych w wersji 2.2.0.0 SP 41 EAP XML Legislator Data: 2016-10-27 ABC PRO Sp. z.o.o. ul. Owsiana
OPIS PRZEDMIOTU ZAMÓWIENIA
Lubelskie Centrum Transferu Technologii Politechniki Lubelskiej ul. Nadbystrzycka 36, 20-618 Lublin Tel. 81 538 42 70, fax. 81 538 42 67; e-mail: lctt@pollub.pl OPIS PRZEDMIOTU ZAMÓWIENIA Do realizacji
Załącznik nr 1. Specyfikacja. Do tworzenia Mapy Kompetencji
Załącznik nr 1 Specyfikacja Do tworzenia Mapy Kompetencji 1. Cel projektu Celem projektu jest utworzenie Mapy kompetencji. Ma ona zawierać informacje o kompetencjach, celach kształcenia, umożliwiać ich
BalticBottomBase. Instytut Morski w Gdańsku Gdańsk,
BalticBottomBase mgr inż. Przemysław Kulesza dr Piotr Piotrowski mgr inż. Michał Wójcik Spójne wyszukiwanie w zbiorze różnorodnych danych geograficznych - metamodel i metoda wyszukiwania Instytut Morski
Humanistyka cyfrowa w Katedrze Lingwistyki Formalnej UW
1/18 Humanistyka cyfrowa w Katedrze Lingwistyki Formalnej UW Janusz S. Bień Katedra Lingwistyki Formalnej Wydział Neofilologii Uniwersytet Warszawski 2 czerwca 2014 r. 2/18 Wprowadzenie Katedra Lingwistyki
Podstawowe możliwości programu Spectro Market Faktura 2011.2
Podstawowe możliwości programu Spectro Market Faktura 2011.2 Obsługa faktur VAT sprzedaży, zaliczki, marży. Obsługa faktur korygujących. Tworzenie not. Tworzenie pokwitowań. Budowane i obsługa kartotek:
Semantyczna analiza języka naturalnego
Semantyczna analiza języka naturalnego Rozwiązanie Applica oparte o IBM SPSS Modeler Piotr Surma Applica 2 Agenda O Applica Analiza tekstu w języku polskim - wyzwania Rozwiązanie Applica Analiza Tekstu
System Informacji dla Linii Kolejowych narzędziem wspomagającym podejmowanie decyzji w PKP Polskie Linie Kolejowe S.A.
System Informacji dla Linii Kolejowych narzędziem wspomagającym podejmowanie decyzji w PKP Polskie Linie Kolejowe S.A. www.plk-sa.pl Kraków, 16 maja 2014 r. System Informacji dla Linii Kolejowych (SILK)
OGÓLNOPOLSKI SPRAWDZIAN KOMPETENCJI TRZECIOKLASISTY OPERON 2015
OGÓLNOPOLSKI SPRAWDZIAN KOMPETENCJI TRZECIOKLASISTY OPERON 2015 Analiza wyników badań umiejętności językowych i umiejętności matematycznych uczniów klas III Szkoły Podstawowej nr 2 im. Jan Kochanowskiego
WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów
IJP PAN / UP Kraków maciejeder@gmail.com WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów ws.clarin-pl.eu/websty.shtml Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika
Logowanie do systemu. Rys. 1 Strona logowania
Spis treści Logowanie do systemu... 2 Dostępne operacje... 3 Zarządzanie dokumentami... 4 Zarządzanie katalogami... 4 Dodawanie dokumentów do analizy... 4 Uzupełnianie dodatkowego opisu dokumentu... 5
Instrukcja obsługi. Generatora CSV
Instrukcja obsługi Generatora CSV Spis treści: 1. Wstęp 2. Praca z programem Generator CSV 2.1. Rozpoczęcie pracy 2.2. Sprawdzanie docelowego pliku CSV 2.3 Korekta błędów w docelowym pliku CSV 2.3.1. Odnajdywanie
Horde. Wojciech Myszka
Horde Wojciech Myszka 1. Książka adresowa System Horde wyposażony jest w książkę adresową. Nie jest ona rozwiązana w sposób idealny, ale ma szereg interesujących własności: dodawanie adresów respondentów
SCENARIUSZE ĆWICZEŃ DLA UŻYTKOWNIKÓW WEWNĘTRZNYCH SYSTEMU INFORMATYCZNEGO NAWIKUS
PAKIET EDUKACYJNY SCENARIUSZE ĆWICZEŃ DLA UŻYTKOWNIKÓW WEWNĘTRZNYCH SYSTEMU INFORMATYCZNEGO NAWIKUS Kraków, grudzień 2014 r. Pro j e k t P I N A W I K U S i n n o w a c y j n a m e t o d a m o n i t o
Repozytoria uczelniane i ich rola w projekcie SYNAT
Jak Cię widzą, tak Cię piszą Repozytoria uczelniane i ich rola w projekcie SYNAT Warszawa Maj 2013 Plan prezentacji 1. Jak Cię widzą 2. Usytuowanie repozytoriów uczelnianych w systemie Synat 3. Czy tylko
Wykonawca systemu: Dr inż. Andrzej Łysko
Katedra Botaniki i Ochrony Przyrody Wydział Biologii Uniwersytetu Szczecińskiego ul. Wąska 13 71-415 Szczecin (91) 444 15 10 agnieszka.popiela@usz.edu.pl Wykonawca systemu: Dr inż. Andrzej Łysko Adresy
Grafika i Systemy Multimedialne (IGM)
Nowa Specjalność na Kierunku Informatyka Informatyka Techniczna (ITN) Grafika i Systemy Multimedialne (IGM) dr inż. Jacek Mazurkiewicz (K-9) Motywacja 2 narastająca potrzeba aktualizacji, modernizacji
Wymagania dla modułu Pracownia Diagnostyczna załącznik A.2
Wymagania dla modułu Pracownia Diagnostyczna załącznik A.2 Wymaganie System posiada wspólny dla wszystkich użytkowników moduł rejestracji pacjentów obsługujący jednocześnie wiele pracowni diagnostycznych
DOBRE PRAKTYKI W PROCESIE BUDOWY INFRASTRUKTURY INFORMACJI PRZESTRZENNEJ DLA TEMATU ZAGOSPODAROWANIE PRZESTRZENNE.
DOBRE PRAKTYKI W PROCESIE BUDOWY INFRASTRUKTURY INFORMACJI DLA TEMATU ZAGOSPODAROWANIE PRZESTRZENNE. WZORCE ROZWIĄZAŃ Jaromar Łukowicz Wrocławski Instytut Zastosowań Informacji Przestrzennej i Sztucznej
Otwarty System Antyplagiatowy
Otwarty System Antyplagiatowy przewodnik po systemie Spis treści 1. Wprowadzenie... 2 2. Zgłoszenie sprawdzenia pracy... 2 3. Raport z badania pracy... 2 4. Logowanie do systemu OSA... 3 5. Widok szczegółów
Wykonawca systemu: Dr inż. Andrzej Łysko
Katedra Taksonomii Roślin i Ochrony Przyrody Wydział Biologii Uniwersytetu Gdańskiego ul. Wita Stwosza 59, 80-308 Gdańsk (58) 523 61 59 katarzyna.wszalek-rozek@biol.ug.edu.pl Wykonawca systemu: Dr inż.
Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:
WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji
Dokumentacja Użytkownika Systemu
Dokumentacja Użytkownika Systemu Integracja z Nokaut i Radar Wersja 2016.2 Spis treści 1 INTEGRACJA... 3 2 REJESTRACJA... 4 2.1 NOKAUT... 4 2.2 RADAR.PL... 4 3 KONFIGURACJA... 5 4 PRZYGOTOWANIE ASORTYMENTU...
Dokumenty planistyczne Gminy Opinogóra Górna
Dokumenty planistyczne Gminy Opinogóra Górna Zaimportowane w aplikacji Rejestr Planów RP Warszawa, 26 listopada 2015 r. Modułowa budowa aplikacji I. Import danych II. Przeglądanie danych III. Korekta danych
Ujednoznacznianie sensów słów
ł ę ł ń ł Warsztaty Ujednoznacznianie sensów słów Ujednoznacznianie sensów słów Idea ujednoznaczniania sensów słów: zamek Warsztaty Ujednoznacznianie sensów słów Idea ujednoznaczniania sensów słów (cd.):
Tworzenie przeszukiwalnych korpusów j zyka polskiego za pomoc Korpusomatu
Tworzenie przeszukiwalnych korpusów j zyka polskiego za pomoc Korpusomatu Witold Kiera± Šukasz Kobyli«ski Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN IV cykl wykªadów i warsztatów CLARIN-PL Šód¹
CLARIN-PL w praktyce badawczej
CLARIN-PL w praktyce badawczej Podsumowanie cyklu wykładów i warsztatów Streszczenie: CLARIN- PL jest infrastrukturą naukową technologii językowych, która udostępnia narzędzia badawcze do analizy zapisów
Dokumentacja Użytkownika Systemu
Dokumentacja Użytkownika Systemu Integracja z Ceneo.pl Wersja 7.0.2 Spis treści 1 INTEGRACJA... 3 2 REJESTRACJA NA CENEO.PL... 4 3 KONFIGURACJA Z SERWISEM CENEO.PL... 5 4 PRZYGOTOWANIE ASORTYMENTU... 8
Rozwój polskich bibliotek cyfrowych. Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe
Rozwój polskich bibliotek cyfrowych Tomasz Parkoła Poznańskie Centrum Superkomputerowo-Sieciowe Plan prezentacji Wprowadzenie Historia rozwoju bibliotek cyfrowych w Polsce Aktualny stan bibliotek cyfrowych
KATEGORIA OBSZAR WIEDZY
Moduł 3 - Przetwarzanie tekstów - od kandydata wymaga się zaprezentowania umiejętności wykorzystywania programu do edycji tekstu. Kandydat powinien wykonać zadania o charakterze podstawowym związane z
Instrukcja składania wniosku o dofinansowanie w systemie informatycznym IP na potrzeby konkursu nr 1/1.1.2/2015
Instrukcja składania wniosku o dofinansowanie w systemie informatycznym IP na potrzeby konkursu nr 1/1.1.2/2015 Informacje ogólne Wnioski o dofinansowanie projektu w ramach konkursu nr 1/1.1.2/2015 mogą
Spis treści tomu pierwszego
Spis treści tomu pierwszego WSTĘP.... 11 DŹWIĘK JAKO ZJAWISKO FIZYCZNE...15 CHARAKTERYSTYKA AKUSTYCZNA I AUDYTYWNA DŹWIĘKÓW MOWY.. 17 SŁUCH...20 WYŻSZE PIĘTRA UKŁADU SŁUCHOWEGO...22 EMISJE OTOAKUSTYCZNE...25